JP6833540B2 - Extractor, extraction method and extraction program - Google Patents

Extractor, extraction method and extraction program Download PDF

Info

Publication number
JP6833540B2
JP6833540B2 JP2017020701A JP2017020701A JP6833540B2 JP 6833540 B2 JP6833540 B2 JP 6833540B2 JP 2017020701 A JP2017020701 A JP 2017020701A JP 2017020701 A JP2017020701 A JP 2017020701A JP 6833540 B2 JP6833540 B2 JP 6833540B2
Authority
JP
Japan
Prior art keywords
product
information
extraction
user
extraction device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017020701A
Other languages
Japanese (ja)
Other versions
JP2018128806A (en
Inventor
正嗣 志立
正嗣 志立
直行 角田
直行 角田
塚本 浩司
浩司 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017020701A priority Critical patent/JP6833540B2/en
Publication of JP2018128806A publication Critical patent/JP2018128806A/en
Application granted granted Critical
Publication of JP6833540B2 publication Critical patent/JP6833540B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、抽出装置、抽出方法及び抽出プログラムに関する。 The present invention relates to an extraction device, an extraction method and an extraction program.

近年、インターネットの飛躍的な普及に伴い、ネットワークを介して様々なコンテンツの提供が盛んに行われている。例えばコンテンツが商材である場合、ユーザは、商材のカテゴリを指定して検索を行い、検索結果として表示されたコンテンツの紹介ページや販売ページにアクセスする。 In recent years, with the rapid spread of the Internet, various contents have been actively provided via networks. For example, when the content is a product, the user searches by specifying the category of the product and accesses the introduction page or the sales page of the content displayed as the search result.

ここで、コンテンツに関する検索結果を利用した技術の一例として、ユーザから検索された対象となった商品群の販売履歴から、対象商品のランキングを生成し、生成したランキングを広告コンテンツのテキストとして利用する技術が知られている。 Here, as an example of the technology using the search result related to the content, the ranking of the target product is generated from the sales history of the target product group searched by the user, and the generated ranking is used as the text of the advertisement content. The technology is known.

特開2015−79449号公報JP-A-2015-79449

しかしながら、上記の従来技術では、商材に関する特徴をより柔軟にアピールすることができるとは限らない。具体的には、上記の従来技術では、ランキングの対象となるような特徴以外から広告コンテンツのテキストを自動的に生成するものであり、実際に商材を紹介するページ(ウェブページ等)において、商材の特徴をユーザに提示するものではない。このため、商材が有する様々な特徴をユーザにアピールすることができない場合がありうる。 However, in the above-mentioned conventional technique, it is not always possible to more flexibly appeal the characteristics of the product. Specifically, in the above-mentioned conventional technology, the text of the advertisement content is automatically generated from the features other than the features that are the targets of the ranking, and the page (web page, etc.) that actually introduces the product is displayed. It does not present the characteristics of the product to the user. Therefore, it may not be possible to appeal the various features of the product to the user.

本願は、上記に鑑みてなされたものであって、商材に関する特徴をより柔軟にアピールすることができる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide an extraction device, an extraction method, and an extraction program capable of more flexibly appealing the characteristics of a product.

本願に係る抽出装置は、ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得部と、ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報のうち、当該集合において所定の条件を満たす情報である特徴情報を抽出する抽出部と、を備えたことを特徴とする。 The extraction device according to the present application includes an acquisition unit that acquires product information associated with a product that is the target of commercial transactions on the network, and a predetermined set included in a set formed based on the contents specified by the user. The product is characterized by including an extraction unit that extracts feature information that satisfies a predetermined condition in the set from the product information of the predetermined product.

実施形態の一態様によれば、商材に関する特徴をより柔軟にアピールすることができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that the characteristics related to the product can be more flexibly appealed.

図1は、実施形態に係る抽出処理の一例を示す図である。FIG. 1 is a diagram showing an example of an extraction process according to an embodiment. 図2は、実施形態に係る抽出処理システムの構成例を示す図である。FIG. 2 is a diagram showing a configuration example of the extraction processing system according to the embodiment. 図3は、実施形態に係る抽出装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the extraction device according to the embodiment. 図4は、実施形態に係る商材情報記憶部の一例を示す図である。FIG. 4 is a diagram showing an example of a product information storage unit according to the embodiment. 図5は、実施形態に係る学習情報記憶部の一例を示す図である。FIG. 5 is a diagram showing an example of the learning information storage unit according to the embodiment. 図6は、実施形態に係る提供情報記憶部の一例を示す図である。FIG. 6 is a diagram showing an example of the provided information storage unit according to the embodiment. 図7は、実施形態に係るウェブサーバの構成例を示す図である。FIG. 7 is a diagram showing a configuration example of the web server according to the embodiment. 図8は、実施形態に係る処理手順を示すフローチャート(1)である。FIG. 8 is a flowchart (1) showing a processing procedure according to the embodiment. 図9は、実施形態に係る処理手順を示すフローチャート(2)である。FIG. 9 is a flowchart (2) showing a processing procedure according to the embodiment. 図10は、実施形態に係る処理手順を示すフローチャート(3)である。FIG. 10 is a flowchart (3) showing a processing procedure according to the embodiment. 図11は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 11 is a hardware configuration diagram showing an example of a computer that realizes the function of the extraction device.

以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, the extraction device, the extraction method, and the embodiment for implementing the extraction program according to the present application (hereinafter, referred to as “the embodiment”) will be described in detail with reference to the drawings. The extraction device, extraction method, and extraction program according to the present application are not limited by this embodiment. In addition, each embodiment can be appropriately combined as long as the processing contents do not contradict each other. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description is omitted.

〔1.抽出処理の一例〕
まず、図1を用いて、実施形態に係る抽出処理の一例について説明する。図1は、実施形態に係る抽出処理の一例を示す図である。図1では、本願に係る抽出装置100によって、電子商取引における商材を紹介するページ(コンテンツ)の抽出処理が行われる例を示す。
[1. Example of extraction process]
First, an example of the extraction process according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram showing an example of an extraction process according to an embodiment. FIG. 1 shows an example in which a page (content) for introducing a product in an electronic commerce is extracted by the extraction device 100 according to the present application.

図1に示す抽出装置100は、電子商取引における商材を紹介するページ(コンテンツの一例)の生成処理を行うサーバ装置である。具体的には、抽出装置100は、商材に関するウェブページや、商材に対応付けられた情報に基づいて、商材を特徴付ける情報を抽出する。そして、抽出装置100は、抽出した特徴を元のウェブページに付加すること等により、ユーザに商材の特徴をアピールすることのできるページ(以下、「アピールページ」と表記する場合がある)を生成する。なお、図1では、商材として、不動産の賃貸物件を例に挙げて説明する。また、図1では、コンテンツの例としてページ(ウェブページ)を示しているが、コンテンツはページに限らず、広告コンテンツやアプリを介して提供される情報ページなど、種々の情報コンテンツを含むものとする。 The extraction device 100 shown in FIG. 1 is a server device that generates a page (an example of content) that introduces a product in electronic commerce. Specifically, the extraction device 100 extracts information that characterizes the product based on a web page related to the product and information associated with the product. Then, the extraction device 100 provides a page (hereinafter, may be referred to as an "appeal page") capable of appealing the characteristics of the product to the user by adding the extracted features to the original web page or the like. Generate. In FIG. 1, a real estate rental property will be described as an example of a commercial material. Further, although a page (web page) is shown as an example of the content in FIG. 1, the content is not limited to the page, and includes various information contents such as an advertisement content and an information page provided via an application.

図1に示すユーザ端末10は、ユーザによって利用される情報処理端末である。例えば、ユーザ端末10は、スマートフォンやタブレット端末である。ユーザ端末10は、ユーザの操作に従い、ネットワーク上のサービスを利用する。例えば、ユーザ端末10は、電子商取引サイト(以下、「商取引サイト」と表記する)にアクセスし、各種サービスに関する購買申込みを行ったり、問い合わせを行ったりすることができる。なお、実施形態では、ユーザ端末10をユーザと読み替える場合がある。例えば、「ユーザがウェブサイトにアクセスする」という記載は、実際には、「ユーザによって操作されたユーザ端末10がウェブサイトにアクセスする」という状況を示す場合がある。 The user terminal 10 shown in FIG. 1 is an information processing terminal used by the user. For example, the user terminal 10 is a smartphone or tablet terminal. The user terminal 10 uses a service on the network according to the operation of the user. For example, the user terminal 10 can access an electronic commerce site (hereinafter referred to as "commercial transaction site") to make a purchase application or make an inquiry regarding various services. In the embodiment, the user terminal 10 may be read as a user. For example, the description "the user accesses the website" may actually indicate the situation that "the user terminal 10 operated by the user accesses the website".

ここで、実施形態で例示する不動産情報サイト等の商取引サイトには、複数の事業者(例えば、不動産業者)が、各々の取り扱う種々の商材(図1の例では物件)をサイトにアップロードしているものとする。 Here, in a commercial transaction site such as a real estate information site illustrated in the embodiment, a plurality of businesses (for example, a real estate agent) upload various products (property in the example of FIG. 1) handled by each to the site. It is assumed that

このような商取引サイトでは、通常、事業者によって物件のタイトルや説明文が作成され、物件の情報(商材情報)として対応付けられる。また、事業者は、物件の家賃や最寄り駅や、最寄り駅までの距離や、広さ(専有面積)や、築年数や、ペット飼育を許可するか否かなど、物件の詳細情報についても、物件の商材情報として対応付ける。 In such a commercial transaction site, the title and description of the property are usually created by the business operator and associated with the property information (product information). In addition, the business operator also provides detailed information on the property, such as the rent of the property, the nearest station, the distance to the nearest station, the area (occupied area), the age of the property, and whether or not to allow pets. Correspond as product information of the property.

そして、事業者は、物件のタイトルや説明文やとともに、物件を撮像した画像やその他の商材情報等をアップロードする。商取引サイト側は、事業者からアップロードされた情報に基づいて物件の紹介ページを生成する。商取引サイトを利用するユーザは、商取引サイトにアクセスし、紹介ページに掲載されたタイトルや説明文を参照して、物件への申し込みや問い合わせを行う。 Then, the business operator uploads an image of the property and other product information along with the title and description of the property. The commercial transaction site side generates a property introduction page based on the information uploaded by the business operator. A user who uses the commercial transaction site accesses the commercial transaction site, refers to the title and description posted on the introduction page, and makes an application or inquiry to the property.

ここで、このような商取引サイトでは、物件に付与する情報(例えば、物件の説明文)の作成が事業者に委ねられる場合がある。このため、商取引サイトでは、適切な物件情報がユーザに提供されるとは限らないといった問題がある。すなわち、事業者が任意に説明文を付与する場合、例えばSEO対策(Search Engine Optimization)等が施されることにより、過度に長い説明文が付与されたり、関係のない語句が説明文に挿入されたりする場合がある。 Here, in such a commercial transaction site, the creation of information to be given to the property (for example, the description of the property) may be entrusted to the business operator. For this reason, there is a problem that appropriate property information is not always provided to the user on the commercial transaction site. That is, when the business operator arbitrarily assigns an explanatory text, for example, by taking SEO measures (Search Engine Optimization) or the like, an excessively long explanatory text is given or an irrelevant phrase is inserted into the explanatory text. It may happen.

この場合、ユーザが商取引サイトにアクセスして紹介ページを閲覧する際に、物件がどのような特徴を有するものかを判別し辛くなる場合がある。これにより、商取引サイト全体のユーザビリティが低下する可能性がある。 In this case, when the user accesses the commercial transaction site and browses the introduction page, it may be difficult to determine what kind of characteristics the property has. This can reduce the usability of the entire commercial trading site.

また、物件の紹介ページに記載される内容が事業者に委ねられる場合、当該物件の特徴が存分にアピールされない場合がある。例えば、ユーザからアクセスされた物件は、ユーザが検索対象として指定した集合(例えば、共通する最寄り駅を有する物件群)の中では、比較的家賃が安い物件であったり、ペットが飼育可能であったりという利点があるとする。しかし、事業者側は、そのような情報が他の物件と比較してアピールポイントとなりうるか否かを判断することが難しいため、紹介ページ(例えば、物件の説明文)では特に強調することがない場合がある。また、例え事業者が特徴を記載していたとしても、物件のページを閲覧したユーザに気付かれない場合もある。 In addition, if the content described on the property introduction page is entrusted to the business operator, the characteristics of the property may not be fully appealed. For example, the property accessed by the user may be a property with a relatively low rent or pets can be bred in the set specified by the user as a search target (for example, a group of properties having a common nearest station). Suppose there is an advantage of However, since it is difficult for the business operator to determine whether such information can be an appealing point compared to other properties, there is no particular emphasis on the introduction page (for example, the description of the property). In some cases. Moreover, even if the business operator describes the characteristics, the user who browses the page of the property may not notice it.

ここで、商取引サイト側からの要請により、事業者に適切な説明文を付与することを義務付けるということも可能であるが、大量の物件をアップロードする事業者等にとっては、一つ一つの物件に適切な説明文を付与することは作業負担が大きい。このため、事業者が、当該商取引サイトへのアップロードを躊躇する可能性も生じる。この場合、商取引サイト側は、大口の事業者を失うことになるため、商取引サイトの運営にとって望ましくない。また、商取引サイト側が、アップロードされた全ての物件に対して人為的に適切な説明文(例えば、アピールポイントを明確に記載したような説明文)を付与するということも、アップロード数が膨大である場合には現実的ではない。 Here, at the request of the commercial transaction site side, it is possible to oblige the business operator to give an appropriate explanation, but for the business operator who uploads a large number of properties, it is possible to make each property individually. It is a heavy work load to give an appropriate explanation. Therefore, the business operator may hesitate to upload to the commercial transaction site. In this case, the commercial transaction site side loses a large business operator, which is not desirable for the operation of the commercial transaction site. In addition, the number of uploads is enormous because the commercial transaction site side artificially gives an appropriate description (for example, a description that clearly states the appeal point) to all the uploaded properties. In some cases it is not realistic.

そこで、実施形態に係る抽出装置100は、以下に説明する手法により、事業者によって物件に対応付けられていた商材情報から、物件の特徴を示す情報を抽出する。さらに、抽出装置100は、抽出された特徴に基づいて、物件を紹介するページであって、物件を宣伝するための特徴情報(アピールポイント)が付与されたアピールページを生成する。かかる処理によって、抽出装置100は、事業者や商取引サイト側に負担を掛けることなく、ユーザに対して物件の特徴をアピールするページを生成することができる。これにより、抽出装置100は、商材に関する特徴をより柔軟にアピールすることができるので、ユーザに対する訴求効果を向上させることができる。以下、図1を用いて、抽出装置100によって行われる抽出処理の一例を流れに沿って説明する。 Therefore, the extraction device 100 according to the embodiment extracts information indicating the characteristics of the property from the product information associated with the property by the business operator by the method described below. Further, the extraction device 100 generates an appeal page to which the feature information (appeal point) for promoting the property is given, which is a page introducing the property based on the extracted features. By such processing, the extraction device 100 can generate a page that appeals the characteristics of the property to the user without imposing a burden on the business operator or the commercial transaction site side. As a result, the extraction device 100 can more flexibly appeal the features related to the product, so that the effect of appealing to the user can be improved. Hereinafter, an example of the extraction process performed by the extraction device 100 will be described along the flow with reference to FIG.

図1に示すように、抽出装置100は、学習フェーズとして、商材情報から特徴情報を抽出する処理を行うための学習を行う。まず、抽出装置100は、学習処理に用いるための学習データとして、商材情報を取得する(ステップS11)。 As shown in FIG. 1, the extraction device 100 performs learning for performing a process of extracting feature information from product information as a learning phase. First, the extraction device 100 acquires product information as learning data to be used in the learning process (step S11).

具体的には、抽出装置100は、商取引サイトにアップされた既存の物件紹介ページである商材B01、B02、B03等を取得する。商材B01等は、例えば、事業者がアップロードした物件の情報であり、各物件のスペックを示した詳細情報である商材情報が含まれるものとする。なお、学習データは、事業者によってアップロードされた情報に基づいて生成された商材B01等の紹介ページであってもよい。 Specifically, the extraction device 100 acquires the existing property introduction pages B01, B02, B03, etc. posted on the commercial transaction site. The product B01 and the like are, for example, information on properties uploaded by the business operator, and include product information which is detailed information indicating the specifications of each property. The learning data may be an introduction page for product B01 or the like generated based on the information uploaded by the business operator.

例えば、抽出装置100は、既知の手法を用いてネットワーク上をクロール(crawl)することにより、商材B01等の情報を取得する。あるいは、抽出装置100は、不動産情報サイトを提供する所定のウェブサーバ等から、商材B01等の情報を取得する。なお、抽出装置100は、必ずしも同一の商取引サイトから商材B01等を取得しなくてもよい。すなわち、抽出装置100は、物件と、物件に対応付けられた商材情報が取得可能であれば、どのような商取引サイトから学習データを取得してもよい。 For example, the extraction device 100 acquires information such as the product B01 by crawling on the network using a known method. Alternatively, the extraction device 100 acquires information such as the product B01 from a predetermined web server or the like that provides the real estate information site. The extraction device 100 does not necessarily have to acquire the product B01 or the like from the same commercial transaction site. That is, the extraction device 100 may acquire the learning data from any commercial transaction site as long as the property and the product information associated with the property can be acquired.

続けて、抽出装置100は、取得した商材情報に基づいて、商材情報の特徴となりうる項目をデータベース化する(ステップS12)。例えば、抽出装置100は、商材が物件等の不動産である場合、物件の家賃や、最寄り駅や、最寄り駅までの距離や、広さ(専有面積)や、築年数や、ペット飼育を許可するか否かなどを、商材情報のうち特徴となりうる項目と判定する。なお、抽出装置100は、かかる判定処理について、予め人為的に特徴となりうる項目の設定を受け付けていてもよい。例えば、抽出装置100は、商材のカテゴリ別(例えば、不動産など)に、特徴となりうる項目の設定を予め受け付けておく。かかる処理により、抽出装置100は、例えば処理対象とする商材を取得した場合に、当該商材情報のうち、特徴情報となりうる項目に対応する情報を迅速に抽出することができる。 Subsequently, the extraction device 100 creates a database of items that can be characteristic of the product information based on the acquired product information (step S12). For example, when the product is real estate such as a property, the extraction device 100 permits the rent of the property, the nearest station, the distance to the nearest station, the area (occupied area), the age of the building, and pet breeding. Whether or not to do so is judged as a characteristic item in the product information. The extraction device 100 may accept in advance the setting of items that can be artificially characterized in such a determination process. For example, the extraction device 100 receives in advance the setting of items that can be characteristic for each product category (for example, real estate). By such processing, for example, when the extraction device 100 acquires the product to be processed, the extraction device 100 can quickly extract the information corresponding to the item that can be the feature information from the product information.

また、抽出装置100は、取得した商材情報において、商材に対応付けられた説明文(テキストデータ)のうち、商材の特徴情報(アピールポイント)となりうる箇所についての学習を行う(ステップS13)。すなわち、抽出装置100は、テキストデータに含まれる特徴を抽出するための所定のモデル(学習器)を生成する。 In addition, the extraction device 100 learns about a portion of the acquired product information that can be characteristic information (appeal point) of the product in the explanatory text (text data) associated with the product (step S13). ). That is, the extraction device 100 generates a predetermined model (learner) for extracting features included in the text data.

詳細は後述するが、抽出装置100は、ある一つの手法に限らず、種々の手法を用いてモデルを生成してもよい。例えば、抽出装置100は、説明文とともに、手動によって説明文を要約した要約文を学習データとして利用する。すなわち、抽出装置100は、説明文が人為的に要約された要約文を正解データとして、その過程において抽出される語句を、その説明文における特徴情報として機械学習を行う。この場合、抽出装置100は、充分なサンプルを学習に利用することで、手動による要約処理の際に抽出される語句の特徴を学習できる。このため、抽出装置100は、新たな説明文をモデルに入力した場合に、手動によって要約文が作成される過程を模して、説明文から重要と想定される語句を抽出することができる。この抽出された情報が、説明文(言い換えれば、説明文に対応付けられている物件)の特徴情報となりうる。 Although the details will be described later, the extraction device 100 is not limited to one method, and a model may be generated by using various methods. For example, the extraction device 100 uses a summary sentence that manually summarizes the description sentence as learning data together with the description sentence. That is, the extraction device 100 performs machine learning using the abstract sentence in which the explanatory text is artificially summarized as correct answer data and the words and phrases extracted in the process as the feature information in the explanatory text. In this case, the extraction device 100 can learn the characteristics of the words and phrases extracted during the manual summarization process by using a sufficient sample for learning. Therefore, when a new explanatory text is input to the model, the extraction device 100 can extract words and phrases that are assumed to be important from the explanatory text by simulating the process of manually creating the summary text. This extracted information can be characteristic information of the description (in other words, the property associated with the description).

また、抽出装置100は、統計処理による学習によってモデルを生成してもよい。例えば、抽出装置100は、ある説明文に含まれる語句であって、その説明文を特徴付ける語句を抽出するための学習を行う。かかる処理は、例えば、説明文を一つのドキュメントと捉えた場合、ドキュメントにおける各単語の重要度を算出し、その重要度に基づいてドキュメントから語句を抽出するようなルールを生成することによって行われる。例えば、抽出装置100は、tf−idf(Term Frequency−Inverse Document Frequency)等の指標値に基づいて、ある説明文(ドキュメント)が入力された場合に、当該説明文のうち、説明文を特徴付ける語句を抽出(出力)するようなモデルを生成してもよい。 Further, the extraction device 100 may generate a model by learning by statistical processing. For example, the extraction device 100 performs learning to extract words and phrases included in a certain explanatory text and characterizing the explanatory text. Such processing is performed, for example, when the description is regarded as one document, the importance of each word in the document is calculated, and a rule for extracting words from the document based on the importance is generated. .. For example, when a certain explanatory text (document) is input based on an index value such as tf-idf (Term Frequency-Inverse Document Frequency), the extraction device 100 uses the phrase that characterizes the explanatory text. You may generate a model that extracts (outputs).

また、抽出装置100は、例えばディープラーニング(Deep Learning)の手法を用いてモデルを生成してもよい。すなわち、抽出装置100は、ディープラーニングの手法を用いて、説明文において特徴となりうる箇所を抽出するための学習を行う。例えば、抽出装置100が生成するモデルは、入力されたデータに対する演算結果を出力する複数のノードを多層に接続したモデルであって、テキストデータが含む特徴を学習するためのモデルである。例えば、モデルは、複数のノードを有する層を多段に接続したニューラルネットワークであり、いわゆるディープラーニングの技術により実現されるDNN(Deep Neural Network)である。 Further, the extraction device 100 may generate a model by using, for example, a method of deep learning. That is, the extraction device 100 uses a deep learning method to perform learning for extracting a portion that can be a feature in the explanatory text. For example, the model generated by the extraction device 100 is a model in which a plurality of nodes that output calculation results for the input data are connected in multiple layers, and is a model for learning the features included in the text data. For example, the model is a neural network in which layers having a plurality of nodes are connected in multiple stages, and is a DNN (Deep Neural Network) realized by a so-called deep learning technique.

例えば、モデルは、ディープラーニングの技術により、以下のような学習手法により生成される。モデルには、各ノードの間の接続係数が初期化され、様々な語句を有するテキストが入力される。そして、モデルは、モデルにおける出力と、入力との誤差が少なくなるようにパラメータ(接続係数)を補正するバックプロパゲーション(Backpropagation(誤差逆伝播法))等の処理により生成される。例えば、モデルは、説明文を構成するテキストデータが入力された際に、その説明文に含まれる特徴情報(例えば、説明文を特徴付ける語句)を出力するように、学習が行われる。なお、学習過程において、モデルの出力に対して、例えば手動によって適切なフィードバックを返すなどの調整が行われてもよい。 For example, the model is generated by the following learning method by the deep learning technique. The connection factor between each node is initialized in the model, and text with various phrases is input. Then, the model is generated by processing such as backpropagation (Backpropagation) that corrects parameters (connection coefficients) so that the error between the output and the input in the model is reduced. For example, the model is trained so as to output the feature information (for example, words and phrases that characterize the description) included in the description when the text data constituting the description is input. In the learning process, adjustments may be made to the output of the model, such as manually returning appropriate feedback.

なお、モデルの学習手法や、生成されるモデルについては、上述した手法に限定されるものではなく、任意の公知技術が適用可能である。すなわち、抽出装置100は、テキストデータから抽象化された特徴を示す特徴情報を出力できるのであれば、任意のモデルを用いることができる。抽出装置100は、学習フェーズにおいて生成したモデルを所定の記憶部に格納する。上記が、実施形態に係る学習フェーズである。 The model learning method and the generated model are not limited to the above-mentioned methods, and any known technique can be applied. That is, the extraction device 100 can use any model as long as it can output the feature information indicating the abstracted feature from the text data. The extraction device 100 stores the model generated in the learning phase in a predetermined storage unit. The above is the learning phase according to the embodiment.

その後、抽出装置100は、生成フェーズとして、ユーザが不動産情報サイト等を利用する場合に、物件に対応付けられた説明文のうち特にアピールポイントとなる点を抽出し、抽出された情報に基づいてアピールページを生成する処理を行う。 After that, as the generation phase, the extraction device 100 extracts points that are particularly appealing points from the explanations associated with the property when the user uses the real estate information site or the like, and based on the extracted information. Performs the process of generating an appeal page.

例えば、ユーザは、不動産情報サイトにおいて、商材に関する条件を入力することで、閲覧したい商材(物件)を指定する(ステップS21)。例えば、ユーザは、物件が所在する地域や最寄り駅といった条件を指定することで、閲覧を所望する物件を絞り込む。そして、ユーザは、図1の例において、絞り込んだ物件のうち所定の物件XXXを閲覧するものとする。例えば、ユーザは、条件を指定したのちに提示された物件群の中から、所定の物件XXXを閲覧するためのリンクをクリックしたものとする。 For example, the user specifies the product (property) to be browsed by inputting the conditions related to the product on the real estate information site (step S21). For example, the user narrows down the properties that he / she wants to browse by specifying conditions such as the area where the property is located and the nearest station. Then, in the example of FIG. 1, the user browses the predetermined property XXX among the narrowed down properties. For example, it is assumed that the user clicks the link for browsing the predetermined property XXX from the property group presented after specifying the conditions.

このとき、抽出装置100は、ユーザから指定された内容に基づいて形成される集合を特定する。ここで、集合とは、抽出装置100がデータベース化した物件のうち、ユーザから指定された内容に適合した複数の物件を示す。例えば、集合は、ユーザが指定した条件によって絞り込まれた物件群と共通する。 At this time, the extraction device 100 specifies a set formed based on the contents specified by the user. Here, the set refers to a plurality of properties that match the contents specified by the user among the properties that the extraction device 100 has created in the database. For example, the set is common to the property group narrowed down by the conditions specified by the user.

そして、抽出装置100は、ユーザが閲覧しようとする物件に含まれる商材情報のうち、集合に含まれる物件に対して、優位な項目を特徴情報として抽出する(ステップS22)。例えば、抽出装置100は、物件XXXという商材に対応付けられている商材情報のうち、集合に含まれる複数の物件の商材情報と比較した場合に優位な項目を抽出する。 Then, the extraction device 100 extracts, as feature information, an item that is superior to the property included in the set from the product information included in the property that the user intends to browse (step S22). For example, the extraction device 100 extracts an item that is superior when compared with the product information of a plurality of properties included in the set from the product information associated with the product XXX.

例えば、抽出装置100は、予め構築していたデータベースを参照し、物件XXXに対応付けられている商材情報のうち、集合と比較して家賃が比較的安い(例えば、集合において家賃が安い順から上位2割に属するなど)という優位性を判定する。また、抽出装置100は、物件XXXに対応付けられている商材情報のうち、集合と比較して最寄り駅からの距離が比較的近い(例えば、集合において最寄り駅からの距離が近い順から上位2割に属するなど)という優位性を判定する。 For example, the extraction device 100 refers to a database constructed in advance, and among the product information associated with the property XXX, the rent is relatively cheap compared to the set (for example, in the order of the cheapest rent in the set). To determine the superiority of (belonging to the top 20%, etc.). Further, the extraction device 100 has a relatively short distance from the nearest station as compared with the set among the product information associated with the property XXX (for example, in the set, the distance from the nearest station is higher in the order of the closest distance). Judge the superiority of (belonging to 20%, etc.).

さらに、抽出装置100は、物件XXXに対応付けられている商材情報として、事業者からアップロードされた説明文F10を取得する。そして、抽出装置100は、取得した説明文F10から、物件の特徴を示す情報である特徴情報を抽出する。具体的には、抽出装置100は、取得した説明文F10をモデルに入力し、説明文F10における特徴情報を出力させる。 Further, the extraction device 100 acquires the explanatory text F10 uploaded from the business operator as the product information associated with the property XXX. Then, the extraction device 100 extracts the feature information, which is the information indicating the feature of the property, from the acquired explanatory text F10. Specifically, the extraction device 100 inputs the acquired explanatory text F10 into the model and outputs the feature information in the explanatory text F10.

例えば、抽出装置100は、商材のカテゴリ「不動産」に対応して生成されたモデルを用いることで、説明文F10における特徴情報として、「家賃」や「角部屋」や「駅からは」や「築年数」等を抽出するものとする。さらに、抽出装置100は、抽出した特徴情報の近傍(例えば、説明文F10を形態素解析した場合に、前後の所定数に含まれる語句)についても、特徴情報と関連する語句として抽出する。かかる処理には、例えば、重要文抽出等の既存の処理手法が応用されてもよい。 For example, the extraction device 100 uses a model generated corresponding to the product category "real estate", and as feature information in the explanation F10, "rent", "corner room", "from the station", etc. "Age" etc. shall be extracted. Further, the extraction device 100 also extracts the vicinity of the extracted feature information (for example, words and phrases included in a predetermined number before and after the explanatory text F10 when morphological analysis is performed) as words and phrases related to the feature information. For such processing, an existing processing method such as extraction of important sentences may be applied.

そして、抽出装置100は、抽出された特徴情報のうち、物件XXXが集合において優位である特徴をさらに特定する。図1の例では、物件XXXは、「家賃」と、「最寄り駅からの時間(距離)」に対応する項目が、集合において優位な特徴である。このため、抽出装置100は、抽出されたこれらの項目が物件XXXにおける特徴情報であると判定して、抽出された特徴情報をアピールするアピールページを生成する(ステップS23)。 Then, the extraction device 100 further identifies the feature in which the property XXX is superior in the set among the extracted feature information. In the example of FIG. 1, in the property XXX, the items corresponding to "rent" and "time (distance) from the nearest station" are advantageous features in the set. Therefore, the extraction device 100 determines that these extracted items are the feature information in the property XXX, and generates an appeal page that appeals the extracted feature information (step S23).

具体的には、抽出装置100は、事業者によって物件XXXに対応付けられていた説明文F10のうち、「家賃」と「最寄り駅からの時間(距離)」の項目に対応する語句を強調表示した態様のアピールページを生成する。より具体的には、抽出装置100は、抽出された特徴を示す語句をハイライト表示したアピールページを生成する。 Specifically, the extraction device 100 highlights the words and phrases corresponding to the items of "rent" and "time (distance) from the nearest station" in the explanatory text F10 associated with the property XXX by the business operator. Generate an appeal page of the above-mentioned aspect. More specifically, the extraction device 100 generates an appeal page that highlights words and phrases indicating the extracted features.

例えば、図1に示すように、抽出装置100は、説明文F10のうち、「家賃は、このあたりではお手頃価格の65000円」という箇所と、「駅からは徒歩5分」という箇所をハイライト表示したアピールページW10を生成する(図1では、図示のため、該当箇所を枠で囲う態様で表現している)。なお、抽出装置100は、アピールページW10を新たに生成するのではなく、元の物件の紹介ページに対して、強調表示する旨の命令(例えば、特徴情報に該当する箇所が強調表示される命令が記載されたスクリプト)を追加することにより、アピールページW10を生成してもよい。図1の例では、アピールページW10は、説明文F10や、物件XXXの画像P10を含む紹介ページに対して、「家賃」や「駅からの距離」等が強調表示されたコンテンツである。 For example, as shown in FIG. 1, the extraction device 100 has high points in the explanation F10 where "the rent is a reasonable price of 65,000 yen" and "a 5-minute walk from the station". A light-displayed appeal page W10 is generated (in FIG. 1, for illustration purposes, the relevant portion is represented by a frame). The extraction device 100 does not newly generate the appeal page W10, but gives an instruction to highlight the introduction page of the original property (for example, an instruction to highlight the part corresponding to the feature information). The appeal page W10 may be generated by adding a script) in which is described. In the example of FIG. 1, the appeal page W10 is a content in which "rent", "distance from the station", etc. are highlighted with respect to the explanation page F10 and the introduction page including the image P10 of the property XXX.

そして、抽出装置100は、生成したアピールページW10をユーザに提供する(ステップS24)。ユーザは、アピールページW10を閲覧することにより、元の事業者によって対応付けられていた物件XXXの説明文F10に記載された情報のみならず、物件XXXが集合に対してどのような優れた特徴を有しているかを把握することができる。具体的には、ユーザは、物件XXXの説明文F10を閲覧しつつ、自身が所望する条件を満たす物件のなかでも、物件XXXは比較的家賃が安いことや、駅からの距離が近いことを把握することができる。すなわち、ユーザは、物件が紹介されたページを閲覧する際に、冗長な説明文F10を全て読まずとも、抽出装置100によって強調表示が施された特徴を読むことで、物件XXXの特徴を効率良く把握することができる。 Then, the extraction device 100 provides the generated appeal page W10 to the user (step S24). By browsing the appeal page W10, the user can see not only the information described in the description F10 of the property XXX associated with the original business operator, but also what excellent features the property XXX has for the set. It is possible to grasp whether or not it has. Specifically, the user browses the description F10 of the property XXX and finds that the rent of the property XXX is relatively low and the distance from the station is short among the properties that satisfy the conditions desired by the user. Can be grasped. That is, when the user browses the page where the property is introduced, the feature of the property XXX is made efficient by reading the feature highlighted by the extraction device 100 without reading all the redundant explanations F10. I can grasp it well.

このように、実施形態に係る抽出装置100は、ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する。そして、抽出装置100は、ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、所定の商材の商材情報のうち、集合において所定の条件を満たす情報(例えば、上位の2割に属するスペックを有する項目など)である特徴情報を抽出する。さらに、抽出装置100は、抽出された特徴情報に基づいて、所定の商材に関するアピールページを生成する。 In this way, the extraction device 100 according to the embodiment acquires the product information associated with the product that is the target of the commercial transaction on the network. Then, the extraction device 100 includes information (for example,) that satisfies a predetermined condition in the set among the product information of the predetermined product in the predetermined product included in the set formed based on the content specified by the user. , Items with specifications belonging to the top 20%, etc.) Extract feature information. Further, the extraction device 100 generates an appeal page for a predetermined product based on the extracted feature information.

具体的には、抽出装置100は、不動産情報サイトにおける物件紹介ページ等において、種々の事業者によって設定された商材情報から、物件の特徴を抽出し、抽出された特徴に基づいてアピールページW10を生成する。これにより、抽出装置100は、事業者によって付与された説明文F10等の情報は維持しつつ、集合において特に優れた特徴を有する物件であることを示す情報と採りいれたアピールページW10を生成することができる。結果として、抽出装置100は、商取引サイトにおける情報の伝達性を向上させるとともに、商材に関する特徴をより柔軟にアピールすることができるという効果を奏することができる。 Specifically, the extraction device 100 extracts the characteristics of the property from the product information set by various businesses on the property introduction page or the like on the real estate information site, and appeal page W10 based on the extracted characteristics. To generate. As a result, the extraction device 100 generates the information indicating that the property has particularly excellent characteristics in the set and the appeal page W10 adopted while maintaining the information such as the explanatory text F10 given by the business operator. be able to. As a result, the extraction device 100 can have the effect of improving the transmissibility of information on the commercial transaction site and more flexibly appealing the characteristics of the product.

なお、抽出装置100は、学習処理を補完するため、種々の情報を用いてもよい。例えば、上記で説明した学習フェーズにおいて、抽出装置100は、抽出装置100によって生成されたアピールページW10を介して、ユーザがコンバージョン(例えば、物件の問い合わせを行ったり、賃貸契約を申し込んだりしたこと等)に至ったかといった結果情報(ユーザの反応)を取得してもよい。そして、抽出装置100は、例えばコンバージョン率が高いなど、ユーザの反応が良かったアピールページW10に付与された特徴情報を正解データとして、学習処理にフィードバックしてもよい。これにより、抽出装置100は、ユーザにアピールするポイントを説明文から抽出するという処理を最適化するよう、学習を進めることができる。以下、このような処理を行う抽出装置100、及び、抽出装置100を含む抽出処理システム1の構成等について、詳細に説明する。 The extraction device 100 may use various information to supplement the learning process. For example, in the learning phase described above, in the extraction device 100, the user has converted (for example, inquired about the property or applied for a rental contract) via the appeal page W10 generated by the extraction device 100. ) May be obtained as a result information (user reaction). Then, the extraction device 100 may feed back the feature information given to the appeal page W10, which has a good user response, such as a high conversion rate, as correct answer data to the learning process. As a result, the extraction device 100 can proceed with learning so as to optimize the process of extracting the points appealing to the user from the explanation. Hereinafter, the configuration of the extraction device 100 that performs such processing and the extraction processing system 1 including the extraction device 100 will be described in detail.

〔2.抽出処理システムの構成〕
次に、図2を用いて、実施形態に係る抽出装置100が含まれる抽出処理システム1の構成について説明する。図2は、実施形態に係る抽出処理システム1の構成例を示す図である。図2に例示するように、実施形態に係る抽出処理システム1には、ユーザ端末10と、事業者端末20と、ウェブサーバ30と、抽出装置100とが含まれる。これらの各種装置は、ネットワークNを介して、有線又は無線により通信可能に接続される。なお、図2に示した抽出処理システム1には、複数台のユーザ端末10や、複数台の事業者端末20や、複数台のウェブサーバ30が含まれてもよい。
[2. Extraction processing system configuration]
Next, the configuration of the extraction processing system 1 including the extraction device 100 according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing a configuration example of the extraction processing system 1 according to the embodiment. As illustrated in FIG. 2, the extraction processing system 1 according to the embodiment includes a user terminal 10, a business operator terminal 20, a web server 30, and an extraction device 100. These various devices are communicably connected via network N by wire or wirelessly. The extraction processing system 1 shown in FIG. 2 may include a plurality of user terminals 10, a plurality of business terminal 20s, and a plurality of web servers 30.

ユーザ端末10は、例えば、スマートフォンや、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット型端末や、携帯電話機、PDA(Personal Digital Assistant)、ウェアラブルデバイス(Wearable Device)等の情報処理装置である。ユーザ端末10は、ユーザによる操作に従って商取引サイトにアクセスし、商取引サイトにおいてユーザが情報を閲覧したり、物件に対する契約を申し込んだりするための処理を行う。 The user terminal 10 is, for example, an information processing device such as a smartphone, a desktop PC (Personal Computer), a notebook PC, a tablet terminal, a mobile phone, a PDA (Personal Digital Assistant), or a wearable device (Wearable Device). Is. The user terminal 10 accesses the commercial transaction site according to the operation by the user, and performs a process for the user to browse the information or apply for a contract for the property on the commercial transaction site.

事業者端末20は、商取引サイトにおいて物件をアップロードする事業者によって利用される情報処理端末である。事業者端末20は、例えば、スマートフォンや、デスクトップ型PCや、ノート型PCや、タブレット型端末や、携帯電話機、PDA、ウェアラブルデバイス等の情報処理装置である。 The business terminal 20 is an information processing terminal used by a business that uploads a property on a commercial transaction site. The business terminal 20 is, for example, an information processing device such as a smartphone, a desktop PC, a notebook PC, a tablet terminal, a mobile phone, a PDA, or a wearable device.

事業者端末20は、事業者による操作に従って、商取引サイトに物件をアップロードするための種々の処理を実行する。例えば、事業者端末20は、物件のタイトルや説明文等のテキストデータを、商取引サイトを提供するウェブサーバ30にアップロードする。また、事業者端末20は、物件のスペック(家賃等)に関する情報を含む商材情報をウェブサーバ30にアップロードする。 The business operator terminal 20 executes various processes for uploading the property to the commercial transaction site according to the operation by the business operator. For example, the business terminal 20 uploads text data such as a property title and a description to a web server 30 that provides a commercial transaction site. In addition, the business terminal 20 uploads product information including information on property specifications (rent, etc.) to the web server 30.

ウェブサーバ30は、ユーザ端末10からアクセスされた場合に、コンテンツ(例えば、ウェブページ)を提供するサーバ装置である。実施形態では、ウェブサーバ30は、所定の商取引サイト(例えば不動産情報サイト)提供するが、他にも、ニュースサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各種ウェブページを提供してもよい。 The web server 30 is a server device that provides content (for example, a web page) when accessed from the user terminal 10. In the embodiment, the web server 30 provides a predetermined commercial transaction site (for example, a real estate information site), but also a news site, a weather forecast site, a shopping site, a finance (stock price) site, a route search site, and a map providing site. , Travel sites, restaurant introduction sites, web blogs, etc. may be provided.

なお、ウェブサーバ30によって提供されるウェブページには、広告を表示するための表示領域である広告枠や、商材に関するレコメンドを表示するための表示領域であるレコメンド枠が含まれてもよい。詳細は後述するが、抽出装置100は、広告枠やレコメンド枠に表示される商材の特徴情報を生成してもよい。 The web page provided by the web server 30 may include an advertising space that is a display area for displaying advertisements and a recommendation frame that is a display area for displaying recommendations related to products. Although the details will be described later, the extraction device 100 may generate the feature information of the product displayed in the advertisement frame or the recommendation frame.

抽出装置100は、商材に対応付けられた商材情報を取得するとともに、ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、所定の商材の商材情報のうち、集合において所定の条件を満たす情報である特徴情報を抽出する。さらに、抽出装置100は、抽出された特徴情報に基づいて、所定の商材に関するアピールページを生成する。 The extraction device 100 acquires the product information associated with the product, and also obtains the product information of the predetermined product in the predetermined product included in the set formed based on the contents specified by the user. Among them, feature information which is information satisfying a predetermined condition in the set is extracted. Further, the extraction device 100 generates an appeal page for a predetermined product based on the extracted feature information.

そして、抽出装置100は、ユーザからアクセスを受け付けた場合に、生成したアピールページをユーザ端末10に提供する。なお、実施形態に係る抽出装置100は、商取引サイトを運営や管理したり、事業者からアップロードされた情報を管理したりするような、ウェブサーバ30としての構成を兼ねてもよい。すなわち、抽出装置100とウェブサーバ30とは、別個の装置であってもよいし、双方の機能を兼ねる装置によって実現されてもよい。 Then, when the extraction device 100 receives access from the user, the extraction device 100 provides the generated appeal page to the user terminal 10. The extraction device 100 according to the embodiment may also have a configuration as a web server 30 that operates and manages a commercial transaction site and manages information uploaded by a business operator. That is, the extraction device 100 and the web server 30 may be separate devices, or may be realized by a device having both functions.

〔3.抽出装置の構成〕
次に、図3を用いて、実施形態に係る抽出装置100の構成について説明する。図3は、実施形態に係る抽出装置100の構成例を示す図である。図3に示すように、抽出装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、抽出装置100は、抽出装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[3. Extractor configuration]
Next, the configuration of the extraction device 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram showing a configuration example of the extraction device 100 according to the embodiment. As shown in FIG. 3, the extraction device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The extraction device 100 includes an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from an administrator or the like who uses the extraction device 100, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. You may have.

(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、ユーザ端末10や、事業者端末20や、ウェブサーバ30との間で情報の送受信を行う。
(About communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the user terminal 10, the business terminal 20, and the web server 30 via the network N.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、商材情報記憶部121と、学習情報記憶部122と、提供情報記憶部123とを有する。
(About storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. The storage unit 120 includes a product information storage unit 121, a learning information storage unit 122, and a provision information storage unit 123.

(商材情報記憶部121について)
商材情報記憶部121は、商取引サイトにアップロードされる商材に関する情報を記憶する。ここで、図4に、実施形態に係る商材情報記憶部121の一例を示す。図4は、実施形態に係る商材情報記憶部121の一例を示す図である。図4に示した例では、商材情報記憶部121は、「商材ID」、「商材情報」といった項目を有する。また、「商材情報」は、「カテゴリ」、「地域」、「間取り」、「家賃」、「最寄り駅からの時間」、「広さ」、「築年数」、「ペット」、「説明文」といった小項目を有する。
(About the product information storage unit 121)
The product information storage unit 121 stores information about the product uploaded to the commercial transaction site. Here, FIG. 4 shows an example of the product information storage unit 121 according to the embodiment. FIG. 4 is a diagram showing an example of the product information storage unit 121 according to the embodiment. In the example shown in FIG. 4, the product information storage unit 121 has items such as "product ID" and "product information". In addition, "product information" includes "category", "region", "floor plan", "rent", "time from the nearest station", "size", "age", "pet", and "description". It has a small item such as ".

「商材ID」は、商材を識別するための識別情報を示す。なお、実施形態において、商材IDのような識別情報は、説明で用いる参照符号と共通するものとする。例えば、商材IDが「B01」である商材を「商材B01」と表記する場合がある。 The "product ID" indicates identification information for identifying the product. In the embodiment, the identification information such as the product ID is the same as the reference code used in the description. For example, a product whose product ID is "B01" may be described as "product B01".

「商材情報」は、商材に対応付けられている情報を示す。例えば、商材情報は、商材のスペックを示す項目と、項目ごとの値等によって構成される。また、商材情報には、商材の提供者である事業者によって設定された説明文や、商材のタイトル等の情報が含まれる。 "Product information" indicates information associated with a product. For example, product information is composed of items indicating the specifications of the product, values for each item, and the like. In addition, the product information includes information such as a description set by the business operator who is the provider of the product and the title of the product.

なお、商材情報は、商材のカテゴリごとに異なる情報を含む。例えば、商材のカテゴリが「不動産」である場合には、商材情報に「家賃」や「広さ」等の項目が含まれる。あるいは、商材のカテゴリが「パソコン」である場合には、商材情報に「CPU」や「メモリ容量」等の項目が含まれる。 The product information includes information different for each product category. For example, when the product category is "real estate", the product information includes items such as "rent" and "size". Alternatively, when the product category is "computer", the product information includes items such as "CPU" and "memory capacity".

「カテゴリ」は、商取引サイトにおける商材が属するカテゴリを示す。「地域」は、商材(図4の例では、物件)が所在する地域を示す。「間取り」は、物件の間取りを示す。「家賃」は、物件の家賃を示す。「最寄り駅からの時間」は、最寄り駅からの距離、もしくは、最寄り駅からかかる移動時間等を示す。「広さ」は、物件の専有面積を示す。「築年数」は、物件が建てられてから経過した年数を示す。「ペット」は、ペット飼育が可能な物件が否かといった情報を示す。 "Category" indicates the category to which the product belongs on the commercial transaction site. “Region” indicates the region where the product (property in the example of FIG. 4) is located. “Floor plan” indicates the floor plan of the property. "Rent" indicates the rent of the property. "Time from the nearest station" indicates the distance from the nearest station, the travel time from the nearest station, and the like. "Area" indicates the occupied area of the property. "Age" indicates the number of years that have passed since the property was built. “Pet” indicates information such as whether or not there is a property where pets can be bred.

「説明文」は、物件に対応付けられた説明文を示す。なお、図4で示した例では、「説明文」を「F01」といった概念で示しているが、実際には、説明文の項目には、説明文を構成するテキストデータが記憶される。 The “description” indicates a description associated with the property. In the example shown in FIG. 4, the "explanatory text" is shown by a concept such as "F01", but in reality, the text data constituting the explanatory text is stored in the item of the explanatory text.

すなわち、図4に示したデータの一例は、商材ID「B01」によって識別される商材B01における商材のカテゴリは「不動産」であり、商材B01の商材情報は、所在する地域が「AAA区」であり、間取りが「1K」であり、家賃が「65000」円であり、最寄り駅からの時間が「徒歩5分」であり、広さが「22」平米であり、ペット飼育が「可」であり、説明文は「F01」であることを示している。 That is, in an example of the data shown in FIG. 4, the category of the product in the product B01 identified by the product ID "B01" is "real estate", and the product information of the product B01 is based on the area where the product is located. It is "AAA Ward", the floor plan is "1K", the rent is "65,000" yen, the time from the nearest station is "5 minutes on foot", the area is "22" square meters, and pet breeding. Is "OK" and the description is "F01".

(学習情報記憶部122について)
学習情報記憶部122は、商材情報に基づく学習処理に関する情報を記憶する。ここで、図5に、実施形態に係る学習情報記憶部122の一例を示す。図5は、実施形態に係る学習情報記憶部122の一例を示す図である。図5に示した例では、学習情報記憶部122は、「学習データID」、「学習データ」、「カテゴリ」、「抽出項目」といった項目を有する。
(About learning information storage unit 122)
The learning information storage unit 122 stores information related to learning processing based on product information. Here, FIG. 5 shows an example of the learning information storage unit 122 according to the embodiment. FIG. 5 is a diagram showing an example of the learning information storage unit 122 according to the embodiment. In the example shown in FIG. 5, the learning information storage unit 122 has items such as "learning data ID", "learning data", "category", and "extracted item".

「学習データID」は、学習データを識別するための識別情報を示す。「学習データ」は、実際に学習処理に用いられた学習データの内容を示す。例えば、実施形態に係る学習データは、商材に対応付けられた商材情報である。 The "learning data ID" indicates identification information for identifying the learning data. The “learning data” indicates the content of the learning data actually used in the learning process. For example, the learning data according to the embodiment is product information associated with the product.

「カテゴリ」は、商材が属するカテゴリを示す。例えば、抽出装置100は、商材のカテゴリごとに学習を行い、カテゴリごとにモデルを生成する。「抽出項目」は、各カテゴリにおいて特徴情報として抽出されるように学習された項目を示す。 "Category" indicates the category to which the product belongs. For example, the extraction device 100 performs learning for each category of products and generates a model for each category. “Extracted items” indicate items learned to be extracted as feature information in each category.

すなわち、図5に示したデータの一例は、学習データID「C01」によって識別される学習データC01は、商材「B01」や商材「B02」や商材「B03」等を学習データとして学習されたことを示しており、そのカテゴリは「不動産」であり、特徴情報として抽出項目は、例えば、「家賃」や、「広さ」や、「最寄り駅からの時間」や、「築年数」であることを示している。 That is, as an example of the data shown in FIG. 5, the learning data C01 identified by the learning data ID “C01” learns the product “B01”, the product “B02”, the product “B03”, etc. as learning data. The category is "real estate", and the items extracted as characteristic information are, for example, "rent", "size", "time from the nearest station", and "age". It shows that.

なお、学習情報記憶部122には、上記学習データに基づいて学習されたモデル自体が記憶されてもよい。また、抽出装置100は、学習情報記憶部122に記憶された学習データを適宜更新するとともに、生成したモデルの学習を継続しても
よい。
The learning information storage unit 122 may store the model itself learned based on the learning data. Further, the extraction device 100 may update the learning data stored in the learning information storage unit 122 as appropriate, and may continue learning the generated model.

また、図5に示した例では、抽出項目として「家賃」等を示したが、抽出装置100は、必ずしも「家賃」という語句のみを抽出するのではなく、「家賃」を示すと想定される同義語等を抽出項目として記憶してもよい。例えば、抽出装置100は、手動による設定や、学習処理によって、「家賃」と「毎月の支払額」等の語句を同義と推定する。この場合、抽出装置100は、説明文の中に「家賃」という明確な語句が登場せずとも、「毎月の支払額は・・・」といった語句が登場した場合に、その語句を「家賃」に対応する特徴情報として抽出することができる。 Further, in the example shown in FIG. 5, "rent" and the like are shown as extraction items, but it is assumed that the extraction device 100 does not necessarily extract only the phrase "rent" but indicates "rent". Synonyms and the like may be stored as extraction items. For example, the extraction device 100 estimates that terms such as "rent" and "monthly payment amount" are synonymous by manual setting or learning processing. In this case, the extraction device 100 uses the phrase "rent" when the phrase "monthly payment is ..." appears even if the phrase "rent" does not appear in the description. Can be extracted as feature information corresponding to.

また、図5での図示は省略するが、学習データの項目には、学習に用いる商材情報のみならず、例えば、特徴情報として抽出すべき項目として手動で設定された情報や、説明文に基づいて手動で作成された要約文等の正解データ等が含まれてもよい。また、学習においてディープラーニングの手法を用いる場合には、学習は、必ずしも正例(正解データ)が明確に判明している学習データのみを用いることを要しない。例えば、抽出装置100は、商材情報に含まれるテキストデータ(ドキュメント)の特徴を抽出し、当該テキストデータに含まれる特徴情報を認識できる学習が行えるのであれば、必ずしも正解データを必要としない。 Further, although not shown in FIG. 5, the learning data items include not only the product information used for learning, but also, for example, information manually set as an item to be extracted as feature information and explanatory text. Correct answer data such as a summary sentence manually created based on the above may be included. Further, when a deep learning method is used in learning, it is not always necessary to use only learning data for which a correct example (correct answer data) is clearly known. For example, the extraction device 100 does not necessarily require correct answer data as long as it can extract the features of the text data (document) included in the product information and can learn to recognize the feature information included in the text data.

(提供情報記憶部123について)
提供情報記憶部123は、ユーザに提供されるページであって、抽出装置100によって生成されるページ(アピールページ)に関する情報を記憶する。ここで、図6に、実施形態に係る提供情報記憶部123の一例を示す。図6は、実施形態に係る提供情報記憶部123の一例を示す図である。図6に示した例では、提供情報記憶部123は、「アピールページID」、「元の商材ID」、「集合情報」、「抽出項目」、「アピールポイント」、「効果測定情報」、「レビュー情報」といった項目を有する。
(About the provided information storage unit 123)
The provided information storage unit 123 stores information about a page (appeal page) that is provided to the user and is generated by the extraction device 100. Here, FIG. 6 shows an example of the provided information storage unit 123 according to the embodiment. FIG. 6 is a diagram showing an example of the provided information storage unit 123 according to the embodiment. In the example shown in FIG. 6, the provided information storage unit 123 has the "appeal page ID", "original product ID", "aggregate information", "extracted item", "appeal point", "effect measurement information", It has items such as "review information".

「アピールページID」は、抽出装置100によって生成されたアピールページを識別するための識別情報を示す。「元の商材ID」は、アピールページの元となった商材の識別情報を示す。 The "appeal page ID" indicates identification information for identifying the appeal page generated by the extraction device 100. The "original product ID" indicates the identification information of the product that is the source of the appeal page.

「集合情報」は、ユーザから指定された形成される集合に関する情報を示す。図6に示した例では、「集合情報」を「F01」といった概念で示しているが、実際には、種々の具体的な情報が記憶される。例えば、集合情報には、ユーザが指定した条件や、ユーザが指定した条件に基づいて形成された集合に含まれる複数の商材の識別情報等が含まれる。なお、集合情報は、動的な情報である。すなわち、集合は、ユーザが指定する条件等を変更するたびに変化するため、集合情報についても、ユーザが指定する条件等を変更するたびに変化する。また、集合が変化することに伴い、集合における優位な情報も変化することから、アピールページにおいて強調表示される項目(特徴情報)も変化することになる。 The "set information" indicates information about the formed set specified by the user. In the example shown in FIG. 6, "set information" is shown by a concept such as "F01", but in reality, various specific information is stored. For example, the set information includes a condition specified by the user, identification information of a plurality of products included in the set formed based on the condition specified by the user, and the like. The set information is dynamic information. That is, since the set changes every time the condition or the like specified by the user is changed, the set information also changes every time the condition or the like specified by the user is changed. In addition, as the set changes, the dominant information in the set also changes, so the items (feature information) highlighted on the appeal page also change.

「抽出項目」は、図5で示した同一の項目に対応する。「アピールポイント」は、商材を特徴付ける情報として抽出された項目のうち、集合において優位である項目を示す。例えば、集合に含まれる複数の商材の中で、家賃の値段が他の商材と比較して優位である場合、アピールポイントには「家賃」の項目が含まれることになる。なお、上述のように、いずれの項目が「優位」であるかといった条件については、例えば抽出装置100の管理者等によって人為的に設定されてもよい。 The “extracted item” corresponds to the same item shown in FIG. The "appeal point" indicates an item that is superior in the set among the items extracted as information that characterizes the product. For example, if the rent price is superior to other products among a plurality of products included in the set, the appeal point will include the item of "rent". As described above, the condition such as which item is "superior" may be artificially set by, for example, the administrator of the extraction device 100.

「効果測定情報」は、アピールページに対するユーザの反応に関する情報のうち、アピールページが効果を発揮したことを示す結果情報を示す。「レビュー情報」は、アピールページに対するユーザの反応に関する情報のうち、アピールページに対してユーザから投稿されたレビューに関する情報を示す。なお、図6に示した例では、「効果測定情報」や「レビュー情報」を、「G01」や「H01」といった概念で示しているが、実際には、種々の具体的な情報が記憶される。 The “effect measurement information” indicates the result information indicating that the appeal page is effective among the information regarding the user's reaction to the appeal page. The "review information" indicates the information regarding the review posted by the user to the appeal page among the information regarding the user's reaction to the appeal page. In the example shown in FIG. 6, "effect measurement information" and "review information" are shown by concepts such as "G01" and "H01", but in reality, various specific information is stored. To.

例えば、「効果測定情報」には、当該アピールページがユーザからアクセスされた数や、当該アピールページにおいてコンバージョン(Conversion)に至ったユーザの数や率が記憶されてもよい。コンバージョンの例としては、アピールページの物件の内覧申込みを行なったことや、物件の紹介ページ(例えば、物件を提供する事業者のウェブページ)にアクセスしたこと等が挙げられる。また、効果測定情報には、例えば、内覧等の具体的な行動に至らなくても、物件がユーザから選択された数(クリックやタッチされた数等)もしくは率が記憶されてもよい。また、効果測定情報には、ユーザがアピールページにアクセスする頻度や、アピールページに滞在した時間等が記憶されてもよい。すなわち、効果測定情報には、アピールページに対するユーザの反応に関する情報であれば、いずれの情報が記憶されてもよい。 For example, the “effect measurement information” may store the number of times the appeal page is accessed by the user, and the number and rate of users who have converted on the appeal page. Examples of conversions include applying for a preview of the property on the appeal page and accessing the property introduction page (for example, the web page of the company that provides the property). Further, in the effect measurement information, for example, the number (the number of clicks or touches, etc.) or the rate of properties selected by the user may be stored even if a specific action such as a preview is not reached. In addition, the effect measurement information may store the frequency with which the user accesses the appeal page, the time spent on the appeal page, and the like. That is, any information may be stored in the effect measurement information as long as it is information on the user's reaction to the appeal page.

また、「レビュー情報」には、アピールページに対するユーザレビューに関する情報が記憶される。例えば、アピールページにおいて、ユーザが5段階の数値で物件を評価するようなシステムが採用されている場合、レビュー情報には、ユーザから評価された点数が記憶される。例えば、レビュー情報には、ユーザから送信される「0」から「5」までの数値の平均値が記憶される。また、レビュー情報には、ユーザレビューがユーザから送信された数や率、あるいは、具体的なユーザレビューのコメント(テキストデータ)等が記憶されてもよい。すなわち、レビュー情報には、アピールページに対するユーザレビューに関する情報であれば、いずれの情報が記憶されてもよい。 In addition, the "review information" stores information regarding user reviews for the appeal page. For example, when the appeal page employs a system in which the user evaluates the property on a five-point scale, the review information stores the points evaluated by the user. For example, in the review information, the average value of the numerical values from "0" to "5" transmitted from the user is stored. Further, the review information may store the number and rate of user reviews sent from the user, specific user review comments (text data), and the like. That is, any information may be stored in the review information as long as it is information related to the user review for the appeal page.

すなわち、図6に示したデータの一例は、アピールページID「W01」で識別されるアピールページW01は、元の商材ID「B01」で識別される商材B01に関するページであることを示している。また、アピールページW01に対応付けられている集合情報は「F01」であり、抽出項目は、「家賃」や「広さ」や「最寄り駅からの時間」や「築年数」等であり、さらに、そのなかで集合に対して優位であるアピールポイントとなる項目は、「家賃」や「最寄り駅からの時間」等であることを示している。また、アピールページW01の効果測定情報は「G01」であり、レビュー情報は「H01」であることを示している。 That is, an example of the data shown in FIG. 6 shows that the appeal page W01 identified by the appeal page ID "W01" is a page related to the product B01 identified by the original product ID "B01". There is. In addition, the set information associated with the appeal page W01 is "F01", and the extracted items are "rent", "size", "time from the nearest station", "age", etc., and further. Among them, the items that are the appealing points that are superior to the set are "rent" and "time from the nearest station". Further, it is shown that the effect measurement information of the appeal page W01 is "G01" and the review information is "H01".

(制御部130について)
制御部130は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、抽出装置100内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラであり、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(About control unit 130)
The control unit 130 is, for example, a controller, and various programs (as an example of an extraction program) stored in a storage device inside the extraction device 100 by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. (Equivalent) is realized by executing RAM as a work area. Further, the control unit 130 is, for example, a controller, and is realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、制御部130は、取得部131と、学習部132と、受付部133と、抽出部134と、生成部135と、提供部136とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。 As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, a learning unit 132, a reception unit 133, an extraction unit 134, a generation unit 135, and a provision unit 136, and the information described below. Realize or execute the function or action of processing. The internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 3, and may be another configuration as long as it is a configuration for performing information processing described later. Further, the connection relationship of each processing unit included in the control unit 130 is not limited to the connection relationship shown in FIG. 3, and may be another connection relationship.

(取得部131について)
取得部131は、各種情報を取得する。例えば、取得部131は、ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する。
(About acquisition unit 131)
The acquisition unit 131 acquires various types of information. For example, the acquisition unit 131 acquires the product information associated with the product that is the target of the commercial transaction on the network.

例えば、取得部131は、商材のスペックを示す項目と、当該項目に対応する値(数値や内容)を取得する。取得部131は、商材のカテゴリごとに異なる商材情報を取得する。一例として、取得部131は、商材のカテゴリが不動産であれば、商材情報として家賃や広さ等、図4で示した商材情報等を取得する。取得部131は、商材を特徴付けるスペック等の情報であれば、あらゆる情報を商材情報として取得してもよい。 For example, the acquisition unit 131 acquires an item indicating the specifications of the product and a value (numerical value or content) corresponding to the item. The acquisition unit 131 acquires different product information for each product category. As an example, if the product category is real estate, the acquisition unit 131 acquires the product information such as rent and area as the product information and the product information shown in FIG. The acquisition unit 131 may acquire any information as product information as long as it is information such as specifications that characterize the product.

そして、取得部131は、商材と商材情報とを対応付けて、図4に示したような商材情報記憶部121に格納する。すなわち、取得部131は、商取引サイトにおける商材に関するデータベースを構築する。かかるデータベースでは、例えば、家賃や広さ等に応じて、物件をソートしたり、ソートした場合の上位2割を抽出したりするデータ管理が可能であるものとする。 Then, the acquisition unit 131 associates the product with the product information and stores the product in the product information storage unit 121 as shown in FIG. That is, the acquisition unit 131 builds a database related to products on the commercial transaction site. In such a database, for example, it is possible to manage data by sorting properties according to rent, size, etc., and extracting the top 20% when sorted.

また、取得部131は、商材情報として、商材に対応付けられたテキストデータを取得する。例えば、取得部131は、商材を紹介するページにおいて、商材を説明するための説明文に対応するテキストデータを取得する。なお、商材を紹介するページとは、商材への申し込みを行うことができるページであったり、商材を購入したり売却したりといった取引を行うことのできるページを含む。 In addition, the acquisition unit 131 acquires text data associated with the product as product information. For example, the acquisition unit 131 acquires the text data corresponding to the explanatory text for explaining the product on the page introducing the product. The page introducing the product includes a page on which an application for the product can be made and a page on which a transaction such as purchasing or selling the product can be performed.

例えば商材が物件である場合、取得部131は、物件に対応付けられた説明文を形態素解析し、説明文に含まれる単語を取得する。さらに、取得部131は、物件の特徴を示す単語を取得する。より具体的には、取得部131は、物件の特徴を示す単語として、例えば家賃や、広さや、築年数や、距離や、最寄り駅等を示す単語を取得する。なお、取得部131は、説明文に限らず、タイトル等、商材に対応付けられているテキストデータであれば、あらゆる情報を取得してもよい。 For example, when the product is a property, the acquisition unit 131 morphologically analyzes the explanatory text associated with the property and acquires the words included in the explanatory text. Further, the acquisition unit 131 acquires a word indicating the characteristics of the property. More specifically, the acquisition unit 131 acquires, for example, words indicating rent, size, age, distance, nearest station, etc. as words indicating the characteristics of the property. The acquisition unit 131 may acquire any information as long as it is text data associated with a product such as a title, not limited to an explanatory text.

なお、取得部131は、タイトルや説明文を形態素解析した場合に、ドキュメント(ここでは、タイトルや説明文)に含まれる単語(語句)の出現数等に基づいて、単語の出現頻度や、複数の説明文における各単語の重要度を算出してもよい。例えば、取得部131は、取得した説明文に関する単語のDF値を算出してもよい。また、取得部131は、DF値に限らず、tf−idf等の指標値を取得してもよい。そして、取得部131は、所定の閾値を超える単語のみを取得するようにしてもよい。これにより、取得部131は、様々なドキュメントに含まれる一般的な語句等を取得せず、物件を特徴付けると想定される単語のみを取得することができる。 When the title or description is morphologically analyzed, the acquisition unit 131 determines the frequency of appearance of the word or a plurality of words based on the number of occurrences of words (phrases) included in the document (here, the title or description). You may calculate the importance of each word in the description of. For example, the acquisition unit 131 may calculate the DF value of the word related to the acquired explanation. Further, the acquisition unit 131 may acquire not only the DF value but also an index value such as tf-idf. Then, the acquisition unit 131 may acquire only the words that exceed a predetermined threshold value. As a result, the acquisition unit 131 can acquire only the words that are supposed to characterize the property without acquiring general words and phrases contained in various documents.

また、取得部131は、実際にアピールページを閲覧したユーザから、当該アピールページに対する反応に関する情報を取得してもよい。例えば、取得部131は、アピールページもしくは商材に対するユーザの反応として、商材がユーザから選択された数もしくは率、又は、商材に関するコンバージョンの数もしくは率の少なくともいずれか一つを取得してもよい。また、取得部131は、ユーザから送信されるレビューに関する情報を取得してもよい。そして、後述する学習部132や抽出部134や生成部135は、取得部131によって取得されたユーザの反応に関する情報に基づいて、生成したモデルや、抽出する特徴情報を適宜チューニングするようにしてもよい。 In addition, the acquisition unit 131 may acquire information regarding the reaction to the appeal page from the user who actually browsed the appeal page. For example, the acquisition unit 131 acquires at least one of the number or rate of products selected by the user or the number or rate of conversions related to the product as the user's reaction to the appeal page or product. May be good. In addition, the acquisition unit 131 may acquire information regarding the review transmitted from the user. Then, the learning unit 132, the extraction unit 134, and the generation unit 135, which will be described later, may appropriately tune the generated model and the feature information to be extracted based on the information regarding the user's reaction acquired by the acquisition unit 131. Good.

なお、取得部131は、生成部135によって生成されたアピールページを閲覧したユーザに関する情報を取得してもよい。ユーザに関する情報とは、例えば、ユーザの属性情報(性別、年齢、居住地、職業等)や、ユーザの行動情報(ネットワーク上の過去の閲覧履歴や購買履歴等)である。例えば、取得部131は、ユーザ端末10から送信されるクッキー(cookie)に基づいてユーザを特定し、特定されたユーザに関する情報を取得する。 The acquisition unit 131 may acquire information about a user who has viewed the appeal page generated by the generation unit 135. The information about the user is, for example, user attribute information (gender, age, place of residence, occupation, etc.) and user behavior information (past browsing history, purchase history, etc. on the network). For example, the acquisition unit 131 identifies a user based on a cookie transmitted from the user terminal 10 and acquires information about the identified user.

取得部131は、取得した情報を記憶部120の各部に適宜格納する。また、取得部131は、後述する各処理部が処理に用いる情報を記憶部120の各部から適宜取得するようにしてもよい。 The acquisition unit 131 appropriately stores the acquired information in each unit of the storage unit 120. Further, the acquisition unit 131 may appropriately acquire information used for processing by each processing unit, which will be described later, from each unit of the storage unit 120.

(学習部132について)
学習部132は、取得部131によって取得された商材情報から、商材の特徴を示す情報である特徴情報を抽出するための学習を行う。
(About learning unit 132)
The learning unit 132 learns to extract feature information, which is information indicating the characteristics of the product, from the product information acquired by the acquisition unit 131.

より具体的には、学習部132は、商材に対して事業者から予め設定されたテキストデータ(説明文)の中から、当該商材の特徴を示す特徴情報を抽出するための学習を行う。 More specifically, the learning unit 132 learns to extract characteristic information indicating the characteristics of the product from the text data (explanatory text) preset by the business operator for the product. ..

例えば、学習部132は、商材情報から抽出する項目として予め設定された正解データを用いた学習処理(例えば、教師あり機械学習)に基づいて、特徴情報を抽出するための学習を行う。例えば、学習部132は、商材の特徴を示すと想定される項目や語句を人為的に抽出した情報を正解データとして取得する。そして、学習部132は、これらの正解データ(サンプル)を学習することにより、商材情報から抽出すべき特徴情報を学習する。 For example, the learning unit 132 performs learning for extracting feature information based on learning processing (for example, supervised machine learning) using correct answer data set in advance as items to be extracted from product information. For example, the learning unit 132 acquires information obtained by artificially extracting items and phrases that are expected to indicate the characteristics of the product as correct answer data. Then, the learning unit 132 learns the feature information to be extracted from the product information by learning these correct answer data (samples).

なお、学習部132は、商材のカテゴリごとに予め設定された所定の条件に基づいて、特徴情報を抽出するための学習を行ってもよい。具体的には、学習部132は、商材が「不動産」である場合には、抽出する特徴情報として、「家賃」や「広さ」等の項目を正解データとして受け付ける。そして、学習部132は、かかる正解データに基づいて、説明文のいずれの箇所が「家賃」や「広さ」等の項目に対応するかを学習する。このように、学習部132は、カテゴリ毎の正解データをサンプルとして用いることで、説明文のうちいずれの情報が商材の特徴を示すかを効率的に学習することができる。 The learning unit 132 may perform learning for extracting feature information based on predetermined conditions set in advance for each product category. Specifically, when the product is "real estate", the learning unit 132 accepts items such as "rent" and "size" as correct answer data as the feature information to be extracted. Then, the learning unit 132 learns which part of the explanatory text corresponds to the item such as "rent" or "size" based on the correct answer data. In this way, the learning unit 132 can efficiently learn which information in the explanatory text indicates the characteristics of the product by using the correct answer data for each category as a sample.

また、学習部132は、商材情報のうち、商材に対応付けられた説明文を特徴付ける情報を抽出するよう学習されたモデル(学習器)を用いて、特徴情報を抽出するようにしてもよい。例えば、学習部132は、ディープラーニング等の手法を用いることで、明確な正解データを有しなくとも、各説明文を特徴付ける情報(特徴量)を抽出するためのモデルを生成することができる。 Further, the learning unit 132 may extract the feature information by using a model (learner) learned to extract the information that characterizes the explanatory text associated with the product from the product information. Good. For example, the learning unit 132 can generate a model for extracting information (feature amount) that characterizes each explanatory sentence even if it does not have clear correct answer data by using a method such as deep learning.

学習部132は、上記いずれの学習処理を用いてモデルを生成してもよい。また、学習部132は、上記で例示した以外の既知の学習処理を適宜用いてもよい。すなわち、学習部132が、後述する抽出部134による特徴情報の抽出処理や、生成部135によるアピールページの生成処理を実現するための学習を行うことが可能であれば、学習の手法は限定さない。 The learning unit 132 may generate a model by using any of the above learning processes. Further, the learning unit 132 may appropriately use a known learning process other than those exemplified above. That is, if the learning unit 132 can perform learning for realizing the extraction process of the feature information by the extraction unit 134 described later and the generation process of the appeal page by the generation unit 135, the learning method is limited. Absent.

なお、学習部132は、ユーザの反応に関する情報に基づいて、抽出する特徴情報を調整する処理を行ってもよい。例えば、学習部132は、ユーザからの反応が所定の閾値を超えたアピールページ(例えば、コンバージョンが所定数を超えたページや、ユーザレビューの点数が所定の点数を超えたページ)において抽出した特徴情報を正解データと判定して、モデルを更新する。すなわち、学習部132は、ユーザからの反応が比較的良いアピールページは、適切に特徴情報が抽出できたページであるとして、モデル生成における正解データとして取り扱う。これにより、学習部132は、モデルを最適化していくことができる。 The learning unit 132 may perform a process of adjusting the feature information to be extracted based on the information regarding the reaction of the user. For example, the learning unit 132 extracts features extracted on an appeal page in which the response from the user exceeds a predetermined threshold value (for example, a page in which the conversion exceeds a predetermined number or a page in which the user review score exceeds a predetermined score). The model is updated by judging the information as correct data. That is, the learning unit 132 treats the appeal page, which has a relatively good response from the user, as correct answer data in model generation, assuming that the page is a page from which feature information can be appropriately extracted. As a result, the learning unit 132 can optimize the model.

また、学習部132は、ユーザごとに異なる特徴情報を抽出するようなモデルを生成してもよい。例えば、アピールページにおいてアピールされる特徴情報の中には、ユーザの属性によって訴求効果が変化する特徴情報が存在する可能性がある。例えば、ある特徴が強調表示されたアピールページにおいて、女性ユーザに対してコンバージョン率が高いのに対して、男性ユーザに対してはコンバージョン率が低くなる可能性がある。このような場合、学習部132は、ユーザ属性に応じて、商材情報から抽出する項目を調整するような学習を行ってもよい。具体的には、学習部132は、女性ユーザ用のアピールページと男性用のアピールページとが異なる態様で表示されるように、特徴情報として抽出される項目を調整するような学習を行ってもよい。これにより、後述する生成部135は、同じ商材をアピールするページであっても、各々のユーザに対して訴求効果が高いと想定される各々の特徴情報が強調された、異なるアピールページを生成することができる。 Further, the learning unit 132 may generate a model that extracts different feature information for each user. For example, among the feature information appealed on the appeal page, there is a possibility that the feature information whose appeal effect changes depending on the user's attribute may exist. For example, on an appeal page where a feature is highlighted, the conversion rate may be high for female users, but low for male users. In such a case, the learning unit 132 may perform learning such as adjusting the items to be extracted from the product information according to the user attribute. Specifically, the learning unit 132 may perform learning such as adjusting items extracted as feature information so that the appeal page for female users and the appeal page for men are displayed in different modes. Good. As a result, the generation unit 135, which will be described later, generates a different appeal page in which each feature information that is expected to have a high appeal effect to each user is emphasized even if the page appeals the same product. can do.

学習部132は、学習に用いた学習データや、学習データに対応するモデルを学習情報記憶部122に適宜格納する。 The learning unit 132 appropriately stores the learning data used for learning and the model corresponding to the learning data in the learning information storage unit 122.

(受付部133について)
受付部133は、商取引に関する種々の要求を受け付ける。例えば、受付部133は、ユーザ端末10から、商取引サイトにおいてユーザが所望する条件に適合する商材を検索する要求を受け付ける。
(About reception desk 133)
The reception unit 133 receives various requests regarding commercial transactions. For example, the reception unit 133 receives a request from the user terminal 10 to search for a product that meets the conditions desired by the user on the commercial transaction site.

具体的には、受付部133は、商取引サイトにアクセスしたユーザ端末10から、物件を検索するための検索クエリを受け付ける。また、受付部133は、検索クエリに対応した検索結果ページを閲覧したユーザから、ユーザが所望する商材に関するページの閲覧(取得)要求を受け付ける。すなわち、受付部133は、ユーザが所望するアピールページへのアクセス要求を受け付ける。なお、受付部133は、ユーザ端末10から直接に種々の要求を受け付けるのではなく、ウェブサーバ30を介して受け付けてもよい。 Specifically, the reception unit 133 receives a search query for searching for a property from the user terminal 10 that has accessed the commercial transaction site. In addition, the reception unit 133 receives a request for browsing (acquiring) a page related to a product desired by the user from a user who browses the search result page corresponding to the search query. That is, the reception unit 133 receives an access request to the appeal page desired by the user. The reception unit 133 may not accept various requests directly from the user terminal 10 but may accept them via the web server 30.

(抽出部134について)
抽出部134は、ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報のうち、当該集合において所定の条件を満たす情報である特徴情報を抽出する。
(About extraction unit 134)
The extraction unit 134 is information that satisfies a predetermined condition in the set among the product information of the predetermined product in the predetermined product included in the set formed based on the contents specified by the user. Extract feature information.

具体的には、抽出部134は、所定の条件として、集合に含まれる所定の商材の商材情報が当該集合において優位性を示す情報である場合に、当該商材情報を特徴情報として抽出する。 Specifically, the extraction unit 134 extracts the product information as feature information when the product information of the predetermined product included in the set is information showing superiority in the set as a predetermined condition. To do.

例えば、抽出部134は、商材のカテゴリごとに予め設定された所定の条件に基づいて、特徴情報を抽出する。具体的には、抽出部134は、まず学習部132によって生成されたモデルを用いて商材情報から特徴となる項目を抽出する。そして、抽出部134は、抽出された項目のうち、カテゴリごとに予め設定された所定の条件に適合する項目を、集合において優位性を示す情報であるとして、特徴情報として抽出する。 For example, the extraction unit 134 extracts feature information based on predetermined conditions set in advance for each product category. Specifically, the extraction unit 134 first extracts characteristic items from the product information using the model generated by the learning unit 132. Then, the extraction unit 134 extracts the extracted items that meet the predetermined conditions set in advance for each category as the feature information as the information indicating the superiority in the set.

一例として、抽出部134は、カテゴリが不動産であれば、「ユーザが検索した条件に適合する複数の物件(すなわち、ユーザが指定した条件に基づいて形成される集合)の商材情報の項目のうちで、上位2割に属する情報を特徴情報として抽出する」といった条件を予め受け付ける。そして、抽出部134は、抽出した項目のうち、上記条件に適合する項目を特徴情報として抽出する。図1の例でいえば、抽出部134は、ユーザが閲覧しようとした物件XXXの商材情報のうち、「家賃」と「最寄り駅までの時間」という2つの項目が上記条件に適合したと判定する。そして、抽出部134は、これらの項目を特徴情報(アピールポイント)として抽出する。 As an example, if the category is real estate, the extraction unit 134 states that "a set of product information items of a plurality of properties (that is, a set formed based on the conditions specified by the user) that match the conditions searched by the user). We accept in advance conditions such as "extract information belonging to the top 20% as feature information." Then, the extraction unit 134 extracts the extracted items that meet the above conditions as feature information. In the example of FIG. 1, the extraction unit 134 states that, of the product information of the property XXX that the user tried to browse, two items, "rent" and "time to the nearest station", met the above conditions. judge. Then, the extraction unit 134 extracts these items as feature information (appeal points).

なお、集合において優位性のある情報とは、必ずしも順位付けされる情報でなくてもよい。例えば、集合において優位性のある情報とは、集合において、他の商材が必ずしも有していない利点を示す情報であってもよい。具体的には、商材が物件である場合には、「ペット飼育可」であるという情報が、他の商材が必ずしも有していない利点を示す情報であるといえる。この場合、所定の条件として、例えば、「ユーザが検索した条件に適合する複数の物件の商材情報の項目のうちで、半数を超える商材が有していない所定のスペックを特徴情報として抽出する」といった設定がなされている場合、抽出部134は、「ペット飼育可」であるという情報を特徴情報として抽出する場合がある。 It should be noted that the information having superiority in the set does not necessarily have to be the information to be ranked. For example, the information that is superior in the set may be information that indicates the advantages that other products do not necessarily have in the set. Specifically, when the product is a property, it can be said that the information that "pets can be bred" indicates the advantage that other products do not necessarily have. In this case, as a predetermined condition, for example, "Among the items of product information of a plurality of properties that match the conditions searched by the user, a predetermined specification that more than half of the products do not have is extracted as feature information. When the setting such as "to do" is made, the extraction unit 134 may extract the information that "pets can be bred" as feature information.

なお、抽出部134は、取得部131によって取得された商材情報から構築されたデータベースを参照することにより、上記の条件との適合等を判定する。 The extraction unit 134 determines conformity with the above conditions by referring to a database constructed from the product information acquired by the acquisition unit 131.

ここで、抽出部134は、商材に対応付けられる商材情報のうち、商材の説明文等(テキストデータ)から特徴情報を抽出する。かかる処理は、上述の学習部132によって生成されたモデルを用いることで実現される。 Here, the extraction unit 134 extracts the feature information from the description of the product (text data) from the product information associated with the product. Such processing is realized by using the model generated by the learning unit 132 described above.

すなわち、抽出部134は、商材情報のうち、商材に対応付けられたテキストデータに対して設定される正解データを用いた学習処理に基づいて、特徴情報を抽出する。この場合、抽出部134は、予め人為的に正解データを与えられて学習されたモデルにテキストデータを入力することで、テキストデータのうち、いずれの箇所が「抽出されるべき項目」に該当するかを判定することができる。そして、抽出部134は、テキストデータから抽出された項目のうち、上記のような所定の条件を満たす項目を当該商材の特徴情報として抽出する。 That is, the extraction unit 134 extracts the feature information based on the learning process using the correct answer data set for the text data associated with the product among the product information. In this case, the extraction unit 134 inputs the text data into the model learned by being artificially given the correct answer data in advance, and any part of the text data corresponds to the "item to be extracted". Can be determined. Then, the extraction unit 134 extracts the items that satisfy the predetermined conditions as described above from the items extracted from the text data as the feature information of the product.

また、抽出部134は、商材情報のうち、商材に対応付けられたテキストデータを特徴付ける情報を抽出するよう学習されたモデル(学習器)を用いて特徴情報を抽出してもよい。かかる処理は、例えばディープラーニング等の手法を用いて学習されたモデルを用いることで実現される。 Further, the extraction unit 134 may extract the feature information by using a model (learner) learned to extract the information that characterizes the text data associated with the product among the product information. Such processing is realized by using a model learned by using a method such as deep learning.

すなわち、抽出部134は、商材情報のうち、商材に対応付けられたテキストデータを特徴付けると判定される語句や文を抽出する。そして、抽出部134は、抽出された語句や文と、商材のデータベースに含まれる各項目とを対応させることで、テキストデータのうち、いずれの箇所が「抽出されるべき項目」に該当するかを判定する。なお、このような、抽出された語句や文と、商材のデータベースに含まれる各項目とを対応させる処理についても、上記ディープラーニング等の手法を用いて学習されたモデルを用いることで実現される。そして、抽出部134は、テキストデータから抽出された項目のうち、上記のような所定の条件を満たす項目を当該商材の特徴情報として抽出する。 That is, the extraction unit 134 extracts words and sentences that are determined to characterize the text data associated with the product from the product information. Then, the extraction unit 134 associates the extracted words and sentences with each item included in the database of the product, and any part of the text data corresponds to the "item to be extracted". Is determined. It should be noted that the process of associating the extracted words and sentences with each item included in the database of products is also realized by using a model learned by using the above-mentioned method such as deep learning. To. Then, the extraction unit 134 extracts the items that satisfy the predetermined conditions as described above from the items extracted from the text data as the feature information of the product.

例えば、抽出部134は、特徴情報として、商材を特徴付ける語句を抽出する。すなわち、抽出部134は、商材を特徴付ける語句であって、集合において優位性を示す語句を抽出する。後述する生成部135は、抽出部134によって抽出された語句(アピールポイント)を強調表示することにより、アピールページを生成する。 For example, the extraction unit 134 extracts words and phrases that characterize the product as feature information. That is, the extraction unit 134 extracts words and phrases that characterize the product and that show superiority in the set. The generation unit 135, which will be described later, generates an appeal page by highlighting the words (appeal points) extracted by the extraction unit 134.

なお、抽出部134によって抽出される特徴情報(語句)は、「家賃」や「広さ」等の一つの単語に限られない。例えば、抽出部134は、特徴情報として、「家賃」のことを記載していると想定される一文を抽出してもよい。また、抽出部134は、特徴情報として、「家賃」のことを記載していると想定される語句と、その前後の所定数の単語を抽出してもよい。なお、このような処理は、既知の重要文抽出処理等を利用することにより実現されてもよい。これにより、抽出部134は、「家賃」のことを記載していると想定される語句と、その前後の所定数の単語を抽出する場合であっても、ユーザにとって不自然とならないような箇所を選択して抽出することができる。 The feature information (words) extracted by the extraction unit 134 is not limited to one word such as "rent" or "size". For example, the extraction unit 134 may extract a sentence that is assumed to describe "rent" as feature information. In addition, the extraction unit 134 may extract a phrase that is supposed to describe "rent" and a predetermined number of words before and after the phrase as feature information. In addition, such a process may be realized by using a known important sentence extraction process or the like. As a result, the extraction unit 134 extracts a phrase that is supposed to describe "rent" and a predetermined number of words before and after it, so that it does not become unnatural for the user. Can be selected and extracted.

なお、抽出部134は、ユーザの反応に関する情報に基づいて、抽出する特徴情報を調整する処理を行ってもよい。例えば、抽出部134は、ユーザからの反応が所定の閾値を超えたアピールページ(例えば、コンバージョンが所定数を超えたページや、ユーザレビューの点数が所定の点数を超えたページ)において抽出した特徴情報を正解データと判定して、結果を学習部132にフィードバックする。すなわち、抽出部134は、ユーザからの反応が比較的良いアピールページは、適切に特徴情報が抽出できたページであるとして、モデル生成における正解データとして取り扱う。これにより、抽出部134は、抽出処理を最適化していくことができる。 The extraction unit 134 may perform a process of adjusting the feature information to be extracted based on the information regarding the reaction of the user. For example, the extraction unit 134 is a feature extracted on an appeal page in which the response from the user exceeds a predetermined threshold value (for example, a page in which the conversion exceeds a predetermined number or a page in which the user review score exceeds a predetermined score). The information is determined to be correct answer data, and the result is fed back to the learning unit 132. That is, the extraction unit 134 treats the appeal page, which has a relatively good response from the user, as the correct answer data in the model generation, assuming that the page is the page from which the feature information can be appropriately extracted. As a result, the extraction unit 134 can optimize the extraction process.

また、抽出部134は、ユーザごとに異なる特徴情報を抽出してもよい。学習部132においても説明したように、商材におけるアピールポイントは、ユーザの属性に応じて訴求効果が変化する場合がありうる。このため、抽出部134は、例えばユーザの属性と、ユーザの反応との相関性に基づいて、商材に対して抽出する特徴情報を調整するようにしてもよい。 Further, the extraction unit 134 may extract different feature information for each user. As explained in the learning unit 132, the appealing effect of the appeal point in the product may change depending on the attribute of the user. Therefore, the extraction unit 134 may adjust the feature information to be extracted for the product, for example, based on the correlation between the user's attribute and the user's reaction.

(生成部135について)
生成部135は、抽出部134によって抽出された特徴情報に基づいて、所定の商材に関するページを生成する。
(About generator 135)
The generation unit 135 generates a page related to a predetermined product based on the feature information extracted by the extraction unit 134.

例えば、生成部135は、商材に対応付けられたテキストデータのうち、抽出部134によって抽出された語句(特徴情報)が強調表示される態様のページを生成する。具体的には、生成部135は、テキストデータのうち、特徴情報に該当する箇所がハイライト表示されてアピールされたアピールページを生成する。これにより、生成部135は、ユーザ端末10に表示される商材において、集合に対してどのくらい優れた特徴があるのかといったスペックを示す情報を、即座にユーザにアピールすることができる。 For example, the generation unit 135 generates a page in which the words (feature information) extracted by the extraction unit 134 are highlighted in the text data associated with the product. Specifically, the generation unit 135 generates an appeal page in which the portion of the text data corresponding to the feature information is highlighted and appealed. As a result, the generation unit 135 can immediately appeal to the user information indicating specifications such as how excellent the characteristics of the set are in the product displayed on the user terminal 10.

また、生成部135は、ユーザからの反応に基づいてアピールページを生成するようにしてもよい。すなわち、上述した抽出部134と同様、生成部135も、ユーザの反応に基づいて、強調表示する範囲や特徴情報の表示の態様等を正解データ(もしくは不正解データ)として生成処理の学習を行い、生成するアピールページを最適化してもよい。 In addition, the generation unit 135 may generate an appeal page based on the reaction from the user. That is, like the extraction unit 134 described above, the generation unit 135 also learns the generation process based on the reaction of the user, using the highlighting range, the display mode of the feature information, etc. as correct answer data (or incorrect answer data). , You may optimize the generated appeal page.

具体例として、物件がコンバージョンされる場合を説明する。アピールページにおいて、特徴情報として提示された情報(例えば、家賃について説明した箇所に対応するテキスト)を強調表示した箇所が適切でなかったり、強調表示する手法が適切でなかったりした場合、言い換えれば、商材のアピールポイントが上手くユーザに伝わっていない場合、ユーザは、当該物件を申し込むこと等を躊躇うと想定される。一方、物件がユーザからコンバージョンされる場合、アピールページでアピールされた特徴情報や、表示手法が正しかったと想定される。 As a specific example, a case where the property is converted will be described. On the appeal page, if the highlighting of the information presented as feature information (for example, the text corresponding to the description of the rent) is not appropriate, or if the highlighting method is not appropriate, in other words. If the appeal point of the product is not well communicated to the user, the user is expected to hesitate to apply for the property. On the other hand, when the property is converted by the user, it is assumed that the feature information and display method appealed on the appeal page were correct.

そこで、生成部135は、このようなユーザの反応に基づいて、アピールページの態様や特徴情報の正否を推定する。例えば、生成部135は、予め所定の閾値を設定する。例えば、生成部135は、ある物件に関するコンバージョン率の閾値を設定する。そして、生成部135は、所定期間内や、一定数の閲覧の間に、閾値を超えるコンバージョン率を達成したか否かを判定する。 Therefore, the generation unit 135 estimates the correctness of the mode of the appeal page and the feature information based on the reaction of such a user. For example, the generation unit 135 sets a predetermined threshold value in advance. For example, the generation unit 135 sets a conversion rate threshold value for a certain property. Then, the generation unit 135 determines whether or not the conversion rate exceeding the threshold value has been achieved within a predetermined period or during a certain number of browsing.

生成部135は、コンバージョン率が閾値を超えていた場合、当該物件に関するアピールページが正解であったものとして、当該アピールページを正例の1つとしてフィードバックする。また、生成部135は、コンバージョン率が閾値を超えなかった場合、当該物件に関するアピールページが不正解であったものとして、当該アピールページを負例の1つとしてフィードバックする。このように、ユーザの反応を利用して学習を継続することで、生成部135は、特徴情報をアピールする手法や、ページの色使いや、強調表示の処理(例えば、フォントの大小や、フォントの種類、ページ全体のレイアウト等)を向上させることができる。 When the conversion rate exceeds the threshold value, the generation unit 135 feeds back the appeal page as one of the correct examples, assuming that the appeal page related to the property is the correct answer. Further, when the conversion rate does not exceed the threshold value, the generation unit 135 feeds back the appeal page as one of the negative examples, assuming that the appeal page related to the property is incorrect. In this way, by continuing learning using the user's reaction, the generation unit 135 can use the method of appealing the feature information, the color usage of the page, and the highlighting process (for example, the size of the font and the font). Type, layout of the entire page, etc.) can be improved.

なお、このようなユーザの反応を得る手法として、抽出装置100は、例えばクラウドソーシングを利用した人手による判定を実施してもよい。人手を利用して学習を行うことで、生成部135は、人が閲覧した場合に不自然のないアピールページを生成することができるようになる。 As a method for obtaining such a user reaction, the extraction device 100 may perform a manual determination using, for example, crowdsourcing. By performing learning using human hands, the generation unit 135 can generate an appeal page that does not look unnatural when viewed by a person.

また、生成部135は、ユーザに関する情報に基づいて、ユーザごとに異なるアピールページを生成してもよい。すなわち、上述した抽出部134と同様、生成部135も、ユーザの属性情報や行動履歴等に基づいて、よりユーザに対して効果が高いと想定されるアピールページを生成するようにしてもよい。 In addition, the generation unit 135 may generate a different appeal page for each user based on the information about the user. That is, like the extraction unit 134 described above, the generation unit 135 may also generate an appeal page that is expected to be more effective for the user based on the user's attribute information, action history, and the like.

(提供部136について)
提供部136は、各種情報を提供する。例えば、提供部136は、受付部133によって商材の閲覧要求が受け付けられた場合には、当該要求を送信したユーザにアピールページを提供(送信)する。また、提供部136は、受付部133によって商材を検索するための検索クエリが受け付けられた場合には、受け付けた検索クエリに対応する検索結果をユーザ端末10に提供する。
(About the provider 136)
The providing unit 136 provides various information. For example, when a request for viewing a product is received by the reception unit 133, the providing unit 136 provides (transmits) an appeal page to the user who has sent the request. Further, when the reception unit 133 receives the search query for searching the product, the providing unit 136 provides the user terminal 10 with the search result corresponding to the received search query.

〔4.ウェブサーバの構成〕
次に、図7を用いて、実施形態に係るウェブサーバ30の構成について説明する。図7は、実施形態に係るウェブサーバ30の構成例を示す図である。図7に示すように、ウェブサーバ30は、通信部31と、コンテンツ記憶部32と、制御部33とを有する。
[4. Web server configuration]
Next, the configuration of the web server 30 according to the embodiment will be described with reference to FIG. 7. FIG. 7 is a diagram showing a configuration example of the web server 30 according to the embodiment. As shown in FIG. 7, the web server 30 has a communication unit 31, a content storage unit 32, and a control unit 33.

通信部31は、例えば、NIC等によって実現される。そして、通信部31は、ネットワークNと有線または無線で接続され、ユーザ端末10や事業者端末20や抽出装置100との間で情報の送受信を行う。 The communication unit 31 is realized by, for example, a NIC or the like. Then, the communication unit 31 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the user terminal 10, the business terminal 20, and the extraction device 100.

コンテンツ記憶部32は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。そして、コンテンツ記憶部32は、コンテンツの一例であるウェブページを記憶する。例えば、コンテンツ記憶部32は、ウェブページを形成するHTMLファイルや、ウェブページに表示される静止画像や動画像を記憶する。なお、コンテンツ記憶部32に記憶されるウェブページには、ウェブページ上に表示させる広告コンテンツを取得するための広告取得命令が含まれる場合がある。 The content storage unit 32 is realized by, for example, a semiconductor memory element such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk. Then, the content storage unit 32 stores a web page which is an example of the content. For example, the content storage unit 32 stores an HTML file forming a web page, and a still image or a moving image displayed on the web page. The web page stored in the content storage unit 32 may include an advertisement acquisition command for acquiring the advertisement content to be displayed on the web page.

制御部33は、コントローラであり、例えば、CPUやMPU等によって、ウェブサーバ30内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部33は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。 The control unit 33 is a controller, and is realized by, for example, a CPU, an MPU, or the like executing various programs stored in a storage device inside the web server 30 using the RAM as a work area. Further, the control unit 33 is a controller, and is realized by, for example, an integrated circuit such as an ASIC or FPGA.

図7に示すように、制御部33は、受付部34と、配信部35とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部33の内部構成は、図7に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部33が有する各処理部の接続関係は、図7に示した接続関係に限られず、他の接続関係であってもよい。 As shown in FIG. 7, the control unit 33 has a reception unit 34 and a distribution unit 35, and realizes or executes an information processing function or operation described below. The internal configuration of the control unit 33 is not limited to the configuration shown in FIG. 7, and may be another configuration as long as it is a configuration for performing information processing described later. Further, the connection relationship of each processing unit included in the control unit 33 is not limited to the connection relationship shown in FIG. 7, and may be another connection relationship.

受付部34は、ユーザ端末10からウェブページの取得要求を受け付ける。例えば、受付部34は、ウェブページの取得要求として、HTTPリクエストを受け付ける。また、受付部34は、事業者端末20から商材に関する情報を受け付ける。受付部34は、事業者端末20から受け付けた商材に関する情報をコンテンツ記憶部32に記憶する。 The reception unit 34 receives a web page acquisition request from the user terminal 10. For example, the reception unit 34 accepts an HTTP request as a request for acquiring a web page. In addition, the reception unit 34 receives information about the product from the business terminal 20. The reception unit 34 stores information about the product received from the business operator terminal 20 in the content storage unit 32.

配信部35は、受付部34によってウェブページの取得要求が受け付けられた場合に、ウェブページをユーザ端末10に配信する。具体的には、配信部35は、コンテンツ記憶部32から取得要求対象のウェブページを取得し、取得したウェブページをユーザ端末10に配信する。上記の通り、コンテンツ記憶部32に記憶されているウェブページは、広告取得命令を含む。すなわち、ユーザ端末10は、取得したウェブページを表示する際に、ウェブページに含まれる広告取得命令に従い、抽出装置100に対して広告コンテンツの配信要求を送信する。 The distribution unit 35 distributes the web page to the user terminal 10 when the reception unit 34 receives the request for acquiring the web page. Specifically, the distribution unit 35 acquires the acquisition request target web page from the content storage unit 32, and distributes the acquired web page to the user terminal 10. As described above, the web page stored in the content storage unit 32 includes an advertisement acquisition command. That is, when displaying the acquired web page, the user terminal 10 transmits an advertisement content distribution request to the extraction device 100 in accordance with the advertisement acquisition command included in the web page.

なお、上記実施形態では、抽出装置100に係る提供部136によってアピールページが提供される例を示したが、アピールページ等のウェブページは、ウェブサーバ30に係る配信部35によってユーザ端末10に配信されてもよい。この場合、ウェブサーバ30は、抽出装置100と連携し、アピールページを生成するために要する情報を抽出装置100に送信したり、抽出装置100からアピールページを取得したりする処理を行うものとする。 In the above embodiment, an example in which the appeal page is provided by the providing unit 136 related to the extraction device 100 is shown, but the web page such as the appeal page is distributed to the user terminal 10 by the distribution unit 35 related to the web server 30. May be done. In this case, the web server 30 cooperates with the extraction device 100 to transmit the information required for generating the appeal page to the extraction device 100 and to acquire the appeal page from the extraction device 100. ..

〔5.処理手順〕
次に、図8、図9及び図10を用いて、実施形態に係る抽出装置100による処理の手順について説明する。まず、図8を用いて、モデルの生成に関する処理手順を説明する。図8は、実施形態に係る処理手順を示すフローチャート(1)である。
[5. Processing procedure]
Next, the procedure of the processing by the extraction device 100 according to the embodiment will be described with reference to FIGS. 8, 9 and 10. First, a processing procedure related to model generation will be described with reference to FIG. FIG. 8 is a flowchart (1) showing a processing procedure according to the embodiment.

図8に示すように、抽出装置100は、モデル生成のための学習データとして、抽出装置商材に対応付けられる商材情報を取得する(ステップS101)。 As shown in FIG. 8, the extraction device 100 acquires product information associated with the extraction device product as learning data for model generation (step S101).

そして、抽出装置100は、取得した商材情報に基づいてデータベースを生成する(ステップS102)。また、抽出装置100は、取得した商材情報に基づいて学習モデルを生成する(ステップS103)。抽出装置上記の流れにより、抽出装置100による学習フェーズは終了する。 Then, the extraction device 100 generates a database based on the acquired product information (step S102). Further, the extraction device 100 generates a learning model based on the acquired product information (step S103). Extraction device The learning phase by the extraction device 100 ends according to the above flow.

次に、図9を用いて、モデルを用いた抽出処理に関する処理手順を説明する。図9は、実施形態に係る処理手順を示すフローチャート(2)である。 Next, a processing procedure relating to the extraction process using the model will be described with reference to FIG. FIG. 9 is a flowchart (2) showing a processing procedure according to the embodiment.

図9に示すように、抽出装置100は、ユーザ端末10から、商材に関する指定を受け付けたか否かを判定する(ステップS201)。抽出装置100は、商材に関する指定を受け付けていない場合(ステップS201;No)、受け付けるまで待機する。 As shown in FIG. 9, the extraction device 100 determines whether or not the designation regarding the product has been received from the user terminal 10 (step S201). When the extraction device 100 has not received the designation regarding the product (step S201; No), the extraction device 100 waits until it receives the designation.

一方、商材に関する指定を受け付けた場合(ステップS201;Yes)、抽出装置100は、受け付けた指定(条件)に対応する集合を特定する(ステップS202)。そして、抽出装置100は、集合に含まれる所定の商材において、集合に対して優位性を有する特徴情報を抽出する(ステップS203)。 On the other hand, when the designation regarding the product is received (step S201; Yes), the extraction device 100 specifies the set corresponding to the received designation (condition) (step S202). Then, the extraction device 100 extracts the feature information having an advantage over the set in the predetermined product included in the set (step S203).

続けて、抽出装置100は、抽出した特徴情報に基づいてアピールページを生成する(ステップS204)。そして、抽出装置100は、商材に関する指定を行ったユーザに対して、アピールページを提供する(ステップS205)。上記の流れにより、抽出装置100による生成フェーズは終了する。 Subsequently, the extraction device 100 generates an appeal page based on the extracted feature information (step S204). Then, the extraction device 100 provides an appeal page to the user who has specified the product (step S205). According to the above flow, the generation phase by the extraction device 100 ends.

次に、図10を用いて、抽出処理及び生成処理に関するフィードバックの手順を説明する。図10は、実施形態に係る処理手順を示すフローチャート(3)である。 Next, the procedure of feedback regarding the extraction process and the generation process will be described with reference to FIG. FIG. 10 is a flowchart (3) showing a processing procedure according to the embodiment.

図10に示すように、抽出装置100は、アピールページに対する反応をユーザ端末10から受け付けたか否かを判定する(ステップS301)。抽出装置100は、反応を受け付けていない場合(ステップS301;No)、受け付けるまで待機する。 As shown in FIG. 10, the extraction device 100 determines whether or not the reaction to the appeal page has been received from the user terminal 10 (step S301). When the extraction device 100 does not accept the reaction (step S301; No), the extraction device 100 waits until it accepts the reaction.

一方、反応を受け付けた場合(ステップS301;Yes)、抽出装置100は、ユーザからの反応を取得する(ステップS302)。そして、抽出装置100は、ユーザからの反応が所定の閾値を超えたか否かを判定する(ステップS303)。 On the other hand, when the reaction is received (step S301; Yes), the extraction device 100 acquires the reaction from the user (step S302). Then, the extraction device 100 determines whether or not the reaction from the user exceeds a predetermined threshold value (step S303).

抽出装置100は、ユーザからの反応が所定の閾値を超えていた場合(ステップS303;Yes)、ユーザに提供したアピールページにおける特徴情報(もしくは、アピールページ自体)を正解であったと判定する(ステップS304)。一方、抽出装置100は、ユーザからの反応が所定の閾値を超えていない場合(ステップS303;No)、特徴情報が不正解であったと判定する(ステップS305)。 When the reaction from the user exceeds a predetermined threshold value (step S303; Yes), the extraction device 100 determines that the feature information (or the appeal page itself) on the appeal page provided to the user is the correct answer (step). S304). On the other hand, when the response from the user does not exceed a predetermined threshold value (step S303; No), the extraction device 100 determines that the feature information is incorrect (step S305).

そして、抽出装置100は、ステップS304及びステップS305で得られたデータを正例もしくは負例とした学習データを利用して、モデルを更新する(ステップS306)。言い換えれば、抽出装置100は、ユーザの反応に基づいて、モデルをさらに強化的に学習する。上記の流れを繰り返すことにより、抽出装置100は、より適切に特徴情報を抽出できるよう、モデルの最適化を図る。 Then, the extraction device 100 updates the model by using the learning data using the data obtained in steps S304 and S305 as a positive example or a negative example (step S306). In other words, the extraction device 100 learns the model more strongly based on the reaction of the user. By repeating the above flow, the extraction device 100 optimizes the model so that the feature information can be extracted more appropriately.

〔6.変形例〕
上述した抽出装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、抽出装置100の他の実施形態について説明する。
[6. Modification example]
The extraction device 100 described above may be implemented in various different forms other than the above embodiment. Therefore, another embodiment of the extraction device 100 will be described below.

〔6−1.特徴情報の種類〕
上記実施形態では、抽出装置100は、商材の説明文のうち特徴情報に対応する箇所を強調表示する態様でアピールページを生成する例を示した。ここで、抽出装置100は、特徴情報は強調表示する態様とは異なる態様のアピールページを生成してもよい。
[6-1. Types of feature information]
In the above embodiment, the extraction device 100 shows an example of generating an appeal page in a mode of highlighting a portion corresponding to the feature information in the description of the product. Here, the extraction device 100 may generate an appeal page in a mode different from the mode in which the feature information is highlighted.

例えば、抽出装置100は、特徴情報に基づいて、商材に対応付けられた説明文の要約文を生成するとともに、要約文が付与されたアピールページを生成してもよい。具体的には、抽出装置100は、事業者によって予め商材に対応付けられた説明文に先立って、生成された要約文が配置される態様のアピールページを生成する。すなわち、抽出装置100は、集合と比較して優れた点などの商材の特徴のみを簡潔に伝える要約文を、説明文よりも先にユーザに伝えることができる。これにより、ユーザは、例えば説明文が冗長であったとしても、説明文自体を読まずに、商材の特徴を的確に捉えることができる。 For example, the extraction device 100 may generate a summary sentence of the explanatory text associated with the product based on the feature information, and may also generate an appeal page to which the summary sentence is added. Specifically, the extraction device 100 generates an appeal page in which the generated summary text is arranged prior to the explanatory text previously associated with the product by the business operator. That is, the extraction device 100 can convey to the user a summary sentence that concisely conveys only the features of the product such as excellent points as compared with the set, before the explanatory sentence. As a result, the user can accurately grasp the characteristics of the product without reading the explanation itself, for example, even if the explanation is redundant.

〔6−2.検索結果への利用〕
抽出装置100は、生成した特徴情報を用いてアピールページを生成するのみならず、種々の処理に特徴情報を使用してもよい。例えば、抽出装置100は、商取引サイト等で行われる商材の検索において、検索結果とともに特徴情報を表示させるようにしてもよい。
[6-2. Use for search results]
The extraction device 100 may not only generate an appeal page using the generated feature information, but may also use the feature information for various processes. For example, the extraction device 100 may display the feature information together with the search result in the search for the product performed on the commercial transaction site or the like.

すなわち、抽出装置100は、所定の検索処理の結果として商材が表示される場合において、商材の特徴情報を含む検索結果ページを生成してもよい。この場合、検索結果ページには、例えば、検索クエリに基づいて検索された商材の近傍に、商材に関する特徴情報(例えば、要約文)が表示される。このため、ユーザは、商材を検索した場合に、アピールページを表示せずとも商材の特徴を把握することができる。このように、抽出装置100は、商取引サイトを利用するユーザの利便性を向上させることができる。 That is, the extraction device 100 may generate a search result page including the feature information of the product when the product is displayed as a result of the predetermined search process. In this case, on the search result page, for example, feature information (for example, a summary sentence) related to the product is displayed in the vicinity of the product searched based on the search query. Therefore, when the user searches for a product, the user can grasp the characteristics of the product without displaying the appeal page. In this way, the extraction device 100 can improve the convenience of the user who uses the commercial transaction site.

〔6−3.レコメンドへの利用〕
抽出装置100は、商取引サイトのみならず、例えば、ウェブページ等とともに表示される商材のレコメンド(例えば、ウェブページの広告枠やレコメンド枠に表示される情報)において、特徴情報を表示するようにしてもよい。
[6-3. Use for recommendations]
The extraction device 100 displays the feature information not only in the commercial transaction site but also in the recommendation of the product displayed together with the web page or the like (for example, the information displayed in the advertisement frame or the recommendation frame of the web page). You may.

例えば、商取引サイトに出品されている商材は、当該商材以外のウェブページ等にレコメンドとして表示される場合がある。この場合に、抽出装置100は、レコメンドされる商材とともに、特徴情報を表示させるようにする。これにより、ユーザは、レコメンドされる商材のアピールページへアクセスせずとも(現在閲覧しているページからアピールページに表示を遷移させなくても)、商材の特徴を把握することができる。 For example, a product listed on a commercial transaction site may be displayed as a recommendation on a web page or the like other than the product. In this case, the extraction device 100 displays the feature information together with the recommended product. As a result, the user can grasp the characteristics of the product without accessing the appeal page of the recommended product (without transitioning the display from the currently viewed page to the appeal page).

なお、抽出装置100は、当該商材のレコメンドがクリックされたか、あるいは、ユーザがコンバージョンに至ったかという情報を取得してもよい。例えば、レコメンドとして表示された特徴情報が不適切な場合や、訴求効果が低い場合には、ユーザは、クリックしたりコンバージョンしたりする反応を返さないものと想定される。一方、ユーザがクリックしたりコンバージョンしたりする反応を返した場合、当該レコメンドとともに表示された特徴情報は、商材の特徴を適切に示す情報であった(正解)と想定される。 The extraction device 100 may acquire information as to whether the recommendation of the product has been clicked or whether the user has converted. For example, if the feature information displayed as a recommendation is inappropriate or the appeal effect is low, it is assumed that the user does not respond to clicking or converting. On the other hand, when the user returns a reaction of clicking or converting, it is assumed that the feature information displayed together with the recommendation is information that appropriately indicates the features of the product (correct answer).

そして、抽出装置100は、上記実施形態で説明したように、レコメンドに対する反応に応じて、特徴情報や特徴情報の処理の正否を判定する。これにより、抽出装置100は、アピールページ以外のユーザからの反応を利用して、抽出処理や抽出処理の精度を向上させる(学習を行う)ことができる。 Then, as described in the above embodiment, the extraction device 100 determines whether the feature information or the processing of the feature information is correct or not according to the reaction to the recommendation. As a result, the extraction device 100 can improve (learn) the accuracy of the extraction process and the extraction process by utilizing the reaction from the user other than the appeal page.

〔6−4.商材〕
上記実施形態では、商材として、不動産の賃貸物件や、パソコン等を例に挙げたが、商材はこれらに限られない。すなわち、抽出装置100は、商取引サイトで取り扱われる商材であって、商材情報を取得可能な商材であれば、商品やサービスなどいずれの商材においても、実施形態に係る抽出処理を行うことができる。
[6-4. commodity〕
In the above embodiment, real estate rental properties, personal computers, and the like are given as examples of products, but the products are not limited to these. That is, the extraction device 100 performs the extraction process according to the embodiment for any product such as a product or a service as long as it is a product handled on the commercial transaction site and the product information can be acquired. be able to.

〔6−5.コンテンツ〕
上記実施形態では、コンテンツとしてウェブページを例として挙げたが、コンテンツはこの例に限られない。例えば、コンテンツは、広告コンテンツであったり、アプリを介して提供される情報ページであったり、レコメンドに係るコンテンツであったりしてもよい。すなわち、抽出装置100が生成するコンテンツとは、ネットワークを介して提供される情報コンテンツであれば、いずれのコンテンツであってもよい。
[6-5. content〕
In the above embodiment, a web page is given as an example of the content, but the content is not limited to this example. For example, the content may be an advertisement content, an information page provided via an application, or content related to a recommendation. That is, the content generated by the extraction device 100 may be any content as long as it is information content provided via the network.

例えば、抽出装置100は、所定の商品における特徴情報を抽出した場合には、抽出した特徴情報を、当該商品を宣伝するための広告コンテンツに反映させてもよい。例えば、抽出装置100は、広告主(商品の提供主)が入稿してきた広告コンテンツが宣伝する商品についての特徴情報を抽出する。そして、抽出装置100は、抽出した特徴情報から生成される宣伝情報(例えば、要約文)を広告コンテンツに付与して、広告コンテンツを生成する。具体的には、抽出装置100は、広告コンテンツにおいて、商品を宣伝するためのテキストデータが挿入される箇所に、特徴情報に基づいて生成した要約文を追加する。これにより、抽出装置100は、例えば多くの競合する商品(すなわち、商品の集合)に対して、より優位な特徴をアピールするような広告コンテンツを生成することができる。 For example, when the extraction device 100 extracts the feature information of a predetermined product, the extracted feature information may be reflected in the advertising content for promoting the product. For example, the extraction device 100 extracts characteristic information about a product advertised by an advertising content submitted by an advertiser (product provider). Then, the extraction device 100 adds advertising information (for example, a summary sentence) generated from the extracted feature information to the advertisement content to generate the advertisement content. Specifically, the extraction device 100 adds a summary sentence generated based on the feature information to a place where text data for promoting the product is inserted in the advertisement content. Thereby, the extraction device 100 can generate advertising content that appeals more superior features to, for example, many competing products (that is, a set of products).

〔7.ハードウェア構成〕
上述してきた実施形態に係る抽出装置100やユーザ端末10や事業者端末20やウェブサーバ30は、例えば図11に示すような構成のコンピュータ1000によって実現される。以下、抽出装置100を例に挙げて説明する。図11は、抽出装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[7. Hardware configuration]
The extraction device 100, the user terminal 10, the business terminal 20, and the web server 30 according to the above-described embodiment are realized by, for example, a computer 1000 having a configuration as shown in FIG. Hereinafter, the extraction device 100 will be described as an example. FIG. 11 is a hardware configuration diagram showing an example of a computer 1000 that realizes the functions of the extraction device 100. The computer 1000 has a CPU 1100, a RAM 1200, a ROM 1300, an HDD 1400, a communication interface (I / F) 1500, an input / output interface (I / F) 1600, and a media interface (I / F) 1700.

CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each part. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started, a program that depends on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(図2に示したネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網500を介して他の機器へ送信する。 The HDD 1400 stores a program executed by the CPU 1100, data used by such a program, and the like. The communication interface 1500 receives data from another device via the communication network 500 (corresponding to the network N shown in FIG. 2) and sends the data to the CPU 1100, and the data generated by the CPU 1100 is transmitted to the other device via the communication network 500. Send to the device.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。 The CPU 1100 controls an output device such as a display or a printer, and an input device such as a keyboard or a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the data generated via the input / output interface 1600 to the output device.

メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. And so on.

例えば、コンピュータ1000が実施形態に係る抽出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the extraction device 100 according to the embodiment, the CPU 1100 of the computer 1000 realizes the function of the control unit 130 by executing the program loaded on the RAM 1200. Further, the data in the storage unit 120 is stored in the HDD 1400. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be acquired from another device via the communication network 500.

〔8.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[8. Others]
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed can be performed. All or part of it can be done automatically by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図3に示した取得部131と、受付部133とは統合されてもよい。また、例えば、記憶部120に記憶される情報は、ネットワークNを介して、外部に備えられた所定の記憶装置に記憶されてもよい。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically distributed / physically in arbitrary units according to various loads and usage conditions. It can be integrated and configured. For example, the acquisition unit 131 shown in FIG. 3 and the reception unit 133 may be integrated. Further, for example, the information stored in the storage unit 120 may be stored in a predetermined storage device provided externally via the network N.

また、上記実施形態では、抽出装置100が、例えば、商材情報を取得する取得処理と、特徴情報を抽出する抽出処理と、アピールページを生成する生成処理とを行う例を示した。しかし、上述した抽出装置100は、取得処理を行う取得装置と、抽出処理を行う抽出装置と、生成処理を行う生成装置とに分離されてもよい。この場合、取得装置は、少なくとも取得部131を有する。抽出装置は、少なくとも抽出部134を有する。生成装置は、少なくとも生成部135を有する。そして、上記の抽出装置100による処理は、取得装置と、抽出装置と、生成装置との各装置を有する抽出処理システム1によって実現される。 Further, in the above embodiment, an example is shown in which the extraction device 100 performs, for example, an acquisition process for acquiring product information, an extraction process for extracting feature information, and a generation process for generating an appeal page. However, the above-mentioned extraction device 100 may be separated into an acquisition device that performs acquisition processing, an extraction device that performs extraction processing, and a generation device that performs generation processing. In this case, the acquisition device has at least the acquisition unit 131. The extraction device has at least an extraction unit 134. The generator has at least a generator 135. Then, the processing by the extraction device 100 is realized by the extraction processing system 1 having each device of the acquisition device, the extraction device, and the generation device.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments and modifications can be appropriately combined as long as the processing contents do not contradict each other.

〔9.効果〕
上述してきたように、実施形態に係る抽出装置100は、取得部131と、抽出部134とを有する。取得部131は、ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する。抽出部134は、ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、所定の商材の商材情報のうち、集合において所定の条件を満たす情報である特徴情報を抽出する。
[9. effect〕
As described above, the extraction device 100 according to the embodiment has an acquisition unit 131 and an extraction unit 134. The acquisition unit 131 acquires the product information associated with the product that is the target of the commercial transaction on the network. In the predetermined product included in the set formed based on the contents specified by the user, the extraction unit 134 is the feature information which is the information satisfying the predetermined condition in the set among the product information of the predetermined product. Is extracted.

このように、実施形態に係る抽出装置100は、例えば商取引サイトにおける商材紹介ページ等において、種々の事業者によって設定された商材情報から、商材の特徴を抽出する。すなわち、抽出装置100は、商材について、ユーザが指定した集合(他の商材)と比べた際に特徴となるアピールポイントを抽出することで、ユーザの指定に応じた動的な特徴をアピールすること、すなわち、商材に関する特徴をより柔軟にアピールすることができる。 As described above, the extraction device 100 according to the embodiment extracts the characteristics of the product from the product information set by various business operators, for example, on the product introduction page on the commercial transaction site. That is, the extraction device 100 appeals the dynamic features according to the user's designation by extracting the appeal points that are characteristic when the product is compared with the set (other products) designated by the user. That is, it is possible to more flexibly appeal the characteristics of the product.

また、抽出部134は、集合に含まれる所定の商材の商材情報が集合において優位性を示す情報である場合に、商材情報を特徴情報として抽出する。 Further, the extraction unit 134 extracts the product information as the feature information when the product information of the predetermined product included in the set is the information indicating the superiority in the set.

このように、実施形態に係る抽出装置100は、ユーザが指定した集合と比べた際の優位性を有する特徴を抽出するので、商材が有する特徴を明確にユーザに伝えることができる。 As described above, since the extraction device 100 according to the embodiment extracts the features having an advantage when compared with the set specified by the user, the features of the product can be clearly conveyed to the user.

また、抽出部134は、商材のカテゴリごとに予め設定された所定の条件に基づいて、特徴情報を抽出する。 In addition, the extraction unit 134 extracts feature information based on predetermined conditions set in advance for each product category.

このように、実施形態に係る抽出装置100は、カテゴリごとに条件を設定し、特徴情報を抽出する。これにより、抽出装置100は、様々な商材に対応した、的確な特徴情報を抽出することができる。 In this way, the extraction device 100 according to the embodiment sets conditions for each category and extracts feature information. As a result, the extraction device 100 can extract accurate feature information corresponding to various products.

また、抽出部134は、商材情報のうち、商材に対応付けられたテキストデータに対して設定される正解データを用いた学習処理に基づいて、特徴情報を抽出する。 Further, the extraction unit 134 extracts the feature information based on the learning process using the correct answer data set for the text data associated with the product among the product information.

このように、実施形態に係る抽出装置100は、予め設定された正解データに基づいて学習を行うことで、人手によって抽出される特徴に類似するような特徴情報を抽出することができる。すなわち、抽出装置100は、的確に商材の特徴を示す特徴情報を抽出することができる。 As described above, the extraction device 100 according to the embodiment can extract feature information similar to the features extracted manually by performing learning based on preset correct answer data. That is, the extraction device 100 can accurately extract the feature information indicating the features of the product.

また、抽出部134は、商材情報のうち、商材に対応付けられたテキストデータを特徴付ける情報を抽出するよう学習された学習器を用いて、特徴情報を抽出する。 Further, the extraction unit 134 extracts the feature information by using a learning device learned to extract the information that characterizes the text data associated with the product among the product information.

このように、実施形態に係る抽出装置100は、例えばディープラーニング等の手法によって、テキストデータを特徴付けている特徴量を抽出する手法によって学習を行ってもよい。かかる処理によって、抽出装置100は、精度よく、また、効率的に特徴情報を抽出することができる。 As described above, the extraction device 100 according to the embodiment may perform learning by a method of extracting the feature amount characterizing the text data by a method such as deep learning. By such processing, the extraction device 100 can extract the feature information accurately and efficiently.

また、実施形態に係る抽出装置100は、抽出部134によって抽出された特徴情報に基づいて、所定の商材に関するページ(コンテンツの一例)を生成する生成部135をさらに備える。 In addition, the extraction device 100 according to the embodiment further includes a generation unit 135 that generates a page (an example of content) related to a predetermined product based on the feature information extracted by the extraction unit 134.

このように、実施形態に係る抽出装置100は、例えば商取引サイトにおける商材紹介ページ等において、商材の特徴を抽出し、抽出された特徴に基づいて特徴をアピールするためのページを生成する。これにより、抽出装置100は、ユーザの指定に応じた動的な特徴をアピールすることができる。 As described above, the extraction device 100 according to the embodiment extracts the features of the product on the product introduction page or the like on the commercial transaction site, and generates a page for appealing the features based on the extracted features. As a result, the extraction device 100 can appeal the dynamic features according to the user's designation.

また、取得部131は、生成部135によって生成されたページを閲覧したユーザの反応を取得する。生成部135は、ユーザからの反応に基づいて、生成されたページを更新する。 In addition, the acquisition unit 131 acquires the reaction of the user who browses the page generated by the generation unit 135. The generation unit 135 updates the generated page based on the reaction from the user.

このように、実施形態に係る抽出装置100は、ユーザの反応をフィードバックさせて抽出処理を行うことができる。これにより、抽出装置100は、生成するページを最適化することができる。 In this way, the extraction device 100 according to the embodiment can perform the extraction process by feeding back the reaction of the user. As a result, the extraction device 100 can optimize the page to be generated.

また、取得部131は、生成部135によって生成されたページを閲覧したユーザに関する情報を取得する。生成部135は、ユーザに関する情報に基づいて、所定の商材に関するページであって、ユーザに関する情報に対応したページを生成する。 In addition, the acquisition unit 131 acquires information about the user who has viewed the page generated by the generation unit 135. The generation unit 135 generates a page related to a predetermined product and corresponding to the information about the user based on the information about the user.

このように、実施形態に係る抽出装置100は、ユーザごとに異なるページを生成してもよい。これにより、抽出装置100は、ユーザ一人一人の特徴に合わせた特徴情報がアピールされたページを提供できるので、ページの訴求効果を向上させることができる。 As described above, the extraction device 100 according to the embodiment may generate different pages for each user. As a result, the extraction device 100 can provide a page in which the feature information tailored to the characteristics of each user is appealed, so that the appealing effect of the page can be improved.

また、抽出部134は、特徴情報として、商材を特徴付ける語句を抽出する。生成部135は、商材に対応付けられたテキストデータのうち、抽出部134によって抽出された語句が強調表示される態様のページを生成する。 In addition, the extraction unit 134 extracts words and phrases that characterize the product as feature information. The generation unit 135 generates a page in which the words and phrases extracted by the extraction unit 134 are highlighted in the text data associated with the product.

このように、実施形態に係る抽出装置100は、元の説明文に対して特徴のみを強調表示するような態様のページを生成してもよい。これにより、抽出装置100は、元の事業者の説明文の表示等のレイアウトや内容を崩さずに、集合に対して当該商材が優れている特徴をアピールすることができる。 As described above, the extraction device 100 according to the embodiment may generate a page having a mode in which only the features are highlighted with respect to the original description. As a result, the extraction device 100 can appeal the superior feature of the product to the set without breaking the layout and contents such as the display of the explanation of the original business operator.

また、生成部135は、特徴情報に基づいて、商材に対応付けられたテキストデータの要約文を生成するとともに、要約文が付与されたページを生成する。 In addition, the generation unit 135 generates a summary sentence of the text data associated with the product based on the feature information, and also generates a page to which the summary sentence is added.

このように、実施形態に係る抽出装置100は、特徴情報として、商材の特徴を要約した要約文を生成してもよい。これにより、抽出装置100は、冗長な説明文の代わりに、短い文章で商材の特徴をユーザに提示できるので、効率的に情報を伝えることのできるページを生成することができる。 As described above, the extraction device 100 according to the embodiment may generate a summary sentence summarizing the features of the product as the feature information. As a result, the extraction device 100 can present the characteristics of the product to the user in a short sentence instead of the redundant explanation, so that it is possible to generate a page capable of efficiently transmitting information.

また、生成部135は、商材に対応付けられたテキストデータに先立って、要約文が配置される態様のページを生成する。 In addition, the generation unit 135 generates a page in which a summary sentence is arranged prior to the text data associated with the product.

このように、実施形態に係る抽出装置100は、元の説明文よりも先立って要約文を提示するページを生成することで、より速く的確に商材の特徴をユーザに伝えることができる。これにより、抽出装置100は、商取引サイトを利用するユーザのユーザビリティを向上させることができる。 As described above, the extraction device 100 according to the embodiment can convey the characteristics of the product to the user more quickly and accurately by generating a page for presenting the summary sentence prior to the original explanatory sentence. As a result, the extraction device 100 can improve the usability of the user who uses the commercial transaction site.

また、生成部135は、所定の検索処理の結果として商材が表示される場合において、抽出部134によって抽出された特徴情報を含む検索結果ページを生成する。 In addition, the generation unit 135 generates a search result page including the feature information extracted by the extraction unit 134 when the product is displayed as a result of the predetermined search processing.

このように、実施形態に係る抽出装置100は、検索結果とともに表示される情報として特徴情報が提示されるようなページを生成してもよい。これにより、抽出装置100は、わざわざユーザがアピールページにアクセスせずとも、商品の特徴をユーザに伝えることができる。 As described above, the extraction device 100 according to the embodiment may generate a page in which the feature information is presented as the information displayed together with the search result. As a result, the extraction device 100 can convey the features of the product to the user without the user having to bother to access the appeal page.

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 The embodiments of the present application have been described in detail with reference to the drawings, but this is an example, and various modifications and improvements are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other forms described above.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 In addition, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the acquisition unit can be read as an acquisition means or an acquisition circuit.

1 抽出処理システム
10 ユーザ端末
20 事業者端末
30 ウェブサーバ
100 抽出装置
110 通信部
120 記憶部
121 商材情報記憶部
122 学習情報記憶部
123 提供情報記憶部
130 制御部
131 取得部
132 学習部
133 受付部
134 抽出部
135 生成部
136 提供部
1 Extraction processing system 10 User terminal 20 Business terminal 30 Web server 100 Extraction device 110 Communication unit 120 Storage unit 121 Product information storage unit 122 Learning information storage unit 123 Provided information storage unit 130 Control unit 131 Acquisition unit 132 Learning unit 133 Reception Part 134 Extraction part 135 Generation part 136 Providing part

Claims (16)

ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得部と、
商材に関する指定をユーザから受け付ける受付部と、
前記受付部が商材に関する指定を前記ユーザから受け付けた場合に、当該商材に関する指定に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報に含まれる、当該所定の商材のスペックに関する情報のうち、当該集合において当該スペックの順位に関する所定の条件を満たす情報である特徴情報を抽出する抽出部と、
を備えたことを特徴とする抽出装置。
An acquisition unit that acquires product information associated with a product that is the target of commercial transactions on the network,
The reception department that accepts specifications regarding products from users,
When the reception unit receives a designation regarding a product from the user, the predetermined product included in the set formed based on the designation regarding the product is included in the product information of the predetermined product. , An extraction unit that extracts feature information that satisfies a predetermined condition regarding the order of the specifications in the set from the information related to the specifications of the predetermined product.
An extraction device characterized by being equipped with.
前記抽出部は、
前記集合に含まれる所定の商材の商材情報が当該集合において優位性を示す情報である場合に、当該商材情報を前記特徴情報として抽出する、
ことを特徴とする請求項1に記載の抽出装置。
The extraction unit
When the product information of a predetermined product included in the set is information showing superiority in the set, the product information is extracted as the feature information.
The extraction device according to claim 1.
前記抽出部は、
前記商材のカテゴリごとに予め設定された前記所定の条件に基づいて、前記特徴情報を抽出する、
ことを特徴とする請求項1又は2に記載の抽出装置。
The extraction unit
The feature information is extracted based on the predetermined conditions set in advance for each category of the product.
The extraction device according to claim 1 or 2.
前記抽出部は、
前記商材情報のうち、前記商材に対応付けられたテキストデータに対して設定される正解データを用いた学習処理に基づいて、前記特徴情報を抽出する、
ことを特徴とする請求項1〜3のいずれか一つに記載の抽出装置。
The extraction unit
Among the product information, the feature information is extracted based on the learning process using the correct answer data set for the text data associated with the product.
The extraction device according to any one of claims 1 to 3.
前記抽出部は、
前記商材情報のうち、前記商材に対応付けられたテキストデータを特徴付ける情報を抽出するよう学習された学習器を用いて、前記特徴情報を抽出する、
ことを特徴とする請求項1〜4のいずれか一つに記載の抽出装置。
The extraction unit
Among the product information, the feature information is extracted by using a learning device learned to extract information that characterizes the text data associated with the product.
The extraction device according to any one of claims 1 to 4, wherein the extraction device is characterized.
前記抽出部によって抽出された特徴情報に基づいて、前記所定の商材に関するコンテンツを生成する生成部、
をさらに備えたことを特徴とする請求項1〜5のいずれか一つに記載の抽出装置。
A generation unit that generates content related to the predetermined product based on the feature information extracted by the extraction unit.
The extraction device according to any one of claims 1 to 5, further comprising.
ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得部と、
ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報のうち、当該集合において所定の条件を満たす情報である特徴情報を抽出する抽出部と、
前記抽出部によって抽出された特徴情報に基づいて、前記所定の商材に関するコンテンツを生成する生成部と、を備え、
前記抽出部は、
前記商材に対応付けられたテキストデータから、前記特徴情報を抽出し、
前記生成部は、
前記特徴情報に基づいて、前記商材に対応付けられた前記テキストデータの要約文を生成するとともに、当該要約文が付与された前記コンテンツを生成する、
ことを特徴とする抽出装置。
An acquisition unit that acquires product information associated with a product that is the target of commercial transactions on the network,
In a predetermined product included in a set formed based on the contents specified by the user, feature information that satisfies a predetermined condition in the set is extracted from the product information of the predetermined product. Extractor and
A generation unit that generates content related to the predetermined product based on the feature information extracted by the extraction unit is provided.
The extraction unit
The feature information is extracted from the text data associated with the product, and the feature information is extracted.
The generator
Based on the feature information, a summary sentence of the text data associated with the product is generated, and the content to which the summary sentence is attached is generated.
An extraction device characterized by that.
前記取得部は、
前記生成部によって生成されたコンテンツを閲覧したユーザの反応を取得し、
前記生成部は、
前記ユーザの反応に基づいて、前記生成されたコンテンツを更新する、
ことを特徴とする請求項6又は7に記載の抽出装置。
The acquisition unit
The reaction of the user who viewed the content generated by the generation unit is acquired, and the reaction is obtained.
The generator
Update the generated content based on the user's reaction.
The extraction device according to claim 6 or 7.
前記取得部は、
前記生成部によって生成されたコンテンツを閲覧したユーザに関する情報を取得し、
前記生成部は、
前記ユーザに関する情報に基づいて、前記所定の商材に関するコンテンツであって、当該ユーザに関する情報に対応したコンテンツを生成する、
ことを特徴とする請求項6〜8のいずれか一つに記載の抽出装置。
The acquisition unit
Obtain information about the user who viewed the content generated by the generation unit,
The generator
Based on the information about the user, the content related to the predetermined product and corresponding to the information about the user is generated.
The extraction device according to any one of claims 6 to 8, wherein the extraction device is characterized.
前記抽出部は、
前記特徴情報として、前記商材を特徴付ける語句を抽出し、
前記生成部は、
前記商材に対応付けられたテキストデータのうち、前記抽出部によって抽出された語句が強調表示される態様の前記コンテンツを生成する、
ことを特徴とする請求項6〜9のいずれか一つに記載の抽出装置。
The extraction unit
As the feature information, words and phrases that characterize the product are extracted.
The generator
Of the text data associated with the product, the content in which the words and phrases extracted by the extraction unit are highlighted is generated.
The extraction device according to any one of claims 6 to 9, wherein the extraction device is characterized.
前記生成部は、
前記商材に対応付けられたテキストデータに先立って、前記要約文が配置される態様の前記コンテンツを生成する、
ことを特徴とする請求項7に記載の抽出装置。
The generator
Prior to the text data associated with the product, the content in the mode in which the summary sentence is arranged is generated.
The extraction device according to claim 7.
前記生成部は、
前記ユーザから指定された内容の商材を検索するための検索クエリに対応する所定の検索処理の結果として前記所定の商材が表示される場合において、前記所定の商材に関するコンテンツとして、前記抽出部によって抽出された特徴情報を含む検索結果ページを生成する、
ことを特徴とする請求項6〜11のいずれか一つに記載の抽出装置。
The generator
When the predetermined product is displayed as a result of a predetermined search process corresponding to a search query for searching the product having the content specified by the user, the extraction is performed as the content related to the predetermined product. Generate a search result page containing the feature information extracted by the department,
The extraction device according to any one of claims 6 to 11, characterized in that.
コンピュータが実行する抽出方法であって、
ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得工程と、
商材に関する指定をユーザから受け付ける受付工程と、
前記受付工程が商材に関する指定を前記ユーザから受け付けた場合に、当該商材に関する指定に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報に含まれる、当該所定の商材のスペックに関する情報のうち、当該集合において当該スペックの順位に関する所定の条件を満たす情報である特徴情報を抽出する抽出工程と、
を含んだことを特徴とする抽出方法。
An extraction method performed by a computer
The acquisition process to acquire the product information associated with the product that is the target of commercial transactions on the network,
The reception process that accepts specifications regarding products from users,
When the reception process receives a designation regarding a product from the user, the predetermined product included in the set formed based on the designation regarding the product is included in the product information of the predetermined product. , An extraction process for extracting feature information that satisfies a predetermined condition regarding the order of the specifications in the set from the information regarding the specifications of the predetermined product.
An extraction method characterized by containing.
コンピュータが実行する抽出方法であって、
ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得工程と、
ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報のうち、当該集合において所定の条件を満たす情報である特徴情報を抽出する抽出工程と、
前記抽出工程によって抽出された特徴情報に基づいて、前記所定の商材に関するコンテンツを生成する生成工程と、を含み、
前記抽出工程は、
前記商材に対応付けられたテキストデータから、前記特徴情報を抽出し、
前記生成工程は、
前記特徴情報に基づいて、前記商材に対応付けられた前記テキストデータの要約文を生成するとともに、当該要約文が付与された前記コンテンツを生成する、
ことを特徴とする抽出方法。
An extraction method performed by a computer
The acquisition process to acquire the product information associated with the product that is the target of commercial transactions on the network,
In a predetermined product included in a set formed based on the contents specified by the user, feature information that satisfies a predetermined condition in the set is extracted from the product information of the predetermined product. Extraction process and
Includes a generation step of generating content related to the predetermined product based on the feature information extracted by the extraction step.
The extraction step
The feature information is extracted from the text data associated with the product, and the feature information is extracted.
The production step is
Based on the feature information, a summary sentence of the text data associated with the product is generated, and the content to which the summary sentence is attached is generated.
An extraction method characterized by that.
ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得手順と、
商材に関する指定をユーザから受け付ける受付手順と、
前記受付手順が商材に関する指定を前記ユーザから受け付けた場合に、当該商材に関する指定に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報に含まれる、当該所定の商材のスペックに関する情報のうち、当該集合において当該スペックの順位に関する所定の条件を満たす情報である特徴情報を抽出する抽出手順と、
をコンピュータに実行させることを特徴とする抽出プログラム。
The acquisition procedure for acquiring the product information associated with the product that is the target of commercial transactions on the network, and
The reception procedure for accepting specifications regarding products from users,
When the reception procedure receives a designation regarding a product from the user, the predetermined product included in the set formed based on the designation regarding the product is included in the product information of the predetermined product. , An extraction procedure for extracting feature information that satisfies a predetermined condition regarding the order of the specifications in the set from the information regarding the specifications of the predetermined product.
An extraction program characterized by having a computer execute.
ネットワーク上の商取引の対象である商材に対応付けられた商材情報を取得する取得手順と、
ユーザから指定された内容に基づいて形成される集合に含まれる所定の商材において、当該所定の商材の商材情報のうち、当該集合において所定の条件を満たす情報である特徴情報を抽出する抽出手順と、
前記抽出手順によって抽出された特徴情報に基づいて、前記所定の商材に関するコンテンツを生成する生成手順と、をコンピュータに実行させ、
前記抽出手順は、
前記商材に対応付けられたテキストデータから、前記特徴情報を抽出し、
前記生成手順は、
前記特徴情報に基づいて、前記商材に対応付けられた前記テキストデータの要約文を生成するとともに、当該要約文が付与された前記コンテンツを生成する、
ことを特徴とする抽出プログラム。
The acquisition procedure for acquiring the product information associated with the product that is the target of commercial transactions on the network, and
In a predetermined product included in a set formed based on the contents specified by the user, feature information that satisfies a predetermined condition in the set is extracted from the product information of the predetermined product. Extraction procedure and
A computer is made to execute a generation procedure for generating content related to the predetermined product based on the feature information extracted by the extraction procedure.
The extraction procedure
The feature information is extracted from the text data associated with the product, and the feature information is extracted.
The generation procedure is
Based on the feature information, a summary sentence of the text data associated with the product is generated, and the content to which the summary sentence is attached is generated.
An extraction program characterized by that.
JP2017020701A 2017-02-07 2017-02-07 Extractor, extraction method and extraction program Active JP6833540B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017020701A JP6833540B2 (en) 2017-02-07 2017-02-07 Extractor, extraction method and extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017020701A JP6833540B2 (en) 2017-02-07 2017-02-07 Extractor, extraction method and extraction program

Publications (2)

Publication Number Publication Date
JP2018128806A JP2018128806A (en) 2018-08-16
JP6833540B2 true JP6833540B2 (en) 2021-02-24

Family

ID=63172859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017020701A Active JP6833540B2 (en) 2017-02-07 2017-02-07 Extractor, extraction method and extraction program

Country Status (1)

Country Link
JP (1) JP6833540B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7215038B2 (en) * 2018-09-25 2023-01-31 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program
JP7092695B2 (en) * 2019-01-28 2022-06-28 株式会社日立製作所 Property search support system and property search support method
JP6773346B1 (en) * 2019-07-17 2020-10-21 Assest株式会社 Tenant recommendation company proposal program, real estate transaction price proposal program
JP7430205B2 (en) 2022-01-13 2024-02-09 Lineヤフー株式会社 Information processing device, information processing method, and information processing program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288190A (en) * 2001-03-26 2002-10-04 Just Syst Corp System, and method for summarizing and program therefor
JP2002358327A (en) * 2001-06-01 2002-12-13 Fujitsu Ltd Providing method for commodity information, using method therefor, providing apparatus therefor, program and recording medium
JP5748503B2 (en) * 2011-02-24 2015-07-15 株式会社ナビタイムジャパン Navigation system, navigation method, and program
JP5973416B2 (en) * 2013-12-06 2016-08-23 ヤフー株式会社 Advertising device, prediction method, and prediction program
WO2015151176A1 (en) * 2014-03-31 2015-10-08 楽天株式会社 Information processing device, information processing method, and information processing program

Also Published As

Publication number Publication date
JP2018128806A (en) 2018-08-16

Similar Documents

Publication Publication Date Title
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US11455660B2 (en) Extraction device, extraction method, and non-transitory computer readable storage medium
US10275534B2 (en) Landing page search results
US9798820B1 (en) Classification of keywords
US20160140627A1 (en) Generating high quality leads for marketing campaigns
US20110112981A1 (en) Feature-Based Method and System for Cold-Start Recommendation of Online Ads
US11295375B1 (en) Machine learning based computer platform, computer-implemented method, and computer program product for finding right-fit technology solutions for business needs
JP6698040B2 (en) Generation device, generation method, and generation program
JP6833540B2 (en) Extractor, extraction method and extraction program
US9268859B2 (en) Method and system for customizing a web site
US20180096067A1 (en) Creation and optimization of resource contents
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
JP6698730B2 (en) Extraction device, extraction method, and extraction program
JP6865045B2 (en) Search device, search method and search program
US20160247194A1 (en) Extraction device, extraction method, and non-transitory computer readable storage medium
US20130332440A1 (en) Refinements in Document Analysis
KR20160130369A (en) In online web text based commercial analysis service system and method thereof
KR20190108624A (en) Systems and Methods for Improved Online Research
US20180165741A1 (en) Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program
JP6664598B2 (en) Provision device, provision method, and provision program
US20210209651A1 (en) Content optimization on a social media platform based on third-party data
US10311484B2 (en) Data processing device and data processing method
JP2019003556A (en) Extraction device, extraction method, and extraction program
US20150248491A1 (en) Data processing device and data processing method
JP7321977B2 (en) Information processing device, information processing method and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181018

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210203

R150 Certificate of patent or registration of utility model

Ref document number: 6833540

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250