JP2021140646A - Target user feature extraction method, target user feature extraction system and target user feature extraction server - Google Patents
Target user feature extraction method, target user feature extraction system and target user feature extraction server Download PDFInfo
- Publication number
- JP2021140646A JP2021140646A JP2020039825A JP2020039825A JP2021140646A JP 2021140646 A JP2021140646 A JP 2021140646A JP 2020039825 A JP2020039825 A JP 2020039825A JP 2020039825 A JP2020039825 A JP 2020039825A JP 2021140646 A JP2021140646 A JP 2021140646A
- Authority
- JP
- Japan
- Prior art keywords
- data
- user
- target
- poster
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims description 170
- 238000004364 calculation method Methods 0.000 claims description 81
- 238000012545 processing Methods 0.000 claims description 68
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 239000000284 extract Substances 0.000 claims description 19
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 17
- 238000010801 machine learning Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 235000019640 taste Nutrition 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000002184 metal Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、ウェブサイトを閲覧するユーザの履歴情報から特定のユーザ特徴を抽出する技術に関する。 The present invention relates to a technique for extracting a specific user feature from the history information of a user who browses a website.
インターネット上のウェブサイトでは、コンテンツにアクセスするユーザの行動履歴(閲覧や視聴又は検索の履歴)に基づいて、コンテンツに表示する広告の内容を決定する技術が知られている。 On websites on the Internet, there is known a technique for determining the content of an advertisement to be displayed on the content based on the behavior history (browsing, viewing, or searching history) of a user who accesses the content.
また、商品やサービスを提供するウェブサイトでは、商品やレビューにアクセスするユーザの行動履歴に基づいてユーザの嗜好を推定し、推薦する商品やサービスを決定する技術が知られている。 Further, on websites that provide products and services, there is known a technique for estimating user preferences based on the behavior history of users who access products and reviews and determining recommended products and services.
ウェブサイトにアクセスするユーザの嗜好を分析するウェブ解析の技術としては、例えば、特許文献1、2が知られている。
For example,
特許文献1には、ユーザ情報格納部及びユーザ履歴情報格納部を参照して、ユーザ毎に、レコメンド候補のアイテムを推定する技術が開示されている。また、特許文献2には、ユーザが選択したアイテムの選択履歴からユーザの嗜好分布を解析し、好分布の中心に近く、嗜好分布形状から離れている推薦指標を算出し、算出された前記推薦指標に基づいて、推薦するアイテムを表示する技術が開示されている。
ウェブサイトにコンテンツ等の情報を提供する投稿者は、提供するコンテンツにアクセスするユーザに応じて、新たなビジネスの創出や、既存のユーザの掘り起こしを意図する場合がある。投稿者がターゲットとするユーザの特徴(以下、ユーザ特徴とする)を抽出する際に、重要視される項目は投稿者の嗜好やターゲット(獲得目標)に依存する。 A contributor who provides information such as content to a website may intend to create a new business or dig up an existing user depending on the user who accesses the provided content. When extracting the characteristics of the user targeted by the poster (hereinafter referred to as user characteristics), the items to be emphasized depend on the preference and target (acquisition target) of the poster.
例えば、投稿者には、現在のビジネスを広げるため、既存の顧客へのアプローチを重要視する者もいれば、新たなビジネスを創出するために、潜在する顧客を探ることを重要視する者もいる。投稿者がターゲットとするユーザ特徴を抽出するためには、ユーザのウェブ解析に加えて、投稿者の意図を的確に抽出することが必要となる。 For example, some contributors emphasize approaching existing customers in order to expand their current business, while others emphasize exploring potential customers in order to create new businesses. There is. In order to extract the user characteristics targeted by the poster, it is necessary to accurately extract the intention of the poster in addition to the web analysis of the user.
上記従来例の特許文献1では、ユーザの嗜好を判定した後、ユーザの行動履歴からユーザに情報を提示する計画を算出している。この特許文献1に開示されている嗜好判定部では、類似度の判定にはユーザの属性情報と履歴情報を用いているのみで、アイテム(コンテンツ)を提供する側のターゲットに関する意図(又は嗜好)は考慮されていない、という問題があった。
In
また、従来例の特許文献2では、ユーザの嗜好を解析して、嗜好分布形状から離れている推薦指標を算出して意外性のあるアイテムを提供している。しかし、この特許文献2では、アイテムの提供者が意図するターゲットについては考慮されていない、という問題があった。
Further, in
そこで本発明は、上記問題点に鑑みてなされたもので、ウェブサイトに情報を提供する投稿者が獲得したいユーザ特徴を、ウェブサイトにアクセスしたユーザの履歴から抽出することを目的とする。 Therefore, the present invention has been made in view of the above problems, and an object of the present invention is to extract user characteristics that a poster who provides information to a website wants to acquire from the history of users who have accessed the website.
本発明は、プロセッサとメモリを有する計算機が、ウェブサーバのコンテンツにアクセスした履歴情報から投稿者が獲得目標とするユーザ特徴を抽出するターゲットユーザ特徴抽出方法であって、前記計算機が、前記ウェブサーバのコンテンツにアクセスしたユーザ端末の履歴情報を格納したセッションデータと、前記ユーザ端末を利用するユーザの属性情報を格納したユーザ属性データと、をユーザデータとして取得するユーザデータ取得ステップと、前記計算機が、前記コンテンツの属性を格納したページ属性データと、前記コンテンツを提供した前記投稿者の属性を格納した投稿者属性データと、を投稿者データとして取得する投稿者データ取得ステップと、前記計算機が、抽出対象とする投稿者を受け付けて、前記投稿者が獲得目標とするユーザの情報をターゲットタイプとして取得する嗜好取得ステップと、前記計算機が、前記投稿者のターゲットタイプから抽出対象のデータの項目と前記項目の値の範囲を算出するターゲット算出ステップと、前記計算機が、前記ユーザデータと前記投稿者データから前記項目に対応する抽出対象データを算出するセッション特徴算出ステップと、前記計算機が、前記抽出対象データと前記投稿者データから前記項目の値の範囲に基づいてアクセスの特徴量を算出するアクセス特徴抽出ステップと、を含む。 The present invention is a target user feature extraction method in which a computer having a processor and a memory extracts user features targeted by a poster from history information of accessing the contents of a web server, wherein the computer is the web server. The user data acquisition step of acquiring the session data storing the history information of the user terminal that has accessed the contents of the above and the user attribute data storing the attribute information of the user who uses the user terminal as user data, and the computer , The poster data acquisition step of acquiring the page attribute data storing the attributes of the content and the poster attribute data storing the attributes of the poster who provided the content as poster data, and the computer The preference acquisition step of accepting the poster to be extracted and acquiring the information of the user targeted by the poster as the target type, and the item of the data to be extracted from the target type of the poster by the computer. A target calculation step for calculating a range of values of the item, a session feature calculation step for the computer to calculate extraction target data corresponding to the item from the user data and the poster data, and the extraction by the computer. It includes an access feature extraction step of calculating an access feature amount based on a range of values of the item from the target data and the poster data.
したがって、本発明は、コンテンツを提供する投稿者の嗜好に応じたユーザ特徴を、ウェブサイトにアクセスしたユーザの履歴情報から抽出することが可能となる。これにより、情報の投稿者が期待するユーザの抽出に加えて、投稿者の意図とは異なる新規のユーザ特徴も抽出することが可能となって、新たなビジネスの創出することも可能となる。 Therefore, the present invention makes it possible to extract user characteristics according to the preference of the poster who provides the content from the history information of the user who has accessed the website. As a result, in addition to extracting the users expected by the poster of the information, it is possible to extract new user characteristics that are different from the intention of the poster, and it is possible to create a new business.
本明細書において開示される主題の、少なくとも一つの実施の詳細は、添付されている図面と以下の記述の中で述べられる。開示される主題のその他の特徴、態様、効果は、以下の開示、図面、請求項により明らかにされる。 Details of at least one practice of the subject matter disclosed herein are set forth in the accompanying drawings and in the description below. Other features, aspects, and effects of the disclosed subject matter are manifested in the disclosures, drawings, and claims below.
以下、本発明の実施形態を添付図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings.
図1は、本発明の実施例を示し、ターゲットユーザ特徴抽出システムの構成の一例を示すブロック図である。 FIG. 1 is a block diagram showing an embodiment of the present invention and showing an example of the configuration of a target user feature extraction system.
ターゲットユーザ特徴抽出システムは、コンテンツ210及び広告220を含むウェブサイトを管理するウェブサーバ200と、ウェブサイトの情報にアクセスするユーザ端末100−1〜100−3と、ウェブサーバ200に情報を供給する投稿端末300−1〜300−3と、投稿端末300−1〜300−3から情報を提供する投稿者が獲得したいユーザ(ターゲットタイプ)を、ウェブサーバ200のアクセス履歴(ログ230)から抽出するターゲットユーザ特徴抽出サーバ1を含む。
The target user feature extraction system supplies information to the
ユーザ端末100−1〜100−3の符号は、個々に特定しない場合では「−」以降を省略した符号「100」を用いる。他の構成要素の符号についても同様の符号を用いる。 As the code of the user terminals 100-1 to 100-3, the code "100" is used, omitting the "-" and subsequent parts when not individually specified. Similar codes are used for the codes of other components.
投稿端末300−1〜300−3は、それぞれ異なる業種の投稿者A、B、Cによって運用され、各投稿者A〜Cは、広告主も兼ねてコンテンツ210と広告220を提供する。
The posting terminals 300-1 to 300-3 are operated by posters A, B, and C in different industries, and each poster A to C also serves as an advertiser to provide the
なお、本実施例では、投稿端末300を運用する投稿者がコンテンツ210の提供と広告主を兼ねる例を示すが、これに限定されるものではなく、コンテンツ210の投稿者と広告主が異なってもよい。また、ユーザ端末100−1〜100−3は、それぞれ異なる業種a、b、cのユーザによって運用され、ウェブサーバ200のコンテンツ210や広告220を閲覧する。
In this embodiment, the poster who operates the
ウェブサーバ200は計算機で構成され、ユーザ端末100のアクセス履歴(履歴情報)と、投稿端末300を利用する投稿者の情報と、コンテンツ210の属性データをターゲットユーザ特徴抽出サーバ1へ送信する。なお、ウェブサーバ200は、データベースサーバやアプリケーションサーバ等に接続されて、ウェブサイトを構築してもよい。
The
ターゲットユーザ特徴抽出サーバ1は、ウェブサーバ200が提供するウェブサイトに情報を提供する投稿者A〜Cが獲得したいユーザ(ユーザ端末100の利用者)を、ウェブサーバ200にアクセスしたユーザの履歴(セッションデータ)からユーザ特徴を抽出する。また、ターゲットユーザ特徴抽出サーバ1は、投稿端末300が提供したコンテンツ(ページ)210を分析してページ特徴として抽出する。
The target user
ターゲットユーザ特徴抽出サーバ1は、ユーザ端末100のアクセスの履歴を所定の周期(例えば、1ヶ月)で収集して、抽出対象の投稿者についてユーザ特徴とページ特徴を含むアクセスの特徴量を抽出して投稿端末300へ通知する。
The target user
なお、投稿端末300は、投稿者が獲得したいユーザの情報をターゲットタイプとして、ターゲットユーザ特徴抽出サーバ1へ予め通知しておく。あるいは、投稿者はターゲットタイプを投稿端末300からウェブサーバ200に通知し、ターゲットユーザ特徴抽出サーバ1がウェブサーバ200からターゲットタイプを取得するようにしてもよい。
The posting
図2は、ターゲットユーザ特徴抽出サーバ1の構成の一例を示すブロック図である。ターゲットユーザ特徴抽出サーバ1は、プロセッサ11と、メモリ12と、ストレージ装置13と、入力装置14と、出力装置15と、通信装置16を含む計算機である。
FIG. 2 is a block diagram showing an example of the configuration of the target user
通信装置16は、ネットワーク400に接続されてウェブサーバ200及び投稿端末300と通信を行う。出力装置15は、ディスプレイ等で構成される。入力装置14は、キーボードやマウス又はタッチパネルで構成される。
The
メモリ12には、処理対象選択部21と、セッション特徴算出部22と、ターゲット算出部23と、アクセス特徴抽出部27と、ターゲット判定項目加工部28と、データ加工部30と、学習部31がプログラムとしてロードされ、プロセッサ11によって実行される。
The
プロセッサ11は、各機能部のプログラムに従って処理を実行することによって、所定の機能を提供する機能部として稼働する。例えば、プロセッサ11は、セッション特徴抽出プログラムに従って処理を実行することでセッション特徴算出部22として機能する。他のプログラムについても同様である。さらに、プロセッサ11は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
The processor 11 operates as a functional unit that provides a predetermined function by executing a process according to a program of each functional unit. For example, the processor 11 functions as the session
ストレージ装置13には、上記各プログラムが使用するデータとして、セッションデータ41と、ユーザ属性データ42と、ページ属性データ43と、投稿者属性データ44と、投稿者ターゲットデータ45と、範囲変換情報46が格納される。
The
セッションデータ41は、ウェブサーバ200が収集したログ230のうち、コンテンツ210(又は広告220)にアクセスしたユーザ端末100のアクセス履歴を示す。ユーザ属性データ42は、ユーザ端末100を利用するユーザの属性を示す。ページ属性データ43は、コンテンツ210の属性を示す。投稿者属性データ44は、投稿者の属性を示す。投稿者ターゲットデータ45は、投稿者A〜Cが獲得したいユーザ層(ターゲットタイプ)が定性的な情報として設定される。なお、投稿者ターゲットデータ45は、項目と値の範囲(又は閾値)を設定することもできる。範囲変換情報46には、ターゲットタイプ毎にユーザ層を特定する分析対象データの項目と、項目の値の範囲(又は閾値)が設定される。なお、各データの詳細については後述する。
The
次に、ターゲットユーザ特徴抽出サーバ1で稼働する各プログラムの概要について説明する。
Next, an outline of each program running on the target user
処理対象選択部21は、ウェブサーバ200から取得したユーザ端末100のアクセス履歴(セッションデータ41)のうち、分析に使用するセッションデータ41の期間と分析対象の投稿者を入力装置14等から受け付ける。なお、投稿者を指定せずに、セッションデータ441の期間を指定して、全ての投稿者のターゲットについて分析を実施してもよい。
The processing
ターゲット算出部23は、分析対象の投稿者を受け付けて、投稿者が獲得したいユーザ特徴の範囲を投稿者ターゲットデータ45からターゲット情報として取得し、ターゲット情報に基づいてセッションデータを分析する項目と、値の範囲を決定する。
The
セッションデータを分析する項目と範囲は、後述するように、投稿者A〜C毎のターゲット情報(獲得目標)や嗜好に応じて設定され、例えば、投稿者のターゲットを判定する項目として、ウェブサーバ200での閲覧数と滞在時間などを用い、範囲はこれらの数値の範囲や閾値などで指定することができる。 As will be described later, the items and ranges for analyzing session data are set according to the target information (acquisition target) and preference for each poster A to C. For example, as an item for determining the target of the poster, the web server Using the number of views and staying time at 200, the range can be specified by the range of these numerical values, the threshold value, and the like.
セッションデータ41を分析する項目と範囲は、範囲算出部26が範囲変換情報46を参照して決定する場合と、ターゲット判定モデル25が項目と範囲を算出する場合がある。
The item and range for analyzing the
範囲変換部24は、投稿者ターゲットデータ45のターゲット情報に対応する範囲変換情報46が存在する場合には、範囲算出部26に範囲変換情報46を参照させて項目と範囲を決定させる。また、範囲変換部24は、ターゲット情報に対応する範囲変換情報46が存在しない場合には、指定された期間のセッションデータ41とユーザ属性データ42とページ属性データ43と投稿者属性データ44及びターゲット情報をターゲット判定モデル25へ入力して、分析対象の項目と範囲を生成させる。
When the
セッション特徴算出部22は、処理対象選択部21が受け付けた期間のセッションデータ41と、セッションデータ41に含まれるユーザのユーザ属性データ42とページ属性データ43及び投稿者属性データ44を取得し、ターゲット算出部23が決定した項目のデータをセッションの特徴を示す抽出対象データとして生成する。なお、セッションデータ41に上記決定された項目が存在する場合には、指定された期間のセッションデータ41を抽出対象データ50とする。
The session
セッション特徴算出部22は、後述するように、ターゲット判定項目加工部28とデータ加工部30を使用して、決定された項目に対応する抽出対象データ50を生成する。なお、ターゲット判定項目加工部28では、ターゲットの項目に応じて類似度算出部29を使用する。
As will be described later, the session
また、セッション特徴算出部22は、ユーザ端末100がアクセスしたコンテンツ210のページ毎、又はページ属性データ43のタグ毎、あるいは、コンテンツ210を提供する投稿者毎に、ユーザ端末100がウェブサーバ200を訪問した履歴を、セッションの特徴を示すデータとして算出することができる。
Further, in the session
アクセス特徴抽出部27は、セッション特徴算出部22からの抽出対象データと、ターゲット算出部23からの項目と範囲を受け付けてユーザ特徴とアクセスされたコンテンツ210の特徴(ページ特徴)を抽出する。
The access
アクセス特徴抽出部27は、まず、セッション特徴算出部22からの抽出対象データと、ターゲット算出部23からの項目と、項目の値の範囲に基づいてユーザの特徴量をユーザ特徴として算出する。また、アクセス特徴抽出部27は、投稿者の属性データ(投稿者属性データ44)と、投稿者がウェブサーバ200に提供したコンテンツ210の属性データ(ページ属性データ43)を受け付けて、ユーザのアクセス等に関するコンテンツ210の特徴量をページ特徴として抽出する。
First, the access
アクセス特徴抽出部27が抽出したユーザ特徴とページ特徴は、投稿端末300に通知される。また、アクセス特徴抽出部27は、抽出したユーザ特徴とページ特徴を出力装置15に表示することができる。
The user feature and page feature extracted by the access
アクセス特徴抽出部27が抽出するユーザ特徴は、特徴量として、例えば、抽出対象の投稿者のコンテンツ210をアクセスしたユーザの業種の比率や、セッションの特性(リピート回数の多寡)等を含むことができる。
The user features extracted by the access
また、アクセス特徴抽出部27が抽出するページ特徴は、特徴量として、例えば、アクセスされたコンテンツ210のタグの比率や、各ページの平均滞在時間等を含むことができる。
Further, the page features extracted by the access
学習部31は、セッションデータ41とユーザ属性データ42と投稿者属性データ44とページ属性データ43と投稿者ターゲットデータ45を入力して機械学習を実施して、ターゲット判定モデル25を生成する。ターゲット判定モデル25の生成は、ユーザ特徴51やページ特徴52を抽出する以前に予め実施しておく。
The learning unit 31 inputs the
<データ>
次に、各プログラムが利用するデータについて説明する。図4は、セッションデータ41の一例を示す図である。セッションデータ41は、ターゲットユーザ特徴抽出サーバ1がウェブサーバ200から所定の周期等で収集した履歴情報である。
<Data>
Next, the data used by each program will be described. FIG. 4 is a diagram showing an example of
セッションデータ41は、ID411と、アクセス時刻412と、訪問ページ413と、リピート回数414と、離脱時刻415をひとつのレコードに含むテーブルである。
The
ID411は、ユーザ端末100の識別子が格納される。ID411は、ウェブサーバ200が付与した値で、ターゲットユーザ特徴抽出システム内でユニークな値であればよい。
The
アクセス時刻412は、ユーザ端末100が当該ページにアクセスを開始した日時を格納する。訪問ページ413は、ユーザ端末100がアクセスしたコンテンツ210のURLを格納する。
The
リピート回数414は、当該ページにアクセスした累計回数を格納する。離脱時刻415は、ユーザ端末100が当該ページの閲覧を終了した時刻を格納する。
The
図5は、ユーザ属性データ42の一例を示す図である。ユーザ属性データ42は、ターゲットユーザ特徴抽出サーバ1で設定するテーブルである。ユーザ属性データ42は、ID421と、IP422と、業種423と、売上424をひとつのレコードに含むテーブルである。
FIG. 5 is a diagram showing an example of
ID421は、ユーザ端末100の識別子を格納する。ID421は、セッションデータ41のID411と同じ値である。IP422は、ユーザ端末100のIPアドレスを格納する。
業種423は、ユーザ端末100を利用するユーザの会社(又は団体)の業種を格納する。業種423は、ユーザ端末100のIPアドレスからユーザが所属する会社を特定できるので、当該会社の情報から業種を決定すればよい。売上424は、ユーザが所属する会社の売上高を格納する。
The
なお、ユーザ端末100を利用するユーザの業種や売上高は、ターゲットユーザ特徴抽出サーバ1の管理者などが設定してもよいし、予め設定されたデータベースなどから設定してもよい。
The type of business and sales of the user who uses the
図6は、抽出対象データ50の一例を示す図である。抽出対象データ50は、セッション特徴算出部22で算出される中間データである。図示の例では、ユーザ層を特定する抽出対象データの項目として、閲覧数と平均滞在時間がターゲット算出部23から出力された例を示す。
FIG. 6 is a diagram showing an example of the
図示の抽出対象データ50の場合、処理対象選択部21が受け付けた期間内のセッションデータ41から、セッション特徴算出部22は各ユーザが閲覧したページを投稿者毎に集計して、ユーザ属性データ42と結合した例を示す。
In the case of the illustrated
抽出対象データ50は、ID501と、投稿者502と、閲覧数503と、平均滞在時間504と、業種505をひとつのレコードに含むテーブルである。
The
ID501は、ユーザ端末100の識別子が格納される。ID501は、セッションデータ41のID411と同じ値である。投稿者502は、当該ID501のユーザが閲覧したコンテンツ210の投稿者の識別子が格納される。コンテンツ210の投稿者の識別子は、コンテンツ210を構成するページ毎に予め設定された情報で、ウェブサーバ200から送信されたページ属性データ43から取得する。
The
閲覧数503は、当該ID501のユーザが閲覧した投稿者502が提供したページの合計を格納する。平均滞在時間504は、当該ID501のユーザが投稿者502によって提供されたページに滞在(閲覧)した平均時間を格納する。業種505は、ユーザ属性データ42の業種423を格納する。
The number of
図7は、範囲変換情報46の一例を示す図である。範囲変換情報46は、投稿者ターゲットデータ45の定性的な情報を、抽出対象の項目と値の範囲に変換するためのテーブルである。
FIG. 7 is a diagram showing an example of the
範囲変換情報46は、投稿者が獲得したいユーザ層を分類するターゲットタイプ461毎に、セッションデータ41及びユーザ属性データ42等から算出する抽出対象データ50の項目とデータの範囲462を予め設定した情報である。なお、ターゲットタイプ461は、投稿者ターゲットデータ45のターゲット情報の値である。
The
ターゲットタイプ461の一例として、「新規」、「既存」、「時間をかけて購読する人」、「リピータ」、「優良顧客」、「切削に興味のある人」が設定された例を示している。
As an example of the
「新規」のターゲットタイプ461は、投稿者が新たなユーザを獲得することを目的としてウェブサーバ200のウェブサイトにコンテンツ210及び広告220の情報を提供することを示す。本実施例では、該当する投稿者のコンテンツ210の閲覧数が50回以下のユーザを「新規」のユーザとする範囲462が予め設定される。
The "new"
「既存」のターゲットタイプ461は、投稿者が、既存のユーザを掘り起こすことを目的としてウェブサーバ200に情報を提供することを示す。本実施例では、該当する投稿者のコンテンツ210の閲覧数が50を超えるユーザを「既存」のユーザとする範囲462が予め設定される。
The "existing"
「時間をかけて購読する人」のターゲットタイプ461は、投稿者のコンテンツ210を時間をかけて閲覧するユーザを獲得することを目的として、ウェブサーバ200にコンテンツ210を提供することを示す。本実施例では、該当する投稿者のコンテンツ210の平均滞在時間504がページ当たり500秒以上のユーザを該当するユーザとして判定する範囲462が予め設定される。
The
「リピータ」のターゲットタイプ461は、投稿者のコンテンツ210を繰り返して閲覧するユーザを獲得することを目的としてウェブサーバ200に情報を提供することを示す。本実施例では、該当する投稿者のコンテンツ210のリピート回数414が2回以上で、訪問間隔が1週間以下のユーザを該当するユーザとして判定する範囲462が予め設定される。
The
「優良顧客」のターゲットタイプ461は、投稿者のコンテンツ210にアクセスするユーザのうち、ユーザが所属する会社の売上424が10億円以上のユーザを該当するユーザとして判定する範囲462が予め設定される。
The
「切削に興味のある人」のターゲットタイプ461は、投稿者のコンテンツ210のうち、「切削」のタグを含むページにアクセスしたユーザを、該当するユーザとして判定する範囲462が予め設定される。
The
なお、投稿者ターゲットデータ45のターゲット情報に対応するターゲットタイプ461が範囲変換情報46に存在しない場合、範囲変換部24は、後述するように、ターゲット判定モデル25にセッションデータ41とユーザ属性データ42とページ属性データ43及び投稿者属性データ44を入力して、項目と範囲を生成させる。
When the
ページ属性データ43は、図示はしないが、各コンテンツ210のページ毎に、URLと、コンテンツ210の種類を示すタグと、コンテンツ210を提供する投稿者の識別子を含むテーブルである。なお、ページ属性データ43は、コンテンツ210の使用単語等の静的情報を含めるようにしてもよいし、word2vec等で算出した文章や記事の特徴量を含めるようにしてもよい。
Although not shown, the
投稿者ターゲットデータ45には、図示はしないが、投稿者の識別子と、投稿者が予め選択したターゲット情報が設定される。なお、投稿者ターゲットデータ45のターゲット情報は、上述の範囲変換情報46のターゲットタイプ461の値に対応するが、範囲変換情報46のターゲットタイプ461に含まれない値を設定することができる。また、投稿者ターゲットデータ45には、定性的な情報以外に、項目と値の範囲を含む情報で設定することができる。また、投稿者属性データ44は、図示はしないが、投稿者の識別子と、投稿者の業種と、投稿者が所属する部門を格納する。
Although not shown, the
<抽出処理>
以下、ターゲットユーザ特徴抽出サーバ1で行われる処理の一例について説明する。図3は、ターゲットユーザ特徴抽出サーバ1で行われる処理の概要を示す図である。この処理は、ターゲットユーザ特徴抽出サーバ1の利用者の指令に基づいて開始される。
<Extraction process>
Hereinafter, an example of the processing performed by the target user
処理対象選択部21は、抽出対象の期間と投稿者を受け付ける。なお、上述したように、投稿者が入力されない場合にはウェブサーバ200の全ての投稿者を抽出対象とする。
The processing
まず、ターゲット算出部23は、処理対象選択部21から投稿者を受け付けて、投稿者ターゲットデータ45から投稿者毎のターゲットタイプを取得し、範囲変換情報46又はターゲット判定モデル25からターゲット情報に対応する項目と値の範囲を決定する。
First, the
ターゲット算出部23は、範囲変換部24を用いて、投稿者毎に抽出対象データ50の項目と範囲を決定し、セッション特徴算出部22へ項目を出力し、アクセス特徴抽出部27へ範囲を出力する。
The
上述したように、範囲変換部24は、ターゲット情報に対応するターゲットタイプ461が範囲変換情報46に存在しない場合には、ターゲット判定モデル25へセッションデータ41とユーザ属性データ42とページ属性データ43及び投稿者属性データ44を入力して、抽出対象の項目と範囲を決定させる。
As described above, when the
また、ターゲット情報に対応するターゲットタイプ461が範囲変換情報46に存在しない場合には、範囲変換部24は、ターゲット判定モデル25によって、抽出対象の項目と範囲を生成することで、アクセス特徴抽出部27が当該ターゲット情報に合致するユーザ特徴を抽出することが可能となる。
When the
ターゲット判定モデル25は、予め機械学習によって生成したモデルである。ターゲットユーザ特徴抽出サーバ1の学習部31は、ユーザ端末100のセッションデータ41とユーザ属性データ42に投稿者属性データ44とページ属性データ43を機械学習することで、ターゲット判定モデル25を生成する。
The
セッション特徴算出部22は、処理対象選択部21から受け付けた期間内のセッションデータ41を取得し、セッションデータ41のID411に対応するユーザ属性データ42を取得する。
The session
セッション特徴算出部22は、ターゲット算出部23から項目を受け付けて、指定された期間内のセッションデータ41とユーザ属性データ42から指定された項目を含む抽出対象データ50を生成する。
The session
抽出対象データ50の項目は、範囲変換情報46のターゲットタイプ461に対応する範囲462の内容又はターゲット判定モデル25の出力に応じて決定される。生成された抽出対象データ50は、アクセス特徴抽出部27へ出力される。なお、セッション特徴算出部22は、抽出対象の投稿者毎に抽出対象データ50を生成してもよいし、抽出対象の投稿者の全ての項目を含む抽出対象データ50を生成してもよい。
The item of the
アクセス特徴抽出部27は、ターゲット算出部23から抽出対象の値の範囲を受け付け、セッション特徴算出部22から抽出対象データ50を受け付ける。アクセス特徴抽出部27は、周知又は公知の分析技術を適用して、投稿者毎に抽出対象データ50から指定された範囲462に該当するユーザ特徴を抽出し、セッションの特徴量としてユーザ特徴51を出力する。
The access
アクセス特徴抽出部27は、例えば、機械学習で生成した特徴抽出モデルを用いる場合では、説明変数として投稿者のターゲットタイプ、目的変数として閲覧数の範囲を用い、ターゲット情報に含まれるユーザ特徴を推測する。
For example, when the feature extraction model generated by machine learning is used, the access
また、アクセス特徴抽出部27は、投稿者属性データ44とページ属性データ43を取得して、抽出対象データ50に含まれるユーザがアクセスしたページを抽出して、セッションの特徴量を示すページ特徴52として出力する。なお、アクセス特徴抽出部27は、ページ特徴52の抽出についても、上記と同様に機械学習によって推測することができる。なお、アクセス特徴抽出部27は、機械学習モデルに限定されるものではなく、平均値や中央値等の統計値などを適用するようにしてもよい。
Further, the access
図23は、アクセス特徴抽出部27が抽出したユーザ特徴51と、ページ特徴52の抽出結果画面600の一例を示す図である。また、図24は、アクセス特徴抽出部27が分析したセッションデータ41の一例を示す図である。
FIG. 23 is a diagram showing an example of the
図24において、ユーザ端末100を利用するユーザ1〜3が投稿者AのページA1、A2と、投稿者BのページB1にアクセスし、投稿者DのページD1のページ特徴もページA1、A2、B1と同様の例を示す。
In FIG. 24,
図23は、抽出対象として投稿者Aのターゲットタイプ461に該当したユーザのユーザ特徴51と、ページ特徴52の抽出結果が表示された例を示す。
FIG. 23 shows an example in which the
投稿者Aのターゲットタイプ461には、図24で示したユーザ1〜3が該当した例を示す。ユーザ特徴51としては、ユーザ1〜3の業種は金属業界が67%で、材料メーカが33%であること示し、ユーザ1〜3のアクセスはリピート回数414が多いことが特徴として抽出される。
The
また、ユーザ1〜3がアクセスしたページ特徴52は、ページ属性データ43のタグとして金属と加工が含まれ、セッションデータ41の特徴として平均滞在時間504が長いことが表示される。
Further, the page features 52 accessed by the
以上の処理によって、ターゲットユーザ特徴抽出サーバ1は、セッション毎のID411と訪問ページ413と時刻情報(412、415)と、ユーザ属性データ42の業種と、ページ属性データ43のタグと投稿者から、ターゲット情報(投稿者の嗜好)に合致するユーザ特徴を抽出対象データ50から抽出することが可能となる。
By the above processing, the target user
投稿者のターゲット情報は、例えば、“新規顧客をターゲットとする”という定性的な値であり、このターゲット情報を定量的に変換した項目と範囲は、“投稿者の記事への閲覧数が30以上50未満で、投稿者の属性との距離(類似度)が10以上離れた業種“とする。 The target information of the poster is, for example, a qualitative value of "targeting a new customer", and the item and range obtained by quantitatively converting this target information are "the number of views to the article of the poster is 30". An industry that is less than 50 and has a distance (similarity) of 10 or more from the attributes of the poster.
アクセス特徴抽出部27で抽出すべきセッションの特徴(ユーザ特徴)は、一つは、投稿者のコンテンツ210に対するユーザの業種毎の訪問数(閲覧数)のデータである。もう一つはユーザの業種の属性同士の距離を示す特徴であり、これはユーザの業種とページ属性データ43のタグに対する訪問数から、類似度を算出した結果を用いることができる。
One of the session features (user features) to be extracted by the access
そのため、データ加工部30では、ユーザ毎のページの訪問数については、投稿者のコンテンツ210毎にユーザのID411に紐づく属性(業種423)毎に合計数を算出したもの算出する。また、データ加工部30が、距離については、例えば、多次元尺度法等の類似度を算出する手法を用いて特徴量に関する距離を算出して、これらのデータで抽出対象データ50を構成する。
Therefore, the
このような、抽出対象データ50に対して、アクセス特徴抽出部27は、投稿者の嗜好である”新規顧客をターゲットとする“に合致するセッションの特徴として、ユーザの業種と訪問数をユーザ特徴51として提示することができる。さらに、アクセス特徴抽出部27は、セッションの特徴に含まれるユーザの業種と、投稿者のコンテンツ210のリンク先でセッションデータを絞り込んだときに、ユーザの業種が訪問したページの特徴を抽出してページ特徴52として出力することができる。
With respect to the
範囲462としては、上記の他に、ユーザ属性データ42の業種423を用いて、訪問ページ413にアクセスした複数のユーザ間の業種の特徴量(類似度)の距離を算出しておくことで、アクセス特徴抽出部27では、コンテンツ210を投稿者毎に、距離に応じたユーザのグループをユーザ特徴51として提示することができる。
As the
図8は、図3に示したセッション特徴算出部22で行われる処理の一例を示すフローチャートである。セッション特徴算出部22は、処理対象選択部21から期間を受け付け、ターゲット算出部23から項目を受け付けると、以下の処理を行う。
FIG. 8 is a flowchart showing an example of processing performed by the session
セッション特徴算出部22は、受け付けた期間内のデータをセッションデータ41から取得する(S1)。次に、セッション特徴算出部22は、指定期間内のセッションデータ41に含まれるユーザ(ユーザ端末100)のユーザ属性データ42を取得する(S2)。
The session
セッション特徴算出部22は、上記ステップS1で取得したセッションデータ41に、ユーザID411、421が一致するユーザ属性データ42を結合して結合データを生成する(S3)。
The session
セッション特徴算出部22は、ターゲット算出部23から受け付けた項目が、上記ステップS3で生成した結合データに含まれるか否かを判定する(S4)。セッション特徴算出部22は、結合データに抽出対象の項目が全て含まれいる場合には、当該結合したデータを抽出対象データ50としてそのまま出力する。一方、セッション特徴算出部22は、結合データに抽出対象の項目が全て含まれいない場合には、ステップS5に進んでデータ加工部30によって、受け付けた項目のデータを結合データから生成する。
The session
データ加工部30は、ターゲット算出部23が決定した抽出対象の項目のデータを、ユーザ毎に結合データから生成する。
The
例えば、項目が平均滞在時間の場合、データ加工部30は、セッションデータ41のID411と訪問ページ413が一致するレコードについて離脱時刻415とアクセス時刻412の差分を算出し、同一の訪問ページ413の平均値を平均滞在時間として算出する。また、データ加工部30は、ページ属性データ43を参照して各訪問ページ413の投稿者(識別子)を特定し、投稿者毎に平均滞在時間を算出してもよい。
For example, when the item is the average stay time, the
次に、セッション特徴算出部22は、ステップS6で上記項目毎に生成したデータを抽出対象データ50としてアクセス特徴抽出部27へ出力する。
Next, the session
以上の処理によって、セッション特徴算出部22は、指定された期間内のセッションデータ41とユーザ属性データ42から、ターゲット情報の判定に使用する項目のデータを算出して抽出対象データ50として出力する。
Through the above processing, the session
図9は、図3に示したターゲット算出部23で行われる処理の一例を示すフローチャートである。ターゲット算出部23は、処理対象選択部21から投稿者を受け付けて以下の処理を開始する。
FIG. 9 is a flowchart showing an example of the processing performed by the
ターゲット算出部23は、受け付けた投稿者について、投稿者ターゲットデータ45からターゲット情報を取得する(S11)。ターゲット算出部23は、取得したターゲット情報が項目と値の範囲(又は閾値)を含む情報であるか否かを判定する(S12)。項目と範囲を含む場合にはステップS14に進み、そうでない場合にはステップS13に進む。
The
ステップS13では、ターゲット情報が定性的な情報の場合であり、この場合、ターゲット算出部23は、範囲変換部24を使用して定性的な情報を項目と範囲に変換する。そして、ステップS14では、変換された項目と値の範囲をセッション特徴算出部22とアクセス特徴抽出部27へ出力する。
In step S13, the target information is qualitative information. In this case, the
図10は、ターゲット算出部23の範囲変換部24で行われる処理の一例を示すフローチャートである。ターゲット算出部23は、ターゲット情報に対応する範囲変換情報46が存在するか否かを判定する(S21)。範囲変換情報46が存在する場合にはステップS22へ進み、存在しない場合にはステップS23へ進む。
FIG. 10 is a flowchart showing an example of processing performed by the
ステップS22では、範囲変換部24が、範囲変換情報46を参照して、ターゲット情報に対応するターゲットタイプ461から範囲462を取得し、範囲462に設定されている項目と値の範囲を決定する。
In step S22, the
ステップS23では、範囲変換部24が、ターゲット判定モデル25にターゲット判定モデル25へセッションデータ41とユーザ属性データ42とページ属性データ43及び投稿者属性データ44を入力して、抽出対象の項目と範囲を決定させる。
In step S23, the
以上の処理によって、投稿者ターゲットデータ45のターゲット情報が定性的な情報の場合には、範囲変換情報46又はターゲット判定モデル25によって抽出対象の項目と値の範囲が決定される。
By the above processing, when the target information of the
図11は、ターゲット算出部23の範囲変換部24で行われるターゲット判定項目加工部28の一例を示す図である。範囲変換部24は、ターゲット判定モデル25を使用する場合、セッションデータ41とユーザ属性データ42のユーザデータ510に対してターゲット判定項目加工部28で処理を行って投稿者のコンテンツ210(ページ)毎に後述する統計処理を行う(S231)。なお、セッションデータ41は、処理対象選択部21から受け付けた期間内のデータである。
FIG. 11 is a diagram showing an example of the target determination
次に、範囲変換部24は、ターゲット判定項目加工の処理結果に、ページ属性データ43と投稿者属性データ44と投稿者ターゲットデータ45を含む投稿者データ520を結合させる(S232)。なお、ページ属性データ43は、処理対象選択部21から受け付けた期間内のセッションデータ41に含まれる訪問ページ413に該当するデータを使用する。
Next, the
そして、ユーザデータ510のターゲット判定項目加工処理結果と投稿者データ520を結合したデータを、ターゲット判定モデル25へ与えて、抽出対象の項目と値の範囲を決定させる。
Then, the data obtained by combining the target determination item processing result of the
図12は、ターゲット判定項目加工部28で行われる処理の一例を示すフローチャートである。この処理は、上記図11のステップS231で実行される。
FIG. 12 is a flowchart showing an example of processing performed by the target determination
ターゲット判定項目加工部28は、図11に示したユーザデータ510を取得する(S32)。ターゲット判定項目加工部28は、ユーザ属性データ42を利用するか否かを判定する(S32)。ユーザ属性データ42の利用の有無は、例えば、投稿者ターゲットデータ45で投稿者の識別子毎に予め設定しておくことができる。
The target determination
ターゲット判定項目加工部28は投稿者ターゲットデータ45を参照してユーザ属性データ42を利用する場合にはステップS33へ進み、利用しない場合にはステップS36へ進む。
The target determination
ステップS33では、ターゲット判定項目加工部28が、ユーザ属性データ42の業種423とセッションデータ41の訪問ページ413とページ属性データ43のタグを取得して、業種423の特徴量を算出する。そして、ターゲット判定項目加工部28は、算出された特徴量の空間で、ユーザの業種423間の距離を多次元尺度解析法(MDS:Multi−Dimensional Scaling)等を用いて算出し、この距離を類似度とする。
In step S33, the target determination
この処理は、図19で示すように、ページ属性データ43のタグ毎に、ユーザ属性データ42の業種423毎の閲覧数を投稿者毎に集計し、閲覧数データ530を生成する。図19の閲覧数データ530は、コンテンツ210のタグ毎に、ユーザ属性データ42の業種423毎の閲覧数の合計値を算出した情報である。
In this process, as shown in FIG. 19, the number of views of the
図19では、投稿者Aのコンテンツ210のタグAのページについて、業種a〜業種dのユーザのそれぞれの閲覧数の集計値が格納されている。図19の閲覧数データ530は、投稿者Aのタグ毎に、ユーザの業種423による興味の多寡を表現することができる。
In FIG. 19, for the page of the tag A of the
ターゲット判定項目加工部28は、図19の閲覧数データ530から多次元尺度解析法を用いて、特徴量1、特徴量2を算出し、図20で示すように特徴量1、特徴量2の空間上に業種423が配置される。なお、図20は、特徴量1、2で表される業種423間の距離を類似度として表現したマップである。なお、図示の例では、投稿者Aのコンテンツ210に対する閲覧数データ530から類似度を算出した例を示す。
The target determination
次に、図12のステップS34では、ターゲット判定項目加工部28が、セッションの特徴を利用するか否かを判定する。セッションの特徴の利用の有無は、例えば、投稿者ターゲットデータ45で投稿者の識別子毎に予め設定しておくことができる。
Next, in step S34 of FIG. 12, the target determination
ターゲット判定項目加工部28は投稿者ターゲットデータ45を参照してセッションの特徴を利用する場合にはステップS35へ進み、利用しない場合には処理を終了する。ステップS35では、ターゲット判定項目加工部28が、投稿者のページ毎にユーザデータ510と投稿者データ520の統計処理を実施する。図21は統計処理によって生成された統計データ540の一例を示す図である。
The target determination
統計データは、投稿者毎のコンテンツ210に対するユーザの業種423別の閲覧数をターゲット判定項目加工部28が集計した結果を示す図である。図21では、投稿者Aのコンテンツ210について、業種a〜業種dのユーザのそれぞれの閲覧数の集計値が格納されている。図21の統計データ540は、投稿者毎に、ユーザの業種423による興味の多寡を表現することができる。
The statistical data is a diagram showing the result of the target determination
図22は、統計処理の結果を図21のマップに加えた類似度マップの一例を示す図である。図中、業種毎の円の大きさは、投稿者Aに対する各業種のユーザの閲覧数に比例する。 FIG. 22 is a diagram showing an example of a similarity map in which the result of statistical processing is added to the map of FIG. 21. In the figure, the size of the circle for each industry is proportional to the number of views of users in each industry for poster A.
以上のように、ターゲット判定項目加工部28は、ユーザ属性データ42とページ属性データ43で統計処理を行った業種423間の距離を投稿者毎に集計した情報を出力する。
As described above, the target determination
なお、ユーザ属性データ42を利用しない場合のステップS36では、セッション特徴算出部22が使用したデータ加工部30で、訪問ページ413毎の滞在時間等のデータ処理を実施して、ターゲット判定モデル25へ出力する。
In step S36 when the
以上のように、ターゲット算出部23がターゲット判定モデル25を使用する場合には、図10〜図12の処理で生成したデータをターゲット判定モデル25へ入力することにより、範囲変換情報46がない場合においても項目と値の範囲を決定することができる。
As described above, when the
<学習処理>
次に、学習部31で行われるターゲット判定モデル25を構築するための学習処理について説明する。図13は、ユーザ属性データ42や投稿者属性データ44を利用しない場合にターゲット判定モデル25の学習を行うデータを定義する選択データ550の一例を示す図である。
<Learning process>
Next, the learning process for constructing the
選択データ550は、ID5501と、ターゲット顧客5502と、平均滞在時間5503と、閲覧数5504をひとつのレコードに含むテーブルである。ID5501には、投稿者の識別子が格納される。ターゲット顧客5502には、各投稿者が選択したターゲットタイプが格納される。なお、ターゲットタイプは、予め設定された定性的な情報から投稿者毎に選択させればよい。
The selection data 550 is a table that includes the
平均滞在時間5503には、当該ID5501の投稿者が提供するページにユーザが滞在(閲覧)した平均時間の条件が格納される。閲覧数5504には、当該ID5501の投稿者が提供するページをユーザが閲覧した総数の条件が格納される。
In the
上記選択データ550は、ターゲットユーザ特徴抽出サーバ1の管理者が、投稿者から受け付けたターゲットタイプに基づいて生成してもよいし、投稿端末300から入力させてもよい。
The selection data 550 may be generated by the administrator of the target user
図示の例では、ターゲット判定モデル25を構築するためのターゲットタイプとして、新規顧客を優先する「新規」と、既存顧客を優先する「既存」の2種類とし、学習処理の項目として、平均滞在時間5503と閲覧数5504を使用する例を示す。 In the illustrated example, there are two types of target types for constructing the target determination model 25: "new" that prioritizes new customers and "existing" that prioritizes existing customers. An example of using 5503 and 5504 views is shown.
図13の選択データ550を、平均滞在時間5503と閲覧数5504の空間で投稿者が選択した領域は、図14のようになる。図14は、選択データ550の一例を示すグラフである。
The area selected by the poster in the space of the
図14では、「既存」を選択した投稿者A、Cがターゲットとするユーザ特徴の領域を実線で示し、「新規」を選択した投稿者B、Dがターゲットとするユーザ特徴の領域を破線で示した。 In FIG. 14, the area of the user feature targeted by the posters A and C who selected "existing" is shown by a solid line, and the area of the user feature targeted by the posters B and D who selected "new" is shown by a broken line. Indicated.
学習部31は、選択データ550で設定された条件の学習用データを生成してターゲット判定モデル25に与えて学習させる。なお、ターゲット判定モデル25に与える学習用データは、実際のセッションデータ41とユーザ属性データ42から生成してもよいが、ダミーデータを使用してもよい。
The learning unit 31 generates learning data under the conditions set in the selection data 550 and gives it to the
なお、ターゲットタイプ(新規又は既存)のセッションの特徴は、実際のデータを加工したものである必要はなく、ダミーデータでいくつかセッションの特徴を示して、複数の投稿者にターゲットタイプを選択して試行させ、試行の結果を保持したデータを用いることができる。また、ターゲットタイプに応じた領域は、予めターゲットタイプの特徴を選択データ550の項目に変換したもので、ターゲットタイプ毎にどの項目が選択されたかを図14のグラフのように出力してもよい。 The characteristics of the session of the target type (new or existing) do not have to be processed from the actual data, and some characteristics of the session are shown by dummy data, and the target type is selected for multiple contributors. It is possible to use the data that holds the result of the trial. Further, the area corresponding to the target type is obtained by converting the characteristics of the target type into the items of the selection data 550 in advance, and which item is selected for each target type may be output as shown in the graph of FIG. ..
なお、学習用のデータを図15A、図15Bで示すカテゴリテーブル560と条件テーブル570で定義してもよい。図15Aは投稿者のターゲットタイプ(嗜好)を反映するカテゴリテーブル560の一例を示す。図15Bは、カテゴリ毎の項目と値の範囲を設定する条件テーブルの一例を示す。 The learning data may be defined in the category table 560 and the condition table 570 shown in FIGS. 15A and 15B. FIG. 15A shows an example of a category table 560 that reflects the poster's target type (preference). FIG. 15B shows an example of a condition table for setting an item and a range of values for each category.
図15Aのカテゴリテーブル560は、ID5601と、ターゲット顧客5602と、カテゴリ番号5603をひとつのレコードに含む。ID5601には、投稿者の識別子が格納される。ターゲット顧客5602には、各投稿者が選択したターゲットタイプが格納される。なお、ターゲットタイプは、予め設定された定性的な情報から投稿者毎に選択させればよい。カテゴリ番号5603には、各投稿者が選択したセッションの特徴を示す領域の番号が設定される。なお、カテゴリ番号5603は、予め設定された番号の中から、投稿者が選択した番号が格納される。
The category table 560 of FIG. 15A includes an
図15Bの条件テーブル570は、ターゲット顧客5701と、平均滞在時間5702と、閲覧数5703をひとつのレコードに含む。ターゲット顧客5701には、カテゴリテーブル560のカテゴリ番号5603に対応する番号が格納される。
The condition table 570 of FIG. 15B includes the
平均滞在時間5702には、投稿者が提供するページにユーザが滞在(閲覧)した平均時間に関する条件が格納される。閲覧数5703には、投稿者が提供するページをユーザが閲覧した総数に関する条件が格納される。
The
上記選択データ550は、ターゲットユーザ特徴抽出サーバ1の管理者が、投稿者から受け付けたターゲットタイプに基づいて生成してもよいし、投稿端末300から入力させてもよい。
The selection data 550 may be generated by the administrator of the target user
図15Aの例では、ターゲットタイプとして「既存」を選択した投稿者A、Cは、カテゴリ番号5603=「1」を選択し、「新規」を選択した投稿者B、Dは、それぞれカテゴリ番号5603=2、3を選択した例を示す。
In the example of FIG. 15A, the contributors A and C who selected "existing" as the target type selected the
カテゴリ番号5603に対応する領域は、条件テーブル570の平均滞在時間5702と閲覧数5703で制限され、図16で示すような領域となる。図16において、閲覧数5703に関わらず、平均滞在時間が100時間未満のデータはカテゴリ「2」となる。また、閲覧数5703が50未満で、平均滞在時間が100時間未満のデータはカテゴリ「3」となり、その他の領域がカテゴリ「1」となる。
The area corresponding to the
以上のように、投稿者の嗜好を格納するカテゴリテーブル560と、データの範囲を決定する条件テーブル570によって、学習用のデータを生成してもよい。 As described above, the data for learning may be generated by the category table 560 that stores the preference of the poster and the condition table 570 that determines the range of the data.
次に、ターゲット判定モデル25の学習用のデータを決定する際に、ユーザ属性データ42と投稿者属性データ44を利用して、上記図21、図22と同様に投稿者とユーザの業種間の距離を用いる例を以下に示す。
Next, when determining the learning data of the
図17は、ターゲット判定モデル25の学習用のデータを定義する選択データ580の一例を示す図である。選択データ580は、ID5801と、ターゲット顧客5802と、業種5803と、選択業種5804と、距離5805と、閲覧数5806をひとつのレコードに含むテーブルである。ID5801には、投稿者の識別子が格納される。ターゲット顧客5802には、各投稿者が選択したターゲットタイプが格納される。なお、ターゲットタイプは、予め設定された定性的な情報から投稿者毎に選択させればよい。
FIG. 17 is a diagram showing an example of selection data 580 that defines data for learning of the
業種5803は、投稿者属性データ44に設定された投稿者の業種が格納される。選択業種5804には、投稿者が選択したユーザの業種が格納される。距離5805には、投稿者とユーザの業種間の類似度の距離が格納される。閲覧数5806には、当該ID5801の投稿者が提供するページをユーザが閲覧した総数が格納される。
The
上記選択データ580は、ターゲットユーザ特徴抽出サーバ1の管理者が、投稿者から受け付けたターゲットタイプに基づいて生成してもよいし、投稿端末300から入力させてもよい。
The selection data 580 may be generated by the administrator of the target user
図示の例では、ID5801=投稿者Aのレコードでは、ターゲット顧客5802として「既存」を選択し、投稿者Aの業種5803=aで、投稿者Aが選択したターゲットユーザの業種5804=bで、業種間の距離5805=Labで、閲覧数5806が100以上のデータが学習用のデータとして定義されている。
In the illustrated example, in the record of ID5801 = contributor A, "existing" is selected as the
図18は、上記図17に示した選択データ5801の投稿者Aの業種5803=aと、選択業種5804間の類似度のマップを示す。図中、業種毎の円の大きさは、投稿者Aのコンテンツ210に対する各業種a〜dのユーザの閲覧数に比例する。
FIG. 18 shows a map of the degree of similarity between the
この例では、セッションデータ41とユーザ属性データ42及び投稿者属性データ44から業種間の類似度を算出し、その類似度を参照して、投稿者の属性とターゲットタイプから、選択した業種に対する距離と業種に関する情報を抽出する。
In this example, the similarity between industries is calculated from the
なお、図示の例では、ユーザの属性の類似度を、投稿者の属性の類似度として適用しているが、これは、ユーザであっても投稿者であっても業種が似ていれば、興味あるタグへの行動は似ているという前提を使用している。 In the illustrated example, the similarity of the user's attributes is applied as the similarity of the poster's attributes. However, if the type of business is similar regardless of whether the user or the poster is used, We use the assumption that the behavior for the tag of interest is similar.
また、例えば、ユーザの検索単語に対するセッションデータ41(アクセス履歴)から類似度を算出するなど、タグへのデータを使用するだけに限定されるものではない。これらから抽出したデータを用いて、説明変数を属性とターゲットタイプ又は嗜好とし、目的変数を属性間の距離と訪問数(閲覧数)として、選択された項目をターゲット判定モデル25に学習させる。学習手法としては、例えば、RandomForestのような機械学習手法を使用することができる。
Further, the similarity is not limited to the use of the data for the tag, for example, the similarity is calculated from the session data 41 (access history) for the user's search word. Using the data extracted from these, the
<結び>
以上のように、本実施例のターゲットユーザ特徴抽出サーバ1は、セッションデータ41とユーザ属性データ42とページ属性データ43及び投稿者属性データ44から、投稿者が希望するターゲットタイプに基づいて抽出対象データ50の項目と値の範囲を決定して抽出対象データ50を生成する。そして、アクセス特徴抽出部27へ値の範囲と抽出対象データ50を入力することで、ウェブサーバ200にコンテンツ210を提供する投稿者が獲得したいユーザ特徴を、ウェブサーバ200にアクセスしたユーザ(ユーザ端末100)の履歴から抽出することが可能となる。また、ターゲットユーザ特徴抽出サーバ1は、投稿者の意図とは異なる新規のユーザも抽出することが可能となって、新たなビジネスの創出することも可能となる。
<Conclusion>
As described above, the target user
また、ターゲットユーザ特徴抽出サーバ1は、抽出したユーザ特徴のセッションデータ41の特徴をページ属性データ43から抽出できるため、投稿者のコンテンツ210のどのような内容(タグ)にユーザが興味を示したかを絞ることができ、マーケティングを支援することが可能となる。
Further, since the target user
なお、上記実施例では、ユーザ属性データ42としてユーザの業種と、投稿者属性データ44として投稿者の業種を用いる例を示したが、これに限定されるものではない。例えば、ユーザの趣味や趣向と、投稿者の趣味や趣向を属性データとして利用することができ、このような属性データからターゲットユーザ特徴を抽出することができる。
In the above embodiment, the user's industry is used as the
また、抽出対象データ50の項目と、値の範囲を決定する場合には、投稿者の嗜好を反映したターゲットタイプに対応する範囲変換情報46が存在しない場合でも、ターゲット判定モデル25を利用することで、投稿者が獲得したいターゲットタイプのユーザ特徴をセッションデータ41等から抽出することが可能となる。
Further, when determining the items of the
以上のように、上記実施例のターゲットユーザ特徴抽出サーバ1は、以下のような構成とすることができる。
As described above, the target user
(1)プロセッサ11とメモリ12を有する計算機(1)が、ウェブサーバ(200)のコンテンツ(210)にアクセスした履歴情報(セッションデータ41)から投稿者が獲得目標とするユーザ特徴を抽出するターゲットユーザ特徴抽出方法であって、
(1) A target in which a computer (1) having a processor 11 and a
前記計算機が、前記ウェブサーバ(200)のコンテンツ(210)にアクセスしたユーザ端末(100)の履歴情報を格納したセッションデータ(41)と、前記ユーザ端末(100)を利用するユーザの属性情報を格納したユーザ属性データ(42)と、をユーザデータ(510)として取得するユーザデータ取得ステップと、前記計算機(1)が、前記コンテンツ(210)の属性を格納したページ属性データ(43)と、前記コンテンツ(210)を提供した前記投稿者の属性を格納した投稿者属性データ(44)と、を投稿者データ(520)として取得する投稿者データ取得ステップと、前記計算機(1)が、抽出対象とする投稿者を受け付けて、前記投稿者が獲得目標とするユーザの情報をターゲットタイプ(461)として取得する嗜好取得ステップと、前記計算機(1)が、前記投稿者のターゲットタイプ(461)から抽出対象のデータの項目と前記項目の値の範囲を算出するターゲット算出ステップ(ターゲット算出部23)と、前記計算機(1)が、前記ユーザデータ(510)と前記投稿者データ(520)から前記項目に対応する抽出対象データを算出するセッション特徴算出ステップ(セッション特徴算出部22)と、前記計算機(1)が、前記抽出対象データと前記投稿者データ(520)から前記項目の値の範囲に基づいてアクセスの特徴量を算出するアクセス特徴抽出ステップ(アクセス特徴抽出部27)と、を含むことを特徴とするターゲットユーザ特徴抽出方法。 Session data (41) in which the computer stores the history information of the user terminal (100) that has accessed the content (210) of the web server (200), and the attribute information of the user who uses the user terminal (100). A user data acquisition step of acquiring the stored user attribute data (42) as user data (510), a page attribute data (43) in which the computer (1) stores the attributes of the content (210), and the like. The poster data acquisition step of acquiring the poster attribute data (44) storing the attributes of the poster who provided the content (210) as the poster data (520), and the computer (1) extract the data. The preference acquisition step of accepting the target contributor and acquiring the user information targeted by the contributor as the target type (461), and the computer (1) are the target type (461) of the contributor. The target calculation step (target calculation unit 23) for calculating the item of the data to be extracted from and the range of the value of the item, and the computer (1) from the user data (510) and the poster data (520). The session feature calculation step (session feature calculation unit 22) for calculating the extraction target data corresponding to the item, and the computer (1) range the value of the item from the extraction target data and the poster data (520). A target user feature extraction method comprising an access feature extraction step (access feature extraction unit 27) for calculating an access feature amount based on the above.
上記構成により、以上のように、本実施例のターゲットユーザ特徴抽出サーバ1は、セッションデータ41とユーザ属性データ42とページ属性データ43及び投稿者属性データ44から、投稿者が希望するターゲットタイプに基づいて抽出対象データ50の項目と値の範囲を決定して抽出対象データ50を生成する。そして、アクセス特徴抽出部27へ値の範囲と抽出対象データ50を入力することで、ウェブサーバ200にコンテンツ210を提供する投稿者が獲得したいユーザ特徴を、ウェブサーバ200にアクセスしたユーザ(ユーザ端末100)の履歴から抽出することが可能となる。また、ターゲットユーザ特徴抽出サーバ1は、投稿者の意図とは異なる新規のユーザも抽出することが可能となって、新たなビジネスの創出することも可能となる。
With the above configuration, as described above, the target user
また、ターゲットユーザ特徴抽出サーバ1は、抽出したユーザ特徴のセッションデータ41の特徴をページ属性データ43から抽出できるため、投稿者のコンテンツ210のどのような内容(タグ)にユーザが興味を示したかを絞ることができ、マーケティングを支援することが可能となる。
Further, since the target user
なお、上記実施例では、ユーザ属性データ42としてユーザの業種と、投稿者属性データ44として投稿者の業種を用いる例を示したが、これに限定されるものではない。例えば、ユーザの趣味や趣向と、投稿者の趣味や趣向を属性データとして利用することができ、このような属性データからターゲットユーザ特徴を抽出することができる。
In the above embodiment, the user's industry is used as the
(2)上記(1)に記載のターゲットユーザ抽出方法であって、前記ターゲット算出ステップ(23)は、前記ターゲットタイプ(461)が定性的な情報の場合には、前記定性的な情報をデータの項目と前記項目の値の範囲に変換する範囲変換ステップ(範囲変換部24)を、含むことを特徴とするターゲットユーザ特徴抽出方法。 (2) In the target user extraction method according to (1) above, in the target calculation step (23), when the target type (461) is qualitative information, the qualitative information is data. A target user feature extraction method, which comprises a range conversion step (range conversion unit 24) for converting the item of
上記構成により、定性的な情報から抽出対象のデータの項目と前記項目の値の範囲を算出することが可能となって、対象とする投稿者の嗜好に合致したユーザ特徴を抽出することが可能となる。 With the above configuration, it is possible to calculate the item of the data to be extracted and the range of the value of the item from the qualitative information, and it is possible to extract the user characteristics that match the taste of the target poster. It becomes.
(3)上記(2)に記載のターゲットユーザ特徴抽出方法であって、前記範囲変換ステップ(23)は、予め設定された判定モデル(ターゲット判定モデル25)に前記ターゲットタイプ(461)と前記ユーザデータ(510)と前記投稿者データ(520)を入力して、抽出対象のデータの項目と前記項目の値の範囲を出力することを特徴とするターゲットユーザ特徴抽出方法。 (3) In the target user feature extraction method according to (2) above, in the range conversion step (23), the target type (461) and the user are added to a preset determination model (target determination model 25). A target user feature extraction method characterized in that data (510) and poster data (520) are input and an item of data to be extracted and a range of values of the item are output.
上記構成により、予め設定されたターゲット判定モデル25にターゲットタイプ(461)とユーザデータ(510)と投稿者データ(520)を入力して、定性的な情報から抽出対象のデータの項目と前記項目の値の範囲を算出することが可能となる。
With the above configuration, the target type (461), user data (510), and poster data (520) are input to the preset
(4)上記(3)に記載のターゲットユーザ特徴抽出方法であって、前記計算機(1)が、前記ユーザデータ(510)と前記投稿者データ(520)と前記ターゲットタイプ(461)を前記判定モデル(25)に与えて学習させる学習ステップ(学習部31)を、さらに含むことを特徴とするターゲットユーザ特徴抽出方法。 (4) In the target user feature extraction method according to (3) above, the computer (1) determines the user data (510), the poster data (520), and the target type (461). A target user feature extraction method characterized by further including a learning step (learning unit 31) given to a model (25) for learning.
上記構成により、学習部31は、ウェブサーバ200から取得したセッションデータ41とユーザ属性データ42とページ属性データ43と投稿者属性データ44とターゲットタイプを機械学習させることでターゲット判定モデル25を生成することができる。
With the above configuration, the learning unit 31 generates the
(5)上記(4)に記載のターゲットユーザ特徴抽出方法であって、前記学習ステップ(31)は、前記ユーザ属性データ(42)を用いて、ユーザの属性間の類似度を算出する類似度算出ステップ(類似度算出部29)を含むことを特徴とするターゲットユーザ特徴抽出方法。 (5) In the target user feature extraction method according to (4) above, the learning step (31) uses the user attribute data (42) to calculate the similarity between user attributes. A target user feature extraction method comprising a calculation step (similarity calculation unit 29).
上記構成により、ユーザ属性データ42の業種423を用いて、訪問ページ413にアクセスした複数のユーザ間の業種の特徴量(類似度)の距離を算出しておくことで、アクセス特徴抽出部27では、コンテンツ210を投稿者毎に、距離に応じたユーザのグループをユーザ特徴51として提示することができる。
With the above configuration, the access
また、類似度算出部29では、セッションデータ41とユーザ属性データ42及び投稿者属性データ44から業種間の類似度を算出し、アクセス特徴抽出部27は、この類似度を参照して、投稿者の属性とターゲットタイプから、選択した業種に対する距離と業種に関する情報を抽出することができる。
Further, the
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。 The present invention is not limited to the above-described examples, and includes various modifications. For example, the above-described embodiment is described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to the one including all the configurations described. Further, it is possible to replace a part of the configuration of one embodiment with the configuration of another embodiment, and it is also possible to add the configuration of another embodiment to the configuration of one embodiment. Further, for a part of the configuration of each embodiment, any of addition, deletion, or replacement of other configurations can be applied alone or in combination.
また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。 Further, each of the above configurations, functions, processing units, processing means and the like may be realized by hardware by designing a part or all of them by, for example, an integrated circuit. Further, each of the above configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 In addition, the control lines and information lines indicate those that are considered necessary for explanation, and do not necessarily indicate all the control lines and information lines in the product. In practice, it can be considered that almost all configurations are interconnected.
1 ターゲットユーザ特徴抽出サーバ
11 プロセッサ
12 メモリ
13 ストレージ装置
16 通信装置
21 処理対象選択部
22 セッション特徴算出部
23 ターゲット算出部
24 範囲変換部
25 ターゲット判定モデル
26 範囲算出部
27 アクセス特徴抽出部
28 ターゲット判定項目加工部
29 類似度算出部
30 データ加工部
41 セッションデータ
42 ユーザ属性データ
43 ページ属性データ
44 投稿者属性データ
45 投稿者ターゲットデータ
46 範囲変換情報
100 ユーザ端末
200 ウェブサーバ
300 投稿端末300
400 ネットワーク
1 Target user feature extraction server 11
400 networks
Claims (15)
前記計算機が、前記ウェブサーバのコンテンツにアクセスしたユーザ端末の履歴情報を格納したセッションデータと、前記ユーザ端末を利用するユーザの属性情報を格納したユーザ属性データと、をユーザデータとして取得するユーザデータ取得ステップと、
前記計算機が、前記コンテンツの属性を格納したページ属性データと、前記コンテンツを提供した前記投稿者の属性を格納した投稿者属性データと、を投稿者データとして取得する投稿者データ取得ステップと、
前記計算機が、抽出対象とする投稿者を受け付けて、前記投稿者が獲得目標とするユーザの情報をターゲットタイプとして取得する嗜好取得ステップと、
前記計算機が、前記投稿者のターゲットタイプから抽出対象のデータの項目と前記項目の値の範囲を算出するターゲット算出ステップと、
前記計算機が、前記ユーザデータと前記投稿者データから前記項目に対応する抽出対象データを算出するセッション特徴算出ステップと、
前記計算機が、前記抽出対象データと前記投稿者データから前記項目の値の範囲に基づいてアクセスの特徴量を算出するアクセス特徴抽出ステップと、
を含むことを特徴とするターゲットユーザ特徴抽出方法。 This is a target user feature extraction method in which a computer having a processor and a memory extracts the user features that the poster aims to acquire from the history information of accessing the contents of the web server.
User data in which the computer acquires session data that stores history information of a user terminal that has accessed the contents of the web server and user attribute data that stores attribute information of a user who uses the user terminal as user data. Acquisition steps and
A poster data acquisition step in which the computer acquires page attribute data storing the attributes of the content and poster attribute data storing the attributes of the poster who provided the content as poster data.
The preference acquisition step in which the computer accepts the poster to be extracted and acquires the information of the user targeted by the poster as the target type.
A target calculation step in which the computer calculates an item of data to be extracted from the target type of the poster and a range of values of the item.
A session feature calculation step in which the computer calculates extraction target data corresponding to the item from the user data and the poster data, and
An access feature extraction step in which the computer calculates an access feature amount based on the range of values of the item from the extraction target data and the poster data.
A target user feature extraction method characterized by including.
前記ターゲット算出ステップは、
前記ターゲットタイプが定性的な情報の場合には、前記定性的な情報をデータの項目と前記項目の値の範囲に変換する範囲変換ステップを、含むことを特徴とするターゲットユーザ特徴抽出方法。 The target user feature extraction method according to claim 1.
The target calculation step is
A target user feature extraction method comprising: when the target type is qualitative information, a range conversion step of converting the qualitative information into a data item and a range of values of the item.
前記範囲変換ステップは、
予め設定された判定モデルに前記ターゲットタイプと前記ユーザデータと前記投稿者データを入力して、抽出対象のデータの項目と前記項目の値の範囲を出力することを特徴とするターゲットユーザ特徴抽出方法。 The target user feature extraction method according to claim 2.
The range conversion step
A target user feature extraction method characterized in that the target type, the user data, and the poster data are input to a preset determination model, and the item of the data to be extracted and the range of the value of the item are output. ..
前記計算機が、前記ユーザデータと前記投稿者データと前記ターゲットタイプを前記判定モデルに与えて学習させる学習ステップを、さらに含むことを特徴とするターゲットユーザ特徴抽出方法。 The target user feature extraction method according to claim 3.
A target user feature extraction method, wherein the computer further includes a learning step in which the user data, the poster data, and the target type are given to the determination model for learning.
前記学習ステップは、
前記ユーザ属性データを用いて、ユーザの属性間の類似度を算出する類似度算出ステップを含むことを特徴とするターゲットユーザ特徴抽出方法。 The target user feature extraction method according to claim 4.
The learning step
A target user feature extraction method comprising a similarity calculation step of calculating the similarity between user attributes using the user attribute data.
ユーザ端末にコンテンツを提供するウェブサーバと、
前記ウェブサーバに前記コンテンツを提供する投稿端末と、を有するターゲットユーザ特徴抽出システムであって、
前記ウェブサーバは、前記ユーザ端末が前記コンテンツにアクセスした履歴情報を収集し、
前記投稿端末は、前記コンテンツの投稿者が獲得目標とするユーザの情報をターゲットタイプとして前記抽出サーバに通知し、
前記抽出サーバは、
前記ウェブサーバのコンテンツにアクセスしたユーザ端末の履歴情報を格納したセッションデータと、前記ユーザ端末を利用するユーザの属性情報を格納したユーザ属性データと、をユーザデータとして取得し、前記コンテンツの属性を格納したページ属性データと、前記コンテンツを提供した前記投稿者の属性を格納した投稿者属性データと、を投稿者データとして取得し、抽出対象とする投稿者の前記ターゲットタイプを取得する処理対象選択部と、
前記投稿者のターゲットタイプから抽出対象のデータの項目と前記項目の値の範囲を算出するターゲット算出部と、
前記ユーザデータと前記投稿者データから前記項目に対応する抽出対象データを算出するセッション特徴算出部と、
前記抽出対象データと前記投稿者データから前記項目の値の範囲に基づいてアクセスの特徴量を算出するアクセス特徴抽出部と、
を有することを特徴とするターゲットユーザ特徴抽出システム。 An extraction server with a processor and memory,
A web server that provides content to user terminals and
A target user feature extraction system having a posting terminal that provides the content to the web server.
The web server collects history information that the user terminal has accessed the content, and the web server collects the history information.
The posting terminal notifies the extraction server of the user information targeted by the poster of the content as the target type.
The extraction server
Session data storing the history information of the user terminal that has accessed the content of the web server and user attribute data storing the attribute information of the user who uses the user terminal are acquired as user data, and the attributes of the content are obtained. The stored page attribute data and the poster attribute data storing the attributes of the poster who provided the content are acquired as poster data, and the target type of the poster to be extracted is acquired. Department and
A target calculation unit that calculates the item of data to be extracted from the target type of the poster and the range of values of the item, and
A session feature calculation unit that calculates extraction target data corresponding to the item from the user data and the poster data, and
An access feature extraction unit that calculates an access feature amount based on the range of values of the item from the extraction target data and the poster data, and an access feature extraction unit.
A target user feature extraction system characterized by having.
前記ターゲット算出部は、
前記ターゲットタイプが定性的な情報の場合には、前記定性的な情報をデータの項目と前記項目の値の範囲に変換する範囲変換部を、有することを特徴とするターゲットユーザ特徴抽出システム。 The target user feature extraction system according to claim 6.
The target calculation unit
A target user feature extraction system comprising a range conversion unit that converts the qualitative information into a data item and a range of values of the item when the target type is qualitative information.
前記範囲変換部は、
予め設定された判定モデルに前記ターゲットタイプと前記ユーザデータと前記投稿者データを入力して、抽出対象のデータの項目と前記項目の値の範囲を出力することを特徴とするターゲットユーザ特徴抽出システム。 The target user feature extraction system according to claim 7.
The range conversion unit
A target user feature extraction system characterized in that the target type, the user data, and the poster data are input to a preset determination model, and the item of the data to be extracted and the range of the value of the item are output. ..
前記ユーザデータと前記投稿者データと前記ターゲットタイプを前記判定モデルに与えて学習させる学習部を、さらに有することを特徴とするターゲットユーザ特徴抽出システム。 The target user feature extraction system according to claim 8.
A target user feature extraction system, further comprising a learning unit that gives the user data, the poster data, and the target type to the determination model for learning.
前記学習部は、
前記ユーザ属性データを用いて、ユーザの属性間の類似度を算出する類似度算出ステップを含むことを特徴とするターゲットユーザ特徴抽出システム。 The target user feature extraction system according to claim 9.
The learning unit
A target user feature extraction system including a similarity calculation step for calculating the similarity between user attributes using the user attribute data.
前記ウェブサーバのコンテンツにアクセスしたユーザ端末の履歴情報を格納したセッションデータと、前記ユーザ端末を利用するユーザの属性情報を格納したユーザ属性データと、をユーザデータとして取得し、前記コンテンツの属性を格納したページ属性データと、前記コンテンツを提供した前記投稿者の属性を格納した投稿者属性データと、を投稿者データとして取得し、抽出対象とする投稿者と、前記コンテンツの投稿者が獲得目標とするユーザの情報をターゲットタイプとして取得する処理対象選択部と、
前記投稿者のターゲットタイプから抽出対象のデータの項目と前記項目の値の範囲を算出するターゲット算出部と、
前記ユーザデータと前記投稿者データから前記項目に対応する抽出対象データを算出するセッション特徴算出部と、
前記抽出対象データと前記投稿者データから前記項目の値の範囲に基づいてアクセスの特徴量を算出するアクセス特徴抽出部と、
を有することを特徴とするターゲットユーザ特徴抽出サーバ。 It is a target user feature extraction server that has a processor and memory and extracts the user features that the poster aims to acquire from the history information of accessing the contents of the web server.
Session data storing the history information of the user terminal that has accessed the content of the web server and user attribute data storing the attribute information of the user who uses the user terminal are acquired as user data, and the attributes of the content are obtained. The stored page attribute data and the poster attribute data storing the attributes of the poster who provided the content are acquired as poster data, and the poster to be extracted and the poster of the content are the acquisition targets. The processing target selection unit that acquires the information of the user to be the target type, and
A target calculation unit that calculates the item of data to be extracted from the target type of the poster and the range of values of the item, and
A session feature calculation unit that calculates extraction target data corresponding to the item from the user data and the poster data, and
An access feature extraction unit that calculates an access feature amount based on the range of values of the item from the extraction target data and the poster data, and an access feature extraction unit.
A target user feature extraction server characterized by having.
前記ターゲット算出部は、
前記ターゲットタイプが定性的な情報の場合には、前記定性的な情報をデータの項目と前記項目の値の範囲に変換する範囲変換部を、有することを特徴とするターゲットユーザ特徴抽出サーバ。 The target user feature extraction server according to claim 11.
The target calculation unit
A target user feature extraction server comprising a range conversion unit that converts the qualitative information into a data item and a range of values of the item when the target type is qualitative information.
前記範囲変換部は、
予め設定された判定モデルに前記ターゲットタイプと前記ユーザデータと前記投稿者データを入力して、抽出対象のデータの項目と前記項目の値の範囲を出力することを特徴とするターゲットユーザ特徴抽出サーバ。 The target user feature extraction server according to claim 12.
The range conversion unit
A target user feature extraction server characterized in that the target type, the user data, and the poster data are input to a preset determination model, and the item of the data to be extracted and the range of the value of the item are output. ..
前記ユーザデータと前記投稿者データと前記ターゲットタイプを前記判定モデルに与えて学習させる学習部を、さらに有することを特徴とするターゲットユーザ特徴抽出サーバ。 The target user feature extraction server according to claim 13.
A target user feature extraction server further comprising a learning unit that gives the user data, the poster data, and the target type to the determination model for learning.
前記学習部は、
前記ユーザ属性データを用いて、ユーザの属性間の類似度を算出する類似度算出ステップを含むことを特徴とするターゲットユーザ特徴抽出サーバ。 The target user feature extraction server according to claim 14.
The learning unit
A target user feature extraction server including a similarity calculation step for calculating the similarity between user attributes using the user attribute data.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020039825A JP2021140646A (en) | 2020-03-09 | 2020-03-09 | Target user feature extraction method, target user feature extraction system and target user feature extraction server |
CN202180008023.5A CN114902196A (en) | 2020-03-09 | 2021-01-20 | Target user feature extraction method, target user feature extraction system and target user feature extraction server |
PCT/JP2021/001917 WO2021181900A1 (en) | 2020-03-09 | 2021-01-20 | Target user feature extraction method, target user feature extraction system, and target user feature extraction server |
DE112021000337.2T DE112021000337T5 (en) | 2020-03-09 | 2021-01-20 | Target user trait extraction method, target user trait extraction system and target user trait extraction server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020039825A JP2021140646A (en) | 2020-03-09 | 2020-03-09 | Target user feature extraction method, target user feature extraction system and target user feature extraction server |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021140646A true JP2021140646A (en) | 2021-09-16 |
Family
ID=77668773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020039825A Pending JP2021140646A (en) | 2020-03-09 | 2020-03-09 | Target user feature extraction method, target user feature extraction system and target user feature extraction server |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP2021140646A (en) |
CN (1) | CN114902196A (en) |
DE (1) | DE112021000337T5 (en) |
WO (1) | WO2021181900A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023182161A1 (en) * | 2022-03-24 | 2023-09-28 | 株式会社博報堂Dyホールディングス | Information processing system and information processing method |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041396A (en) * | 2000-07-28 | 2002-02-08 | Bell-Park Co Ltd | Advertisement distributor system and advertisement distributing method |
JP2002082931A (en) * | 2000-09-07 | 2002-03-22 | Toppan Forms Co Ltd | System for preparing on-demand document |
US20050240352A1 (en) * | 2004-04-23 | 2005-10-27 | Invitrogen Corporation | Online procurement of biologically related products/services using interactive context searching of biological information |
WO2008126796A1 (en) * | 2007-04-06 | 2008-10-23 | International Business Machines Corporation | Service program generation technology |
JP2009157500A (en) * | 2007-12-25 | 2009-07-16 | Ntt Docomo Inc | Distribution server and distribution method |
CN101996215B (en) * | 2009-08-27 | 2013-07-24 | 阿里巴巴集团控股有限公司 | Information matching method and system applied to e-commerce website |
JP5401261B2 (en) | 2009-10-30 | 2014-01-29 | 株式会社日立製作所 | Information recommendation method and apparatus |
JP5124680B1 (en) * | 2011-11-30 | 2013-01-23 | 楽天株式会社 | Information processing apparatus, information processing method, information processing program, and recording medium |
JP2014010627A (en) * | 2012-06-29 | 2014-01-20 | Konami Digital Entertainment Co Ltd | Management device, service provision system, control method for management device and program for management device |
EP2924659A4 (en) * | 2012-11-22 | 2016-07-13 | Sony Corp | Information processing device, system, information processing method and program |
JP6280381B2 (en) | 2014-02-07 | 2018-02-14 | Kddi株式会社 | Item presentation apparatus, item presentation method, and program |
JP6264946B2 (en) * | 2014-03-03 | 2018-01-24 | 富士通株式会社 | Data collection method and data collection apparatus |
JP5878218B1 (en) * | 2014-10-07 | 2016-03-08 | 株式会社マクロミル | Advertising evaluation system |
JP2019020944A (en) * | 2017-07-14 | 2019-02-07 | 富士ゼロックス株式会社 | Display device and program |
JP6822923B2 (en) * | 2017-08-24 | 2021-01-27 | ヤフー株式会社 | Information processing equipment, information processing methods, and information processing programs |
JP2020039825A (en) | 2018-09-13 | 2020-03-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Information processing method and washing machine |
JP6826631B2 (en) * | 2019-05-07 | 2021-02-03 | ヤフー株式会社 | Information processing equipment, information processing methods, and information processing programs |
-
2020
- 2020-03-09 JP JP2020039825A patent/JP2021140646A/en active Pending
-
2021
- 2021-01-20 WO PCT/JP2021/001917 patent/WO2021181900A1/en active Application Filing
- 2021-01-20 DE DE112021000337.2T patent/DE112021000337T5/en not_active Withdrawn
- 2021-01-20 CN CN202180008023.5A patent/CN114902196A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023182161A1 (en) * | 2022-03-24 | 2023-09-28 | 株式会社博報堂Dyホールディングス | Information processing system and information processing method |
Also Published As
Publication number | Publication date |
---|---|
WO2021181900A1 (en) | 2021-09-16 |
CN114902196A (en) | 2022-08-12 |
DE112021000337T5 (en) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2304619B1 (en) | Correlated information recommendation | |
US20200273054A1 (en) | Digital receipts economy | |
US7813965B1 (en) | Method, system, and computer readable medium for ranking and displaying a pool of links identified and aggregated from multiple customer reviews pertaining to an item in an electronic catalog | |
US8380727B2 (en) | Information processing device and method, program, and recording medium | |
US9734503B1 (en) | Hosted product recommendations | |
US8341101B1 (en) | Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics | |
US20150074114A1 (en) | Tag management device, tag management method, tag management program, and computer-readable recording medium for storing said program | |
WO2017158798A1 (en) | Information processing device, information distribution system, information processing method, and information processing program | |
KR20140026932A (en) | System and method providing a suited shopping information by analyzing the propensity of an user | |
JP2010224873A (en) | Commodity retrieval server, commodity retrieval method, program, and recording medium | |
KR100987058B1 (en) | Method and system for providing advertising service using the keywords of internet contents and program recording medium | |
US8478702B1 (en) | Tools and methods for determining semantic relationship indexes | |
US20140372220A1 (en) | Social Media Integration for Offer Searching | |
WO2021181900A1 (en) | Target user feature extraction method, target user feature extraction system, and target user feature extraction server | |
KR20100123206A (en) | Method and apparatus for ranking analysis based on artificial intelligence, and recording medium thereof | |
JPWO2017104064A1 (en) | Management device, management method, non-transitory recording medium, and program | |
JP2017091054A (en) | Advertising system and advertisement distributing method | |
KR20220026255A (en) | Recommendation System for Health Supplement by Using Big Data | |
US20150278828A1 (en) | Market analysis for an online business | |
US20070276720A1 (en) | Indexing of a focused data set through a comparison technique method and apparatus | |
US11810148B1 (en) | Content influencer scoring system and related methods | |
KR102429104B1 (en) | Product catalog automatic classification system based on artificial intelligence | |
JP6320353B2 (en) | Digital marketing system | |
JP2015028685A (en) | Information processing apparatus, information processing method and program | |
JP2022016146A (en) | Information processing device, information processing method, and information processing program |