JP2018195099A - Character analyzing device, device for generating model for character analysis, and character analyzing program - Google Patents

Character analyzing device, device for generating model for character analysis, and character analyzing program Download PDF

Info

Publication number
JP2018195099A
JP2018195099A JP2017098728A JP2017098728A JP2018195099A JP 2018195099 A JP2018195099 A JP 2018195099A JP 2017098728 A JP2017098728 A JP 2017098728A JP 2017098728 A JP2017098728 A JP 2017098728A JP 2018195099 A JP2018195099 A JP 2018195099A
Authority
JP
Japan
Prior art keywords
model
personality
information
personality type
behavior characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017098728A
Other languages
Japanese (ja)
Inventor
神谷 誠一郎
Seiichiro Kamiya
誠一郎 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KANKYO I CO Ltd
Original Assignee
KANKYO I CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KANKYO I CO Ltd filed Critical KANKYO I CO Ltd
Priority to JP2017098728A priority Critical patent/JP2018195099A/en
Publication of JP2018195099A publication Critical patent/JP2018195099A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To enable analysis of characters of a user more accurately.SOLUTION: A learning processing unit 20 generates, based on behavior characteristic information indicating a browsing state of a web page related to a model user whose character type is known, character type model information in which a behavior characteristic and a personality type by a model user are associated with each other. A determination processing unit 30 determines a character type of a user from behavior characteristic information indicating a browsing state of a web page related to a user whose personality type is unknown and personality type model information. By generating the personality type model information by excluding the behavior characteristic information of a model user whose page view count is less than a threshold value, personality type model information is generated only from the behavior characteristic information of the model user considered to include multiple personality-based page browsing, so that personality type can be determined from more accurate character type model information.SELECTED DRAWING: Figure 2

Description

本発明は、性格分析装置、性格判定用モデル生成装置および性格分析用プログラムに関し、特に、ページを閲覧しているユーザの行動特性情報を利用してユーザの性格タイプを分析する装置に用いて好適なものである。   The present invention relates to a personality analysis device, a personality determination model generation device, and a personality analysis program, and is particularly suitable for use in a device that analyzes the personality type of a user using the behavior characteristic information of the user browsing the page. It is a thing.

個人の性格を理解することは、人間関係の構築のみならず、性格を考慮した広告配信といった販売促進、性格を考慮した生活習慣病予防策の提案、群集行動把握など統計分析など、ビジネスの局面でも有効である。そのため、従来、様々な方法により性格分析が行われてきた。例えば、アンケートのように特別な作業をユーザに行ってもらうことなく、ユーザが閲覧しているデジタルコンテンツの情報を利用してユーザの性格分析を行うことができるようにしたシステムが知られている(例えば、特許文献1参照)。   Understanding personality is not only about building relationships, but also promoting sales such as advertising distribution that considers personality, proposals for lifestyle-related disease prevention measures that consider personality, and statistical analysis such as understanding crowd behavior. But it is effective. Therefore, personality analysis has been conventionally performed by various methods. For example, a system is known in which a user's personality analysis can be performed using digital content information viewed by the user without requiring the user to perform special work such as a questionnaire. (For example, refer to Patent Document 1).

この特許文献1に記載の性格分析装置では、ユーザが閲覧しているページまたは当該ページ上のコンテンツの特性情報、およびページまたはコンテンツに対するユーザの行動に関する時間情報をユーザの行動特性情報として取得する。そして、当該取得したユーザの行動特性情報と、複数のユーザの行動に関する時間情報の平均値とに基づいて、行動特性情報で示されるユーザの行動が性格タイプ記憶部にあらかじめ記憶された行動様式のどれに該当するかを判定し、該当する行動様式に関連付けられた性格タイプをユーザの性格タイプとして判定するようにしている。   In the personality analysis apparatus described in Patent Literature 1, characteristic information of a page being browsed by a user or content on the page, and time information regarding user behavior with respect to the page or content are acquired as user behavior characteristic information. And based on the acquired user behavior characteristic information and the average value of the time information regarding the behaviors of a plurality of users, the behavior of the user indicated by the behavior characteristic information is stored in the personality type storage unit in advance. The personality type associated with the relevant behavior is determined as the personality type of the user.

特開2015−1795号公報Japanese Patent Laid-Open No. 2015-1795

上記特許文献1に記載の性格分析装置によれば、どのような特性を持ったページまたはコンテンツをユーザが閲覧しているのか、そのページまたはコンテンツに対してユーザがどのような時間をかけて行動しているのかなど、ユーザの性格による影響を受けて変わる可能性のある行動に関する複数の要素を用いてユーザの性格タイプを判定しているので、単にページの閲覧時間といった単一の要素に基づいて性格分析を行う従来技術に比べて、ユーザの性格分析を正確に行うことが可能である。しかし、より正確に性格分析を行うことが望まれていた。   According to the personality analysis apparatus described in the above-mentioned Patent Document 1, what kind of characteristics the user is browsing a page or content, and what kind of time the user takes to act on the page or content Since the user's personality type is determined using multiple factors related to behavior that may change depending on the user's personality, such as Therefore, it is possible to accurately analyze the personality of the user as compared to the conventional technique for performing personality analysis. However, more accurate personality analysis has been desired.

本発明は、このような問題を解決するために成されたものであり、ページを閲覧しているユーザの行動特性情報を利用して、ユーザの性格分析をより正確に行うことができるようにすることを目的とする。   The present invention has been made to solve such a problem, so that the personality analysis of a user can be performed more accurately by using the behavior characteristic information of the user browsing the page. The purpose is to do.

上記した課題を解決するために、本発明では、性格タイプが既知の複数のモデルユーザによるページの閲覧状況を複数のモデルユーザの行動特性情報として取得する。そして、所定期間分の行動特性情報に基づいて、モデルユーザによる複数のページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成し、性格タイプ判定用の情報としてモデル情報記憶部に記憶させる。ここで、各モデルユーザについて蓄積した所定期間分の行動特性情報のうち、ページ閲覧回数が閾値未満のモデルユーザの行動特性情報を除外して性格タイプモデル情報を生成する。そして、性格タイプが未知の判定対象ユーザについて取得された所定期間分の行動特性情報と、上記のように生成された性格タイプモデル情報とに基づいて、判定対象ユーザの性格タイプを判定するようにしている。   In order to solve the above-described problem, in the present invention, the browsing state of a page by a plurality of model users whose personality types are known is acquired as behavior characteristic information of the plurality of model users. Then, based on the behavior characteristic information for a predetermined period, personality type model information formed by associating behavior characteristics on a plurality of pages by a model user and a plurality of personality types is generated, and the model is used as information for personality type determination. The information is stored in the information storage unit. Here, out of the behavior characteristic information for a predetermined period accumulated for each model user, the personality type model information is generated by excluding the behavior characteristic information of the model user whose page browsing frequency is less than the threshold. Then, the personality type of the determination target user is determined based on the behavior characteristic information for a predetermined period acquired for the determination target user whose personality type is unknown and the personality type model information generated as described above. ing.

上記のように構成した本発明によれば、ユーザがどのようなページをどのように閲覧しているのかというページ閲覧状況の情報に基づいてユーザの性格タイプが判定される。ユーザの性格タイプは、そのユーザの気質を表しており、様々なページに表示されるコンテンツの捉え方と意識決定の違いを生み、最終的には行動の違いを生む。特に、インターネット上でページを閲覧しているときは、プライベートで閉じた世界であることが多いため、周囲の目を気にせず、ありのままの自分が表れ、ユーザの性格がページ閲覧の行動に無意識に反映される傾向がある。つまり、ユーザがどのようなページをどのように閲覧するかは、ユーザの性格による影響を受けている。本発明では、このようにユーザの性格による影響を受けて変わる可能性のある行動特性を用いて、ユーザの性格タイプが判定される。   According to the present invention configured as described above, the personality type of the user is determined based on the information on the page browsing situation such as what page the user is browsing. The personality type of the user represents the temperament of the user, and causes a difference in how to perceive content displayed on various pages and a determination of consciousness, and finally causes a difference in behavior. Especially when browsing pages on the Internet, it is often a private and closed world, so you don't have to worry about your surroundings. Tend to be reflected. In other words, what page the user views is influenced by the user's personality. In the present invention, the personality type of the user is determined using behavioral characteristics that may change due to the influence of the personality of the user.

特に、本発明では、以上のような性格タイプの判定に用いる性格タイプモデル情報が、ページ閲覧回数が閾値未満のモデルユーザの行動特性情報を除外して生成される。モデルユーザによるページ閲覧は、モデルユーザの性格が反映された行動と、そのときの思いつきあるいは外的な環境などに影響されていてモデルユーザの性格があまり反映されていない行動との両方の可能性があり得るが、モデルユーザのページ閲覧回数が閾値未満しかない場合、モデルユーザの性格が反映されたページ閲覧の数が、正確な性格タイプモデルを生成するには少ない可能性がある。本発明では、そのような行動特性情報は使わずに、モデルユーザの性格に基づくページ閲覧が比較的多く含まれると考えられる行動特性情報のみから性格タイプモデル情報が生成されるので、より正確な性格タイプモデル情報を得ることができる。そして、この正確な性格タイプモデル情報を用いて性格タイプの判定を行うことにより、ユーザの性格タイプの分析をより正確に行うことができる。   In particular, in the present invention, the personality type model information used for the determination of the personality type as described above is generated by excluding the behavior characteristic information of the model user whose page browsing frequency is less than the threshold. Page browsing by a model user can be both an action that reflects the personality of the model user and an action that is influenced by the idea or external environment at that time and does not reflect the personality of the model user. However, if the number of page views of the model user is less than a threshold, the number of page views that reflect the model user's personality may be small to generate an accurate personality type model. In the present invention, the personality type model information is generated only from the behavior characteristic information that is considered to include relatively many page views based on the model user's personality without using such behavior characteristic information. Personality type model information can be obtained. Then, by determining the personality type using this accurate personality type model information, the user's personality type can be analyzed more accurately.

本実施形態による性格分析システムの全体構成例を示す図である。It is a figure which shows the example of whole structure of the character analysis system by this embodiment. 本実施形態による性格分析装置の機能構成例を示すブロック図である。It is a block diagram which shows the function structural example of the personality analyzer by this embodiment. 本実施形態の履歴情報記憶部に記憶されるモデルユーザの行動履歴情報の一例を示す図である。It is a figure which shows an example of the action history information of the model user memorize | stored in the history information storage part of this embodiment. 本実施形態のモデル情報記憶部に記憶される性格タイプモデル情報の一例を模式的に示す図である。It is a figure which shows typically an example of the character type model information memorize | stored in the model information storage part of this embodiment. 本実施形態の履歴情報記憶部に記憶される判定対象ユーザの行動履歴情報の一例を示す図である。It is a figure which shows an example of the action history information of the determination target user memorize | stored in the history information storage part of this embodiment.

以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態による性格分析システムの全体構成例を示す図である。図1に示すように、本実施形態による性格分析システムは、ウェブページを閲覧する複数のユーザが使用する複数のユーザ端末100と、各ユーザ端末100から各種ウェブページに対して行われるアクセスを解析するアクセス解析装置200と、ユーザの性格タイプを分析する性格分析装置300とを備えて構成されている。ユーザ端末100、アクセス解析装置200および性格分析装置300は、インターネット400を介して接続可能に構成されている。   Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing an example of the overall configuration of the personality analysis system according to this embodiment. As shown in FIG. 1, the personality analysis system according to the present embodiment analyzes a plurality of user terminals 100 used by a plurality of users who browse web pages, and accesses performed from each user terminal 100 to various web pages. Access analysis device 200 and a personality analysis device 300 that analyzes the personality type of the user. The user terminal 100, the access analysis device 200, and the personality analysis device 300 are configured to be connectable via the Internet 400.

ユーザ端末100は、ウェブブラウザを備え、インターネット400のウェブサイト上にあるウェブページを表示することが可能である。アクセス解析装置200は、ユーザ端末100からウェブページへのアクセスを解析する。本実施形態では少なくとも、性格タイプの分析に使用するウェブページに対するアクセスを解析すればよい。解析対象とするウェブページは、例えば、当該ウェブページに対してHTML(HyperText Markup Language)による所定の解析タグを設定しておくことによりあらかじめ特定することが可能である。   The user terminal 100 includes a web browser and can display a web page on a website of the Internet 400. The access analysis device 200 analyzes access from the user terminal 100 to a web page. In this embodiment, at least access to a web page used for personality type analysis may be analyzed. The web page to be analyzed can be specified in advance by setting a predetermined analysis tag in HTML (HyperText Markup Language) for the web page, for example.

アクセス解析装置200が解析するアクセスの内容は、アクセスを行ったユーザ、アクセスされたウェブページ、ウェブページでの滞在時間(ユーザによる閲覧時間)などである。アクセスを行ったユーザの特定は、ユーザまたはユーザ端末100に固有の情報を用いて特定することが可能である。例えば、性格分析に使用するウェブサイトへのアクセスにログインが必要な場合は、ログインIDによってユーザを特定することが可能である。また、アクセスにログインが必要でない場合は、クッキー情報によってユーザを特定することが可能である。   The contents of the access analyzed by the access analysis device 200 are the user who performed the access, the accessed web page, the staying time on the web page (viewing time by the user), and the like. Identification of the user who performed the access can be performed using information unique to the user or the user terminal 100. For example, when login is required to access a website used for personality analysis, the user can be specified by the login ID. If login is not required for access, the user can be specified by cookie information.

また、ウェブページへのアクセスに際してユーザ端末100のIPアドレスやMACアドレス等が使用される場合は、当該IPアドレスやMACアドレスによってユーザ端末100を特定することが可能である。ユーザ端末100とそれを使用するユーザとを何らかの情報によってあらかじめ紐付けておけば、IPアドレスやMACアドレスをもとに、ウェブページにアクセスしたユーザを一意に特定することが可能である。   When the IP address or MAC address of the user terminal 100 is used for accessing the web page, the user terminal 100 can be specified by the IP address or MAC address. If the user terminal 100 and the user who uses the user terminal 100 are associated with each other in advance, it is possible to uniquely identify the user who has accessed the web page based on the IP address or the MAC address.

アクセスされたウェブページの特定は、ウェブページに固有の情報を用いて行うことが可能である。例えば、ウェブページごとに異なるURL(Uniform Resource Locator)によって、アクセスされたウェブページを特定することが可能である。また、ウェブページに設定する解析タグをウェブページ毎に異なるものとすれば、その解析タグをページIDとして用いることができ、当該ページIDによってウェブページを特定することが可能である。あるいは、解析グとは別に専用のページIDを各ウェブページに設定しておくようにしてもよい。   The accessed web page can be specified using information unique to the web page. For example, the accessed web page can be specified by a URL (Uniform Resource Locator) that is different for each web page. Moreover, if the analysis tag set to the web page is different for each web page, the analysis tag can be used as the page ID, and the web page can be specified by the page ID. Alternatively, a dedicated page ID may be set for each web page separately from the analysis group.

また、ウェブページでの滞在時間は、当該ウェブページが開かれた時刻と離脱した時刻との差分を検出することによって特定することが可能である。アクセス解析装置200は、ウェブページのアクセス解析情報(アクセスを行ったユーザ、アクセスされたウェブページ、ウェブページでの滞在時間)を性格分析装置300に送信する。   The staying time on the web page can be specified by detecting a difference between the time when the web page is opened and the time when the web page is left. The access analysis device 200 transmits web page access analysis information (the user who made the access, the accessed web page, and the stay time on the web page) to the personality analysis device 300.

なお、アクセス解析情報の送信は、ユーザ端末100からウェブページへのアクセスが行われてアクセス解析装置200によりアクセス解析が行われる都度のタイミングで行ってもよいし、性格分析装置300からの要求があったときに行ってもよい。性格分析装置300からの要求に応じてアクセス解析情報を送信する場合、アクセス解析装置200は、当該アクセス解析情報を一定期間保存しておく必要がある。   The transmission of the access analysis information may be performed each time the web page is accessed from the user terminal 100 and the access analysis is performed by the access analysis device 200, or a request from the personality analysis device 300 is received. You may go when there is. When transmitting access analysis information in response to a request from the personality analysis device 300, the access analysis device 200 needs to store the access analysis information for a certain period.

図2は、本実施形態による性格分析装置300の機能構成例を示すブロック図である。図2に示すように、本実施形態の性格分析装置300は、その機能構成として、アクセス解析情報受信部10、学習処理部20および判定処理部30を備えている。学習処理部20は、具体的な機能構成として、モデル行動特性取得部21、モデル行動履歴記録部22および性格タイプモデル生成部23を備えている。また、判定処理部30は、具体的な機能構成として、行動特性取得部31、行動履歴記録部32および性格タイプ判定部33を備えている。さらに、本実施形態の性格分析装置300は、記憶媒体として、履歴情報記憶部40およびモデル情報記憶部50を備えている。   FIG. 2 is a block diagram illustrating a functional configuration example of the personality analysis apparatus 300 according to the present embodiment. As shown in FIG. 2, the personality analysis apparatus 300 of the present embodiment includes an access analysis information receiving unit 10, a learning processing unit 20, and a determination processing unit 30 as its functional configuration. The learning processing unit 20 includes a model behavior characteristic acquisition unit 21, a model behavior history recording unit 22, and a personality type model generation unit 23 as specific functional configurations. The determination processing unit 30 includes a behavior characteristic acquisition unit 31, a behavior history recording unit 32, and a personality type determination unit 33 as specific functional configurations. Furthermore, the personality analysis apparatus 300 according to this embodiment includes a history information storage unit 40 and a model information storage unit 50 as storage media.

なお、上記各機能ブロック10,20,30は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック10,20,30は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶された性格分析用プログラムが動作することによって実現される。   Each of the functional blocks 10, 20, and 30 can be configured by any of hardware, DSP (Digital Signal Processor), and software. For example, when configured by software, each of the functional blocks 10, 20, and 30 is actually configured with a CPU, RAM, ROM, etc. of a computer and stored in a recording medium such as RAM, ROM, hard disk, or semiconductor memory. This is realized by operating a personality analysis program.

アクセス解析情報受信部10は、アクセス解析装置200から送信されたアクセス解析情報を受信する。学習処理部20は、性格タイプが既知の複数のユーザ(以下、モデルユーザという)に関するアクセス解析情報を用いた学習処理によって、性格タイプが未知のユーザ(以下、判定対象ユーザという)について性格タイプを判定する際に用いる性格タイプモデル情報を生成する。判定処理部30は、性格タイプが未知の判定対象ユーザに関するアクセス解析情報と、学習処理部20により生成された性格タイプモデル情報とに基づいて、判定対象ユーザの性格タイプを判定する。   The access analysis information receiving unit 10 receives the access analysis information transmitted from the access analysis device 200. The learning processing unit 20 obtains a personality type for a user whose personality type is unknown (hereinafter referred to as a determination target user) through a learning process using access analysis information regarding a plurality of users whose personality types are known (hereinafter referred to as model users). Personality type model information used for determination is generated. The determination processing unit 30 determines the personality type of the determination target user based on the access analysis information regarding the determination target user whose personality type is unknown and the personality type model information generated by the learning processing unit 20.

まず、学習処理部20について詳細を説明する。モデル行動特性取得部21は、アクセス解析情報受信部10により受信されたアクセス解析情報に基づいて、性格タイプが既知の複数のモデルユーザが閲覧したウェブページを特定するページ情報、および当該ウェブページの閲覧時間を、複数のモデルユーザの行動特性情報として取得する。この行動特性情報は、各モデルユーザがどのウェブページをどのくらいの時間をかけて閲覧したかを示す情報であり、アクセス解析情報により示される各ウェブページでの滞在時間がこれに該当する。   First, details of the learning processing unit 20 will be described. Based on the access analysis information received by the access analysis information receiving unit 10, the model behavior characteristic acquisition unit 21 specifies page information for identifying web pages viewed by a plurality of model users whose personality types are known, and the web page The browsing time is acquired as behavior characteristic information of a plurality of model users. This behavior characteristic information is information indicating how much time each model user has viewed which web page, and the staying time on each web page indicated by the access analysis information corresponds to this behavior characteristic information.

モデル行動履歴記録部22は、モデル行動特性取得部21により取得された行動特性情報を、モデルユーザを一意に識別可能な情報(ログインIDまたはクッキー情報など)と共に複数のモデルユーザの行動履歴として履歴情報記憶部40に記録する。   The model behavior history recording unit 22 records the behavior characteristic information acquired by the model behavior characteristic acquisition unit 21 as behavior histories of a plurality of model users together with information (such as login ID or cookie information) that can uniquely identify the model user. Record in the information storage unit 40.

図3は、履歴情報記憶部40に記憶されるモデルユーザの行動履歴情報の一例を示す図である。図3に示すように、履歴情報記憶部40は、モデルユーザ毎に、アクセスしたウェブページを一意に特定するページ情報(URLまたはページID等)、閲覧開始時刻、閲覧終了時刻、閲覧時間などから成る行動特性情報を記憶する。図3の例では、モデルユーザMU1が複数のウェブページP1,P5,P3,・・・をそれぞれ3秒、63秒、41秒、・・・ずつ閲覧したという行動履歴が記憶されている。   FIG. 3 is a diagram illustrating an example of behavior history information of a model user stored in the history information storage unit 40. As shown in FIG. 3, the history information storage unit 40 includes, for each model user, page information (URL or page ID or the like) that uniquely identifies the accessed web page, browsing start time, browsing end time, browsing time, and the like. The behavior characteristic information consisting of is stored. In the example of FIG. 3, an action history is stored that the model user MU1 has viewed a plurality of web pages P1, P5, P3,... 3 seconds, 63 seconds, 41 seconds,.

性格タイプモデル生成部23は、行動履歴記録部40に記憶された所定期間分(例えば、1ヵ月分)の複数のモデルユーザの行動特性情報に基づいて、モデルユーザによる複数のウェブページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成し、それをモデル情報記憶部50に記憶させる。   The personality type model generation unit 23 is based on behavior characteristic information of a plurality of model users for a predetermined period (for example, for one month) stored in the behavior history recording unit 40 on a plurality of web pages by the model user. Personality type model information formed by associating behavior characteristics with a plurality of personality types is generated and stored in the model information storage unit 50.

本実施形態において、一のモデルユーザによる一のウェブページ上での行動特性の一例として、履歴情報記憶部40に行動履歴情報が記憶された複数のモデルユーザによる一のウェブページの閲覧時間の平均値よりも、一のモデルユーザによる一のウェブページの閲覧時間が短いか長いかを示したものを用いる。また、この行動特性に関連付ける性格タイプは、モデルユーザについて既知の性格タイプである。このように行動特性と性格タイプとを関連付けて成る性格タイプモデル情報は、具体的には、平均値算出部23Aおよび関連付け部23Bによって生成する。   In the present embodiment, as an example of behavior characteristics on one web page by one model user, an average of browsing time of one web page by a plurality of model users whose behavior history information is stored in the history information storage unit 40 A value indicating whether the browsing time of one web page by one model user is shorter or longer than the value is used. The personality type associated with this behavior characteristic is a personality type known for the model user. Specifically, the personality type model information formed by associating the behavior characteristic with the personality type is generated by the average value calculating unit 23A and the associating unit 23B.

平均値算出部23Aは、履歴情報記憶部40に記憶された複数のモデルユーザの行動特性情報に基づいて、複数のモデルユーザによるウェブページの閲覧時間の平均値をウェブページ毎に算出する。例えば、図3のように、ウェブページP1はモデルユーザMU1がある日時において3秒間閲覧しているが、他の日時にもウェブページP1を閲覧していればそのときの閲覧時間と、他のモデルユーザもウェブページP1を閲覧していればその閲覧時間とを全て考慮して、それらの閲覧時間の平均値を算出する。他のウェブページについても同様に、閲覧時間の平均値をそれぞれ算出する。   The average value calculation unit 23A calculates, for each web page, an average value of browsing times of the web pages by the plurality of model users based on the behavior characteristic information of the plurality of model users stored in the history information storage unit 40. For example, as shown in FIG. 3, the web page P1 is browsed for 3 seconds at a certain date and time by the model user MU1, but if the web page P1 is also browsed at other dates and times, If the model user is also browsing the web page P1, all the browsing time is considered and the average value of the browsing time is calculated. Similarly, the average browsing time is calculated for each of the other web pages.

関連付け部23Bは、ウェブページの閲覧時間が平均値算出部23Aにより算出された閲覧時間の平均値より短いか長いかを基準として定めた複数の行動特性が、どの性格タイプに該当するかをウェブページ毎に関連付けることによって、性格タイプモデル情報を生成する。ここで、複数の行動特性とは、ウェブページの閲覧時間が平均値より短いという第1の行動特性と、ウェブページの閲覧時間が平均値より長いという第2の行動特性である。また、この行動特性に関連付ける性格タイプは、モデルユーザについて既知の性格タイプである。   The associating unit 23B determines which personality type corresponds to the plurality of behavior characteristics determined based on whether the browsing time of the web page is shorter or longer than the average value of the browsing time calculated by the average value calculating unit 23A. Personality type model information is generated by associating each page. Here, the plurality of behavior characteristics are a first behavior characteristic that the browsing time of the web page is shorter than the average value and a second behavior characteristic that the browsing time of the web page is longer than the average value. The personality type associated with this behavior characteristic is a personality type known for the model user.

例えば、あるモデルユーザMUiのウェブページP1の閲覧時間が平均値より短い場合、関連付け部23Bは、そのウェブページP1に関して、第1の行動特性に対して当該モデルユーザMUiの既知の性格タイプを関連付ける。なお、このモデルユーザMUiがウェブページP1を複数回閲覧しているときは、関連付け部23Bはその平均値を算出する。そして、関連付け部23Bは、当該モデルユーザMUiによる閲覧時間の平均値が、平均値算出部23Aにより算出された全体のモデルユーザによる閲覧時間の平均値より短いか長いかによって、モデルユーザMUiの行動特性を特定する。   For example, when the browsing time of the web page P1 of a certain model user MUi is shorter than the average value, the associating unit 23B associates the known personality type of the model user MUi with respect to the first behavior characteristic for the web page P1. . When the model user MUi is browsing the web page P1 a plurality of times, the associating unit 23B calculates the average value. Then, the associating unit 23B determines the behavior of the model user MUi depending on whether the average value of the browsing time by the model user MUi is shorter or longer than the average value of the browsing time by the entire model user calculated by the average value calculating unit 23A. Identify characteristics.

同様に、他のモデルユーザMUjについてもウェブページP1の閲覧履歴があれば、関連付け部23Bは、当該モデルユーザMUjの閲覧時間が平均値より短いか長いかによって、ウェブページP1に関するモデルユーザMUjの行動特性が第1の行動特性か第2の行動特性かを特定する。そして、モデルユーザMUjの行動特性が第1の行動特性に該当する場合、関連付け部23Bは、そのウェブページP1に関して、第1の行動特性に対して当該モデルユーザMUjの既知の性格タイプを関連付ける。以下同様にして、関連付け部23Bは、ウェブページP1を閲覧している各モデルユーザの既知の性格タイプを、第1の行動特性または第2の行動特性の何れかに関連付ける。   Similarly, if there is a browsing history of the web page P1 for other model users MUj, the associating unit 23B determines whether or not the model user MUj related to the web page P1 depends on whether the browsing time of the model user MUj is shorter or longer than the average value. It is specified whether the behavior characteristic is the first behavior characteristic or the second behavior characteristic. When the behavior characteristic of the model user MUj corresponds to the first behavior characteristic, the associating unit 23B associates the known personality type of the model user MUj with respect to the first behavior characteristic for the web page P1. Similarly, the associating unit 23B associates the known personality type of each model user who is browsing the web page P1 with either the first behavior characteristic or the second behavior characteristic.

このようにすると、例えばウェブページP1に関する第1の行動特性に対し、1以上のモデルユーザの性格タイプが関連付けられることになる。同様に、ウェブページP1に関する第2の行動特性に対しても、1以上のモデルユーザの性格タイプが関連付けられることになる。ここで、ウェブページP1に関する第1の行動特性に対して関連付けられた1以上のモデルユーザの性格タイプが全て同じであれば、関連付け部23Bはそのままその性格タイプを採用する。   If it does in this way, the personality type of one or more model users will be related with the 1st action characteristic about web page P1, for example. Similarly, one or more personality types of model users are associated with the second behavior characteristic related to the web page P1. Here, if the personality types of one or more model users associated with the first behavior characteristic relating to the web page P1 are all the same, the associating unit 23B adopts the personality type as it is.

一方、ウェブページP1に関する第1の行動特性に対して関連付けられた1以上のモデルユーザの性格タイプが全て同じでなく、複数種類の性格タイプに分かれる場合は、関連付け部23Bはその中から何れかを選択して採用する。この場合における選択のアルゴリズムとしては、種々の方法を適用することが可能である。例えば、関連付けの数が最も多い性格タイプを選択するという方法を用いることが可能である。あるいは、関連付けの数が所定数よりも多い1以上の性格タイプを選択するという方法を用いてもよい。   On the other hand, if the personality types of one or more model users associated with the first behavior characteristic related to the web page P1 are not all the same and are divided into a plurality of types of personality types, the associating unit 23B selects one of them. Select and adopt. As a selection algorithm in this case, various methods can be applied. For example, it is possible to use a method of selecting a personality type having the largest number of associations. Or you may use the method of selecting one or more personality types with more associations than a predetermined number.

図4は、以上のようにして関連付け部23Bにより生成されモデル情報記憶部50に記憶される性格タイプモデル情報の一例を模式的に示す図である。ここでは、各モデルユーザを9種類の性格タイプ(例えば、エニアグラムの性格タイプ)の何れかに分類した場合の例を示している。例えば、ウェブページP1に関しては、閲覧時間が平均値より短い第1の行動特性に対して第1の性格タイプが関連付けられ、閲覧時間が平均値より長い第2の行動特性に対して第9の性格タイプが関連付けられている。つまりこれは、第1の性格タイプを持つモデルユーザは、ウェブページP1を平均値よりも短い時間しか閲覧しない傾向にあること、第9の性格タイプを持つモデルユーザは、ウェブページP1を平均値よりも長い時間閲覧する傾向にあることを示したものと言える。   FIG. 4 is a diagram schematically illustrating an example of the personality type model information generated by the associating unit 23B and stored in the model information storage unit 50 as described above. Here, an example is shown in which each model user is classified into one of nine types of personality types (for example, Enneagram personality types). For example, for the web page P1, the first personality type is associated with the first behavior characteristic whose browsing time is shorter than the average value, and the ninth personality is associated with the second behavior characteristic whose browsing time is longer than the average value. A personality type is associated. That is, this is because the model user having the first personality type tends to browse the web page P1 only for a shorter time than the average value, and the model user having the ninth personality type averages the web page P1. It can be said that it showed a tendency to browse for a longer time.

なお、性格タイプモデル生成部23が以上に説明した処理を行うことにより、図4に例示した性格タイプモデル情報を生成することは一例に過ぎず、本発明はこれに限定されない。例えば、ニューラルネットワーク、SVM(support vector machine)、ランダムフォレスト、ロジスティック回帰などの学習アルゴリズムを利用して、性格タイプモデル情報を生成するようにしてもよい。   Note that the personality type model generation unit 23 performs the processing described above to generate the personality type model information illustrated in FIG. 4 is merely an example, and the present invention is not limited to this. For example, personality type model information may be generated using a learning algorithm such as neural network, SVM (support vector machine), random forest, logistic regression, or the like.

例えば、ニューラルネットワークを用いた学習アルゴリズムによって性格タイプモデル情報を生成する場合、性格タイプモデル生成部23は、モデルユーザの行動特性情報をニューラルネットワークの入力層に与えるとともに、モデルユーザの性格タイプをニューラルネットワークの出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。これにより、学習済みのニューラルネットワークが得られる。この学習済みのニューラルネットワークは、モデルユーザの行動特性と性格タイプとを関連付けた性格タイプモデル情報に相当する。   For example, when personality type model information is generated by a learning algorithm using a neural network, the personality type model generation unit 23 provides the behavior characteristics information of the model user to the input layer of the neural network, and also sets the personality type of the model user to the neural network. Given to the output layer of the network, learning processing is performed using the personality type of the output layer as teacher data. As a result, a learned neural network is obtained. This learned neural network corresponds to personality type model information in which the behavior characteristics and personality type of the model user are associated with each other.

また、ニューラルネットワークを用いた学習アルゴリズムによって性格タイプモデル情報を生成する場合、性格タイプモデル生成部23は、モデルユーザの行動特性情報をニューラルネットワークの入力層に与えるとともに、モデルユーザの性格タイプをニューラルネットワークの出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。これにより、学習済みのニューラルネットワークが得られる。この学習済みのニューラルネットワークは、モデルユーザの行動特性と性格タイプとを関連付けた性格タイプモデル情報に相当する。   In addition, when generating personality type model information by a learning algorithm using a neural network, the personality type model generation unit 23 provides the behavior characteristics information of the model user to the input layer of the neural network, and also sets the personality type of the model user to the neural network. Given to the output layer of the network, learning processing is performed using the personality type of the output layer as teacher data. As a result, a learned neural network is obtained. This learned neural network corresponds to personality type model information in which the behavior characteristics and personality type of the model user are associated with each other.

また、SVMを用いた学習アルゴリズムによって性格タイプモデル情報を生成する場合、性格タイプモデル生成部23は、モデルユーザの行動特性情報をSVMの入力層に与えるとともに、モデルユーザの性格タイプをSVMの出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。これにより、学習済みの分類モデルが得られる。この分類モデルは、モデルユーザの行動特性と性格タイプとを関連付けた性格タイプモデル情報に相当する。SVMは、与えられたデータを2種類に分類する目的で用いられる機械学習のアルゴリズムである。他のアルゴリズムに比べ精度の高い分類ができるのが特徴である。よって、2種類の性格タイプを判定する目的の場合は、SVMを用いるとよい。   When generating personality type model information by a learning algorithm using SVM, personality type model generation unit 23 provides the behavior characteristics information of the model user to the input layer of SVM and outputs the personality type of the model user to SVM. The learning process is performed using the personality type of the output layer as teacher data. Thereby, a learned classification model is obtained. This classification model corresponds to personality type model information in which the behavior characteristics and personality type of the model user are associated. SVM is a machine learning algorithm used for the purpose of classifying given data into two types. The feature is that classification can be performed with higher accuracy than other algorithms. Therefore, SVM may be used for the purpose of determining two types of personality types.

また、ランダムフォレストを用いた学習アルゴリズムによって性格タイプモデル情報を生成する場合、性格タイプモデル生成部23は、モデルユーザの行動特性情報をランダムフォレストの入力層に与えるとともに、モデルユーザの性格タイプをランダムフォレストの出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。これにより、学習済みの集団学習モデルが得られる。この集団学習モデルは、モデルユーザの行動特性と性格タイプとを関連付けた性格タイプモデル情報に相当する。ランダムフォレストは、条件ごとに枝分かれする樹形図型のグラフである決定木による学習を複数重ね合わせることで、分析の精度を高めるために用いられる機械学習のアルゴリズムである。他のアルゴリズムに比べて、大量のデータを必要とするものの精度の高い予測や分類が行えるのが特徴である。   In addition, when generating personality type model information by a learning algorithm using a random forest, the personality type model generation unit 23 gives the behavior characteristics information of the model user to the input layer of the random forest, and randomly selects the personality type of the model user. Given to the output layer of the forest, learning processing is performed using the personality type of the output layer as teacher data. Thereby, a learned group learning model is obtained. This collective learning model corresponds to personality type model information in which the behavior characteristics and personality types of model users are associated. Random forest is a machine learning algorithm that is used to increase the accuracy of analysis by superimposing a plurality of learnings using a decision tree, which is a tree diagram-type graph that branches for each condition. Compared to other algorithms, it requires a large amount of data, but can be predicted and classified with high accuracy.

また、ロジスティック回帰を用いた学習アルゴリズムによって性格タイプモデル情報を生成する場合、性格タイプモデル生成部23は、モデルユーザの行動特性情報をロジスティック回帰の入力層に与えるとともに、モデルユーザの性格タイプをロジスティック回帰の出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。これにより、学習済みの回帰モデルが得られる。この回帰モデルは、モデルユーザの行動特性と性格タイプとを関連付けた性格タイプモデル情報に相当する。ロジスティック回帰は、データを分類する際に、分類だけでなく、分類に対する信頼度が得られる機械学習のアルゴリズムである。どの位の割合で反応があるか否かの確率を算出できる点に特徴を有する。   In addition, when generating personality type model information by a learning algorithm using logistic regression, the personality type model generation unit 23 gives the behavior characteristics information of the model user to the input layer of the logistic regression and also sets the personality type of the model user to logistic. Given to the output layer of regression, learning processing is performed using the personality type of the output layer as teacher data. As a result, a learned regression model is obtained. This regression model corresponds to personality type model information in which the behavior characteristics and personality type of the model user are associated. Logistic regression is a machine learning algorithm that provides not only classification but also reliability for classification when classifying data. This method is characterized in that it can calculate the probability of how much there is a reaction.

ところで、本実施形態において性格タイプモデル生成部23は、行動履歴記録部40に記憶された所定期間分の複数のモデルユーザの行動特性情報のうち、所定期間におけるページ閲覧回数が閾値未満(例えば、50回未満)のモデルユーザの行動特性情報を除外して、性格タイプモデル情報を生成する。図3の例において、モデルユーザMU1は複数のウェブページP1,P5,P3,・・・を閲覧している。1つのウェブページを閲覧したときに1回とカウントし、その合計の閲覧回数が閾値未満の場合は、このモデルユーザMU1の行動特性情報は使わずに、平均値算出部23Aおよび関連付け部23Bの処理を行う。   By the way, in this embodiment, the personality type model generation unit 23 has the number of page browsing in a predetermined period of less than a threshold among the behavior characteristic information of a plurality of model users for a predetermined period stored in the action history recording unit 40 (for example, The personality type model information is generated by excluding the behavior characteristic information of the model user (less than 50 times). In the example of FIG. 3, the model user MU1 is browsing a plurality of web pages P1, P5, P3,. When one web page is browsed, it is counted once, and when the total number of browsing is less than the threshold, the behavior value information of the model user MU1 is not used, and the average value calculation unit 23A and the association unit 23B Process.

また、性格タイプモデル生成部23は、行動履歴記録部40に記憶された所定期間分の複数のモデルユーザの行動特性情報のうち、閲覧時間が外れ値を示している部分の行動特性情報も除外して、性格タイプモデル情報を生成する。外れ値とは、統計において他の閲覧時間から大きく外れた値をいう。例えば、性格タイプモデル生成部23は、公知のスミルノフ・グラブス検定あるいはトンプソン検定を行うことによって閲覧時間の外れ値を検出し、外れ値として検出された部分の行動特性情報は使わずに、性格タイプモデル情報を生成する。例えば、図3の例において、モデルユーザMU1によるウェブページP1の閲覧時間(3秒)が外れ値として検出された場合、このモデルユーザMU1によるウェブページP1の閲覧時間は使わずに、平均値算出部23Aおよび関連付け部23Bの処理を行う。   In addition, the personality type model generation unit 23 also excludes the behavior characteristic information of a portion where the browsing time indicates an outlier among the behavior characteristic information of a plurality of model users for a predetermined period stored in the behavior history recording unit 40. Then, personality type model information is generated. An outlier is a value that deviates significantly from other browsing times in statistics. For example, the personality type model generation unit 23 detects an outlier of the browsing time by performing a known Smirnov-Grubbs test or Thompson test, and does not use the behavior characteristic information of the portion detected as the outlier, and uses the personality type. Generate model information. For example, in the example of FIG. 3, when the browsing time (3 seconds) of the web page P1 by the model user MU1 is detected as an outlier, the average value is calculated without using the browsing time of the web page P1 by the model user MU1. The processing of the unit 23A and the associating unit 23B is performed.

次に、判定処理部30について詳細を説明する。行動特性取得部31は、アクセス解析情報受信部10により受信されたアクセス解析情報に基づいて、性格タイプが未知の判定対象ユーザが閲覧したウェブページを特定するページ情報、および当該ウェブページの閲覧時間を、判定対象ユーザの行動特性情報として取得する。この行動特性情報は、判定対象ユーザがどのウェブページをどのくらいの時間をかけて閲覧したかを示す情報であり、アクセス解析情報により示される各ウェブページでの滞在時間がこれに該当する。   Next, details of the determination processing unit 30 will be described. Based on the access analysis information received by the access analysis information receiving unit 10, the behavior characteristic acquisition unit 31 specifies page information that identifies a web page browsed by a determination target user whose personality type is unknown, and a browsing time of the web page Is acquired as the behavior characteristic information of the determination target user. This behavior characteristic information is information indicating which web page the determination target user has spent and how long, and the stay time on each web page indicated by the access analysis information corresponds to this behavior characteristic information.

行動履歴記録部32は、行動特性取得部31により取得された行動特性情報を、判定対象ユーザを一意に識別可能な情報(ログインIDまたはクッキー情報など)と共に判定対象ユーザの行動履歴として履歴情報記憶部40に記録する。   The behavior history recording unit 32 stores the behavior characteristic information acquired by the behavior characteristic acquisition unit 31 as history information of the determination target user together with information (such as login ID or cookie information) that can uniquely identify the determination target user. Record in section 40.

図5は、履歴情報記憶部40に記憶される判定対象ユーザの行動履歴情報の一例を示す図である。図5に示すように、履歴情報記憶部40は、判定対象ユーザ毎TU1,TU2,TU3,・・・毎に、アクセスしたウェブページを一意に特定するページ情報(URLまたはページID等)、閲覧開始時刻、閲覧終了時刻、閲覧時間などから成る行動特性情報を記憶する。これは、図3に示したモデルユーザの行動特性情報と同様である。   FIG. 5 is a diagram illustrating an example of action history information of a determination target user stored in the history information storage unit 40. As shown in FIG. 5, the history information storage unit 40 includes page information (URL or page ID or the like) that uniquely identifies the accessed web page for each determination target user TU1, TU2, TU3,. Action characteristic information including a start time, a browsing end time, a browsing time, and the like is stored. This is the same as the behavior characteristic information of the model user shown in FIG.

性格タイプ判定部33は、行動履歴記録部40に記憶された所定期間分の判定対象ユーザの行動特性情報と、モデル情報記憶部50に記憶された性格タイプモデル情報とに基づいて、判定対象ユーザの性格タイプを判定する。なお、ここでいう「所定期間」は、性格タイプモデル生成部23が性格タイプモデル情報を生成する際に用いるモデルユーザの行動特性情報の抽出期間を示す「所定期間」の長さと同じであってもよいし、異なっていてもよい。   The personality type determination unit 33 is based on the behavior characteristic information of the determination target user for a predetermined period stored in the behavior history recording unit 40 and the personality type model information stored in the model information storage unit 50. Determine the personality type. Note that the “predetermined period” here is the same as the length of the “predetermined period” indicating the extraction period of the behavior characteristic information of the model user used when the personality type model generation unit 23 generates the personality type model information. It may be different or different.

例えば、性格タイプモデル生成部23により図4のような性格タイプモデル情報を生成する場合、性格タイプ判定部33は、判定対象ユーザの行動特性情報で示されるウェブページ毎の閲覧時間に基づいて、性格タイプモデル情報で示される複数の行動特性のどれに該当するかをウェブページ毎に判定し、該当する行動特性に関連付けられた性格タイプをもとに判定対象ユーザの性格タイプを判定する。   For example, when personality type model information as shown in FIG. 4 is generated by the personality type model generation unit 23, the personality type determination unit 33 is based on the browsing time for each web page indicated by the behavior characteristic information of the determination target user. Which of the plurality of behavior characteristics indicated by the personality type model information is determined for each web page, and the personality type of the determination target user is determined based on the personality type associated with the corresponding behavior characteristics.

図5の例おいて、判定対象ユーザTU1は、複数のウェブページP7,P1,P8,・・・を閲覧している。性格タイプ判定部33は、まず、判定対象ユーザTU1によるウェブページP7の閲覧時間が、平均値算出部23Aにより算出されたウェブページP7の閲覧時間の平均値よりも短いか長いかによって、ウェブページP7に関する判定対象ユーザTU1の行動特性が第1の行動特性か第2の行動特性かを特定する。そして、性格タイプ判定部33は、モデル情報記憶部50に記憶されている図4のような性格タイプモデル情報を参照して、ウェブページP7に関して特定した判定対象ユーザTU1の行動特性に関連付けられている性格タイプを検出する。   In the example of FIG. 5, the determination target user TU1 is browsing a plurality of web pages P7, P1, P8,. The personality type determination unit 33 first determines whether the browsing time of the web page P7 by the determination target user TU1 is shorter or longer than the average browsing time of the web page P7 calculated by the average value calculation unit 23A. It is specified whether the behavior characteristic of the determination target user TU1 regarding P7 is the first behavior characteristic or the second behavior characteristic. Then, the personality type determination unit 33 refers to the personality type model information as shown in FIG. 4 stored in the model information storage unit 50 and is associated with the behavior characteristic of the determination target user TU1 specified for the web page P7. Detect personality type.

同様に、性格タイプ判定部33は、判定対象ユーザTU1によるウェブページP1の閲覧時間が、平均値算出部23Aにより算出されたウェブページP1の閲覧時間の平均値よりも短いか長いかによって、ウェブページP1に関する判定対象ユーザTU1の行動特性が第1の行動特性か第2の行動特性かを特定する。そして、性格タイプ判定部33は、モデル情報記憶部50に記憶されている図4のような性格タイプモデル情報を参照して、ウェブページP1に関して特定した判定対象ユーザTU1の行動特性に関連付けられている性格タイプを検出する。   Similarly, the personality type determination unit 33 determines whether the browsing time of the web page P1 by the determination target user TU1 is shorter or longer than the average browsing time of the web page P1 calculated by the average value calculation unit 23A. It is specified whether the behavior characteristic of the determination target user TU1 regarding the page P1 is the first behavior characteristic or the second behavior characteristic. Then, the personality type determination unit 33 refers to the personality type model information as shown in FIG. 4 stored in the model information storage unit 50 and is associated with the behavior characteristic of the determination target user TU1 specified with respect to the web page P1. Detect personality type.

以下同様にして、判定対象ユーザTU1が閲覧している複数のウェブページについて、その閲覧時間から判定対象ユーザTU1の行動特性を特定し、特定した行動特性に関連付けられている性格タイプを検出する。これにより、1人の判定対象ユーザTU1について、閲覧しているウェブページの数だけ性格タイプが検出されることになる。ここで、判定対象ユーザTU1が閲覧している複数のウェブページから検出された性格タイプが全て同じであれば、性格タイプ判定部33はそのままその性格タイプを採用し、それを判定対象ユーザTU1の性格タイプとして判定する。   In the same manner, the behavior characteristic of the determination target user TU1 is specified from the browsing time for a plurality of web pages being browsed by the determination target user TU1, and the personality type associated with the identified behavior characteristic is detected. Thereby, the personality type is detected for the number of web pages being browsed for one determination target user TU1. Here, if the personality types detected from the plurality of web pages viewed by the determination target user TU1 are all the same, the personality type determination unit 33 adopts the personality type as it is, and uses it as the determination target user TU1. Judge as personality type.

一方、判定対象ユーザTU1が閲覧している複数のウェブページから検出された性格タイプが全て同じでなく、複数種類の性格タイプに分かれる場合は、性格タイプ判定部33はその中から何れかを選択して採用する。この場合における選択のアルゴリズムとしては、種々の方法を適用することが可能である。例えば、検出された数が最も多い性格タイプを選択するという方法を用いることが可能である。あるいは、判定対象ユーザTU1の性格タイプとして該当の度合いが高いものとして、検出された数が所定数よりも多い1以上の性格タイプを検出数の多い方から順に選択するという方法を用いてもよい。例えば、最も多く検出されたものをメインの性格タイプと判定し、次に多く検出されたものをサブの性格タイプと判定するようにしてもよい。   On the other hand, when the personality types detected from the plurality of web pages viewed by the determination target user TU1 are not all the same and are divided into a plurality of types of personality types, the personality type determination unit 33 selects one of them. And adopt. As a selection algorithm in this case, various methods can be applied. For example, it is possible to use a method of selecting a personality type with the largest number of detected. Alternatively, it is possible to use a method in which one or more personality types whose detected number is higher than a predetermined number are sequentially selected in descending order of the detected number, assuming that the personality type of the determination target user TU1 is high. . For example, the most frequently detected item may be determined as the main personality type, and the next most frequently detected item may be determined as the sub personality type.

または、複数のウェブページに関する行動特性情報からそれぞれ検出される性格タイプのうち、ある性格タイプの検出回数が他の性格タイプの検出回数よりもX%(Xは任意の値に設定可能)以上多くなっている場合に、当該ある性格タイプを判定対象ユーザの性格タイプと判定するようにしてもよい。このようにすれば、他に比べて突出している特徴を持った性格タイプを判定対象ユーザの性格タイプとして判定することができるので、判定対象ユーザの性格分析をより正確に行うことができる。   Or, among the personality types detected from the behavior characteristic information related to a plurality of web pages, the number of detections of a certain personality type is more than X% (X can be set to any value) more than the number of detections of other personality types. In such a case, the personality type may be determined as the personality type of the determination target user. In this way, since the personality type having a prominent feature compared to others can be determined as the personality type of the determination target user, the personality analysis of the determination target user can be performed more accurately.

なお、性格タイプモデル生成部23がニューラルネットワーク、SVM、ランダムフォレスト、ロジスティック回帰などの学習アルゴリズムを利用して性格タイプモデル情報を生成する場合、性格タイプ判定部33は、行動履歴記録部40に記憶された所定期間分の判定対象ユーザの行動特性情報を、モデル情報記憶部50に記憶された学習済みモデルに入力データとして与えることにより、その学習済みモデルの出力データを、判定対象ユーザの性格タイプとして判定する。   When the personality type model generation unit 23 generates personality type model information using a learning algorithm such as a neural network, SVM, random forest, or logistic regression, the personality type determination unit 33 stores the personality type determination unit 33 in the action history recording unit 40. The behavior characteristic information of the determination target user for the predetermined period is given as input data to the learned model stored in the model information storage unit 50, and the output data of the learned model is used as the personality type of the determination target user. Judge as.

性格タイプ判定部33が判定対象ユーザの性格タイプを判定するタイミングとしては、判定対象ユーザがウェブページを閲覧しているタイミング、あるいは、定期または不定期で指定されたタイミングとすることが可能である。判定対象ユーザがウェブページを閲覧しているときにその判定対象ユーザの性格タイプを判定する場合、性格タイプ判定部33は、閲覧中のウェブページについてアクセス解析装置200から随時送られてくるアクセス解析情報をもとに履歴情報記憶部40に随時記憶される行動特性情報を用いて、判定対象ユーザの性格タイプを判定する。   The timing at which the personality type determination unit 33 determines the personality type of the determination target user can be a timing at which the determination target user is browsing the web page, or a timing designated regularly or irregularly. . When the determination target user is browsing a web page, when determining the personality type of the determination target user, the personality type determination unit 33 accesses the access analysis sent from the access analysis device 200 at any time for the web page being browsed. Based on the information, the personality type of the determination target user is determined using the behavior characteristic information stored at any time in the history information storage unit 40.

一方、指定されたタイミングで判定対象ユーザの性格タイプを判定する場合、性格タイプ判定部33は、指定された判定対象ユーザについて履歴情報記憶部40に記憶されている行動特性情報を用いて、判定対象ユーザの性格タイプを判定する。例えば、あらかじめ設定されたタイミングでバッチ処理を定期的に起動し、その起動のタイミングで履歴情報記憶部40に記憶されている行動特性情報を用いて、全ての判定対象ユーザまたは指定した一部の判定対象ユーザの性格タイプを判定することが可能である。   On the other hand, when determining the personality type of the determination target user at the specified timing, the personality type determination unit 33 determines using the behavior characteristic information stored in the history information storage unit 40 for the specified determination target user. Determine the personality type of the target user. For example, the batch processing is periodically started at a preset timing, and the behavior characteristic information stored in the history information storage unit 40 at the startup timing is used to select all the determination target users or a part of the specified user. It is possible to determine the personality type of the determination target user.

また、複数の判定対象ユーザに関するアクセス解析情報が既に蓄積されているウェブサイトに対して性格分析装置300による処理を適用することも可能である。この場合、当該複数の判定対象ユーザに関するアクセス解析情報を一括して性格分析装置300にて受信し、行動特性取得部10により各判定対象ユーザの行動特性情報をそれぞれ取得して履歴情報記憶部40に記憶させる。そして、履歴情報記憶部40に記憶された全判定対象ユーザの行動特性情報を用いて、性格タイプ判定部33により全判定対象ユーザの性格タイプを一括して判定する。   It is also possible to apply the processing by the personality analysis apparatus 300 to a website in which access analysis information regarding a plurality of determination target users has already been accumulated. In this case, the personality analysis device 300 collectively receives access analysis information related to the plurality of determination target users, acquires the behavior characteristic information of each determination target user by the behavior characteristic acquisition unit 10, and stores the history information storage unit 40. Remember me. Then, using the behavior characteristic information of all determination target users stored in the history information storage unit 40, the personality type determination unit 33 determines the personality types of all determination target users at once.

以上詳しく説明したように、本実施形態では、性格タイプが既知の複数のモデルユーザに関するウェブページの閲覧状況を示す所定期間分の行動特性情報に基づいて、モデルユーザによる複数のウェブページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成する。そして、性格タイプが未知の判定対象ユーザについて取得された所定期間分の行動特性情報と、上記のように生成された性格タイプモデル情報とに基づいて、判定対象ユーザの性格タイプを判定するようにしている。   As described above in detail, in the present embodiment, based on behavior characteristic information for a predetermined period indicating the browsing status of web pages related to a plurality of model users whose personality types are known, the model users on a plurality of web pages Personality type model information formed by associating behavior characteristics with a plurality of personality types is generated. Then, the personality type of the determination target user is determined based on the behavior characteristic information for a predetermined period acquired for the determination target user whose personality type is unknown and the personality type model information generated as described above. ing.

上記のように構成した本実施形態によれば、判定対象ユーザがどのようなウェブページをどのような時間をかけて閲覧しているのかというページ閲覧状況の情報に基づいて、判定対象ユーザの性格タイプが判定される。ユーザがどのようなウェブページをどのような時間をかけて閲覧するかは、ユーザの性格による影響を受けている。特に、インターネット上でウェブページを閲覧しているときは、プライベートで閉じた世界であることが多いため、周囲の目を気にせず、ありのままの自分が表れ、ユーザの性格がページ閲覧の行動に無意識に反映される傾向がある。本実施形態では、このようにユーザの性格による影響を受けて変わる可能性のある行動特性を用いて、性格タイプが既知のモデルユーザから性格タイプモデル情報が生成され、その性格タイプモデル情報と判定対象ユーザの行動特性から判定対象ユーザの性格タイプが判定される。よって、判定対象ユーザの性格タイプをより正確に判定することができる。   According to the present embodiment configured as described above, the personality of the determination target user is determined based on the information on the page browsing situation that the determination target user is browsing what web page for what time. The type is determined. What kind of web page a user spends and what kind of time is viewed are influenced by the personality of the user. In particular, when browsing web pages on the Internet, it is often a private and closed world, so you don't have to worry about your surroundings. There is a tendency to be reflected unconsciously. In the present embodiment, personality type model information is generated from a model user whose personality type is known using behavioral characteristics that may change due to the influence of the personality of the user, and is determined as the personality type model information. The personality type of the determination target user is determined from the behavior characteristics of the target user. Therefore, the personality type of the determination target user can be determined more accurately.

特に、本実施形態では、所定期間分の行動特性情報のうち、ページ閲覧回数が閾値未満のモデルユーザの行動特性情報を除外して性格タイプモデル情報を生成するようにしている。モデルユーザのページ閲覧回数が閾値未満しかない場合、そのときの思いつきあるいは外的な環境に影響されたページ閲覧が多くて、モデルユーザの性格が反映されたページ閲覧の数が少ない可能性がある。本実施形態では、そのような行動特性情報は使わずに、モデルユーザの性格に基づくページ閲覧が比較的多く含まれると考えられる行動特性情報のみから性格タイプモデル情報が生成されるので、より正確な性格タイプモデル情報を得ることができる。そして、この正確な性格タイプモデル情報を用いて性格タイプの判定を行うことにより、判定対象ユーザの性格タイプの分析をより正確に行うことができる。   In particular, in the present embodiment, personality type model information is generated by excluding the behavior characteristic information of a model user whose page browsing frequency is less than a threshold from the behavior characteristic information for a predetermined period. When the number of page views of model users is less than the threshold, there are many page views that are influenced by the idea or the external environment at that time, and the number of page views that reflect the characteristics of the model user may be small . In this embodiment, personality type model information is generated only from behavior characteristic information that is considered to include relatively many page views based on the model user's personality without using such behavior characteristic information. Personality type model information can be obtained. Then, by determining the personality type using this accurate personality type model information, the personality type of the determination target user can be analyzed more accurately.

特に、インターネット上のウェブページは、性格タイプを判定することを目的として作られたテストページではないため、ページ閲覧の全てに性格が反映されるとは限らない。そのため、ページ閲覧回数が閾値未満しかないモデルユーザの行動特性情報を使わずに性格タイプモデル情報を生成することは、より正確な性格タイプモデル情報を得る上で極めて有効である。その際、その閾値を適切に設定することが重要である。   In particular, since web pages on the Internet are not test pages created for the purpose of determining personality types, personality is not always reflected in all page browsing. Therefore, generating personality type model information without using the behavior characteristic information of a model user whose page browsing frequency is less than a threshold is extremely effective in obtaining more accurate personality type model information. In that case, it is important to set the threshold appropriately.

閾値を適切に設定するために、例えば以下の方法を用いることが可能である。すなわち、複数のモデルユーザについて収集した行動特性情報を2つのグループに分ける。このうち、第1のグループは性格タイプモデル情報の生成用、第2のグループは性格タイプ判定の正当性の確認用とする。ここで、第1のグループに含ませるモデルユーザは、それぞれの性格タイプの数がほぼ均等数ずつ含まれるように選出するのが好ましい。すなわち、判定すべき性格タイプが3種類ある場合、各性格タイプのモデルユーザの数の比率がほぼ1/3で均一となるようにするのが好ましい。これに対して、第2のグループに含まれるモデルユーザの性格タイプはランダムでよい。   In order to appropriately set the threshold value, for example, the following method can be used. That is, the behavior characteristic information collected for a plurality of model users is divided into two groups. Of these, the first group is used to generate personality type model information, and the second group is used to check the validity of personality type determination. Here, it is preferable that the model users included in the first group are selected so that the number of personality types is approximately equal. In other words, when there are three personality types to be determined, it is preferable that the ratio of the number of model users of each personality type is approximately 1/3 and uniform. On the other hand, the personality type of the model user included in the second group may be random.

以上のように複数のモデルユーザをグルーピングした上で、まず、第1のグループに属するモデルユーザの行動特性情報を対象として、閾値を変えながら、ページ閲覧回数が閾値以上の行動特性情報だけを用いて数パターンの性格タイプモデル情報を生成する。次に、生成した数パターンの性格タイプモデル情報を用いて、第2のグループに属するモデルユーザの行動特性情報を入力し、その結果判定された性格タイプと、第2のグループに属するモデルユーザの既知の(正解の)性格タイプとを比較することにより、正解率を算出する。   As described above, after grouping a plurality of model users, first, using only the behavior characteristic information whose page browsing frequency is equal to or larger than the threshold while changing the threshold for the behavior characteristic information of the model users belonging to the first group. To generate personality type model information of several patterns. Next, using the generated personality type model information of several patterns, the behavior characteristic information of model users belonging to the second group is input, and as a result, the personality type determined and the model user belonging to the second group The correct answer rate is calculated by comparing with a known (correct) personality type.

ここで、例えば、正解率が最も高くなる性格タイプモデル情報を特定し、それを生成したときに用いた閾値を、最適な閾値として特定することが可能である。あるいは、正解率が所定値以上となる1以上の性格タイプモデル情報を特定し、それらを生成したときに用いた閾値の平均値を、適切な閾値として特定することようにしてもよい。このように閾値を最適化した上で、所定期間におけるページ閲覧回数が閾値未満のモデルユーザの行動特性情報を除外して、性格タイプモデル情報を生成することにより、より正確な性格タイプモデル情報を得ることができる。そして、この正確な性格タイプモデル情報を用いて性格タイプの判定を行うことにより、判定対象ユーザの性格タイプの分析をより正確に行うことができるようになる。   Here, for example, it is possible to specify the personality type model information with the highest accuracy rate, and to specify the threshold value used when generating it as the optimum threshold value. Alternatively, one or more personality type model information whose correct answer rate is equal to or higher than a predetermined value may be specified, and an average value of the threshold values used when generating them may be specified as an appropriate threshold value. In this way, by optimizing the threshold value and excluding the behavior characteristic information of the model user whose page browsing frequency in the predetermined period is less than the threshold value, and generating the personality type model information, more accurate personality type model information can be obtained. Can be obtained. Then, by determining the personality type using this accurate personality type model information, the personality type of the determination target user can be analyzed more accurately.

さらに、本実施形態では、所定期間分の行動特性情報のうち、閲覧時間が外れ値を示している部分の行動特性情報を除外して性格タイプモデル情報を生成するようにしている。モデルユーザによる特定のウェブページの閲覧時間が外れ値を示している場合、そのときのモデルユーザの行動は、そのときの思いつきあるいは外的な環境に影響された行動で、モデルユーザの性格が強く反映されたものではない可能性がある。本実施形態では、そのような行動特性情報は使わずに、モデルユーザの性格が反映されている可能性のある行動特性情報のみから性格タイプモデル情報が生成されるので、より正確な性格タイプモデル情報を得ることができる。そして、この正確な性格タイプモデル情報を用いて性格タイプの判定を行うことにより、判定対象ユーザの性格タイプの分析をより正確に行うことができる。   Furthermore, in the present embodiment, the personality type model information is generated by excluding the behavior characteristic information of the portion where the browsing time indicates an outlier from the behavior characteristic information for a predetermined period. When the browsing time of a specific web page by a model user shows an outlier, the behavior of the model user at that time is the behavior influenced by the idea or the external environment at that time, and the personality of the model user is strong It may not be reflected. In this embodiment, since the personality type model information is generated only from the behavior characteristic information that may reflect the personality of the model user without using such behavior characteristic information, a more accurate personality type model Information can be obtained. Then, by determining the personality type using this accurate personality type model information, the personality type of the determination target user can be analyzed more accurately.

なお、上記実施形態では、性格タイプモデル生成部23が性格タイプモデル情報を生成する際に外れ値を除外する例について説明したが、性格タイプ判定部33が性格タイプを判定する際に外れ値を除外するようにしてもよい。すなわち、性格タイプ判定部33は、履歴情報記憶部40に記憶された所定期間分の判定対象ユーザの行動特性情報のうち、閲覧時間が外れ値を示している部分の行動特性情報を除外して、判定対象ユーザの性格タイプを判定するようにしてもよい。   In the above embodiment, the example in which the personality type model generation unit 23 excludes outliers when generating personality type model information has been described. However, when the personality type determination unit 33 determines personality types, outliers are determined. You may make it exclude. In other words, the personality type determination unit 33 excludes the behavior characteristic information of the portion of the browsing time indicating an outlier from the behavior characteristic information of the determination target user for a predetermined period stored in the history information storage unit 40. The personality type of the determination target user may be determined.

また、上記実施形態では、ユーザによるウェブページの閲覧時間が、平均値算出部23Aにより算出されたウェブページの閲覧時間の平均値よりも短いか長いかによって、ユーザの行動特性が第1の行動特性か第2の行動特性かを特定する例について説明したが、本発明はこれに限定されない。例えば、ユーザによるウェブページの閲覧時間が所定値よりも短いか長いかによって、ユーザの行動特性が第1の行動特性か第2の行動特性かを特定するようにしてもよい。   Moreover, in the said embodiment, a user's action characteristic is 1st action according to whether the browsing time of the web page by a user is shorter or longer than the average value of the browsing time of the web page calculated by the average value calculation part 23A. Although the example which specifies a characteristic or a 2nd behavior characteristic was demonstrated, this invention is not limited to this. For example, you may make it identify whether a user's action characteristic is a 1st action characteristic or a 2nd action characteristic by the browsing time of the web page by a user being shorter or longer than a predetermined value.

また、特定する行動特性は2種類に限定されず、3種類以上であってもよい。例えば、閾値を2つ以上設定し、ユーザによるウェブページの閲覧時間がどの閾値とどの閾値との間に属するかによって、3種類以上の行動特性の中から何れかを特定するようにすることが可能である。   Further, the behavior characteristics to be specified are not limited to two types, and may be three or more types. For example, two or more threshold values are set, and one of three or more types of behavior characteristics is specified depending on which threshold value the web page browsing time by the user belongs to. Is possible.

また、上記実施形態では、ユーザの行動特性情報としてウェブページの閲覧時間を取得し、当該閲覧時間に基づいてユーザの性格タイプを判定する例について説明したが、本発明はこれに限定されない。すなわち、ウェブページの閲覧時間に代えてまたは加えて、ユーザが閲覧したウェブページの遷移状況、ウェブページの閲覧時間帯、ウェブページの閲覧回数または閲覧頻度、ウェブページの閲覧インターバル、ウェブページの種類(ウェブページの内容に基づく特性)などのうち何れか1つまたは複数の組み合わせに基づいて、性格タイプを判定するようにしてもよい。   Moreover, although the said embodiment demonstrated the example which acquires the browsing time of a web page as a user's action characteristic information, and determines a user's personality type based on the said browsing time, this invention is not limited to this. That is, instead of or in addition to the browsing time of the web page, the transition status of the web page browsed by the user, the browsing time zone of the web page, the browsing frequency or browsing frequency of the web page, the browsing interval of the web page, the type of the web page The personality type may be determined based on any one or a combination of (characteristics based on the content of the web page).

例えば、ウェブページの閲覧時間、遷移状況および閲覧時間帯の3つのパラメータを用いて、ニューラルネットワーク、SVM、ランダムフォレスト、ロジスティック回帰などの学習アルゴリズムにより性格タイプを判定する場合、性格タイプモデル生成部23は、モデルユーザについて得られた3つのパラメータを入力層に与えるとともに、モデルユーザの性格タイプを出力層に与えて、出力層の性格タイプを教師データとして学習処理を行う。そして、性格タイプ判定部33は、判定対象ユーザについて得られた3つのパラメータを、上述のようにして性格タイプモデル生成部23により生成された学習済みモデルに入力データとして与えることにより、その学習済みモデルの出力データを、判定対象ユーザの性格タイプとして判定する。   For example, when the personality type is determined by a learning algorithm such as neural network, SVM, random forest, logistic regression, etc. using three parameters of web page browsing time, transition status, and browsing time zone, the personality type model generation unit 23 Gives the three parameters obtained for the model user to the input layer, gives the personality type of the model user to the output layer, and performs the learning process using the personality type of the output layer as teacher data. Then, the personality type determination unit 33 gives the three parameters obtained for the determination target user as input data to the learned model generated by the personality type model generation unit 23 as described above. The model output data is determined as the personality type of the determination target user.

また、上記実施形態では、アクセス解析装置200と性格分析装置300とを別構成とする例について説明したが、本発明はこれに限定されない。例えば、アクセス解析装置200の機能を性格分析装置300が備えるようにしてもよい。   Moreover, although the said embodiment demonstrated the example which makes the access analysis apparatus 200 and the personality analysis apparatus 300 a different structure, this invention is not limited to this. For example, the personality analysis device 300 may have the function of the access analysis device 200.

その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。   In addition, each of the above-described embodiments is merely an example of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed in a limited manner. That is, the present invention can be implemented in various forms without departing from the gist or the main features thereof.

10 アクセス解析情報受信部
20 学習処理部
21 モデル行動特性取得部
22 モデル行動履歴記録部
23 性格タイプモデル生成部
30 判定処理部
31 行動特性取得部
32 行動履歴記録部
33 性格タイプ判定部
100 ユーザ端末
200 アクセス解析装置
300 性格分析装置
DESCRIPTION OF SYMBOLS 10 Access analysis information receiving part 20 Learning processing part 21 Model action characteristic acquisition part 22 Model action history recording part 23 Personality type model generation part 30 Determination processing part 31 Action characteristic acquisition part 32 Action history recording part 33 Personality type determination part 100 User terminal 200 Access Analysis Device 300 Personality Analysis Device

Claims (12)

性格タイプが既知の複数のモデルユーザによるページの閲覧状況を上記複数のモデルユーザの行動特性情報として取得するモデル行動特性取得部と、
上記モデル行動特性取得部により取得された行動特性情報を上記複数のモデルユーザの行動履歴として履歴情報記憶部に記録するモデル行動履歴記録部と、
上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報に基づいて、上記モデルユーザによる複数のページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成し、モデル情報記憶部に記憶させる性格タイプモデル生成部と、
上記性格タイプが未知の判定対象ユーザによるページの閲覧状況を上記判定対象ユーザの行動特性情報として取得する行動特性取得部と、
上記行動特性取得部により取得された行動特性情報を上記判定対象ユーザの行動履歴として上記履歴情報記憶部に記録する行動履歴記録部と、
上記履歴情報記憶部に記憶された所定期間分の上記判定対象ユーザの行動特性情報と、上記モデル情報記憶部に記憶された上記性格タイプモデル情報とに基づいて、上記判定対象ユーザの性格タイプを判定する性格タイプ判定部とを備え、
上記性格タイプモデル生成部は、上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報のうち、所定期間におけるページ閲覧回数が閾値未満の上記モデルユーザの行動特性情報を除外して、上記性格タイプモデル情報を生成することを特徴とする性格分析装置。
A model behavior characteristic acquisition unit that acquires the browsing status of a page by a plurality of model users whose personality types are known as behavior characteristic information of the plurality of model users;
A model behavior history recording unit that records behavior characteristic information acquired by the model behavior characteristic acquisition unit in a history information storage unit as behavior histories of the plurality of model users;
A personality type formed by associating behavioral characteristics on a plurality of pages by the model user with a plurality of personality types based on the behavioral characteristic information of the plurality of model users for a predetermined period stored in the history information storage unit. A personality type model generation unit for generating model information and storing it in the model information storage unit;
A behavior characteristic acquisition unit that acquires a browsing state of a page by a determination target user whose personality type is unknown as behavior characteristic information of the determination target user;
An action history recording unit that records the behavior characteristic information acquired by the behavior characteristic acquisition unit in the history information storage unit as an action history of the determination target user;
Based on the behavior characteristic information of the determination target user for a predetermined period stored in the history information storage unit and the personality type model information stored in the model information storage unit, the personality type of the determination target user is determined. A personality type determination unit for determining,
The personality type model generation unit is the behavior characteristic information of the model user whose number of page browsing in a predetermined period is less than a threshold among the behavior characteristic information of the plurality of model users for a predetermined period stored in the history information storage unit The personality analysis apparatus characterized in that the personality type model information is generated excluding the personal information.
上記モデル行動特性取得部は、上記モデルユーザの行動特性情報として、当該モデルユーザが閲覧したページを特定するページ情報、および当該ページの閲覧時間を取得し、
上記行動特性取得部は、上記判定対象ユーザの行動特性情報として、当該判定対象ユーザが閲覧したページを特定するページ情報、および当該ページの閲覧時間を取得することを特徴とする請求項1に記載の性格分析装置。
The model behavior characteristic acquisition unit acquires, as the model user behavior characteristic information, page information for specifying a page viewed by the model user, and browsing time of the page,
The said behavior characteristic acquisition part acquires the page information which specifies the page which the said determination target user browsed, and the browsing time of the said page as said behavior characteristic information of the said determination target user. Personality analyzer.
上記性格タイプモデル生成部は、上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報のうち、上記閲覧時間が外れ値を示している部分の行動特性情報を除外して、上記性格タイプモデル情報を生成することを特徴とする請求項2に記載の性格分析装置。   The personality type model generation unit excludes the behavior characteristic information of a portion of the plurality of model users for a predetermined period stored in the history information storage unit that has an outlier in the browsing time. The personality analysis apparatus according to claim 2, wherein the personality type model information is generated. 上記性格タイプ判定部は、上記履歴情報記憶部に記憶された上記判定対象ユーザの行動特性情報のうち、上記閲覧時間が外れ値を示している部分の行動特性情報を除外して、上記判定対象ユーザの性格タイプを判定することを特徴とする請求項2または3に記載の性格分析装置。   The personality type determination unit excludes, from the behavior characteristic information of the determination target user stored in the history information storage unit, the behavior characteristic information of the portion where the browsing time indicates an outlier, and the determination target 4. The personality analyzer according to claim 2, wherein the personality type of the user is determined. 上記性格タイプモデル生成部は、
上記履歴情報記憶部に記憶された上記複数のモデルユーザの行動特性情報に基づいて、上記複数のモデルユーザの上記閲覧時間の平均値を上記ページ毎に算出する平均値算出部と、
上記ページの閲覧時間が上記平均値算出部により算出された上記閲覧時間の平均値より短いか長いかを基準として定めた複数の上記行動特性が、どの性格タイプに該当するかを上記ページ毎に関連付けることによって上記性格タイプモデル情報を生成する関連付け部とを備えることを特徴とする請求項2〜4の何れか1項に記載の性格分析装置。
The personality type model generation unit
Based on the behavior characteristic information of the plurality of model users stored in the history information storage unit, an average value calculation unit that calculates an average value of the browsing times of the plurality of model users for each page;
For each page, which personality type corresponds to the plurality of behavior characteristics determined based on whether the browsing time of the page is shorter or longer than the average value of the browsing time calculated by the average value calculation unit The personality analysis apparatus according to claim 2, further comprising an association unit that generates the personality type model information by associating the personality type model information.
上記性格タイプ判定部は、上記判定対象ユーザの行動特性情報で示される上記ページ毎の閲覧時間に基づいて、上記性格タイプモデル情報で示される上記複数の行動特性のどれに該当するかを上記ページ毎に判定し、該当する行動特性に関連付けられた性格タイプをもとに上記判定対象ユーザの性格タイプを判定することを特徴とする請求項5に記載の性格分析装置。   The personality type determination unit determines which of the plurality of behavioral characteristics indicated by the personality type model information corresponds to the page based on the browsing time for each page indicated by the behavioral characteristic information of the determination target user. The personality analysis apparatus according to claim 5, wherein the personality analysis apparatus determines the personality type of the determination target user based on the personality type associated with the corresponding behavior characteristic. 性格タイプが未知の判定対象ユーザによるページの閲覧に関する行動特性情報に基づいて上記性格タイプを判定する際に用いるモデル情報を生成する性格判定用モデル生成装置であって、
上記性格タイプが既知の複数のモデルユーザによるページの閲覧状況を上記複数のモデルユーザの行動特性情報として取得するモデル行動特性取得部と、
上記モデル行動特性取得部により取得された行動特性情報を上記複数のモデルユーザの行動履歴として履歴情報記憶部に記録するモデル行動履歴記録部と、
上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報に基づいて、上記モデルユーザによる複数のページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成し、モデル情報記憶部に記憶させる性格タイプモデル生成部とを備え、
上記性格タイプモデル生成部は、上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報のうち、所定期間におけるページ閲覧回数が閾値未満の上記モデルユーザの行動特性情報を除外して、上記性格タイプモデル情報を生成することを特徴とする性格判定用モデル生成装置。
A personality determination model generation device that generates model information for use in determining the personality type based on behavior characteristic information related to browsing a page by a determination target user whose personality type is unknown,
A model behavior characteristic acquisition unit that acquires the browsing status of a page by a plurality of model users with known personality types as behavior characteristic information of the plurality of model users;
A model behavior history recording unit that records behavior characteristic information acquired by the model behavior characteristic acquisition unit in a history information storage unit as behavior histories of the plurality of model users;
A personality type formed by associating behavioral characteristics on a plurality of pages by the model user with a plurality of personality types based on the behavioral characteristic information of the plurality of model users for a predetermined period stored in the history information storage unit. A personality type model generation unit that generates model information and stores the model information in a model information storage unit;
The personality type model generation unit is the behavior characteristic information of the model user whose number of page browsing in a predetermined period is less than a threshold among the behavior characteristic information of the plurality of model users for a predetermined period stored in the history information storage unit And generating the personality type model information except for the personality determination model generation device.
上記モデル行動特性取得部は、上記モデルユーザの行動特性情報として、当該モデルユーザが閲覧したページを特定するページ情報、および当該ページの閲覧時間を取得することを特徴とする請求項7に記載の性格判定用モデル生成装置。   The said model behavior characteristic acquisition part acquires the page information which specifies the page which the said model user browsed, and the browsing time of the said page as said behavior characteristic information of the said model user, The browsing time of the said page is characterized by the above-mentioned. Personality determination model generator. 上記性格タイプモデル生成部は、上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報のうち、上記閲覧時間が外れ値を示している上記モデルユーザの行動特性情報を除外して、上記性格タイプモデル情報を生成することを特徴とする請求項8に記載の性格判定用モデル生成装置。   The personality type model generation unit includes the behavior characteristic information of the model user indicating the outlier during the browsing time among the behavior characteristic information of the plurality of model users for a predetermined period stored in the history information storage unit. The personality determination model generation device according to claim 8, wherein the personality type model information is generated by removing the personality type model information. 上記性格タイプモデル生成部は、
上記履歴情報記憶部に記憶された上記複数のモデルユーザの行動特性情報に基づいて、上記複数のモデルユーザの上記閲覧時間の平均値を上記ページ毎に算出する平均値算出部と、
上記ページの閲覧時間が上記平均値算出部により算出された上記閲覧時間の平均値より短いか長いかを基準として定めた複数の上記行動特性が、どの性格タイプに該当するかを上記ページ毎に関連付けることによって上記性格タイプモデル情報を生成する関連付け部とを備えることを特徴とする請求項8または9に記載の性格判定用モデル生成装置。
The personality type model generation unit
Based on the behavior characteristic information of the plurality of model users stored in the history information storage unit, an average value calculation unit that calculates an average value of the browsing times of the plurality of model users for each page;
For each page, which personality type corresponds to the plurality of behavior characteristics determined based on whether the browsing time of the page is shorter or longer than the average value of the browsing time calculated by the average value calculation unit The personality determination model generation device according to claim 8, further comprising an association unit that generates the personality type model information by associating.
性格タイプが既知の複数のモデルユーザによるページの閲覧状況を上記複数のモデルユーザの行動特性情報として取得するモデル行動特性取得手段、
上記モデル行動特性取得手段により取得された行動特性情報を上記複数のモデルユーザの行動履歴として履歴情報記憶部に記録するモデル行動履歴記録手段、および
上記履歴情報記憶部に記憶された所定期間分の上記複数のモデルユーザの行動特性情報に基づいて、上記モデルユーザによる複数のページ上での行動特性と複数の性格タイプとを関連付けて成る性格タイプモデル情報を生成し、モデル情報記憶部に記憶させる性格タイプモデル生成手段であって、所定期間におけるページ閲覧回数が閾値未満の上記モデルユーザの行動特性情報を除外して上記性格タイプモデル情報を生成する性格タイプモデル生成手段
としてコンピュータを機能させるための性格分析用プログラム。
Model behavior characteristic acquisition means for acquiring the browsing status of a page by a plurality of model users whose personality types are known as behavior characteristic information of the plurality of model users,
Model behavior history recording means for recording the behavior characteristic information acquired by the model behavior characteristic acquisition means in the history information storage unit as behavior histories of the plurality of model users, and a predetermined period of time stored in the history information storage unit Based on the behavior characteristic information of the plurality of model users, personality type model information formed by associating behavior characteristics on a plurality of pages by the model user and a plurality of personality types is generated and stored in the model information storage unit Personality type model generation means for causing a computer to function as personality type model generation means for generating the personality type model information excluding the behavior characteristic information of the model user whose number of page browsing in a predetermined period is less than a threshold value Personality analysis program.
性格タイプが未知の判定対象ユーザによるページの閲覧状況を上記判定対象ユーザの行動特性情報として取得する行動特性取得手段、
上記行動特性取得手段により取得された行動特性情報を上記判定対象ユーザの行動履歴として履歴情報記憶部に記録する行動履歴記録手段、および
上記履歴情報記憶部に記憶された上記判定対象ユーザの行動特性情報と、請求項11に記載の上記性格タイプモデル生成手段によって上記モデル情報記憶部に記憶された上記性格タイプモデル情報とに基づいて、上記判定対象ユーザの性格タイプを判定する性格タイプ判定手段
としてコンピュータを機能させるための性格分析用プログラム。
Behavior characteristic acquisition means for acquiring a browsing state of a page by a determination target user whose personality type is unknown as the behavior characteristic information of the determination target user;
Action history recording means for recording the behavior characteristic information acquired by the behavior characteristic acquisition means in the history information storage unit as the action history of the determination target user, and the behavior characteristics of the determination target user stored in the history information storage unit Personality type determination means for determining the personality type of the determination target user based on the information and the personality type model information stored in the model information storage unit by the personality type model generation means according to claim 11 A personality analysis program that allows a computer to function.
JP2017098728A 2017-05-18 2017-05-18 Character analyzing device, device for generating model for character analysis, and character analyzing program Pending JP2018195099A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017098728A JP2018195099A (en) 2017-05-18 2017-05-18 Character analyzing device, device for generating model for character analysis, and character analyzing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017098728A JP2018195099A (en) 2017-05-18 2017-05-18 Character analyzing device, device for generating model for character analysis, and character analyzing program

Publications (1)

Publication Number Publication Date
JP2018195099A true JP2018195099A (en) 2018-12-06

Family

ID=64570484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017098728A Pending JP2018195099A (en) 2017-05-18 2017-05-18 Character analyzing device, device for generating model for character analysis, and character analyzing program

Country Status (1)

Country Link
JP (1) JP2018195099A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020098456A (en) * 2018-12-18 2020-06-25 東日本電信電話株式会社 Analysis system
JP2020140624A (en) * 2019-03-01 2020-09-03 西日本電信電話株式会社 Attribute estimation device, attribute estimation method, and program
JP2022549878A (en) * 2019-09-25 2022-11-29 シベント、インコーポレイテッド Automated Computerized Price Tracking, Valuation, and Negotiation Optimization

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020098456A (en) * 2018-12-18 2020-06-25 東日本電信電話株式会社 Analysis system
JP2020140624A (en) * 2019-03-01 2020-09-03 西日本電信電話株式会社 Attribute estimation device, attribute estimation method, and program
JP2022549878A (en) * 2019-09-25 2022-11-29 シベント、インコーポレイテッド Automated Computerized Price Tracking, Valuation, and Negotiation Optimization

Similar Documents

Publication Publication Date Title
US11281552B2 (en) Self-learning alerting and anomaly detection
US11327934B2 (en) Systems and methods for cleansing automated robotic traffic from sets of usage logs
US10938927B2 (en) Machine learning techniques for processing tag-based representations of sequential interaction events
US20190356684A1 (en) Detecting robotic internet activity across domains utilizing one-class and domain adaptation machine-learning models
US20150278706A1 (en) Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning
US10229160B2 (en) Search results based on a search history
KR101452082B1 (en) Research mission identification
JP2014006898A (en) Systems and methods for behavioral pattern mining
US20120331128A1 (en) Method and a system for analysing impact of changes to content of a website
US10706359B2 (en) Method and system for generating predictive models for scoring and prioritizing leads
US20220366299A1 (en) Provisioning interactive content based on predicted user-engagement levels
US20170032252A1 (en) Method and system for performing digital intelligence
JP2018195099A (en) Character analyzing device, device for generating model for character analysis, and character analyzing program
JP2015011690A (en) Effect measurement program, method, and device
US10346856B1 (en) Personality aggregation and web browsing
JP5439678B1 (en) Personality analyzer and personality analysis program
JP2022143937A (en) Information processing apparatus, information processing method, and information processing program
JP6872853B2 (en) Detection device, detection method and detection program
Korstanje Machine Learning for Streaming Data with Python: Rapidly build practical online machine learning solutions using River and other top key frameworks
CN111881007A (en) Operation behavior judgment method, device, equipment and computer readable storage medium
Wang et al. Testing a decision-theoretic approach to the evaluation of information retrieval systems
WO2018002664A1 (en) Data aggregation and performance assessment
JP6982404B2 (en) Information processing equipment, information processing methods and information processing programs
CN113822566A (en) Business assessment processing method and device, computer equipment and storage medium
CN111309706A (en) Model training method and device, readable storage medium and electronic equipment