WO2019187358A1 - 評価装置 - Google Patents

評価装置 Download PDF

Info

Publication number
WO2019187358A1
WO2019187358A1 PCT/JP2018/044714 JP2018044714W WO2019187358A1 WO 2019187358 A1 WO2019187358 A1 WO 2019187358A1 JP 2018044714 W JP2018044714 W JP 2018044714W WO 2019187358 A1 WO2019187358 A1 WO 2019187358A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
trend information
score
user
recommended
Prior art date
Application number
PCT/JP2018/044714
Other languages
English (en)
French (fr)
Inventor
桂一 落合
柊 高橋
佑介 深澤
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to US16/968,347 priority Critical patent/US20200394540A1/en
Priority to JP2020509627A priority patent/JP6929445B2/ja
Publication of WO2019187358A1 publication Critical patent/WO2019187358A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • One aspect of the present invention relates to an evaluation apparatus for evaluating a tendency of content preference for a user.
  • Patent Document 1 estimates the similarity of browsing histories between users, calculates the recommended level of content based on the estimated similarity and browsing history, and based on the calculated recommended level Display content.
  • the recommended content extraction apparatus described in Patent Document 2 below calculates the similarity of usage history information related to content between users, performs clustering for each user based on the similarity, and classifies the same cluster as the recommended target user.
  • the content of the recommendation target service included in the usage history information of the other user thus determined is determined as the content recommended to the recommendation target user.
  • An object of the present invention is to provide an evaluation device that can perform the above-described evaluation.
  • an evaluation apparatus provides a preference for storing tendency information indicating a tendency of content preference for each of a plurality of time zones and for each type of content for each of a plurality of users.
  • the score calculation unit that calculates the recommended score for each of the plurality of contents for the recommended target user, and the trend information for each of the plurality of users stored in the preference trend storage unit, Based on the classification unit that clusters user groups with similar trend information to the user, and the trend information of the affiliated users belonging to the user group clustered by the classification unit, the overall trend of the affiliated user's trend information as overall trend information
  • a deriving unit for deriving and a recommended score for each of a plurality of contents calculated by the score calculating unit is a code to which a plurality of contents in the target time zone belong The target time zone is based on the score adjustment unit that adjusts the recommended score for each of the plurality of contents by reflecting the overall trend information of the content type, and the recommended score for each of the plurality of contents adjusted by the score adjustment unit.
  • a determination unit that determines content recommended for the target user.
  • the trend information indicating the tendency of the content preference for each time zone is stored for each user, the user group whose trend information is similar to the recommended user is clustered, and the overall trend of the user group
  • the overall trend information indicating the user group is derived from the trend information of the user group, and the recommended score for each of the plurality of contents is adjusted by reflecting the overall trend information.
  • content recommended to the user regarding the target time zone is determined based on the adjusted recommended score. In this way, by reflecting the preference tendency of each clustered user for each time zone in the recommended score, the content is appropriately recommended by reflecting the preference tendency for each user time zone having a similar preference trend. be able to.
  • FIG. 1 It is a block diagram which shows the structure of the content evaluation apparatus 1 concerning suitable one Embodiment of this invention. It is a figure which shows an example of a data structure of the utilization log information stored in the log
  • FIG. 1 is a block diagram showing a configuration of a content evaluation apparatus 1 according to a preferred embodiment of the present invention.
  • This content evaluation apparatus 1 distributes music data, video data, information data, etc. provided via a communication network to mobile communication terminals 10 including smartphones, tablet terminals, feature phones, etc. used by a plurality of users.
  • This is a server device that analyzes usage trends, which are data content preference trends, and provides recommended information about content based on the analysis results.
  • a plurality of mobile communication terminals 10 can communicate by connecting to the content evaluation apparatus 1 via a communication network such as a mobile communication network.
  • the content that is the target of the recommended information provided by the content evaluation device 1 is delivered to the mobile communication terminal 10 from the server device on the communication network and then played back on the mobile communication terminal 10.
  • Examples of such content include music, movies, dramas, news, sports, and the like, but are not limited to specific types as long as they can be distributed to the mobile communication terminal 10.
  • the content evaluation apparatus 1 includes a history storage unit 101, a totaling unit 102, a usage frequency storage unit 103, a usage trend storage unit (preference trend storage unit) 104, a score calculation unit 105, a classification unit 106, and a derivation.
  • Unit 107, cluster tendency storage unit 108, score adjustment unit 109, and determination unit 110 each component of the content evaluation apparatus 1 will be described.
  • the history storage unit 101 stores in advance usage history information related to content usage histories by users of a plurality of mobile communication terminals 10. This usage history information is generated and stored based on the reproduction log of the content reproduced in the plurality of mobile communication terminals 10. For example, the usage history information is stored in the history storage unit 101 by collecting the reproduction logs of the plurality of mobile communication terminals 10 at an arbitrary timing (periodic timing or the like) by the content evaluation device 1.
  • FIG. 2 shows an example of the data structure of the usage history information stored in the history storage unit 101.
  • the history storage unit 101 stores and stores a plurality of usage history information related to usage (playback) of content at a plurality of timings by a plurality of users.
  • Each usage history information includes a terminal identifier (for example, “U1”) that is user specifying information for specifying the user and a content ID (for example, “Item1”) that is content specifying information for specifying the content reproduced by the user. )
  • the reproduction time of the content for example, “2017/12/01 10:00” are associated with each other.
  • content reproduction start time information is stored. However, as long as content use time information is used, other information (for example, content reproduction end time information, content distribution time information, etc.) is stored. ) May be stored.
  • the tabulation unit 102 uses the terminal identifier to identify the usage history information of each user whose content usage time is within a predetermined period (for example, the most recent month, the most recent week, etc.). It is read out by extracting from the usage history information stored in the history storage unit 101, the usage frequency of each content related to each user is totaled, and the totaling result is stored in the usage frequency storage unit 103.
  • FIG. 3 shows an example of the data structure of the aggregation results stored in the usage frequency storage unit 103 by the aggregation unit 102.
  • the totaling unit 102 indicates a usage tendency that is a tendency of content preference for each of a plurality of time zones and for each content type, based on usage history information of each user whose content usage time is within a predetermined period.
  • the trend information is aggregated, and the trend information for each of a plurality of users is stored in the usage trend storage unit 104.
  • FIG. 4 shows an example of the data structure of the trend information stored in the usage trend storage unit 104 by the totaling unit 102.
  • each time zone (“0 hour”, “1 hour” for each content type (“movie”, “news”, etc.)
  • the data indicating the distribution of the numerical value of the usage frequency of the content in “etc.” is tabulated and stored (stored).
  • the score calculation unit 105 calculates a recommended score indicating the degree of recommendation for each of a plurality of contents for a target user who provides recommended information.
  • the score calculation unit 105 uses, for example, a collaborative filtering (CF) method as a recommended score calculation method.
  • This collaborative filtering is based on the assumption that users with similar usage (viewing) trends will continue to use content with similar usage trends in the future.
  • This is a method of calculating the degree of recommendation (recommended score) of the target user by using a value obtained by weighting the similarity of the group usage history. By using such a method, it is possible to predict the usage level of content with respect to unused content (content for which usage history information does not exist) of the target user.
  • the score calculation unit 105 reads the usage frequency of each content related to each user from the usage frequency storage unit 103. And the similarity between each user is expressed by the following formula (1); And calculate by cosine similarity.
  • C i, j is the usage frequency related to the content “j” of the user “i”
  • C k, j is the usage frequency related to the content “j” of the user “k”
  • w i, k is ,
  • the similarity between the user “i” and the user “k” is shown.
  • the similarity wi , k is the sum of the product of the usage frequency of the user "i” and the usage frequency of the user "k” for each content, and the usage of each user "i", “k”. Calculated by dividing by the product of the square root of the frequency.
  • the score calculation unit 105 uses the calculated similarity w i, k to calculate a recommended score C ⁇ i, j for each content “j” targeted for the target user “i” using the following formula (2); Calculate by In this way, the recommended score C ⁇ i, j is obtained by using the usage frequency C k, j related to the content “j” of each user “k” to the similarity w i, between the user “k” and the user “i” . It is calculated by dividing the sum of the values multiplied by k by the sum of the similarities wi , k .
  • the score calculation unit 105 may calculate a recommended score for each content by using an MF (Matrix Factorization) method in addition to collaborative filtering.
  • MF is a technique for predicting the value of a missing part by subjecting the usage frequency value of each content relating to each user constituting the matrix to the matrix decomposition of only the part where the value exists. is there.
  • the score calculation unit 105 may calculate a recommended score for each content using a supervised machine learning model called FM (Factorization Machine).
  • the classification unit 106 clusters user groups whose trend information is similar to the target user based on the trend information for each of the plurality of users stored in the usage trend storage unit 104. That is, the classification unit 106 reads the distribution of usage frequency values (trend information) for each content type and for each time period for each user from the usage trend storage unit 104 and expands this distribution into a one-dimensional vector. For example, according to the example of FIG. 4, the usage frequency values “0”, “1”,..., “1” for each content type in the time zone “0 hour range” are targeted for the usage frequency value of the user “UN”.
  • the classifying unit 106 regards the developed vectors of each user as feature vectors indicating the usage tendency of the content for each user's time zone, and targets those vectors as k-means.
  • a group of users having similar feature vectors is clustered using a clustering technique such as a method.
  • the deriving unit 107 uses the trend information of the belonging users belonging to the cluster (user group) including the target user to determine the overall tendency of the trend information of the belonging users belonging to the cluster. Derived as overall trend information. Specifically, the derivation unit 107 reads out the trend information regarding all the belonging users belonging to the target user's cluster from the usage trend storage unit 104, and uses the usage frequency value of each content type in each time zone as a target. An average value between users is calculated, and the calculated average value for each time zone and each content type is stored in the cluster trend storage unit 108 as overall trend information.
  • each content type for example, “movie”, “news”,.
  • An average value for example, “0”, “0”,..., “1” of use frequency values for each “sport” is stored.
  • the score adjustment unit 109 reflects the recommended tendency for each content calculated for the target user by the score calculation unit 105 and the overall trend information for the cluster to which the target user belongs, derived by the derivation unit 107. To make adjustments. Specifically, the score adjustment unit 109 reads, from the cluster trend storage unit 108, the overall trend information of the cluster to which the target user corresponding to the time zone including the target time for generating the recommended information belongs. Then, the score adjustment unit 109 adjusts the recommended score by adding a numerical value based on the value of the overall trend information corresponding to the content type to which each content belongs to the recommended score of each content calculated by the score calculation unit 105. To do.
  • C ⁇ 10 C ⁇ 1 + ⁇ ⁇ AV 1 To adjust the value C ⁇ 10 .
  • the score adjustment unit 109 calculates a recommended score C ⁇ 10 for all contents that can be recommended.
  • the determining unit 110 determines the content recommended for the target user in the time zone including the recommended target time based on the recommended score for each content calculated by the score adjusting unit 109. For example, the determination unit 110 may determine content that recommends a relatively high recommended score as content that recommends content that has a recommended score higher than a preset threshold.
  • the recommended content information (recommended information) determined in this way can be referred to by the mobile communication terminal 10 via the communication network.
  • the recommended information may be actively transmitted from the content evaluation apparatus 1 to the outside of the mobile communication terminal 10 or the like via a communication network.
  • FIG. 6 is a flowchart showing an operation procedure of the evaluation process by the content evaluation apparatus 1
  • FIG. 7 is a flowchart showing a detailed operation procedure of the score adjustment process of FIG.
  • the content evaluation process by the content evaluation apparatus 1 shown in FIG. 6 is automatically started at an arbitrary timing (periodic or regular timing).
  • a history totaling process (step S1) for totalizing the usage history of each user's content, and an initial score calculation process (an initial recommended score calculation process for each content targeting the target user) Step S2), a score adjustment process (step S3) for adjusting the initial recommended score is executed in this order.
  • the counting unit 102 In the history counting process (step S1), the counting unit 102 generates a counting result by counting the usage frequency of each content for the usage history information of each user, and stores the counting result in the usage frequency storage unit 103. In addition, the aggregation unit 102 generates trend information indicating the usage trend of the content for each of a plurality of time zones and for each type of content for the usage history information of each user, and uses the trend information as the usage trend storage unit 104. To store.
  • the score calculation unit 105 recommends the recommended score of each content for a plurality of target users based on the usage frequency of each content related to each user stored in the usage frequency storage unit 103.
  • the initial value of is calculated.
  • the score adjustment process (step S3) is executed according to the procedure shown in FIG.
  • the classification unit 106 clusters a group of users whose trend information is similar to a plurality of target users, based on the trend information for each of the plurality of users stored in the usage trend storage unit 104 (step S101).
  • the deriving unit 107 derives overall trend information by averaging the trend information of the belonging users belonging to the clusters for each cluster to which the target user belongs (step S102).
  • the score adjustment unit 109 adjusts the initial value of the recommended score for each content calculated for each target user by reflecting the overall trend information corresponding to the cluster to which the target user belongs, and the recommended score for each content Is calculated (step S103).
  • the determination unit 110 determines the content recommended for the target user for each target user with reference to the final value of the recommended score of each content (step S104). Then, the determination unit 110 stores the recommended information related to the recommended content in the internal memory or the like of the content evaluation device 1 (step S105). As a result, the recommended information can be referred to by the mobile communication terminal 10.
  • tendency information indicating a usage tendency which is a tendency of content preference for each time zone
  • a group of users whose trend information is similar to the recommended user is clustered.
  • Overall trend information indicating the overall trend of the group is derived from the trend information of the user group, and a recommended score for each of a plurality of contents is adjusted by reflecting the overall trend information. Then, content recommended to the user regarding the target time zone is determined based on the adjusted recommended score.
  • the trend information for each of a plurality of time zones and types is expanded into a vector, and user groups having similar vectors are clustered.
  • the average value of the trend information of the users belonging to each cluster is calculated as the overall trend information.
  • the overall tendency of the clustered user group can be calculated easily and appropriately.
  • the recommended score is adjusted by adding a numerical value based on the overall trend information to the recommended score. By doing so, it is possible to more easily calculate a recommended score that reflects the overall tendency of the clustered user group. As a result, it is possible to recommend the content with more efficient calculation by reflecting the usage tendency of the users with similar usage trends for each time zone.
  • each functional block may be realized by one device physically and / or logically coupled, and two or more devices physically and / or logically separated may be directly and / or indirectly. (For example, wired and / or wireless) and may be realized by these plural devices.
  • an apparatus constituting the content evaluation apparatus 1 according to an embodiment of the present invention may function as a computer that performs processing of the content evaluation apparatus 1 according to the present embodiment.
  • FIG. 8 is a diagram illustrating an example of a hardware configuration of the computer 20 configuring the content evaluation apparatus 1 according to the present embodiment.
  • the above-described computer 20 may physically include a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the term “apparatus” can be read as a circuit, a device, a unit, or the like.
  • the hardware configuration of the computer 20 may be configured to include one or a plurality of devices illustrated in the figure, or may be configured not to include some devices.
  • Each function in the computer 20 is performed by reading predetermined software (program) on hardware such as the processor 1001 and the memory 1002, so that the processor 1001 performs an operation and performs communication by the communication device 1004 and in the memory 1002 and the storage 1003. This is realized by controlling reading and / or writing of data.
  • the processor 1001 controls the entire computer by operating an operating system, for example.
  • the processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic device, a register, and the like.
  • CPU central processing unit
  • the totaling unit 102, the score calculation unit 105, the classification unit 106, the derivation unit 107, the score adjustment unit 109, the determination unit 110, and the like may be realized by the processor 1001.
  • the processor 1001 reads programs (program codes), software modules, and data from the storage 1003 and / or the communication device 1004 to the memory 1002, and executes various processes according to these.
  • programs program codes
  • software modules software modules
  • data data from the storage 1003 and / or the communication device 1004 to the memory 1002, and executes various processes according to these.
  • the program a program that causes a computer to execute at least a part of the operations described in the above embodiments is used.
  • the totaling unit 102 of the computer 20 may be realized by a control program stored in the memory 1002 and operated by the processor 1001, and may be realized similarly for other functional blocks.
  • the above-described various processes have been described as being executed by one processor 1001, they may be executed simultaneously or sequentially by two or more processors 1001.
  • the processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via a telecommunication line.
  • the memory 1002 is a computer-readable recording medium, and includes, for example, at least one of ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), RAM (Random Access Memory), and the like. May be.
  • the memory 1002 may be called a register, a cache, a main memory (main storage device), or the like.
  • the memory 1002 can store a program (program code), a software module, and the like that can be executed to perform the determination process according to the embodiment of the present invention.
  • the storage 1003 is a computer-readable recording medium such as an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, a magneto-optical disk (for example, a compact disk, a digital versatile disk, a Blu-ray). (Registered trademark) disk, smart card, flash memory (for example, card, stick, key drive), floppy (registered trademark) disk, magnetic strip, and the like.
  • the storage 1003 may be referred to as an auxiliary storage device.
  • the storage medium described above may be, for example, a database, server, or other suitable medium including the memory 1002 and / or the storage 1003.
  • the history storage unit 101, the usage frequency storage unit 103, the usage trend storage unit 104, the cluster tendency storage unit 108, and the like may be realized by the storage 1003.
  • the communication device 1004 is hardware (transmission / reception device) for performing communication between computers via a wired and / or wireless network, and is also referred to as a network device, a network controller, a network card, a communication module, or the like.
  • the input device 1005 is an input device that accepts input from the outside, and the output device 1006 is an output device that performs output to the outside.
  • the input device 1005 and the output device 1006 may be realized by a touch panel display in which both are integrated.
  • each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured with a single bus or may be configured with different buses between apparatuses.
  • the computer 20 includes hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), and a field programmable gate array (FPGA). Some or all of the functional blocks may be realized by the hardware. For example, the processor 1001 may be implemented by at least one of these hardware.
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • the derivation unit 107 of the above embodiment derives the overall trend information as an average value of the usage frequency value of the belonging user, but other statistical values such as a median value or an addition value of the usage frequency value of the belonging user are obtained. You may derive
  • the score adjustment unit 109 of the above embodiment adjusts the initial value of the recommended score for each content by adding a numerical value based on the value of the overall trend information, but based on the value of the overall trend information to the initial value You may adjust by multiplying a numerical value. Even in this way, it is possible to more easily calculate a recommended score that reflects the overall tendency of the clustered user group. As a result, it is possible to recommend the content with more efficient calculation by reflecting the usage tendency of the users with similar usage trends for each time zone.
  • the content evaluation device 1 of the above-described embodiment analyzes the usage tendency that is the tendency of content preference, and provides recommended information regarding the content based on the analysis result. Rating numerical values (for example, numerical values evaluated in five levels), which are the results of the user rating each content, may be collected and analyzed.
  • the usage frequency storage unit 103 stores the rating value for the content instead of the numeric value of the usage frequency of the content, which is the usage trend.
  • the score calculation part 105 calculates the recommendation score for every content with the method mentioned above using the numerical value of the rating of each content regarding each user.
  • the classification unit 106 clusters user groups based on the trend information including the rating value, the derivation unit 107 derives the overall trend information using the trend information including the rating value, and the score adjustment unit 109
  • the recommended score for each content is adjusted by reflecting the overall trend information derived from the trend information including the numerical value of the rating.
  • Each aspect / embodiment described in this specification includes LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G, 5G, FRA (Future Radio Access), W-CDMA.
  • LTE Long Term Evolution
  • LTE-A Long Term Evolution-Advanced
  • SUPER 3G IMT-Advanced
  • 4G 5G
  • FRA Full Radio Access
  • W-CDMA Wideband
  • GSM registered trademark
  • CDMA2000 Code Division Multiple Access 2000
  • UMB User Mobile Broadband
  • IEEE 802.11 Wi-Fi
  • IEEE 802.16 WiMAX
  • IEEE 802.20 UWB (Ultra-WideBand
  • the present invention may be applied to a Bluetooth (registered trademark), a system using another appropriate system, and / or a next generation system extended based on the system.
  • the input / output information or the like may be stored in a specific location (for example, a memory) or may be managed by a management table. Input / output information and the like can be overwritten, updated, or additionally written. The output information or the like may be deleted. The input information or the like may be transmitted to another device.
  • the determination may be performed by a value represented by 1 bit (0 or 1), may be performed by a true / false value (Boolean: true or false), or may be performed by comparing numerical values (for example, a predetermined value) Comparison with the value).
  • notification of predetermined information is not limited to explicitly performed, but is performed implicitly (for example, notification of the predetermined information is not performed). Also good.
  • software, instructions, etc. may be transmitted / received via a transmission medium.
  • software may use websites, servers, or other devices using wired technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or wireless technology such as infrared, wireless and microwave.
  • wired technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or wireless technology such as infrared, wireless and microwave.
  • DSL digital subscriber line
  • wireless technology such as infrared, wireless and microwave.
  • determining may encompass a wide variety of actions.
  • “Judgment”, “decision” can be, for example, calculating, computing, processing, deriving, investigating, looking up (eg, table, database or another (Searching in the data structure), and confirming (ascertaining) what has been confirmed may be considered as “determining” or “determining”.
  • “determination” and “determination” include receiving (for example, receiving information), transmitting (for example, transmitting information), input (input), output (output), and access. (accessing) (e.g., accessing data in a memory) may be considered as “determined” or "determined”.
  • determination and “decision” means that “resolving”, “selecting”, “choosing”, “establishing”, and “comparing” are regarded as “determining” and “deciding”. May be included. In other words, “determination” and “determination” may include considering some operation as “determination” and “determination”.
  • the phrase “based on” does not mean “based only on”, unless expressly specified otherwise. In other words, the phrase “based on” means both “based only on” and “based at least on.”
  • One embodiment of the present invention uses an evaluation apparatus that evaluates a tendency of content preference in a user, and makes it possible to appropriately recommend content reflecting the tendency of content preference for each user's time zone. Is.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンテンツ評価装置1は、時間帯毎、コンテンツ種別毎の利用傾向を示す傾向情報をユーザ毎に記憶する利用傾向格納部104と、コンテンツ毎の推奨スコアを算出するスコア算出部105と、ユーザ毎の傾向情報を基に傾向情報が類似するユーザ群をクラスタリングする分類部106と、クラスタリングされたユーザ群に属する所属ユーザの傾向情報から全体傾向情報を導出する導出部107と、コンテンツ毎の推奨スコアに対して、対象の時間帯における全体傾向情報を反映することによって、コンテンツ毎の推奨スコアを調整するスコア調整部109と、調整されたコンテンツ毎の推奨スコアを基に、対象の時間帯に関して対象のユーザに推奨するコンテンツを決定する決定部110とを備える。

Description

評価装置
 本発明の一側面は、ユーザにおけるコンテンツの嗜好の傾向を評価する評価装置に関する。
 従来から、ユーザのコンテンツの閲覧履歴を基にユーザに推奨するコンテンツを判定する技術が知られている。下記特許文献1に記載のレコメンド装置は、ユーザ間の閲覧履歴の類似性を類推し、類推した類似性と閲覧履歴を基に、コンテンツの推奨度を算出して、算出した推薦度を基にコンテンツを表示する。また、下記特許文献2に記載の推薦コンテンツ抽出装置は、ユーザ間におけるコンテンツに関する利用履歴情報の類似度を算出し、それを基にユーザ毎のクラスタリングを行い、推薦対象ユーザと同一のクラスタに分類された他のユーザの利用履歴情報に含まれる推薦対象サービスのコンテンツを、推薦対象ユーザに推薦するコンテンツと判定する。
特開2013-25325号公報 特開2011-81728号公報
 上記特許文献2に記載の技術においては、例えば、同一クラスタの他のユーザに最も多く購入されているコンテンツ、あるいは同一クラスタの他のユーザに直近に売れたコンテンツ等を推薦コンテンツと判定する。したがって、ユーザの時間帯毎のコンテンツの嗜好の傾向を反映させてコンテンツを推奨することは難しい傾向にある。
 そこで、上述の課題を解決するために、本発明の一側面は、かかる課題に鑑みてなされたものであり、ユーザの時間帯毎のコンテンツの嗜好の傾向を反映させてコンテンツを適切に推奨することが可能な評価装置を提供することを目的とする。
 上述の課題を解決するために、本発明の一側面にかかる評価装置は、複数の時間帯毎およびコンテンツの種別毎のコンテンツの嗜好の傾向を示す傾向情報を、複数のユーザ毎に記憶する嗜好傾向格納部と、推奨対象のユーザを対象に、複数のコンテンツ毎の推奨スコアを算出するスコア算出部と、嗜好傾向格納部に記憶された複数のユーザ毎の傾向情報を基に、推奨対象のユーザと傾向情報が類似するユーザ群をクラスタリングする分類部と、分類部によってクラスタリングされたユーザ群に属する所属ユーザの傾向情報を基に、所属ユーザの傾向情報の全体の傾向を、全体傾向情報として導出する導出部と、スコア算出部によって算出された複数のコンテンツ毎の推奨スコアに対して、対象の時間帯における複数のコンテンツが属するコンテンツの種別の全体傾向情報を反映することによって、複数のコンテンツ毎の推奨スコアを調整するスコア調整部と、スコア調整部によって調整された複数のコンテンツ毎の推奨スコアを基に、対象の時間帯に関して対象のユーザに推奨するコンテンツを決定する決定部と、を備える。
 上記一側面によれば、時間帯毎のコンテンツの嗜好の傾向を示す傾向情報がユーザ毎に記憶され、推奨対象のユーザと傾向情報が類似するユーザ群がクラスタリングされ、そのユーザ群の全体の傾向を示す全体傾向情報がユーザ群の傾向情報から導出され、複数のコンテンツ毎の推奨スコアが、全体傾向情報が反映されることによって調整される。そして、調整された推奨スコアを基に対象の時間帯に関してユーザに推奨するコンテンツが決定される。このように、クラスタリングされたユーザの時間帯毎の嗜好の傾向を推奨スコアに反映することで、嗜好の傾向が類似するユーザの時間帯毎の嗜好の傾向を反映させてコンテンツを適切に推奨することができる。
 本発明の一側面によれば、ユーザの時間帯毎のコンテンツの嗜好の傾向を反映させてコンテンツを適切に推奨することができる。
本発明の好適な一実施形態にかかるコンテンツ評価装置1の構成を示すブロック図である。 図1の履歴格納部101に格納された利用履歴情報のデータ構成の一例を示す図である。 図1の集計部102によって利用頻度格納部103に格納された集計結果のデータ構成の一例を示す図である。 図1の集計部102によって利用傾向格納部104に格納された傾向情報のデータ構成の一例を示している。 図1の導出部107によってクラスタ傾向格納部108に格納された全体傾向情報のデータ構成の一例を示す図である。 図1のコンテンツ評価装置1による評価処理の動作手順を示すフローチャートである。 図6のスコア調整処理の詳細な動作手順を示すフローチャートある。 図1のコンテンツ評価装置1を構成するコンピュータ20のハードウェア構成の一例を示す図である。
 添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
 図1は、本発明の好適な一実施形態にかかるコンテンツ評価装置1の構成を示すブロック図である。このコンテンツ評価装置1は、複数のユーザの使用するスマートフォン、タブレット端末、フィーチャーフォン等を含む移動通信端末10に対して通信ネットワークを介して提供される音楽データ、映像データ、あるいは情報データ等の配信データであるコンテンツの嗜好の傾向である利用傾向を分析して、分析結果を基にコンテンツに関する推奨情報を提供するサーバ装置である。複数の移動通信端末10は、移動体通信ネットワーク等の通信ネットワークを介してコンテンツ評価装置1と通信接続することにより通信を行うことができる。
 コンテンツ評価装置1が提供する推奨情報の対象となるコンテンツは、通信ネットワーク上のサーバ装置から移動通信端末10に配信されてから移動通信端末10において再生される。このようなコンテンツの例としては、音楽、映画、ドラマ、ニュース、スポーツ等に関するものが挙げられるが、移動通信端末10に配信可能なものであれば特定の種類のものには限定されない。
 図1に示すように、コンテンツ評価装置1は、履歴格納部101、集計部102、利用頻度格納部103、利用傾向格納部(嗜好傾向格納部)104、スコア算出部105、分類部106、導出部107、クラスタ傾向格納部108、スコア調整部109、及び決定部110を含んで構成されている。以下、コンテンツ評価装置1の各構成要素について説明する。
 履歴格納部101は、複数の移動通信端末10のユーザによるコンテンツの利用履歴に関する利用履歴情報を予め格納する。この利用履歴情報は、複数の移動通信端末10において再生されたコンテンツの再生ログを基に生成され格納される。例えば、コンテンツ評価装置1によって複数の移動通信端末10の再生ログを任意のタイミング(定期的なタイミング等)で収集することによって、履歴格納部101に利用履歴情報が格納される。
 図2には、履歴格納部101に格納された利用履歴情報のデータ構成の一例を示す。同図に示すように、履歴格納部101には、複数のユーザによる複数のタイミングでのコンテンツの利用(再生)に関する複数の利用履歴情報が蓄積されて記憶されている。それぞれの利用履歴情報には、ユーザを特定するユーザ特定情報である端末識別子(例えば、“U1”)と、ユーザによって再生されたコンテンツを特定するコンテンツ特定情報であるコンテンツID(例えば、“Item1”)と、コンテンツの再生時刻(例えば、“2017/12/01 10:00”)とが対応付けられている。なお、ここでは、コンテンツの再生開始時刻の情報を格納しているが、コンテンツの利用時刻の情報であれば、他の情報(例えば、コンテンツの再生終了時刻の情報、コンテンツの配信時刻の情報等)を格納してもよい。
 図1に戻って、集計部102は、コンテンツの利用時刻が所定の期間内(例えば、直近の一か月、直近の一週間等)にある各ユーザの利用履歴情報を、端末識別子を基に履歴格納部101に格納された利用履歴情報の中から抽出することによって読み出し、各ユーザに関する各コンテンツの利用頻度を集計し、集計結果を利用頻度格納部103に格納する。図3は、集計部102によって利用頻度格納部103に格納された集計結果のデータ構成の一例を示している。このように、各ユーザを特定する端末識別子“U1”,“U2”,“U3”毎に、コンテンツID“Item1”,“Item2”,“Item3”によって特定される各コンテンツの利用頻度のデータが対応付けて格納される。
 また、集計部102は、コンテンツの利用時刻が所定の期間内にある各ユーザの利用履歴情報を基に、複数の時間帯毎およびコンテンツの種別毎のコンテンツの嗜好の傾向である利用傾向を示す傾向情報を集計し、複数のユーザ毎の傾向情報を利用傾向格納部104に格納する。図4は、集計部102によって利用傾向格納部104に格納された傾向情報のデータ構成の一例を示している。このように、端末識別子“UN”によって特定されるユーザに対応する傾向情報として、コンテンツの種別(“映画”、“ニュース”等)毎に各時間帯(“0時台”、“1時台”等)におけるコンテンツの利用頻度の数値の分布を示すデータが集計及び格納(記憶)される。
 再び図1に戻って、スコア算出部105は、推奨情報を提供する対象のユーザを対象に、複数のコンテンツ毎の推奨の度合いを示す推奨スコアを算出する。このスコア算出部105は、推奨スコアの算出手法として、例えば、協調フィルタリング(CF:Collaborative Filtering)の手法を用いる。この協調フィルタリングは、似たような利用(視聴)傾向のユーザ群は将来も似たような利用傾向でコンテンツを利用するという仮定の下で、利用傾向に関するユーザ間の類似度を計算し、ユーザ群の利用履歴に対して類似度の重み付けをした値を用いて、対象のユーザの推奨度合い(推奨スコア)を算出する手法である。このような手法により、対象ユーザの未利用のコンテンツ(利用履歴情報が存在しないコンテンツ)に対して、コンテンツの利用度合いを予測することができる。
 すなわち、スコア算出部105は、利用頻度格納部103から、各ユーザに関する各コンテンツの利用頻度を読み出す。そして、各ユーザ間の類似度を下記式(1);
Figure JPOXMLDOC01-appb-M000001
 
を用いて、コサイン類似度によって計算する。上記式(1)中、Ci,jは、ユーザ“i”のコンテンツ“j”に関する利用頻度、Ck,jは、ユーザ“k”のコンテンツ“j”に関する利用頻度、wi,kは、ユーザ“i”とユーザ“k”の間の類似度を示す。このように、類似度wi,kは、それぞれのコンテンツに関するユーザ“i”の利用頻度とユーザ“k”の利用頻度との積の和を、それぞれのユーザ“i”,“k”の利用頻度の二乗和平方根の積で除することによって計算される。
 さらに、スコア算出部105は、計算した類似度wi,kを用いて、対象ユーザ“i”を対象とした各コンテンツ“j”に関する推奨スコアC^i,jを、下記式(2);
Figure JPOXMLDOC01-appb-M000002
 
によって計算する。このように、推奨スコアC^i,jは、各ユーザ“k”のコンテンツ“j”に関する利用頻度Ck,jに、ユーザ“k”とユーザ“i”との間の類似度wi,kを乗じた値の和を、類似度wi,kの総和で除することによって計算される。
 なお、スコア算出部105は、協調フィルタリング以外にも、MF(Matrix Factorization)の手法を用いて各コンテンツに関する推奨スコアを算出してもよい。MFとは、行列を構成する各ユーザに関する各コンテンツの利用頻度の値を対象にして、値が存在する部分だけを行列分解することにより、値が欠損している部分の値を予測する手法である。また、スコア算出部105は、FM(Factorization Machine)と呼ばれる教師あり機械学習のモデルを用いて各コンテンツに関する推奨スコアを算出してもよい。
 分類部106は、利用傾向格納部104に格納された複数のユーザ毎の傾向情報を基に、対象ユーザと傾向情報が類似するユーザ群をクラスタリングする。すなわち、分類部106は、利用傾向格納部104から、各ユーザに関して、コンテンツ種別毎及び各時間帯毎の利用頻度値の分布(傾向情報)を読み出し、この分布を一次元のベクトルに展開する。例えば、図4の例によれば、ユーザ“UN”の利用頻度値を対象に、時間帯“0時台”の各コンテンツ種別の利用頻度値“0”、“1”、…“1”と、時間帯“1時台”の各コンテンツ種別の利用頻度値“0”、“0”、…“0”とを、一次元のベクトル“[0,1,…,1,0,0,…,0,…]に展開する。さらに、分類部106は、展開した各ユーザのベクトルを各ユーザの時間帯毎のコンテンツの利用傾向を示す特徴ベクトルとして捉え、それらのベクトルを対象にk-means法等のクラスタリング手法を用いて、特徴ベクトルが類似するユーザ群をクラスタリングする。
 導出部107は、分類部106によるクラスタリングの結果を基に、対象ユーザを含むクラスタ(ユーザ群)に属する所属ユーザの傾向情報を用いて、クラスタに属する所属ユーザの傾向情報の全体の傾向を、全体傾向情報として導出する。具体的には、導出部107は、対象ユーザのクラスタに属する全ての所属ユーザに関する傾向情報を利用傾向格納部104から読み出し、各時間帯における各コンテンツ種別の利用頻度値を対象に、全ての所属ユーザ間の平均値を算出し、算出した各時間帯毎および各コンテンツ種別毎の平均値を、全体傾向情報としてクラスタ傾向格納部108に格納する。図5は、導出部107によってクラスタ傾向格納部108に格納された全体傾向情報のデータ構成の一例を示している。このように、対象ユーザが属するクラスタ“クラスタ1”の全体傾向情報として、各時間帯(例えば、“0時台”)毎に各コンテンツ種別(例えば、“映画”、“ニュース”、…、“スポーツ”)毎の利用頻度値の平均値(例えば、“0”、“0”、…、“1”)が格納される。
 図1に戻って、スコア調整部109は、スコア算出部105によって対象ユーザを対象に算出された各コンテンツに関する推奨スコアを、導出部107によって導出された対象ユーザが属するクラスタに関する全体傾向情報を反映することによって調整する。具体的には、スコア調整部109は、推奨情報を生成する対象の時刻が含まれる時間帯に対応する対象ユーザの属するクラスタの全体傾向情報を、クラスタ傾向格納部108から読み出す。そして、スコア調整部109は、スコア算出部105によって算出された各コンテンツの推奨スコアに、各コンテンツの属するコンテンツ種別に対応する全体傾向情報の値に基づく数値を加算することによって、推奨スコアを調整する。例えば、スコア算出部105によって算出された推奨スコアC^を、全体傾向情報に含まれる利用頻度値の平均値AVと、所定の係数αを用いて、下記式;
C^10=C^+α×AV
を用いて、値C^10に調整する。
 さらに詳細には、スコア調整部109は、コンテンツ“映画A”に関してスコア算出部105によって算出された推奨スコアC^=“0.8”を対象に、推奨対象の時刻“22時”における推奨スコアC^10に調整する際には、図5に示すような全体傾向情報から、“22時台”およびコンテンツ種別“映画”に対応する平均値AV=“3”を参照することによって、
C^10=0.8+1.0×3=3.8
と、推奨スコアC^10を計算する。この計算例は、係数α=1.0と設定された場合の例である。同様にして、スコア調整部109は、推奨の対象となりうるすべてのコンテンツの推奨スコアC^10を繰り返し計算する。
 決定部110は、スコア調整部109によって計算された各コンテンツ毎の推奨スコアを基に、推奨対象の時刻の含まれる時間帯において対象ユーザに推奨するコンテンツを決定する。例えば、決定部110は、推奨スコアが相対的に高いコンテンツを推奨するコンテンツとして決定してもよいし、推奨スコアが予め設定された閾値よりも高いコンテンツを推奨するコンテンツとして決定してもよい。このようにして決定された推奨するコンテンツの情報(推奨情報)は、通信ネットワークを介して移動通信端末10によって参照可能とされる。また、推奨情報は、コンテンツ評価装置1から通信ネットワークを介して移動通信端末10等の外部に能動的に送信可能とされてもよい。
 次に、上述した構成のコンテンツ評価装置1の評価処理について説明する。図6はコンテンツ評価装置1による評価処理の動作手順を示すフローチャートであり、図7は図6のスコア調整処理の詳細な動作手順を示すフローチャートある。
 図6に示すコンテンツ評価装置1によるコンテンツの評価処理は、任意のタイミング(定期的なあるいは定時のタイミング)で自動的に開始される。この評価処理が開始されると、各ユーザのコンテンツの利用履歴を集計する履歴集計処理(ステップS1)、対象ユーザを対象とした各コンテンツの初期の推奨スコアの算出処理である初期スコア算出処理(ステップS2)、初期の推奨スコアを調整するスコア調整処理(ステップS3)が、この順で実行される。
 履歴集計処理(ステップS1)では、集計部102が、各ユーザの利用履歴情報を対象に、各コンテンツの利用頻度を集計した集計結果を生成し、集計結果を利用頻度格納部103に格納する。それに加えて、集計部102は、各ユーザの利用履歴情報を対象に、複数の時間帯毎およびコンテンツの種別毎のコンテンツの利用傾向を示す傾向情報を生成し、傾向情報を利用傾向格納部104に格納する。
 初期スコア算出処理(ステップS2)では、スコア算出部105が、利用頻度格納部103に格納された各ユーザに関する各コンテンツの利用頻度を基に、複数の対象ユーザを対象とした各コンテンツの推奨スコアの初期値を算出する。
 スコア調整処理(ステップS3)は、図7に示す手順で実行される。まず、分類部106が、利用傾向格納部104に格納された複数のユーザ毎の傾向情報を基に、複数の対象ユーザと傾向情報が類似するユーザ群をクラスタリングする(ステップS101)。そして、導出部107は、対象ユーザの属するクラスタ毎に、クラスタに属する所属ユーザの傾向情報を平均化することによって全体傾向情報を導出する(ステップS102)。次に、スコア調整部109が、対象ユーザ毎に算出された各コンテンツの推奨スコアの初期値を、対象ユーザが属するクラスタに対応する全体傾向情報を反映することによって調整し、各コンテンツの推奨スコアの最終値を計算する(ステップS103)。
 その後、決定部110は、対象ユーザ毎に、各コンテンツの推奨スコアの最終値を参照して、対象ユーザに推奨するコンテンツを決定する(ステップS104)。そして、決定部110は、推奨するコンテンツに関する推奨情報を、コンテンツ評価装置1の内部メモリ等に記憶する(ステップS105)。これによって、推奨情報が移動通信端末10によって参照可能とされる。
 つぎに、本実施形態のコンテンツ評価装置1の作用効果について説明する。このコンテンツ評価装置1においては、時間帯毎のコンテンツの嗜好の傾向である利用傾向を示す傾向情報がユーザ毎に記憶され、推奨対象のユーザと傾向情報が類似するユーザ群がクラスタリングされ、そのユーザ群の全体の傾向を示す全体傾向情報がユーザ群の傾向情報から導出され、複数のコンテンツ毎の推奨スコアが、全体傾向情報が反映されることによって調整される。そして、調整された推奨スコアを基に対象の時間帯に関してユーザに推奨するコンテンツが決定される。
 このように、クラスタリングされたユーザの時間帯毎の利用傾向を推奨スコアに反映することで、利用傾向が類似するユーザの時間帯毎の利用傾向を反映させてコンテンツを適切に推奨することができる。つまり、協調フィルタリング等で導き出された初期の推奨スコアに時間帯毎の利用傾向を反映させることによって、時間帯毎のユーザの嗜好に合ったコンテンツを推奨することができる。特に、推奨対象のユーザが属するクラスタの利用傾向を反映させているので、推奨対象のユーザの利用履歴がスパースである場合も、ユーザ全体の利用傾向を反映させてコンテンツを適切に推奨することができる。
 また、上記実施形態では、複数の時間帯毎および種別毎の傾向情報をベクトルに展開し、ベクトルが類似するユーザ群をクラスタリングしている。このような構成により、時間帯毎の利用(視聴)傾向が類似したユーザ群を効率的にクラスタリングすることができる。その結果、推奨するコンテンツの評価処理の効率化が可能となる。
 また、上記実施形態では、全体傾向情報として各クラスタに属する所属ユーザの傾向情報の平均値を算出している。このような構成により、クラスタリングされたユーザ群の全体傾向を簡易かつ適切に算出することができる。その結果、利用傾向が類似したユーザの時間帯毎の利用傾向を反映させてコンテンツをより適切に推奨することができる。
 さらに上記実施形態では、推奨スコアに対して全体傾向情報に基づく数値を加算することによって、推奨スコアを調整している。こうすることにより、クラスタリングされたユーザ群の全体傾向を反映した推奨スコアをより簡易に算出することができる。その結果、利用傾向が類似したユーザの時間帯毎の利用傾向を反映させて、コンテンツをより効率的な計算で推奨することができる。
 また、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
 例えば、本発明の一実施の形態におけるコンテンツ評価装置1を構成する装置は、本実施形態のコンテンツ評価装置1の処理を行うコンピュータとして機能してもよい。図8は、本実施形態に係るコンテンツ評価装置1を構成するコンピュータ20のハードウェア構成の一例を示す図である。上述のコンピュータ20は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含んで構成されてもよい。
 なお、本明細書における説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。コンピュータ20のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 コンピュータ20における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、集計部102、スコア算出部105、分類部106、導出部107、スコア調整部109、決定部110などは、プロセッサ1001で実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、コンピュータ20の集計部102は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る判定処理を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。例えば、履歴格納部101、利用頻度格納部103、利用傾向格納部104、クラスタ傾向格納部108などは、ストレージ1003で実現されてもよい。
 通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
 入力装置1005は、外部からの入力を受け付ける入力デバイスであり、出力装置1006は、外部への出力を実施する出力デバイスである。入力装置1005及び出力装置1006は、両者が一体となったタッチパネルディスプレイで実現されてもよい。
 また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
 また、コンピュータ20は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
 以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
 例えば、上記実施形態の導出部107は、全体傾向情報を所属ユーザの利用頻度値の平均値として導出していたが、所属ユーザの利用頻度値の中央値あるいは加算値等の他の統計値を全体傾向情報として導出してもよい。このようにしても、クラスタリングされたユーザ群の全体傾向を簡易かつ適切に算出することができる。その結果、利用傾向が類似したユーザの時間帯毎の利用傾向を反映させてコンテンツをより適切に推奨することができる。
 また、上記実施形態のスコア調整部109は、各コンテンツに関する推奨スコアの初期値を全体傾向情報の値に基づく数値を加算することによって調整しているが、初期値に全体傾向情報の値に基づく数値を乗算することによって調整してもよい。このようにしても、クラスタリングされたユーザ群の全体傾向を反映した推奨スコアをより簡易に算出することができる。その結果、利用傾向が類似したユーザの時間帯毎の利用傾向を反映させて、コンテンツをより効率的な計算で推奨することができる。
 また、上記実施形態のコンテンツ評価装置1は、コンテンツの嗜好の傾向である利用傾向を分析して、分析結果を基にコンテンツに関する推奨情報を提供していたが、コンテンツの嗜好の傾向として、各ユーザが各コンテンツに対してレーティングした結果であるレーティングの数値(例えば、5段階で評価した数値)を収集し分析してもよい。
 このような場合は、利用頻度格納部103においては、利用傾向であるコンテンツの利用頻度の数値の代わりに、コンテンツに対するレーティングの数値が記憶される。そして、スコア算出部105は、各ユーザに関する各コンテンツのレーティングの数値を用いて、上述した手法でコンテンツ毎の推奨スコアを算出する。また、分類部106は、レーティングの数値を含む傾向情報を基にユーザ群をクラスタリングし、導出部107は、レーティングの数値を含む傾向情報を用いて全体傾向情報を導出し、スコア調整部109は、各コンテンツに関する推奨スコアを、レーティングの数値を含む傾向情報から導出された全体傾向情報を反映することによって調整する。
 本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G、5G、FRA(Future Radio Access)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。
 本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
 本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
 なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
 上述したパラメータに使用する名称はいかなる点においても限定的なものではない。
 本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
 本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 「含む(include)」、「含んでいる(comprising)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
 本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。
 本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
 本発明の一形態は、ユーザにおけるコンテンツの嗜好の傾向を評価する評価装置を使用用途とし、ユーザの時間帯毎のコンテンツの嗜好の傾向を反映させてコンテンツを適切に推奨することを可能にするものである。
 1…コンテンツ評価装置、10…移動通信端末、104…利用傾向格納部、105…スコア算出部、106…分類部、107…導出部、109…スコア調整部、110…決定部。

Claims (5)

  1.  複数の時間帯毎およびコンテンツの種別毎のコンテンツの嗜好の傾向を示す傾向情報を、複数のユーザ毎に記憶する嗜好傾向格納部と、
     推奨対象のユーザを対象に、複数のコンテンツ毎の推奨スコアを算出するスコア算出部と、
     前記嗜好傾向格納部に記憶された複数のユーザ毎の傾向情報を基に、前記推奨対象のユーザと傾向情報が類似するユーザ群をクラスタリングする分類部と、
     前記分類部によってクラスタリングされたユーザ群に属する所属ユーザの前記傾向情報を基に、前記所属ユーザの前記傾向情報の全体の傾向を、全体傾向情報として導出する導出部と、
     前記スコア算出部によって算出された複数のコンテンツ毎の推奨スコアに対して、対象の時間帯における前記複数のコンテンツが属するコンテンツの種別の前記全体傾向情報を反映することによって、前記複数のコンテンツ毎の推奨スコアを調整するスコア調整部と、
     前記スコア調整部によって調整された前記複数のコンテンツ毎の推奨スコアを基に、前記対象の時間帯に関して前記対象のユーザに推奨するコンテンツを決定する決定部と、
    を備える評価装置。
  2.  嗜好傾向格納部は、前記嗜好の傾向を示す前記傾向情報として、前記コンテンツの利用傾向を示す傾向情報を記憶する、
    請求項1に記載の評価装置。
  3.  前記嗜好傾向格納部は、前記傾向情報として、コンテンツの嗜好の傾向を示す数値を記憶し、
     前記分類部は、前記複数の時間帯毎および前記種別毎の前記傾向情報をベクトルに展開し、前記ベクトルが類似するユーザ群をクラスタリングする、
    請求項1又は2に記載の評価装置。
  4.  前記嗜好傾向格納部は、前記傾向情報として、コンテンツの嗜好の傾向を示す数値を記憶し、
     前記導出部は、ユーザ群に属する所属ユーザの前記傾向情報を対象に、平均値、中央値、あるいは加算値を算出して前記全体傾向情報を導出する、
    請求項1~3のいずれか1項に記載の評価装置。
  5.  前記スコア調整部は、前記推奨スコアに対して前記全体傾向情報に基づく数値を加算あるいは乗算することによって、前記推奨スコアを調整する、
    請求項1~4のいずれか1項に記載の評価装置。
PCT/JP2018/044714 2018-03-29 2018-12-05 評価装置 WO2019187358A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US16/968,347 US20200394540A1 (en) 2018-03-29 2018-12-05 Evaluation device
JP2020509627A JP6929445B2 (ja) 2018-03-29 2018-12-05 評価装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-064566 2018-03-29
JP2018064566 2018-03-29

Publications (1)

Publication Number Publication Date
WO2019187358A1 true WO2019187358A1 (ja) 2019-10-03

Family

ID=68061160

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/044714 WO2019187358A1 (ja) 2018-03-29 2018-12-05 評価装置

Country Status (3)

Country Link
US (1) US20200394540A1 (ja)
JP (1) JP6929445B2 (ja)
WO (1) WO2019187358A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461247A (zh) * 2020-04-09 2020-07-28 浙江国贸云商控股有限公司 一种特征数据处理方法及相关装置
WO2021135778A1 (zh) * 2019-12-30 2021-07-08 百果园技术(新加坡)有限公司 信息推送方法、装置、服务器和存储介质
WO2022250124A1 (ja) * 2021-05-28 2022-12-01 株式会社アルタレーナ 情報処理方法及び情報処理装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6665899B2 (ja) * 2018-08-22 2020-03-13 ダイキン工業株式会社 香り提示情報出力システム
KR102595508B1 (ko) * 2018-12-11 2023-10-31 삼성전자주식회사 전자장치 및 그 제어방법
US11212186B2 (en) * 2019-03-13 2021-12-28 Facebook, Inc. Measuring the impact of network deployments
US11792108B2 (en) * 2021-04-30 2023-10-17 Bank Of America Corporation Dynamic auto-routing and load balancing for communication systems
US20220382424A1 (en) * 2021-05-26 2022-12-01 Intuit Inc. Smart navigation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011186829A (ja) * 2010-03-09 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置、情報処理方法およびそのためのプログラム
JP2013029872A (ja) * 2009-10-19 2013-02-07 Nec Corp 情報推薦システム、方法、及び、プログラム
JP2017167906A (ja) * 2016-03-17 2017-09-21 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552596B2 (en) * 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
US20160171590A1 (en) * 2014-11-10 2016-06-16 0934781 B.C. Ltd Push-based category recommendations
US10284916B2 (en) * 2014-11-19 2019-05-07 Comcast Cable Communications, Llc Personalized menus and media content interface
US10516906B2 (en) * 2015-09-18 2019-12-24 Spotify Ab Systems, methods, and computer products for recommending media suitable for a designated style of use
US10341728B2 (en) * 2015-12-30 2019-07-02 Sling Media L.L.C. Media systems for temporally and contextually relevant recommendations
US20180089739A1 (en) * 2016-09-28 2018-03-29 International Business Machines Corporation Predicting user preferences based on olfactory characteristics

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013029872A (ja) * 2009-10-19 2013-02-07 Nec Corp 情報推薦システム、方法、及び、プログラム
JP2011186829A (ja) * 2010-03-09 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置、情報処理方法およびそのためのプログラム
JP2017167906A (ja) * 2016-03-17 2017-09-21 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021135778A1 (zh) * 2019-12-30 2021-07-08 百果园技术(新加坡)有限公司 信息推送方法、装置、服务器和存储介质
CN111461247A (zh) * 2020-04-09 2020-07-28 浙江国贸云商控股有限公司 一种特征数据处理方法及相关装置
WO2022250124A1 (ja) * 2021-05-28 2022-12-01 株式会社アルタレーナ 情報処理方法及び情報処理装置
JPWO2022250124A1 (ja) * 2021-05-28 2022-12-01
JP7311220B2 (ja) 2021-05-28 2023-07-19 株式会社アルタレーナ 情報処理方法及び情報処理装置

Also Published As

Publication number Publication date
JPWO2019187358A1 (ja) 2020-12-03
JP6929445B2 (ja) 2021-09-01
US20200394540A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
WO2019187358A1 (ja) 評価装置
US11526799B2 (en) Identification and application of hyperparameters for machine learning
Park et al. Reversed CF: A fast collaborative filtering algorithm using a k-nearest neighbor graph
US10719769B2 (en) Systems and methods for generating and communicating application recommendations at uninstall time
US9213729B2 (en) Application recommendation system
US10152479B1 (en) Selecting representative media items based on match information
CN110020122B (zh) 一种视频推荐方法、系统及计算机可读存储介质
US9811391B1 (en) Load balancing and conflict processing in workflow with task dependencies
US9449281B2 (en) Statistical machine learning
US11593860B2 (en) Method, medium, and system for utilizing item-level importance sampling models for digital content selection policies
US10504028B1 (en) Techniques to use machine learning for risk management
KR20210125590A (ko) 해싱-기반의 효과적인 사용자 모델링
CN111142968A (zh) 电子设备配置推荐处理方法、装置及存储介质
EP3167409A1 (en) Adaptive featurization as a service
Tian et al. What and how long: Prediction of mobile app engagement
US11924487B2 (en) Synthetic total audience ratings
US10853130B1 (en) Load balancing and conflict processing in workflow with task dependencies
CN109408556B (zh) 基于大数据的异常用户识别方法及装置、电子设备、介质
CN113222073B (zh) 训练广告推荐模型的方法及装置
US9811439B1 (en) Functional testing of code modifications for read processing systems
WO2021039797A1 (ja) クリック率予測モデル構築装置
US20140129694A1 (en) Evaluating information retrieval systems in real-time across dynamic clusters of evidence
CN111159515B (zh) 数据处理方法、装置及电子设备
US11665402B2 (en) Recommendation device
JP2019020979A (ja) 情報処理装置および信用度算出方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18912905

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020509627

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18912905

Country of ref document: EP

Kind code of ref document: A1