WO2016194621A1 - 情報処理装置、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理方法、及び、プログラム Download PDF

Info

Publication number
WO2016194621A1
WO2016194621A1 PCT/JP2016/064831 JP2016064831W WO2016194621A1 WO 2016194621 A1 WO2016194621 A1 WO 2016194621A1 JP 2016064831 W JP2016064831 W JP 2016064831W WO 2016194621 A1 WO2016194621 A1 WO 2016194621A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
user
presentation
unit
recommendation
Prior art date
Application number
PCT/JP2016/064831
Other languages
English (en)
French (fr)
Inventor
宮嵜 充弘
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Publication of WO2016194621A1 publication Critical patent/WO2016194621A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Definitions

  • the present technology relates to an information processing device, an information processing method, and a program.
  • the present technology relates to an information processing device, an information processing method, and a program that can present information including content that a user feels unexpected. .
  • Patent Document 1 a technique for recommending unexpected content based on a difference from a user's preference has been proposed.
  • Patent Document 1 does not discuss recommending unexpected content based on the content.
  • the present technology has been made in view of such a situation, and enables information including contents that the user feels surprising to be presented.
  • An information processing apparatus is similar to at least one of a topic and a subjective type between seed information that is extracted based on at least one of a user's preference and information accessed by the user.
  • An extraction unit that extracts low-priority information as first presentation information that is preferentially presented to the user, and a presentation control unit that controls presentation of the first presentation information.
  • the extraction unit extracts second presentation information to be presented to the user based on the user preference, and the presentation control unit associates the first presentation information with the second presentation information. Can be controlled to present.
  • the extraction unit preferentially extracts combinations having low relevance between words from among the word combinations representing the characteristics of the second presentation information, and the presentation control unit together with the second presentation information It can be controlled to present a combination of extracted words.
  • the presentation control unit can be controlled to present the first presentation information including a word selected from the presented combination of words.
  • the extraction unit can calculate the relevance between words based on the distance between vectors representing the characteristics of each word based on the importance for each of a plurality of predetermined topics.
  • the presentation control unit presents the word representing the feature of the second presentation information separately from other words and presents the first presentation information including the word selected from the word representing the feature. It can be controlled to present.
  • the extraction unit can extract information excluding the first presentation information from the information extracted based on the user's preference as the second presentation information.
  • the extraction unit can preferentially extract information having low topic similarity with the seed information from the information extracted based on the user's preference as the first presentation information. .
  • the extraction unit preferentially extracts information having low topic similarity with the seed information from the information including a word representing the characteristics of the seed information as the first presentation information. it can.
  • the extraction unit extracts the seed information based on the user's preference in the user's current context, and the user's preference in a context different from the user's current context, or the user's general Information having a low topic similarity with the seed information can be preferentially extracted as the first presentation information from the extracted information which is information extracted based on the preference.
  • the extraction unit preferentially selects information having a low topic similarity with the seed information from information including a word representing the characteristics of the seed information in the extracted information. Can be extracted as
  • the extraction unit can preferentially extract information different from the seed information and the subjective type as the first presentation information from information including words representing the characteristics of the seed information.
  • the extraction unit can preferentially extract information with high user preference as the seed information.
  • the extraction unit can preferentially extract information that is close to the present time when the user accesses as the seed information.
  • the extraction unit calculates a topic similarity between the seed information and target information based on a distance between vectors representing information features based on probabilities belonging to a plurality of predetermined topics. Can be made.
  • a program according to an aspect of the present technology has a similarity between at least one of a topic and a subjective type between the user's preference and seed information that is extracted based on at least one of information accessed by the user.
  • a computer is caused to execute processing including an extraction step of extracting low information as first presentation information to be preferentially presented to the user, and a presentation control step of controlling presentation of the first presentation information.
  • the similarity between at least one of the topic and the subjective type is low between the user's preference and the seed information that is extracted based on at least one of the information accessed by the user.
  • Information is extracted as first presentation information to be preferentially presented to the user, and presentation of the first presentation information is controlled.
  • 1 is a block diagram illustrating an embodiment of an information processing system to which the present technology is applied. It is a block diagram which shows the structural example of the function of a server. It is a block diagram which shows the structural example of the function of a client. It is a flowchart for demonstrating an information acquisition process. It is a flowchart for demonstrating an information analysis process. It is a flowchart for demonstrating an information presentation process. It is a flowchart for demonstrating recommendation information extraction processing. It is a flowchart for demonstrating 1st Embodiment of unexpectedness recommendation information extraction processing. It is a figure which shows the relationship of each information in 1st Embodiment of an unexpectedness recommendation information extraction process.
  • Embodiment 2 modes for carrying out the present technology (hereinafter referred to as embodiments) will be described. The description will be given in the following order. 1. Embodiment 2. FIG. Modified example
  • FIG. 1 shows an embodiment of an information processing system 1 to which the present technology is applied.
  • the information processing system 1 is configured to include a server 11 and clients 12-1 to 12-n.
  • the server 11 and the clients 12-1 to 12-n are connected to each other via the network 13 and communicate with each other.
  • the communication method of the server 11 and the clients 12-1 to 12n can adopt any communication method regardless of wired or wireless.
  • the server 11 provides a search / recommendation service for searching and recommending various information and objects to users who use the clients 12-1 to 12-n. Further, the server 11 provides the clients 12-1 to 12-n with application programs (hereinafter referred to as a search / recommendation service APP) necessary for using the search / recommendation service, as necessary.
  • a search / recommendation service APP application programs
  • the clients 12-1 to 12-n are used when each user uses a search / recommendation service provided by the server 11, for example.
  • the clients 12-1 to 12-n may be of any embodiment as long as they can use the search / recommendation service.
  • the clients 12-1 to 12-n are smartphones, tablets, mobile phones, portable information terminals such as notebook personal computers, wearable devices, desktop personal computers, game machines, video playback devices, music playback devices, etc. Consists of.
  • the wearable device for example, various types such as a glasses type, a watch type, a bracelet type, a necklace type, a neckband type, an earphone type, a headset type, and a head mount type can be adopted.
  • information to be searched, recommended, presented, etc. mainly refers to articles.
  • information to be presented to the user is not limited to articles.
  • clients 12-1 to 12-n are simply referred to as clients 12 when there is no need to distinguish them individually.
  • FIG. 2 shows a configuration example of functions of the server 11.
  • the server 11 is configured to include an information collection module 111, an information editing module 112, a language analysis module 113, a topic analysis module 114, a relevance analysis module 115, an information personalization module 116, and an information integration module 117.
  • the information collection module 111 is configured to include an input unit 121, an information collection unit 122, a display unit 123, and a storage unit 124.
  • the information collection unit 122 is configured by, for example, a processor.
  • the information collection unit 122 collects information to be presented to the user from another server (not shown) or the like via the network 13 and supplies information related to the collected information to the management unit 191 of the information integration module 117.
  • the display unit 123 includes, for example, a display, and displays a screen for using the information collection module 111.
  • the storage unit 124 is configured by a storage device, for example, and stores data and the like necessary for the processing of the information collection unit 122.
  • the information editing module 112 includes an input unit 131, an information editing unit 132, a display unit 133, and a storage unit 134.
  • the input unit 131 includes various input devices such as a keyboard, a mouse, a button, a switch, a pointing device, and a microphone.
  • the input unit 131 is used, for example, for inputting commands and data to the information editing module 112 and supplies the input commands and data to the information editing unit 132.
  • the information editing unit 132 is configured by, for example, a processor.
  • the information editing unit 132 acquires information related to information collected by the information collection module 111 from the management unit 191 and performs information editing.
  • the information editing is, for example, excluding malicious information or information on a website having a security problem, or selecting information that is preferentially recommended to the user.
  • the information editing unit 132 supplies information indicating the result of information editing to the management unit 191.
  • the display unit 133 is configured by, for example, a display and displays a screen for using the information editing module 112.
  • the storage unit 134 is configured by a storage device, for example, and stores data and the like necessary for the processing of the information editing unit 132.
  • the information acquisition module 101 includes the information collection module 111 and the information editing module 112.
  • the language analysis module 113 is configured to include a language analysis unit 141 and a storage unit 142.
  • the storage unit 142 is constituted by a storage device, for example, and stores data and the like necessary for the processing of the language analysis unit 141.
  • the topic analysis module 114 is configured to include a topic analysis unit 151 and a storage unit 152.
  • the topic analysis unit 151 includes, for example, a processor.
  • the topic analysis unit 151 obtains the result of language analysis of each information from the management unit 191 and performs topic analysis of each information based on the result of language analysis.
  • the topic analysis unit 151 supplies the result of topic analysis of each information to the management unit 191.
  • the storage unit 152 is configured by a storage device, for example, and stores data and the like necessary for the processing of the topic analysis unit 151.
  • the relevance analysis module 115 is configured to include a relevance analysis unit 161 and a storage unit 162.
  • the relevance analysis unit 161 includes, for example, a processor.
  • the relevance analysis unit 161 acquires the result of topic analysis of each information from the management unit 191 and analyzes the relevance between pieces of information based on the result of topic analysis.
  • the relevance analysis unit 161 analyzes the relevance between words appearing in each piece of information based on the result of topic analysis of each piece of information.
  • the relationship analysis unit 161 supplies the analysis result of the relationship between each piece of information and the analysis result of the relationship between each word to the management unit 191.
  • the storage unit 162 is configured by a storage device, for example, and stores data and the like necessary for the processing of the relevance analysis unit 161.
  • the language analysis module 113, the topic analysis module 114, and the relevance analysis module 115 constitute the analysis unit 102.
  • the information personalization module 116 is configured to include an extraction unit 171, a learning unit 172, and a storage unit 173.
  • the extraction unit 171 and the learning unit 172 are configured by, for example, a processor.
  • the extraction unit 171 extracts information to be presented to each user.
  • the extraction unit 171 is configured to include a search unit 181 and a recommendation unit 182.
  • the recommendation unit 182 acquires the learning result of each user's preference from the management unit 191. And the recommendation part 182 extracts the information recommended to each user based on the acquired data. The recommendation unit 182 supplies information indicating information recommended to each user to the management unit 191.
  • the learning unit 172 learns each user's preference. For example, the learning unit 172 acquires the presentation information history of each user and the results of language analysis and topic analysis of each information from the management unit 191. The learning unit 172 learns the preference for each user's information based on the acquired data and the like. The learning unit 172 supplies the learning result of each user's preference to the management unit 191.
  • the information personalization module 116 constitutes the presentation information extraction unit 103.
  • the information integration module 117 is configured to include a management unit 191, a presentation control unit 192, a user information acquisition unit 193, a communication unit 194, and a storage unit 195.
  • the management unit 191, the presentation control unit 192, and the user information acquisition unit 193 are configured by, for example, a processor.
  • the management unit 191 controls, for example, the processing of each module and the exchange of data and the like between the modules.
  • the management unit 191 stores data acquired from each module, the presentation control unit 192, and the user information acquisition unit 193 in the storage unit 195, and stores data stored in the storage unit 195 in each module and To the presentation control unit 192.
  • the presentation control unit 192 transmits data and the like for presenting information to the user to each client 12 via the communication unit 194 and the network 13, and controls the presentation of information in each client 12.
  • the user information acquisition unit 193 receives user information about each user from each client 12 via the network 13 and the communication unit 194.
  • the user information includes, for example, user operation information indicating the operation content for the user search / recommendation service, user reaction analysis information indicating the analysis result of the user's response to the presented information, user context information regarding the user context, and the like. .
  • the user information acquisition unit 193 supplies the received user information to the management unit 191.
  • FIG. 3 shows a functional configuration example of the client 12.
  • the client 12 is configured to include an information presentation module 201, a reaction detection module 202, a context detection module 203, and an information integration module 204.
  • the information presentation module 201 is a module that controls the presentation of information in the search / recommendation service.
  • the information presentation module 201 is configured to include an input unit 211, a control unit 212, a presentation unit 213, and a storage unit 214.
  • the input unit 211 includes various input devices such as a keyboard, a mouse, a button, a switch, a pointing device, and a microphone.
  • the input unit 211 is used, for example, for inputting commands and data to the information presentation module 201 and supplies the input commands and data to the control unit 212.
  • the control unit 212 includes, for example, a processor.
  • the control unit 212 controls search / recommendation service processing in the client 12.
  • the control unit 212 receives data or the like transmitted from the server 11 via the network 13 or the like, and controls the presentation of information to the user in the presentation unit 213 based on the received data or the like.
  • the control unit 212 supplies user operation information indicating the content of the user operation input by the user using the input unit 211 to the management unit 241 of the information integration module 204.
  • the presentation unit 213 includes, for example, a display device, an audio output device, and the like. Under the control of the control unit 212, the presentation unit 213 displays a screen for using the information presentation module 201, outputs audio, and the like.
  • the storage unit 214 is configured by a storage device, for example, and stores data and the like necessary for the processing of the control unit 212.
  • the reaction detection module 202 is a module that detects a user reaction to information presented in the search / recommendation service.
  • the reaction detection module 202 is configured to include an input unit 221, a detection unit 222, a reaction analysis unit 223, and a storage unit 224.
  • the input unit 221 includes various input devices such as a keyboard, a mouse, a button, a switch, a pointing device, and a microphone.
  • the input unit 211 is used, for example, for inputting commands, data, and the like to the reaction detection module 202 and for inputting user feedback for information presented in the information presentation module 201.
  • the input unit 211 supplies the input command, data, and the like to the reaction analysis unit 223.
  • the detection unit 222 includes, for example, a voice recognition device, an image recognition device, a biological information sensor, and the like.
  • the detection unit 222 detects information indicating a user's reaction to the information presented in the information presentation module 201 and supplies the detected information to the reaction analysis unit 223.
  • the reaction analysis unit 223 Based on the user feedback input by the input unit 221 and the information indicating the user response detected by the detection unit 222, the reaction analysis unit 223 performs a user response to the information presented in the information presentation module 201. To analyze. The reaction analysis unit 223 generates user reaction analysis information indicating the analysis result of the user's reaction, and supplies it to the management unit 241 of the information integration module 204.
  • the storage unit 224 is configured by a storage device, for example, and stores data and the like necessary for the processing of the reaction analysis unit 223.
  • the context detection module 203 is a module that detects a user's context.
  • the user's context includes, for example, the user's own state and situation, and the user's surrounding state and situation.
  • the user state and situation include, for example, user attributes, behavior, posture, emotion, physical condition, the type of client 12 used by the user, and the like.
  • the user's attributes include, for example, the user's name, sex, age, nationality, address, occupation, hobby, special skill, personality, physical characteristics, and the like.
  • the state and situation around the user include, for example, date and time, place, weather, temperature, ambient brightness, ambient sound, ambient odor, people and objects around the user, and the like.
  • the context detection module 203 is configured to include, for example, an input unit 231, a detection unit 232, a context analysis unit 233, and a storage unit 214.
  • the input unit 231 includes various input devices such as a keyboard, a mouse, a button, a switch, a pointing device, and a microphone.
  • the input unit 231 is used, for example, for inputting commands and data to the context detection module 203, and supplies the input commands and data to the context analysis unit 233.
  • the detection unit 232 includes, for example, various devices that detect data related to the user's context.
  • the detection unit 232 includes a radio clock, a GPS (Global Positioning System) receiver, a voice recognition device, an image recognition device, various sensors, and the like.
  • Various sensors include, for example, an optical sensor, an image sensor, a speed sensor, an acceleration sensor, an angular velocity sensor, a magnetic sensor, a temperature sensor, a humidity sensor, a biological information sensor, and the like.
  • the detection unit 232 includes, for example, a communication device and acquires data related to the user's context from an external device or sensor. Furthermore, the detection unit 232 acquires data related to the user's context from a service or application program other than the search / recommendation service APP being executed by the client 12, for example.
  • the service and application program include, for example, SNS (Social Networking Service), scheduler, and the like.
  • the data related to the user's context acquired by the detection unit 232 includes, for example, data related to a location around the user (for example, POI (Point Of Interest) data, etc.), data related to the user's behavior, and the person with whom the user is together. Data on the user, data on the user's schedule, and the like.
  • the detection unit 232 supplies data regarding the detected or acquired user context to the context analysis unit 233.
  • the context analysis unit 233 analyzes the user's context based on the data from the detection unit 232.
  • the context analysis unit 233 supplies user context information indicating the analysis result of the user's context to the management unit 241 of the information integration module 204.
  • the storage unit 234 is constituted by a storage device, for example, and stores data and the like necessary for the processing of the context analysis unit 233.
  • the information integration module 204 is configured to include a management unit 241, a communication unit 242, and a storage unit 243.
  • the management unit 241 is configured by, for example, a processor. For example, the management unit 241 controls processing of each module and controls exchange of data and the like between the modules. In addition, the management unit 241 supplies data acquired from each module to the communication unit 242 or stores the data in the storage unit 243. Further, the management unit 241 supplies the data acquired from the communication unit 242 to each module or stores the data in the storage unit 243. In addition, the management unit 241 supplies data and the like stored in the storage unit 243 to each module and the communication unit 242.
  • the communication unit 242 is configured by a communication device, for example, and communicates with the server 11 via the network 13.
  • the storage unit 243 is configured by a storage device, for example, and stores data and the like necessary for the processing of the entire client 12.
  • this process is periodically executed, for example, once a day or once an hour.
  • this process is executed, for example, according to a command from a search / recommendation service administrator (hereinafter referred to as a service administrator).
  • step S1 the server 11 collects information.
  • the information collection unit 122 of the information collection module 111 crawls a website providing RSS information (hereinafter referred to as an RSS site) via the network 13.
  • the information collection unit 122 supplies information related to new arrival information and update information (hereinafter referred to as new arrival / update related information) of each RSS site obtained as a result of crawling to the management unit 191 of the information integration module 117.
  • the management unit 191 stores the acquired new arrival / update related information in the storage unit 195.
  • new arrival / update related information includes metadata of each information.
  • the metadata of each information includes, for example, the title of the information, the text of the information, the date of issue, the date of update, the URL of the web page on which the information is posted, the language used, and the like.
  • step S2 the server 11 performs information editing.
  • the management unit 191 supplies the new arrival / update related information acquired in the process of step S ⁇ b> 1 to the information editing unit 132 of the information editing module 112.
  • the information editing unit 132 extracts problematic information from the information included in the new arrival / update related information and registers it in the black list.
  • the problematic information is, for example, malicious information or information on a website having a security problem.
  • this blacklist registration process may be performed manually by hand, or may be automatically executed by the information editing unit 132.
  • the service manager selects information to be registered in the black list.
  • the information editing unit 132 automatically selects information to be registered in the black list using a learning model or the like.
  • the information editing unit 132 selects information that is preferentially recommended to the user from newly arrived information and update information in accordance with a command input via the input unit 131 by the service administrator, for example, and displays the information in the pickup list. sign up.
  • the information editing unit 132 supplies the black list and the pickup list to the management unit 191.
  • the management unit 191 stores the black list and the pickup list in the storage unit 195.
  • step S3 the management unit 191 of the information integration module 117 registers analysis target information. Specifically, the management unit 191 registers information other than information registered in the black list among the new arrival information and update information in the analysis target information.
  • Information analysis processing executed by the server 11 will be described with reference to the flowchart of FIG. Note that this process is periodically executed, for example, once a day or once an hour. Alternatively, this process is executed after the information acquisition process described above with reference to FIG. Alternatively, this process is executed according to a command from a service manager, for example.
  • step S51 the server 11 performs language analysis of the analysis target information.
  • the language analysis unit 141 of the language analysis module 113 acquires the metadata of the analysis target information from the storage unit 195 via the management unit 191.
  • the language analysis unit 141 performs, for example, a morphological analysis of the title and text of each piece of analysis target information using a word dictionary stored in advance in the storage unit 142, and extracts words from the title and text of each piece of information.
  • the total number of pieces of analysis target information is N
  • words w or words when it is not necessary to individually distinguish the words w i, they are simply referred to as words w or words, and when it is not necessary to distinguish the information d j, they are simply referred to as information d or information.
  • the language analysis unit 141 calculates tfidf i, j of each word w i in each information d j according to the following equation (1).
  • the language analysis unit 141 generates a word vector AWV j including the weight of each word w i in each information d j according to the following equation (2).
  • AWV j ⁇ tfidf 1, j , tfidf 2, j ,..., Tfidf M, j ⁇ ... (2)
  • the word vector AWV j is a feature vector that represents the feature of each information d j based on the weight of each word w i . Therefore, it can be said that the word w i having a larger tfidf i, j in the word vector AWV j is a word that more significantly represents the characteristics of the information d j .
  • step S52 the server 11 performs topic analysis.
  • the management unit 191 supplies the language analysis result of the analysis target information to the topic analysis unit 151 of the topic analysis module 114.
  • the topic analysis unit 151 uses topic analysis of information to be analyzed using a probabilistic topic model such as PLSA (Probabilistic Latent Semantic Analysis) or LDA (Latent Dirichlet Allocation). I do.
  • PLSA Probabilistic Latent Semantic Analysis
  • LDA Latent Dirichlet Allocation
  • the topic analysis unit 151 receives tf i, j and tfidf i, j which are language analysis results of the analysis target information , and the number K of topics (clusters) to be classified, and is expressed by the following equation (3).
  • d j ) of each information d j to each topic z k (k 1, 2,..., K) and each word in each topic z k to calculate the
  • d j ) is the occurrence probability of the word w i in the information d j .
  • the topic analysis unit 151 generates a topic vector ATV j composed of the topic attribution probability p (z k
  • ATV j ⁇ p (z 1
  • topic vector ATV j of each information d j is the feature vector representing the characteristics of each information d j based on the probability of belonging to each topic z k. Therefore, it can be said that the topic z k having a larger p (z k
  • the topic analysis unit 151 performs topic analysis of each word. For example, the topic analysis unit 151 generates a topic vector WTV i composed of the topic attribution probabilities of each word w i to each topic z k according to the following equation (5).
  • topic vector WTV i of each word w i as weights tfidf i, j of each word w i of each information d j, Some weighted sum topics vector ATV j of each information d j.
  • the topic vector WTV i is a feature vector that represents the feature of each word w i based on the probability belonging to each topic z k . Therefore, the topic vector WTV i in larger the value of the topic z k, severity higher topic word w i (e.g., word w i is the topic indicating a feature of topics more remarkably) can be said to be.
  • the topic analysis unit 151 supplies the topic analysis result to the management unit 191, and the management unit 191 stores the topic analysis result in the storage unit 195.
  • the topic analysis result includes a topic vector ATV j of each analysis target information and a topic vector WTV i of each word.
  • topics of the same genre can be classified in more detail.
  • economic topics can be classified into stock topics, specialized topics, introductory topics, and the like.
  • topic z k when it is not necessary to distinguish the topics z k individually, they are simply referred to as topics z or topics. Further, hereinafter, when it is not necessary to individually distinguish the word vector AWV j , the topic vector ATV j , and the topic vector WTV i , they are simply referred to as a word vector AWV, a topic vector ATV, and a topic vector WTV, respectively.
  • d j ) when it is not necessary to individually distinguish the topic attribution probability p (z k
  • step S53 the server 11 performs relevance analysis. Specifically, the management unit 191 supplies the topic analysis result to the relationship analysis unit 161 of the relationship analysis module 115.
  • the relevance analysis unit 161 calculates the relevance between the pieces of analysis target information. For example, the association analysis unit 161, relevance rel (d i, d j) of the information d i and the information d j as, between the topic vector ATV j topic vector ATV j and information d j information d i Calculate cosine distance. Therefore, the relevance rel (d i , d j ) increases as the similarity between the topics of the information d i and the information d j increases, and decreases as the similarity decreases.
  • the relevance analysis unit 161 calculates the relevance level between all words appearing in the analysis target information. For example, the association analysis unit 161, a word w i and word w j of relevance rel (w i, w j) as, between the topic vector WTV j topic vector WTV i and word w j of word w i Calculate cosine distance. Therefore, relevance rel (w i, w j) is, the higher the topic of the degree of similarity between the high importance information of high importance of word w i information and the word w j becomes larger, the lower the degree of similarity Get smaller.
  • step S54 the management unit 191 of the information integration module 117 registers the browsing target information. Specifically, the management unit 191 sets each analysis target information together with metadata of each information, a word vector AWV j , a topic vector ATV j , a relevance rel (d i , d j ), and a topic with the maximum attribution probability. And register as browsing object information.
  • the topic with the maximum attribution probability is a topic having the maximum topic attribution probability p (z k
  • the number of topic classifications (hereinafter referred to as the total number of topics) K is 10, and the value of the topic vector ATV 1 of the information d 1 is ⁇ 0.2, 0.4, 0.8, 0.1, 0. .3, 0.5, 0.1, 0.1, 0.3, 0.6 ⁇ , the topic with the maximum attribution probability of the information d 1 is the topic z 3 . That is, it is predicted that the information d 1 has the highest probability of belonging to the topic z 3 and contains the most content related to the topic z 3 .
  • Information presentation process Next, information presentation processing executed by the information processing system 1 will be described with reference to the flowchart of FIG.
  • the user uses the input unit 211 of the information presentation module 201 of the client 12 to operate the search / recommendation service provided by the server 11 (for example, start of the search / recommendation service APP). It starts when an operation is performed.
  • the search / recommendation service provided by the server 11 (for example, start of the search / recommendation service APP). It starts when an operation is performed.
  • step S101 the control unit 212 of the information presentation module 201 of the client 12 determines whether to wait for a user operation. If it is determined to wait for a user operation, the process proceeds to step S102.
  • step S102 the information processing system 1 acquires user operation information. Specifically, when the user of interest performs a predetermined operation on the search / recommendation service using the input unit 211 of the information presentation module 201 of the client 12, the input unit 211 displays information indicating the operation content in the control unit 212. To supply.
  • the predetermined operation for the search / recommendation service for example, an operation for starting or updating the presentation of information by the search / recommendation service or an operation for ending the search / recommendation service is assumed. Also, for example, an operation for setting search conditions for information such as inputting a search query, setting a period (date and time) for searching information, setting a language used for information, and selecting an RSS site to distribute information is assumed. Is done. An operation indicating a reaction to the presented information is detected in step S112 described later.
  • the control unit 212 generates user operation information indicating the operation content of the user of interest.
  • the control unit 212 transmits the generated user operation information to the server 11 via the management unit 241, the communication unit 242, and the network 13.
  • the user information acquisition unit 193 of the information integration module 117 of the server 11 receives the user operation information transmitted from the client 12 via the communication unit 194 and supplies it to the management unit 191.
  • the management unit 191 supplies the acquired user operation information to each module as necessary.
  • step S103 the context analysis unit 233 of the context detection module 203 of the client 12 determines whether to detect the user's context. If it is determined that the user context is detected, the process proceeds to step S104.
  • the context analysis unit 233 analyzes the current user's context based on the acquired data. Then, the context analysis unit 233 classifies the current user's context according to a predetermined classification method as necessary.
  • the type of the client 12 used by the user of interest is classified into a wearable device, a smartphone, a tablet, or a personal computer.
  • the current day of the week is classified as a weekday or holiday.
  • the current time zone is classified as morning, noon or night.
  • the place where the user of interest is located is classified into a home, a company, a vehicle (for example, a train, etc.), or a place to go.
  • the current attention user behavior is classified as standing, sitting, or walking.
  • the context analysis unit 233 detects, for example, whether the target user is one person or another person based on an image obtained by photographing the periphery of the target user. Moreover, the context analysis part 233 specifies the person who is together, for example using techniques, such as face recognition, when an attention user is with another person. Alternatively, the context analysis unit 233 detects a person who is with the user of interest based on information from an application program such as SNS, for example.
  • the context analysis unit 233 generates user context information indicating the current context of the user of interest, and transmits the user context information to the server 11 via the management unit 241, the communication unit 242, and the network 13.
  • the user information acquisition unit 193 of the information integration module 117 of the server 11 receives the user context information transmitted from the client 12 via the communication unit 194 and supplies it to the management unit 191.
  • the management unit 191 supplies the acquired user context information to each module as necessary, or causes the storage unit 195 to store the acquired user context information.
  • step S104 determines whether the user's context is detected. If it is determined in step S103 that the user's context is not detected, the process of step S104 is skipped, and the process proceeds to step S105.
  • step S105 the search unit 181 of the information personalization module 116 of the server 11 determines whether to search for information to be presented to the user. If it is determined to search for information to be presented to the user, the process proceeds to step S106.
  • step S106 the search unit 181 searches for information to be presented to the user. Specifically, the search unit 181 acquires browsing target information from the storage unit 195 via the management unit 191. Then, for example, the search unit 181 searches the browsing target information for information that matches the search condition specified by the user of interest. The search unit 181 supplies information indicating the search result to the management unit 191, and the management unit 191 stores information indicating the search result in the storage unit 195.
  • search information the article searched in the process of step S106 is referred to as search information.
  • step S105 determines that information to be presented to the user is not searched. If it is determined in step S105 that information to be presented to the user is not searched, the process of step S106 is skipped, and the process proceeds to step S107.
  • step S107 the recommendation unit 182 of the information personalization module 116 of the server 11 determines whether or not to recommend information to the user. If it is determined to recommend information to the user, the process proceeds to step S108.
  • step S108 the recommendation unit 182 executes recommendation information extraction processing.
  • the details of the recommendation information extraction processing will be described with reference to the flowchart of FIG.
  • step S151 the recommendation unit 182 determines whether or not to recommend unexpectedness recommendation information. Specifically, the recommendation unit 182 acquires the presentation information history of the user of interest from the storage unit 195 via the management unit 191. Then, the search unit 181 determines whether to recommend the unexpectedness information based on the presentation information history of the attention user.
  • the recommendation unit 182 determines that the unexpectedness information is recommended when the user of interest frequently accesses the unexpectedness recommendation information, and determines that the unexpectedness information is not recommended when the user does not access much. Note that whether or not the unexpectedness recommendation information is frequently accessed is determined based on, for example, the number of accesses to the unexpectedness recommendation information of the user of interest within the most recent predetermined period.
  • the recommendation unit 182 determines that the unexpectedness information is recommended when the user of interest shows a positive response to the unexpectedness recommendation information, and when the notable user does not show a positive reaction, the recommendation information Is determined not to be recommended.
  • whether or not a positive reaction is shown with respect to the unexpectedness recommendation information is, for example, the number of times or the ratio of the attention user showing a positive response with respect to the unexpectedness recommendation information within the most recent predetermined period, etc. It is determined based on.
  • step S152 when it determines with not recommending unexpected recommendation information, a process progresses to step S152.
  • WPV is a vector indicating the user's preference for the word
  • TPV is a vector indicating the user's preference for the topic.
  • the recommendation unit 182 calculates the similarity between the general WPV of the target user and the word vector AWV of each browsing target information, and the general TPV of the target user and the topic vector ATV of each browsing target information. Based on at least one of the similarities between them, a normal recommendation score for each browsing target information is calculated.
  • the similarity between vectors is calculated by, for example, a cosine distance, and the normal recommendation score increases as the similarity between vectors increases.
  • the recommendation unit 182 extracts information with a high normal recommendation score from the browsing target information as normal recommendation information. For example, the recommendation unit 182 extracts, as normal recommendation information, information with a normal recommendation score of the top A from the browsing target information. Thereby, information with a high preference degree of an attention user is extracted preferentially as normal recommendation information.
  • step S151 if it is determined in step S151 that the recommendation recommendation information is recommended, the process proceeds to step S154.
  • step S154 the recommendation unit 182 selects a method for extracting unexpected recommendation information. As will be described later, there are a plurality of methods for extracting the unexpectedness recommendation information. Therefore, the recommendation unit 182 selects one from a plurality of extraction methods.
  • the recommendation unit 182 randomly selects one from a plurality of extraction methods.
  • the recommendation unit 182 selects an extraction method based on the user's preference. For example, the recommendation unit 182 acquires the total result of the unexpectedness recommendation information reaction distribution of the attention user from the storage unit 195 via the management unit 191. And the recommendation part 182 weights with respect to each kind of unexpected recommendation information based on the frequency
  • the recommendation part 182 selects the kind of unexpected recommendation information recommended to an attention user according to the set weight. That is, the higher the weight, the higher the probability of selection, and the lower the weight, the lower the probability of selection. Then, the recommendation unit 182 selects an extraction method used for extracting the selected type of unexpectedness recommendation information.
  • step S155 the recommendation unit 182 executes the unexpected recommendation information extraction process, and the recommendation information extraction process ends.
  • the unexpectedness recommendation information extraction processing will be described with reference to FIGS.
  • FIG. 8 is a flowchart for explaining the first embodiment of the unexpectedness recommendation information extraction processing.
  • FIG. 9 is a diagram illustrating the relationship between each piece of information.
  • step S201 the normal recommendation score of each browsing target information is calculated in the same manner as the processing in step S152 in FIG.
  • the recommendation unit 182 extracts information having a high normal recommendation score from the browsing target information as the normal recommendation target information. For example, the recommendation unit 182 extracts information with a normal recommendation score of the top A from the browsing target information as normal recommendation target information.
  • the recommendation unit 182 extracts information having a particularly high normal recommendation score from the normal recommendation target information as relevance seed information. For example, the recommendation unit 182 extracts information having a normal recommendation score of the top S from the normal recommendation target information as relevance seed information. Thereby, information with a particularly high preference degree of the attention user is preferentially extracted as relevance seed information.
  • step S204 the recommendation unit 182 sets information obtained by removing the relevance seed information from the normal recommendation target information as the surprising target information.
  • step S205 the recommendation unit 182 performs topic analysis of the relevance seed information.
  • the recommendation unit 182 calculates the relevance seed topic vector STV according to the following equation (6).
  • the relevance seed topic vector STV is a feature vector that represents general characteristics of relevance seed information based on the probability of belonging to each topic z k .
  • the relevance seed topic vector STV represents the general topic trend of relevance seed information.
  • the recommendation unit 182 extracts information having a low seed recommendation score from the surprising target information as the unexpected recommendation information. For example, the recommendation unit 182 extracts information with a seed recommendation score of lower B items from the unexpectedness target information as unexpectedness recommendation information. Thereby, the information regarding the topic with low similarity to the topic of the relevance seed information among the unexpectedness target information is preferentially extracted as the unexpectedness recommendation information.
  • step S208 the recommendation unit 182 sets information obtained by removing the unexpected recommendation information from the normal recommendation target information as normal recommendation information.
  • the recommendation unit 182 supplies information indicating the extraction result of the normal recommendation information and the unexpected recommendation information to the management unit 191, and the management unit 191 stores the information indicating the extraction result in the storage unit 195.
  • information having a low topic similarity (relevance) with information (relevance seed information) having a particularly high preference degree of the attention user among information having a high preference degree of the attention user. are preferentially extracted as unexpected recommendation information.
  • information obtained by removing unexpected recommendation information from information (normal recommendation target information) having a high preference level of the user of interest is extracted as normal recommendation information.
  • the relevance seed information is mainly information related to sports.
  • the unexpectedness recommendation information is information related to topics other than sports and is centered on information that matches the interest of the user of interest. Therefore, as will be described later, by recommending the normal recommendation information and the unexpectedness target information, information on a wide range of topics can be presented to the attention user.
  • FIG. 10 is a flowchart for explaining the second embodiment of the unexpectedness recommendation information extraction process.
  • FIG. 11 is a diagram illustrating the relationship between each piece of information.
  • step S251 the normal recommendation score of each browsing target information is calculated in the same manner as the processing in step S152 in FIG.
  • step S252 as in the process of step S153 in FIG. 7, information having a high normal recommendation score is extracted from the browsing target information as normal recommendation information.
  • step S253 information having a particularly high normal recommendation score is extracted as relevance seed information from the normal recommendation information by the same processing as in step S203 of FIG.
  • step S254 the recommendation unit 182 sets information obtained by removing the relevance seed information from the browsing target information as the surprising target information.
  • step S255 the recommendation unit 182 performs word analysis of the relevance seed information.
  • the recommendation unit 182 calculates the relevance seed word vector SWV according to the following equation (7).
  • the relevance seed word vector SWV is a feature vector that represents general characteristics of the relevance seed information based on the weight of each word in each piece of information included in the relevance seed information. In other words, the relevance seed word vector SWV represents the importance of each word in the relevance seed information.
  • step S256 the recommendation unit 182 extracts an important word representing the feature of the relevance seed information as a relevance seed word group. For example, the recommendation unit 182 extracts the top W words having tfidf in the relevance seed word vector SWV as relevance seed word groups.
  • step S257 the recommendation unit 182 excludes information that does not include any related seed word group from the unexpectedness target information. Thereby, information in which no word included in the relevance seed word group appears is excluded from the unexpectedness target information.
  • steps S258 to S260 processing similar to that in steps S205 to S207 in FIG. 8 is executed.
  • the recommendation unit 182 supplies information indicating the extraction result of the normal recommendation information and the unexpected recommendation information to the management unit 191, and the management unit 191 stores the information indicating the extraction result in the storage unit 195. .
  • This second embodiment differs from the first embodiment in the extraction method of normal recommendation information and unexpected recommendation information. That is, information with a high preference level of the noted user is preferentially extracted as normal recommendation information. Further, among the information including important words representing the characteristics of the information (relevance seed information) that has a particularly high preference level of the user of interest, there is information having a low topic similarity (relevance) with the relevance seed information. , It is preferentially extracted as unexpectedness recommendation information.
  • the relevance seed information is mainly information related to sports.
  • the relevance seed word group is centered on sports-related words.
  • recommendation information For example, music information related to the support song of soccer player A, business information analyzing the management of baseball team B, and the like are extracted as unexpected recommendation information.
  • FIG. 12 is a flowchart for explaining a third embodiment of the unexpectedness recommendation information extraction process.
  • FIG. 13 is a diagram illustrating a relationship between pieces of information.
  • the recommendation unit 182 extracts information accessed most recently by the user as relevance seed information. For example, the recommendation unit 182 extracts the latest S items of information accessed by the target user in the past as relevance seed information. Alternatively, for example, the recommendation unit 182 extracts information accessed by the user of interest within the most recent predetermined period as relevance seed information. As a result, information that is close to the present time when the target user accessed is preferentially extracted as relevance seed information.
  • the information accessed by the target user includes, for example, information that the target user has presented to the client 12 by his / her own operation, and information that is displayed by the target user without being operated by the target user.
  • the indicated information (for example, information that has been input) is included.
  • the third embodiment differs from the first embodiment only in the method of extracting relevance seed information.
  • information accessed most recently by the target user is extracted as relevance seed information.
  • information having a low topic similarity with information (relevance seed information) accessed most recently by the focused user among information having a high preference level of the focused user is preferential. Is extracted as unexpected recommendation information.
  • information on a topic that matches the attention user's preference is extracted as unexpected recommendation information, although the topic is different from the topic that the attention user has recently been interested in.
  • information that is related to the user's preference is extracted preferentially as unexpectedness recommendation information as information related to topics other than the economy.
  • FIG. 14 is a flowchart for explaining a fourth embodiment of the unexpectedness recommendation information extraction process.
  • FIG. 15 is a diagram illustrating a relationship between pieces of information.
  • step S253 in FIG. 10 information with a particularly high normal recommendation score is extracted as relevance seed information from the normal recommendation target information.
  • step S353 as in the process of step S303 in FIG. 12, information most recently accessed by the user is extracted as relevance seed information.
  • the fourth embodiment differs from the second embodiment only in the method of extracting relevance seed information. That is, in the fourth embodiment, information accessed most recently by the target user is extracted as relevance seed information. Among the information including important words representing the characteristics of the information (relevance seed information) accessed most recently by the target user, information having a low topic similarity with the relevance seed information is preferentially unexpected. Extracted as sex recommendation information.
  • FIG. 16 is a flowchart for explaining a fifth embodiment of the unexpectedness recommendation information extraction process.
  • FIG. 17 is a diagram illustrating a relationship between pieces of information.
  • step S401 the recommendation unit 182 calculates a context recommendation score of each browsing target information based on the current context of the user. Specifically, the recommendation unit 182 acquires the browsing target information and the WPV and TPV of the target user from the storage unit 195 via the management unit 191.
  • step S114 not only the general WPV and TPV of the user of interest but also the WPV and TPV for each context classified according to a predetermined standard are generated.
  • weekday WPV and TPV of the user of interest and holiday WPV and TPV are generated.
  • the morning WPV and TPV, the daytime WPV and TPV, and the night time WPV and TPV of the user of interest are generated.
  • WPV and TPV at the home of the user of interest WPV and TPV at the company, WPV and TPV in the vehicle, and WPV and TPV at the outside are generated.
  • WPV and TPV when the user of interest stands, WPV and TPV when sitting, and WPV and TPV when walking are generated.
  • WPV and TPV when there is no person who is the target user WPV and TPV when the wife is, WPV and TPV when the child is, and WPV when the wife and the child are A TPV is generated.
  • the recommendation unit 182 uses the WPV and TPV corresponding to the current context of the target user among the WPV and TPV for each classification unit of these contexts, and uses the WPV corresponding to the current context of the target user (hereinafter referred to as an integrated WPV). And TPV (hereinafter referred to as integrated TPV). For example, when the attention user stands on the train on a weekday morning, the recommendation unit 182 adds the weekday WPV of the attention user, the morning WPV, the WPV in the vehicle, and the WPV when standing. Thus, an integrated WPV is generated. Similarly, the recommendation unit 182 generates an integrated TPV by adding the weekday TPV of the user of interest, the morning TPV, the TPV in the vehicle, and the TPV when standing.
  • the recommendation unit 182 when the focused user is a child at home, the recommendation unit 182 generates an integrated WPV by adding the WPV at the focused user's home and the WPV when the person being together is a child. Similarly, the recommendation unit 182 generates an integrated TPV by adding the TPV at the home of the focused user and the TPV when the person who is together is a child.
  • the recommendation unit 182 includes the similarity between the integrated WPV of the target user and the word vector of each browsing target information, and the similarity between the integrated TPV of the target user and the topic vector of each browsing target information. Based on at least one of the above, a context recommendation score for each browsing target information is calculated.
  • the similarity between vectors is calculated by, for example, a cosine distance, and the context recommendation score increases as the similarity between vectors increases.
  • the recommendation unit 182 extracts information having a high context recommendation score from the browsing target information as normal recommendation information. For example, the recommendation unit 182 extracts information having a context recommendation score of the top A from the browsing target information as normal recommendation information. As a result, information having a high preference level of the attention user in the current context is preferentially extracted as normal recommendation information.
  • the recommendation unit 182 extracts information with a particularly high context recommendation score from the normal recommendation information as relevance seed information. For example, the recommendation unit 182 extracts information having the highest context recommendation score as the relevance seed information from the normal recommendation information. Thereby, information with a particularly high preference degree of the attention user in the current context is preferentially extracted as relevance seed information.
  • the recommendation unit 182 calculates an unexpected recommendation score for each piece of browsing target information under conditions different from the user's current context. For example, the recommendation unit 182 calculates a recommendation score for each piece of browsing target information based on a context different from the current context of the user by the same process as step S401, and sets the calculated recommendation score as an unexpected recommendation score. . Or the recommendation part 182 calculates the normal recommendation score of each browsing object information similarly to the process of step S152 of FIG. 7, and makes the calculated normal recommendation score an unexpected recommendation score.
  • the recommendation unit 182 extracts information with a high unexpectedness recommendation score from the browsing target information as the unexpectedness target information. For example, the recommendation unit 182 extracts information having a T unexpectedness recommendation score among the browsing target information as the surprising target information. As a result, information having a high preference level of the focused user under conditions different from the current context is preferentially extracted as the unexpectedness target information.
  • steps S406 to S408 processing similar to that in steps S258 to S260 of the second embodiment in FIG. 10 is executed.
  • the information on the economy is usually extracted as recommended information on the morning train on weekdays.
  • the information related to music is extracted as unexpected recommendation information in the morning train on weekdays.
  • the sixth embodiment is an embodiment in which the second embodiment and the fifth embodiment are combined.
  • the method of extracting normal recommendation information is the same as that of the fifth embodiment, but the method of extracting unexpected recommendation information is different. That is, in the sixth embodiment, compared with the fifth embodiment, the unexpectedness recommendation information represents a feature of information (relevance seed information) that has a particularly high degree of preference in the context of the current user of interest. Further refined to information containing important words.
  • the information on the economy is usually extracted as recommended information on the morning train on weekdays.
  • the information on the economy is usually extracted as recommended information on the morning train on weekdays.
  • Information relating to the music event of S as a sponsor, information analyzing the economics of the music industry, and the like are extracted as unexpected recommendation information.
  • Patent Document 2 Japanese Patent Laid-Open No. 2010-272004
  • Non-Patent Document 1 Japanese Patent Laid-Open No. 2010-272004
  • Patent Document 2 “N. Kobayashi et al.,“ Opinion Mining from Web documents: Extraction and Structurization ”, Journal of Artificial Intelligence Society, Vol. .22, No.2, March 2007, pp.227-238 ”(hereinafter referred to as Non-Patent Document 1), etc.
  • Patent Document 1 Japanese Patent Laid-Open No. 2010-272004
  • Patent Document 1 Japanese Patent Laid-Open No. 2010-272004
  • the subjective information is, for example, information including subjective expressions (for example, thoughts, opinions, feelings, etc.), and corresponds to the opinion sentence in Patent Document 2.
  • the objective information is, for example, information that does not include subjective expressions but includes only objective facts, and corresponds to the non-opinion sentence of Patent Document 2.
  • the positive information is information including a positive expression, for example.
  • negative information is information including negative expressions, for example.
  • each information can be classified into three types of subjective types, that is, positive information, negative information, and objective information, using a subjective discrimination method.
  • the recommendation unit 182 classifies each relevance seed information into three subjective types of positive information, negative information, and objective information by subjective discrimination.
  • the recommendation unit 182 selects one word from the related seed word group, extracts information including the selected word from the related seed information, and classifies the extracted information according to the subjective type. Then, the recommendation unit 182 estimates that the subjective type having the largest number of information is the subjective type preferred by the attention user with respect to the information including the selected word.
  • the recommendation unit 182 performs the same processing for all the words in the relevance seed word group. Thereby, the attention user's preference with respect to the subjective type of the information containing each word is estimated for every word contained in a relevance seed word group.
  • the recommendation unit 182 selects one word from the relevance seed word group, and extracts information including the selected word from the surprising target information. Then, the recommendation unit 182 excludes, from the unexpected information, the subjective type information that matches the subjective type preferred by the attention user for the information including the selected word from the extracted information.
  • the recommendation unit 182 performs the same processing for all the words in the relevance seed word group. Thereby, the subjective type information that includes any of the related seed word groups and matches the subjective type preferred by the attention user for each word is excluded from the unexpected object information.
  • the recommendation unit 182 may exclude the relevant information from the unexpectedness target information, or may not exclude it.
  • the recommendation unit 182 includes a word in which the subjective type of the target information matches the subjective type preferred by the target user (hereinafter referred to as a subjective match word), and the subjective type of the target information and the subjective preference of the target user.
  • the number of words whose types do not match (hereinafter referred to as subjective mismatch words) is compared. For example, when the attention user likes positive information including “soccer”, likes negative information including “player A”, and likes negative information including “team B”, “soccer”, “player A” In the positive information including “Team B”, “Soccer” is a subjective match word, and “Player A” and “Team B” are subjective mismatch words.
  • the recommendation unit 182 excludes information that has more subjective match words than subjective mismatch words from the surprising target information, and does not exclude information that has subjective mismatch words more than subjective match words from the surprising target information. To do. Note that information with the same number of subjectively matched words and subjectively mismatched words may be excluded or not excluded.
  • the recommendation unit 182 extracts information having a high normal recommendation score from the unexpectedness target information as the unexpectedness recommendation information. For example, the recommendation unit 182 extracts, as unexpectedness recommendation information, information having a normal recommendation score of the top B from the unexpectedness object information. The recommendation unit 182 supplies information indicating the extraction result of the normal recommendation information and the unexpected recommendation information to the management unit 191, and the management unit 191 stores the information indicating the extraction result in the storage unit 195.
  • the method for selecting normal recommendation information is the same as that in the second embodiment, but the method for selecting unexpected recommendation information is different. That is, in the seventh embodiment, among the information having a high degree of preference of the attention user, it includes an important word representing the characteristics of the information (relevance seed information) having a particularly high degree of preference of the attention user, and the relevance Information having a subjective type different from the seed information (subjective type has a low similarity) is preferentially extracted as the unexpectedness recommendation information.
  • step S510 may be omitted. That is, information that is different from the relevance seed information and subjective type may be presented to the attention user without considering the attention user's preference.
  • step S553 is different.
  • step S503 of FIG. 20 information with a particularly high normal recommendation score is extracted from the normal recommendation information as relevance seed information.
  • the eighth embodiment differs from the seventh embodiment only in the method of extracting relevance seed information.
  • information accessed most recently by the target user is extracted as relevance seed information.
  • the eighth embodiment among the information having a high degree of preference of the attention user, it includes an important word representing the characteristics of the information (relevance seed information) accessed most recently by the attention user, and the relevance seed Information having a subjective type different from information is preferentially extracted as unexpectedness recommendation information.
  • step S550 can be omitted. That is, information that is different from the relevance seed information and subjective type may be presented to the attention user without considering the attention user's preference.
  • recommendation information information extracted as information recommended to the user in the recommendation information extraction process in step S108 is collectively referred to as recommendation information. That is, the recommendation information always includes normal recommendation information and may include unexpected recommendation information.
  • step S107 if it is determined in step S107 that information is not recommended to the user, the process of step S108 is skipped, and the process proceeds to step S109.
  • step S109 the presentation control unit 192 of the information integration module 117 of the server 11 determines whether to present information to the user. If it is determined to present information to the user, the process proceeds to step S110.
  • step S110 the information processing system 1 presents information to the user.
  • the management unit 191 of the information integration module 117 of the server 11 acquires information indicating search information and recommendation information selection results for the user of interest, and metadata of the search information and recommendation information from the storage unit 195. .
  • the management unit 191 supplies the acquired information and data to the presentation control unit 192.
  • the presentation control unit 192 selects information to be presented to the target user from the search information and the recommendation information. Then, the presentation control unit 192 generates information presentation control data for causing the client 12 of the user to present the selected information.
  • the presentation control unit 192 transmits information presentation control data to the client 12 via the communication unit 194 and the network 13.
  • the control unit 212 of the information presentation module 201 of the client 12 receives information presentation control data from the server 11 via the communication unit 242 and the management unit 241.
  • the control unit 212 causes the presentation unit 213 to present the information selected by the server 11 based on the information presentation control data.
  • FIG. 22 shows an example of a screen displayed on the presentation unit 213 at this time.
  • the window 301 is displayed on the presentation unit 213.
  • a title row 311 and information display portions 312a to 312e are arranged in the vertical direction.
  • the title line 311 indicates that a recommended article is displayed in the window 301.
  • the information display units 312a to 312e for example, a part of an article or headline extracted as normal recommendation information is displayed.
  • sports-related articles are all displayed on the information display units 312a to 312e, and it can be seen that the user of interest has a strong interest in sports.
  • the user of interest can move the cursor for selecting the information display units 312a to 312e via the input unit 121, or can confirm the selection.
  • a window 321 and a button 322 are displayed. In this figure, an example in which the selection of the information display unit 312a in the window 301 is confirmed is shown.
  • the details of the article selected in the window 301 are displayed in the window 321.
  • an article regarding the success of the soccer player A is displayed.
  • important words representing the characteristics of articles in the window 301 are displayed with emphasis so that they can be distinguished from other words.
  • “Italy” and “soccer player A” are highlighted.
  • words included in the related seed word group extracted in the unexpectedness recommendation information extraction process described above are displayed with emphasis.
  • the button 322 is a button for displaying an article having an unexpected relationship with the article in the window 321.
  • a window 331 is displayed.
  • a title row 341 and information display portions 342a to 342c are arranged in the vertical direction.
  • the title line 341 indicates that an unexpected recommended article is displayed in the window 331.
  • a part of an article or headline extracted as unexpected recommendation information is displayed. More specifically, a part of an article or a headline having an unexpected association with an article in the window 321 is displayed.
  • an article related to the support song of the soccer player A which is an article related to the soccer player A but is not so much related to soccer
  • the information display unit 342b displays an article related to the weather in the hometown of the soccer player A, which is not related to soccer.
  • the information display section 342c displays an article related to Italy's economy, which is an article related to Italy but has little relation to soccer.
  • the user of interest can move the cursor for selecting the information display units 342a to 342c or confirm the selection via the input unit 121. And when selection with respect to any one of the information display parts 342a thru
  • an emphasized word in the window 321 may be selected. And when a word is selected, you may make it narrow down to the article containing the selected word from the articles extracted as unexpected recommendation information, and you may make it display in the window 331.
  • the words may be selected one by one, or a plurality of words may be selected at a time.
  • a combination of unexpected words in the information presented to the user may be extracted and presented to the user.
  • the window 301 in FIG. 23 is the same as the window 301 in FIG.
  • the windows 401 to 403 and the button 404 are displayed.
  • an example in which the selection of the information display unit 312d in the window 301 is confirmed is shown.
  • the window 401 details of the article selected in the window 301 are displayed.
  • the idol group XYZ appears in the professional baseball start ball type, and that the member who is serving the start ball type is the idol group XYZ.
  • the member D has become a hot topic as a result of acquiring the qualification of a medicine coordinator.
  • “idol group XYZ” and “medicine”, which are important words representing the characteristics of articles in the window 401, are displayed in an emphasized manner so that they can be distinguished from other words.
  • a pair of words having an unexpected relationship among the words included in the article in the window 401 is displayed.
  • “idol group XYZ” is displayed in the window 403
  • “medicine” is displayed in the button 404.
  • the window 403 and the button 404 are arranged side by side and connected by a dotted line, and the characters “unexpected relevance” are displayed in the window 402, so that the user of interest can select “idol group XYZ” and “medicine” It can be easily recognized that “ ⁇ ” has an unexpected relationship.
  • a window 421 is displayed.
  • a title row 431 and information display portions 432a to 432c are arranged in the vertical direction.
  • the title line 431 indicates that an unexpected recommended article is displayed in the window 421.
  • the information display sections 432a to 432c a part of an article or a headline relating to “medicine” is displayed.
  • the window 431 for example, an article including “medicine candy” in the unexpectedness recommendation information is displayed.
  • an article searched by the word “medicine” is displayed. In this case, the retrieved articles may be further narrowed down based on the user's preference.
  • the user of interest can move the cursor for selecting the information display units 432a to 432c or confirm the selection via the input unit 121. And when selection with respect to any one of the information display parts 432a thru
  • the window 421 may be displayed by using the window 402 as a button and pressing the button.
  • an unexpected recommended article based on the “idle group XYZ” may be displayed in the window 421 in the same manner as when the button 404 is pressed.
  • a plurality of word pairs having unexpected relevance may be displayed.
  • an unexpected recommended article based on a pair of words selected from a plurality of pairs may be displayed in the window 421.
  • the recommendation unit 182 of the server 11 extracts a plurality of important words representing the characteristics of the information to be presented. For example, the recommendation unit 182 extracts X words (X> 2) having higher tfidf values in the word vector AWV of the information to be presented. Alternatively, for example, the recommendation unit 182 extracts a plurality of words having a tfidf value of a predetermined threshold or more in the word vector AWV of the information to be presented.
  • the recommendation unit 182 extracts a pair with low relevance from all the extracted word pairs. For example, the recommendation unit 182 calculates the degree of association rel (w i , w j ) for all pairs of extracted words. Then, the recommendation unit 182 extracts Y pairs having lower relevance values rel (w i , w j ). Alternatively, the recommendation unit 182 extracts a pair whose relevance rel (w i , w j ) is a predetermined threshold value or less. Thereby, a pair with low relevance between words is extracted preferentially from all the pairs of extracted words.
  • the word having the larger tfidf value among the extracted word pairs is displayed as the main word in the window 403 on the left side of FIG.
  • the word with the smaller tfidf value is displayed in the right window 404 as a secondary word.
  • a word having a high degree of association with the topic of the information to be presented is easily displayed as the main word, and a word having a low degree of association with the topic of the information to be presented is a secondary word. It becomes easy to be displayed.
  • the number of words included in the unexpected word combination is not limited to two, and for example, a combination including three or more words may be extracted.
  • normal recommendation information and unexpected recommendation information can be associated with each other and presented to the user of interest.
  • step S111 the process then proceeds to step S111.
  • step S109 determines whether information is presented to the user. If it is determined in step S109 that no information is presented to the user, the process of step S110 is skipped, and the process proceeds to step S111.
  • step S111 the reaction analysis unit 223 of the reaction detection module 202 of the client 12 determines whether or not to detect a user reaction. If it is determined that a user reaction is detected, the process proceeds to step S112.
  • the reaction detection module 202 of the client 12 detects a user reaction. For example, when the attention user inputs feedback (for example, selection or evaluation of the presented information) to the presented information via the input unit 221, the input unit 221 indicates the content of the input feedback. Information is supplied to the reaction analysis unit 223.
  • the feedback of the noted user may be explicit or implicit.
  • the reaction analysis unit 223 analyzes the user's response to the presented information based on the information indicating the feedback of the attention user and the information indicating the reaction of the attention user. For example, the reaction analysis unit 223 analyzes whether the user of interest has shown a positive reaction, a negative reaction, or a neutral reaction with respect to the presented information. Note that the reaction analysis unit 223 may analyze the degree of positive or negative reaction of the user of interest. For example, the reaction analysis unit 223 analyzes the degree of positive reaction depending on whether the focused user actually accessed the information or whether the focused user gave a good evaluation.
  • information indicating a positive reaction by the target user is referred to as positive reaction information.
  • the information indicating that the user of interest has shown a positive reaction is, for example, information that the user of interest has given a good evaluation, information that has actually accessed the presented information, information that indicates a positive biological reaction, or the like.
  • information indicating a negative reaction by the target user is referred to as negative reaction information.
  • the information indicating that the target user has shown a negative reaction is, for example, information that the target user gave a bad evaluation, information that was not accessed, information that indicates a negative biological reaction, or the like.
  • information indicating a positive or negative response from the user of interest is referred to as user response information.
  • the reaction analysis unit 223 generates user reaction analysis information indicating the analysis result of the attention user's reaction, and transmits the generated user reaction analysis information to the server 11 via the management unit 241, the communication unit 242, and the network 13.
  • the user information acquisition unit 193 of the information integration module 117 of the server 11 receives the user reaction analysis information transmitted from the client 12 via the communication unit 194 and supplies it to the management unit 191.
  • the management unit 191 updates the presentation information history of the noted user based on the user reaction analysis information.
  • the management unit 191 stores the updated presentation information history in the storage unit 195.
  • step S111 determines whether user reaction is detected. If it is determined in step S111 that no user reaction is detected, the process of step S112 is skipped, and the process proceeds to step S113.
  • step S114 the learning unit 172 learns user preferences. Specifically, the learning unit 172 acquires the presentation information history of the attention user from the storage unit 195 via the management unit 191. Then, the learning unit 172 generates the WPV and TPV of the focused user based on the word vector and the topic vector of information (user response information) indicating that the focused user has reacted. For example, the learning unit 172 generates a WPV by adding word vectors of user reaction information. Similarly, for example, the learning unit 172 generates a TPV by adding topic vectors of user reaction information.
  • the learning unit 172 generates not only the general WPV and TPV of the target user, but also the WPV and TPV for each context when information is presented to the target user.
  • the learning unit 172 classifies the user reaction information into information presented to the attention user on weekdays and information presented on the holiday to the attention user. And the learning part 172 produces
  • the learning unit 172 classifies the user reaction information into information presented to the attention user in the morning, information presented to the attention user in the daytime, and information presented to the attention user in the night. And the learning part 172 produces
  • the morning WPV and TPV, the daytime WPV and TPV, and the nighttime WPV and TPV of the user of interest are generated.
  • the learning unit 172 may provide user response information to information presented when the attention user is standing, information presented when the attention user is sitting, or information presented when the attention user is walking. Classify. And the learning part 172 produces
  • the learning unit 172 may provide information presented when the attention user is alone, information presented when the attention user is a wife, information presented when the attention user is a child, The user reaction information is classified into the information presented when the wife and the child are present. And the learning part 172 produces
  • the target period of the presentation information history used for generating WPV and TPV can be set to an arbitrary period.
  • the learning unit 172 uses the presentation information history of the entire period when the user of interest has used the search / recommendation service so far, or the predetermined period immediately before (for example, 1 day, 1 week, 1 month, 1 The presentation information history in the year etc.) is used.
  • the learning unit 172 learns the preference for the type of unexpectedness recommendation information of the user of interest. Specifically, for example, the learning unit 172 aggregates the unexpectedness recommendation information response distribution indicating the distribution of the types of unexpectedness recommendation information in which the target user has shown a positive response.
  • the totaling period of the unexpectedness recommendation information reaction distribution can be set to an arbitrary period.
  • the aggregation period of the unexpectedness recommendation information reaction distribution may be the entire period in which the attention user has used the search / recommendation service until now, or the predetermined period immediately before (for example, one week, one month, one year, etc.) Is set.
  • the learning unit 172 causes the storage unit 195 to store the WPV and TPV of the user of interest and the total result of the unexpected recommendation information reaction distribution via the management unit 191.
  • step S113 determines that the user's preference is not learned. If it is determined in step S113 that the user's preference is not learned, the process of step S114 is skipped, and the process proceeds to step S115.
  • step S115 the control unit 212 of the information presentation module 201 of the client 12 determines whether or not to end the presentation of information. For example, if the user operation content acquired in the process of step S102 is not an operation for terminating the search / recommendation service, the control unit 212 determines to continue presenting information, and the process returns to step S101.
  • steps S101 to S115 are repeatedly executed until it is determined in step S115 that the presentation of information is finished.
  • step S115 the control unit 212 of the information presentation module 201 of the client 12 presents information when, for example, the user operation content acquired in the process of step S102 is an operation for terminating the search / recommendation service. Determine to end. Thereafter, the process proceeds to step S116.
  • step S116 the client 12 ends the presentation of information.
  • the control unit 212 of the information presentation module 201 of the client 12 ends the execution of the search / recommendation service APP.
  • a combination of information having unexpected relevance is extracted, and the extracted information is associated and presented to the user can do.
  • a combination of words having unexpected relevance in the information can be extracted, and the extracted words can be associated and presented to the user. Furthermore, based on the extracted word combination, it is possible to extract a combination of information having a further unexpected relationship and present it to the user.
  • information with different subjectivity on the same topic can be presented to the user.
  • the learning speed and learning accuracy of the user's preference can be increased.
  • ⁇ Variation regarding extraction of recommendation information For example, when extracting normal recommendation information, normal recommendation target information, relevance seed information, and unexpected recommendation information, information with a score equal to or higher than a predetermined threshold is used instead of a predetermined number of information at the top of each score. You may make it extract.
  • all the normal recommendation information may be set as the relevance seed information.
  • the second embodiment (FIG. 10), the fifth embodiment (FIG. 16), and the eighth embodiment (FIG. 21) of the unexpectedness recommendation information extraction process for example, the latest Instead of the information accessed by the noticed user, information that the noticed user has shown a positive reaction most recently, information that was presented to the noticed user most recently, or the like may be used as the relevance seed information.
  • the context of the user of interest is considered without considering the user's preference. It is also possible to extract recommended information based only on this.
  • the normal recommendation information may be extracted based on only the context of the current user of interest, and the unexpectedness target information may be extracted based only on a context different from the context of the current user of interest.
  • the normal recommendation information is used instead of the relevance seed information, and the subjective recommendation information is extracted.
  • the user's preference for the type may be analyzed.
  • words whose tfidf is greater than or equal to a predetermined threshold may be extracted as a relevance seed word group.
  • each embodiment of the unexpectedness information extraction process can be combined as necessary.
  • information whose subjective type is different from the related seed information may be extracted as unexpectedness recommendation information from information having a low seed recommendation score.
  • the recommendation unit 182 may extract the recommended information from the search information searched by the search unit 181 instead of the browsing target information.
  • the recommendation unit 182 extracts information recommended to the attention user based on the preferences of other users. You may make it do. For example, the recommendation unit 182 may extract information recommended to the target user by using an average value of WPV and TPV of all users or an average value of WPV and TPV of a user similar to the target user. .
  • the method for presenting information is not limited to the above-described example, and can be presented visually or audibly in various ways.
  • the information is transferred from the client 12 to another device (for example, a portable information terminal or a wearable device), and the other device presents the transferred information. It is also possible to do so.
  • another device for example, a portable information terminal or a wearable device
  • the analysis unit 102 is based on the text information related to the non-text information.
  • Each non-text information can be classified into a plurality of clusters by using the latent topic model.
  • text information included in metadata of non-text information for example, title, artist, performer, genre, generation location, generation date, etc.
  • review papers, impressions, articles, etc. regarding non-text information for example, clustering is performed.
  • the analysis unit 102 classifies the non-text information into a plurality of clusters based on the attribute of the non-text information and the feature amount of the non-text information itself (for example, the feature amount of moving images, images, sounds, etc.). be able to.
  • the analysis unit 102 can classify the music data into a plurality of clusters (for example, genres) based on the feature amount of the music data.
  • the present technology can also be applied to, for example, presenting information on products, actions, places, people, and the like.
  • products and the like can also be clustered based on related text information and the feature amount of the product and the like.
  • any clustering method other than the above-described latent topic model can be adopted.
  • the clustering method employed in the present technology may be a hierarchical method or a non-hierarchical method.
  • the clustering method employed in the present technology may be soft clustering or hard clustering. Or you may make it a person perform clustering of a presentation object by a manual.
  • all or some of the functions of the information personalization module 116 may be provided in the client 12.
  • reaction detection module 202 may be provided in the server 11.
  • the function of the reaction analysis unit 223 may be provided in the server 11, and the server 11 may analyze each user's reaction based on information and data collected by the client 12.
  • all or part of the functions of the information personalization module 116 may be provided in the client 12 so that the client 12 learns the user's preferences.
  • the learning unit 172 may be provided outside the server 11, and the server 11 may acquire a learning result of the user's preference from the outside.
  • presentation control unit 192 may be provided in the client 12, and the client 12 may control the presentation method.
  • all or part of the function of the detection unit 222 of the reaction detection module 202 is provided outside the client 12 so that all or part of information indicating the user's reaction is detected outside the client 12. Also good.
  • all or part of the function of the detection unit 232 of the context detection module 203 may be provided outside the client 12 so that all or part of the data related to the user's context is detected outside the client 12. Good.
  • the input unit, display unit, and storage unit of a plurality of modules can be shared as appropriate.
  • the function of the server 11 may be shared by a plurality of servers.
  • the series of processes described above can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in the computer.
  • the computer includes, for example, a general-purpose personal computer capable of executing various functions by installing various programs by installing a computer incorporated in dedicated hardware.
  • FIG. 25 is a block diagram illustrating an example of a hardware configuration of a computer that executes the above-described series of processes using a program.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 605 is further connected to the bus 604.
  • An input unit 606, an output unit 607, a storage unit 608, a communication unit 609, and a drive 610 are connected to the input / output interface 605.
  • the input unit 606 includes a keyboard, a mouse, a microphone, and the like.
  • the output unit 607 includes a display, a speaker, and the like.
  • the storage unit 608 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 609 includes a network interface or the like.
  • the drive 610 drives a removable medium 611 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 601 loads the program stored in the storage unit 608 to the RAM 603 via the input / output interface 605 and the bus 604 and executes the program, for example. Is performed.
  • the program executed by the computer (CPU 601) can be provided by being recorded on a removable medium 611 as a package medium, for example.
  • the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Accordingly, a plurality of devices housed in separate housings and connected via a network and a single device housing a plurality of modules in one housing are all systems. .
  • the present technology can take a cloud computing configuration in which one function is shared by a plurality of devices via a network and is jointly processed.
  • each step described in the above flowchart can be executed by one device or can be shared by a plurality of devices.
  • the present technology can take the following configurations.
  • Information with low similarity between at least one of topic and subjective type is given to the user preferentially between the user's preference and seed information that is extracted based on at least one of the information accessed by the user
  • An extraction unit that extracts the first presentation information to be presented;
  • An information processing apparatus comprising: a presentation control unit that controls presentation of the first presentation information.
  • the extraction unit extracts second presentation information to be presented to the user based on the user's preference, The information processing apparatus according to (1), wherein the presentation control unit performs control so as to associate and present the first presentation information and the second presentation information.
  • the extraction unit preferentially extracts a combination of words having low relevance among the combinations of words representing the characteristics of the second presentation information;
  • the presentation control unit controls to present the first presentation information including a word selected from the presented combination of words.
  • the extraction unit calculates the relevance between the words based on the distance between vectors representing the characteristics of each word based on the importance for each of a plurality of predetermined topics. (3) or (4) The information processing apparatus described.
  • the presentation control unit presents a word representing the feature of the second presentation information separately from other words, and presents the first presentation information including a word selected from the words representing the feature
  • the information processing apparatus according to any one of (2) to (5).
  • the information processing apparatus according to any one of (2) to (6), wherein the extraction unit extracts the seed information from the second presentation information.
  • the extraction unit preferentially extracts information having a low topic similarity with the seed information from the information extracted based on the user's preference as the first presentation information. Thru
  • the extraction unit preferentially extracts, as the first presentation information, information having a low topic similarity with the seed information from information including words representing the characteristics of the seed information.
  • the information processing apparatus according to any one of (9) to (9).
  • (11) The extraction unit extracts the seed information based on the user's preference in the user's current context, and the user's preference in a context different from the user's current context, or the user's general preference Information having a low topic similarity with the seed information is extracted preferentially as the first presentation information from the extracted information that is information extracted based on the above (1) to (10) The information processing apparatus according to any one of the above.
  • the extraction unit preferentially uses information having a low topic similarity with the seed information as the first presentation information from information including a word representing the characteristics of the seed information in the extracted information. Extracting the information processing apparatus according to (11). (13) The extraction unit preferentially extracts, as the first presentation information, information having a different subjective type from the seed information from information including a word representing the characteristics of the seed information. ). (14) The information processing apparatus according to any one of (1) to (13), wherein the extraction unit preferentially extracts information having high user preference as the seed information. (15) The information processing apparatus according to any one of (1) to (14), wherein the extraction unit preferentially extracts information that is close to the present time as the user's access time as the seed information.
  • the extraction unit calculates a topic similarity between the seed information and target information based on a distance between vectors representing information characteristics based on probabilities belonging to a plurality of predetermined topics.
  • the information processing apparatus according to any one of (1) to (15).
  • the extraction unit can extract the first presentation information by a plurality of methods, A learning unit that learns the user's preference for the first presentation information extracted by each of the plurality of methods;
  • the information processing apparatus according to any one of (1) to (16), wherein the extraction unit selects a method for extracting the first presentation information based on a learning result of the learning unit.
  • Information with low similarity between at least one of topic and subjective type is given to the user preferentially between the user's preference and seed information that is extracted based on at least one of the information accessed by the user An extraction step of extracting as the first presentation information to be presented; A presentation control step of controlling presentation of the first presentation information.
  • Information with low similarity between at least one of topic and subjective type is given to the user preferentially between the user's preference and seed information that is extracted based on at least one of the information accessed by the user An extraction step of extracting as the first presentation information to be presented;
  • Information processing system 11 server, 12 client, 102 analysis unit, 103 presentation information extraction unit, 113 language analysis module, 114 topic analysis module, 115 relevance analysis module, 116 information personalization module, 117 information integration module, 141 language Analysis unit, 151 topic analysis unit, 161 relevance analysis unit, 171 extraction unit, 172 learning unit, 181 search unit, 182 recommendation unit, 191 management unit, 192 presentation control unit, 193 user information acquisition unit, 201 information presentation module, 202 reaction detection module, 203 context detection module, 204 information integration module, 212 control unit, 213 presentation unit, 221 input unit, 222 Detection unit, 223 reaction analysis unit, 232 detection unit, 233 context analysis unit, 241 management unit

Abstract

本技術は、ユーザが意外性を感じる内容を含む情報を提示することができるようにする情報処理装置、情報処理方法、及び、プログラムに関する。 抽出部は、ユーザの嗜好及びユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的にユーザに提示する第1の提示情報として抽出し、提示制御部は、第1の提示情報の提示を制御する。本技術は、例えば、ニュース等の記事を推薦するサービスを提供するサーバ等に適用できる。

Description

情報処理装置、情報処理方法、及び、プログラム
 本技術は、情報処理装置、情報処理方法、及び、プログラムに関し、例えば、ユーザが意外性を感じる内容を含む情報を提示することができるようにした情報処理装置、情報処理方法、及び、プログラムに関する。
 従来、ユーザの嗜好との差異に基づいて意外性のあるコンテンツを推薦する技術が提案されている(例えば、特許文献1参照)。
特開2009-140075号公報
 しかしながら、特許文献1では、コンテンツの内容に基づいて意外性のあるコンテンツを推薦することは検討されていない。
 本技術は、このような状況に鑑みてなされたものであり、ユーザが意外性を感じる内容を含む情報を提示することができるようにするものである。
 本技術の一側面の情報処理装置は、ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出部と、前記第1の提示情報の提示を制御する提示制御部とを備える。
 前記抽出部には、前記ユーザの嗜好に基づいて前記ユーザに提示する第2の提示情報を抽出させ、前記提示制御部には、前記第1の提示情報と前記第2の提示情報とを関連付けて提示するように制御させることができる。
 前記抽出部には、前記第2の提示情報の特徴を表す単語の組み合わせのうち単語間の関連性が低い組み合わせを優先的に抽出させ、前記提示制御部には、前記第2の提示情報とともに抽出された単語の組み合わせを提示するように制御させることができる。
 前記提示制御部には、提示した前記単語の組み合わせの中から選択された単語を含む前記第1の提示情報を提示するように制御させることができる。
 前記抽出部には、所定の複数のトピックのそれぞれに対する重要度に基づいて各単語の特徴を表すベクトル間の距離に基づいて、各単語間の関連性を計算させることができる。
 前記提示制御部には、前記第2の提示情報の特徴を表す単語を他の単語と区別して提示するとともに、前記特徴を表す単語の中から選択された単語を含む前記第1の提示情報を提示するように制御させることができる。
 前記抽出部には、前記第2の提示情報から前記シード情報を抽出させることができる。
 前記抽出部には、前記ユーザの嗜好に基づいて抽出した情報から前記第1の提示情報を除く情報を前記第2の提示情報として抽出させることができる。
 前記抽出部には、前記ユーザの嗜好に基づいて抽出した情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先して前記第1の提示情報として抽出させることができる。
 前記抽出部には、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出させることができる。
 前記抽出部には、前記ユーザの現在のコンテクストにおける前記ユーザの嗜好に基づいて前記シード情報を抽出させ、前記ユーザの現在のコンテクストと異なるコンテクストにおける前記ユーザの嗜好、又は、前記ユーザの全般的な嗜好に基づいて抽出した情報である抽出情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出させることができる。
 前記抽出部には、前記抽出情報のうち前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出させることができる。
 前記抽出部には、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報と前記主観タイプが異なる情報を優先的に前記第1の提示情報として抽出させることができる。
 前記抽出部には、前記ユーザの嗜好度が高い情報を優先的に前記シード情報として抽出させることができる。
 前記抽出部には、前記ユーザがアクセスした時期が現在に近い情報を優先的に前記シード情報として抽出させることができる。
 前記抽出部には、所定の複数のトピックにそれぞれ帰属する確率に基づいて情報の特徴を表すベクトル間の距離に基づいて、前記シード情報と対象となる情報との間のトピックの類似度を計算させることができる。
 前記抽出部は、複数の方法により前記第1の提示情報を抽出することが可能であり、前記複数の方法によりそれぞれ抽出された前記第1の提示情報に対する前記ユーザの嗜好を学習する学習部をさらに設け、前記抽出部には、前記学習部の学習結果に基づいて、前記第1の提示情報を抽出する方法を選択させることができる。
 本技術の一側面の情報処理方法は、ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、前記第1の提示情報の提示を制御する提示制御ステップとを含む。
 本技術の一側面のプログラムは、ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、前記第1の提示情報の提示を制御する提示制御ステップと含む処理をコンピュータに実行させる。
 本技術の一側面においては、ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報が優先的に前記ユーザに提示する第1の提示情報として抽出され、前記第1の提示情報の提示が制御される。
 本技術の一側面によれば、ユーザが意外性を感じる内容を含む情報を提示することができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術を適用した情報処理システムの一実施の形態を示すブロック図である。 サーバの機能の構成例を示すブロック図である。 クライアントの機能の構成例を示すブロック図である。 情報取得処理を説明するためのフローチャートである。 情報解析処理を説明するためのフローチャートである。 情報提示処理を説明するためのフローチャートである。 推薦情報抽出処理を説明するためのフローチャートである。 意外性推薦情報抽出処理の第1の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第1の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第2の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第2の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第3の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第3の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第4の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第4の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第5の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第5の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第6の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第6の実施の形態における各情報の関係を示す図である。 意外性推薦情報抽出処理の第7の実施の形態を説明するためのフローチャートである。 意外性推薦情報抽出処理の第8の実施の形態を説明するためのフローチャートである。 クライアントにおいて提示される画面の第1の例を示す図である。 クライアントにおいて提示される画面の第2の例を示す図である。 意外性単語ペア抽出処理を説明するためのフローチャートである。 コンピュータの構成例を示すブロック図である。
 以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
{情報処理システム1の構成例}
 図1は、本技術を適用した情報処理システム1の一実施の形態を示している。
 情報処理システム1は、サーバ11及びクライアント12-1乃至12-nを含むように構成される。サーバ11及びクライアント12-1乃至12-nは、ネットワーク13を介して相互に接続されており、互いに通信を行う。サーバ11及びクライアント12-1乃至12nの通信方式は、有線又は無線に関わらず、任意の通信方式を採用することが可能である。
 サーバ11は、クライアント12-1乃至12-nを使用するユーザに対して、各種の情報や物等の検索及び推薦を行う検索・推薦サービスを提供する。また、サーバ11は、必要に応じて、検索・推薦サービスを利用するのに必要なアプリケーションプログラム(以下、検索・推薦サービスAPPと称する)をクライアント12-1乃至12-nに提供する。
 クライアント12-1乃至12-nは、例えば、サーバ11が提供する検索・推薦サービスを各ユーザが利用する際に用いられる。なお、クライアント12-1乃至12-nは、検索・推薦サービスを利用可能な装置であれば、その実施形態は問わない。例えば、クライアント12-1乃至12-nは、スマートフォン、タブレット、携帯電話機、ノート型のパーソナルコンピュータ等の携帯情報端末、ウェアラブルデバイス、デスクトップ型のパーソナルコンピュータ、ゲーム機、動画再生装置、音楽再生装置等により構成される。また、ウェアラブルデバイスには、例えば、眼鏡型、腕時計型、ブレスレット型、ネックレス型、ネックバンド型、イヤフォン型、ヘッドセット型、ヘッドマウント型等の各種の方式を採用することができる。
 なお、以下、検索・推薦サービスにおいてニュース等の記事をユーザに提示する場合を具体例に挙げて説明する。従って、以下、検索、推薦、及び、提示等の対象となる情報は、主に記事を指すものとする。ただし、後述するように、ユーザに提示する提示対象となる情報は、記事に限定されるものではない。
 また、以下、クライアント12-1乃至12-nを個々に区別する必要がない場合、単にクライアント12と称する。
{サーバ11の機能の構成例}
 図2は、サーバ11の機能の構成例を示している。サーバ11は、情報収集モジュール111、情報編集モジュール112、言語解析モジュール113、トピック解析モジュール114、関連性解析モジュール115、情報個人化モジュール116、及び、情報統合モジュール117を含むように構成される。
 情報収集モジュール111は、入力部121、情報収集部122、表示部123、及び、記憶部124を含むように構成される。
 入力部121は、例えば、キーボード、マウス、ボタン、スイッチ、ポインティングデバイス、マイクロフォン等の各種の入力デバイスにより構成される。入力部121は、例えば、情報収集モジュール111に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を情報収集部122に供給する。
 情報収集部122は、例えば、プロセッサ等により構成される。情報収集部122は、ネットワーク13を介して、図示せぬ他のサーバ等からユーザに提示する情報の収集を行い、収集した情報に関する情報を情報統合モジュール117の管理部191に供給する。
 表示部123は、例えば、ディスプレイ等により構成され、情報収集モジュール111を使用するための画面等の表示を行う。
 記憶部124は、例えば、記憶装置により構成され、情報収集部122の処理に必要なデータ等を記憶する。
 情報編集モジュール112は、入力部131、情報編集部132、表示部133、及び、記憶部134を含むように構成される。
 入力部131は、例えば、キーボード、マウス、ボタン、スイッチ、ポインティングデバイス、マイクロフォン等の各種の入力デバイスにより構成される。入力部131は、例えば、情報編集モジュール112に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を情報編集部132に供給する。
 情報編集部132は、例えば、プロセッサ等により構成される。情報編集部132は、情報収集モジュール111が収集した情報に関する情報を管理部191から取得し、情報編集を行う。ここで、情報編集とは、例えば、悪質な情報や、セキュリティ面に問題があるウエブサイト上の情報等を除外したり、優先的にユーザに推薦する情報の選択を行ったりすることである。情報編集部132は、情報編集の結果を示す情報を管理部191に供給する。
 表示部133は、例えば、ディスプレイ等により構成され、情報編集モジュール112を使用するための画面等の表示を行う。
 記憶部134は、例えば、記憶装置により構成され、情報編集部132の処理に必要なデータ等を記憶する。
 なお、情報収集モジュール111及び情報編集モジュール112により、情報取得部101が構成される。
 言語解析モジュール113は、言語解析部141及び記憶部142を含むように構成される。
 言語解析部141は、例えば、プロセッサ等により構成される。言語解析部141は、各情報のメタデータを管理部191から取得し、各情報の言語解析を行う。言語解析部141は、言語解析の結果を管理部191に供給する。
 記憶部142は、例えば、記憶装置により構成され、言語解析部141の処理に必要なデータ等を記憶する。
 トピック解析モジュール114は、トピック解析部151及び記憶部152を含むように構成される。
 トピック解析部151は、例えば、プロセッサ等により構成される。トピック解析部151は、各情報の言語解析の結果を管理部191から取得し、言語解析の結果に基づいて、各情報のトピック解析を行う。トピック解析部151は、各情報のトピック解析の結果を管理部191に供給する。
 記憶部152は、例えば、記憶装置により構成され、トピック解析部151の処理に必要なデータ等を記憶する。
 関連性解析モジュール115は、関連性解析部161及び記憶部162を含むように構成される。
 関連性解析部161は、例えば、プロセッサ等により構成される。関連性解析部161は、各情報のトピック解析の結果を管理部191から取得し、トピック解析の結果に基づいて、各情報間の関連性の解析を行う。また、関連性解析部161は、各情報のトピック解析の結果に基づいて、各情報に出現する単語間の関連性の解析を行う。関連性解析部161は、各情報間の関連性の解析結果、及び、各単語間の関連性の解析結果を管理部191に供給する。
 記憶部162は、例えば、記憶装置により構成され、関連性解析部161の処理に必要なデータ等を記憶する。
 なお、言語解析モジュール113、トピック解析モジュール114、及び、関連性解析モジュール115により、解析部102が構成される。
 情報個人化モジュール116は、抽出部171、学習部172、及び、記憶部173を含むように構成される。
 抽出部171、及び、学習部172は、例えば、プロセッサ等により構成される。
 抽出部171は、各ユーザに提示する情報を抽出する。抽出部171は、検索部181及び推薦部182を含むように構成される。
 検索部181は、各ユーザに提示する情報の検索を行う。例えば、検索部181は、ユーザにより指定された検索条件、及び、ユーザに提示する対象となる情報に関する情報を管理部191から取得し、検索条件と合致する情報を検索する。検索部181は、検索結果を管理部191に供給する。
 推薦部182は、各ユーザに推薦する情報の抽出を行う。例えば、推薦部182は、提示情報履歴、並びに、ユーザに提示する対象となる情報に関する情報を管理部191から取得する。提示情報履歴は、ユーザに提示した情報の履歴、提示した情報へのアクセスの有無、提示した情報に対するユーザの反応、及び、情報を提示したときのユーザのコンテクストを示す情報を含む。また、提示情報履歴は、提示した情報が意外性推薦情報の場合、意外性推薦情報の種類を示す情報を含む。
 ここで、意外性推薦情報とは、通常の方法により抽出された通常推薦情報と意外な関連性を持つ情報のことである。また、意外性推薦情報は、抽出方法の違いにより複数の種類に分かれる。
 また、推薦部182は、各ユーザの嗜好の学習結果を管理部191から取得する。そして、推薦部182は、取得したデータ等に基づいて、各ユーザに推薦する情報を抽出する。推薦部182は、各ユーザに推薦する情報を示す情報を管理部191に供給する。
 学習部172は、各ユーザの嗜好の学習を行う。例えば、学習部172は、各ユーザの提示情報履歴、並びに、各情報の言語解析及びトピック解析の結果を管理部191から取得する。学習部172は、取得したデータ等に基づいて、各ユーザの情報に対する嗜好を学習する。学習部172は、各ユーザの嗜好の学習結果を管理部191に供給する。
 また、学習部172は、各ユーザの提示情報履歴に基づいて、各ユーザの意外性推薦情報の種類に対する嗜好を学習する。より具体的には、学習部172は、各ユーザがポジティブな反応を示した意外性推薦情報の種類の分布を示す意外性推薦情報反応分布を集計する。学習部172は、各ユーザの意外性推薦情報反応分布の集計結果を管理部191に供給する。
 記憶部173は、例えば、記憶装置により構成され、検索部181、推薦部182、及び、学習部172の処理に必要なデータ等を記憶する。
 なお、情報個人化モジュール116により提示情報抽出部103が構成される。
 情報統合モジュール117は、管理部191、提示制御部192、ユーザ情報取得部193、通信部194、及び、記憶部195を含むように構成される。
 管理部191、提示制御部192、及び、ユーザ情報取得部193は、例えば、プロセッサ等により構成される。
 管理部191は、例えば、各モジュールの処理を制御したり、各モジュール間のデータ等の授受を制御したりする。また、管理部191は、各モジュール、提示制御部192、及び、ユーザ情報取得部193から取得したデータ等を記憶部195に記憶させたり、記憶部195に記憶されているデータ等を各モジュール及び提示制御部192に供給したりする。
 提示制御部192は、通信部194及びネットワーク13を介して、ユーザに情報を提示するためのデータ等を各クライアント12に送信し、各クライアント12における情報の提示の制御を行う。
 ユーザ情報取得部193は、各ユーザに関するユーザ情報を、ネットワーク13及び通信部194を介して各クライアント12から受信する。ユーザ情報は、例えば、ユーザの検索・推薦サービスに対する操作内容を示すユーザ操作情報、提示した情報に対するユーザの反応の解析結果を示すユーザ反応解析情報、及び、ユーザのコンテクストに関するユーザコンテクスト情報等を含む。ユーザ情報取得部193は、受信したユーザ情報を管理部191に供給する。
 通信部194は、例えば、通信装置により構成され、ネットワーク13を介して、各クライアント12と通信を行う。
 記憶部195は、例えば、記憶装置により構成され、サーバ11全体の処理に必要なデータ等を記憶する。
{クライアント12の機能の構成例}
 図3は、クライアント12の機能の構成例を示している。クライアント12は、情報提示モジュール201、反応検出モジュール202、コンテクスト検出モジュール203、及び、情報統合モジュール204を含むように構成される。
 情報提示モジュール201は、検索・推薦サービスにおける情報の提示を制御するモジュールである。情報提示モジュール201は、入力部211、制御部212、提示部213、及び、記憶部214を含むように構成される。
 入力部211は、例えば、キーボード、マウス、ボタン、スイッチ、ポインティングデバイス、マイクロフォン等の各種の入力デバイスにより構成される。入力部211は、例えば、情報提示モジュール201に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を制御部212に供給する。
 制御部212は、例えば、プロセッサ等により構成される。制御部212は、クライアント12における検索・推薦サービスの処理の制御を行う。例えば、制御部212は、ネットワーク13等を介してサーバ11から送信されるデータ等を受信し、受信したデータ等に基づいて、提示部213におけるユーザへの情報の提示を制御する。また、制御部212は、入力部211を用いてユーザにより入力されたユーザ操作の内容を示すユーザ操作情報を情報統合モジュール204の管理部241に供給する。
 提示部213は、例えば、表示装置や音声出力装置等により構成される。提示部213は、制御部212の制御の下に、情報提示モジュール201を使用するための画面の表示や音声の出力等を行う。
 記憶部214は、例えば、記憶装置により構成され、制御部212の処理に必要なデータ等を記憶する。
 反応検出モジュール202は、検索・推薦サービスにおいて提示された情報に対するユーザの反応を検出するモジュールである。反応検出モジュール202は、入力部221、検出部222、反応解析部223、及び、記憶部224を含むように構成される。
 入力部221は、例えば、キーボード、マウス、ボタン、スイッチ、ポインティングデバイス、マイクロフォン等の各種の入力デバイスにより構成される。入力部211は、例えば、反応検出モジュール202に対する指令やデータ等の入力、及び、情報提示モジュール201において提示された情報に対するユーザのフィードバックの入力に用いられる。入力部211は、入力された指令やデータ等を反応解析部223に供給する。
 検出部222は、例えば、音声認識装置、画像認識装置、生体情報センサ等により構成される。検出部222は、情報提示モジュール201において提示された情報に対するユーザの反応を示す情報を検出し、検出した情報を反応解析部223に供給する。
 反応解析部223は、入力部221により入力されたユーザのフィードバック、及び、検出部222により検出されたユーザの反応を示す情報に基づいて、情報提示モジュール201において提示された情報に対するユーザの反応を解析する。反応解析部223は、ユーザの反応の解析結果を示すユーザ反応解析情報を生成し、情報統合モジュール204の管理部241に供給する。
 記憶部224は、例えば、記憶装置により構成され、反応解析部223の処理に必要なデータ等を記憶する。
 コンテクスト検出モジュール203は、ユーザのコンテクストを検出するモジュールである。ここで、ユーザのコンテクストには、例えば、ユーザ自身の状態や状況、及び、ユーザの周囲の状態や状況が含まれる。ユーザの状態や状況には、例えば、ユーザの属性、行動、姿勢、感情、体調、ユーザが使用しているクライアント12の種類等が含まれる。ユーザの属性には、例えば、ユーザの氏名、性別、年齢、国籍、住所、職業、趣味、特技、性格、身体的特徴等が含まれる。ユーザの周囲の状態や状況には、例えば、日時、場所、天候、気温、周囲の明るさ、周囲の音、周囲の匂い、ユーザの周囲の人や物等が含まれる。
 コンテクスト検出モジュール203は、例えば、入力部231、検出部232、コンテクスト解析部233、及び、記憶部214を含むように構成される。
 入力部231は、例えば、キーボード、マウス、ボタン、スイッチ、ポインティングデバイス、マイクロフォン等の各種の入力デバイスにより構成される。入力部231は、例えば、コンテクスト検出モジュール203に対する指令やデータ等の入力に用いられ、入力された指令やデータ等をコンテクスト解析部233に供給する。
 検出部232は、例えば、ユーザのコンテクストに関するデータを検出する各種のデバイスを含む。例えば、検出部232は、電波時計、GPS(Global Positioning System)レシーバ、音声認識装置、画像認識装置、各種センサ等を含む。各種センサは、例えば、光センサ、画像センサ、速度センサ、加速度センサ、角速度センサ、磁気センサ、温度センサ、湿度センサ、生体情報センサ等を含む。
 また、検出部232は、例えば、通信装置等を含み、外部の機器やセンサ等からユーザのコンテクストに関するデータを取得する。さらに、検出部232は、例えば、クライアント12で実行中の検索・推薦サービスAPP以外のサービスやアプリケーションプログラムからユーザのコンテクストに関するデータを取得する。なお、このサービスやアプリケーションプログラムには、例えば、SNS(Social Networking Service)、スケジューラ等が含まれる。また、検出部232が取得するユーザのコンテクストに関するデータには、例えば、ユーザの周辺の場所に関するデータ(例えば、POI(Point Of Interest)データ等)、ユーザの行動に関するデータ、ユーザが一緒にいる人に関するデータ、ユーザの予定に関するデータ等が含まれる。
 そして、検出部232は、検出又は取得したユーザのコンテクストに関するデータをコンテクスト解析部233に供給する。
 コンテクスト解析部233は、検出部232からのデータに基づいて、ユーザのコンテクストを解析する。コンテクスト解析部233は、ユーザのコンテクストの解析結果を示すユーザコンテクスト情報を、情報統合モジュール204の管理部241に供給する。
 記憶部234は、例えば、記憶装置により構成され、コンテクスト解析部233の処理に必要なデータ等を記憶する。
 情報統合モジュール204は、管理部241、通信部242、及び、記憶部243を含むように構成される。
 管理部241は、例えば、プロセッサ等により構成される。管理部241は、例えば、各モジュールの処理を制御したり、各モジュール間のデータ等の授受を制御したりする。また、管理部241は、各モジュールから取得したデータ等を通信部242に供給したり、記憶部243に記憶させたりする。さらに、管理部241は、通信部242から取得したデータ等を各モジュールに供給したり、記憶部243に記憶させたりする。また、管理部241は、記憶部243に記憶されているデータ等を各モジュール及び通信部242に供給する。
 通信部242は、例えば、通信装置により構成され、ネットワーク13を介して、サーバ11と通信を行う。
 記憶部243は、例えば、記憶装置により構成され、クライアント12全体の処理に必要なデータ等を記憶する。
{情報処理システム1の処理}
 次に、図4乃至図24を参照して、情報処理システム1の処理について説明する。
(情報取得処理)
 まず、図4のフローチャートを参照して、サーバ11により実行される情報取得処理について説明する。なお、この処理は、例えば、1日に1回、1時間に1回等、定期的に実行される。或いは、この処理は、例えば、検索・推薦サービスの管理者(以下、サービス管理者と称する)からの指令により実行される。
 ステップS1において、サーバ11は、情報収集を行う。例えば、情報収集モジュール111の情報収集部122は、ネットワーク13を介して、RSS情報を提供しているウエブサイト(以下、RSSサイトと称する)のクロールを行う。情報収集部122は、クロールの結果得られた各RSSサイトの新着情報及び更新情報に関する情報(以下、新着・更新関連情報と称する)を、情報統合モジュール117の管理部191に供給する。管理部191は、取得した新着・更新関連情報を記憶部195に記憶させる。
 なお、新着・更新関連情報は、各情報のメタデータを含む。また、各情報のメタデータは、例えば、情報のタイトル、情報の本文、発行日時、更新日時、情報を掲載しているウエブページのURL、使用言語等を含む。
 ステップS2において、サーバ11は、情報編集を行う。具体的には、管理部191は、ステップS1の処理で取得した新着・更新関連情報を、情報編集モジュール112の情報編集部132に供給する。情報編集部132は、新着・更新関連情報に含まれる情報の中から問題のある情報を抽出し、ブラックリストに登録する。ここで、問題のある情報とは、例えば、悪質な情報や、セキュリティ面に問題のあるウエブサイト上の情報等である。
 なお、このブラックリストへの登録処理は、人手によりマニュアルで行うようにしてもよいし、情報編集部132が自動的に実行するようにしてもよい。前者の場合、例えば、サービス管理者が、ブラックリストに登録する情報を選択する。後者の場合、例えば、情報編集部132が、学習モデル等を用いて、ブラックリストに登録する情報を自動的に選択する。
 また、情報編集部132は、例えば、サービス管理者により入力部131を介して入力される指令に従って、新着情報及び更新情報の中から優先的にユーザに推薦する情報を選択して、ピックアップリストに登録する。
 情報編集部132は、ブラックリスト及びピックアップリストを管理部191に供給する。管理部191は、ブラックリスト及びピックアップリストを記憶部195に記憶させる。
 ステップS3において、情報統合モジュール117の管理部191は、解析対象情報の登録を行う。具体的には、管理部191は、新着情報及び更新情報のうち、ブラックリストに登録されている情報を除く情報を解析対象情報に登録する。
 その後、情報取得処理は終了する。
(情報解析処理)
 次に、図5のフローチャートを参照して、サーバ11により実行される情報解析処理について説明する。なお、この処理は、例えば、1日に1回、1時間に1回等、定期的に実行される。或いは、この処理は、例えば、図4を参照して上述した情報取得処理の後に実行される。或いは、この処理は、例えば、サービス管理者からの指令により実行される。
 ステップS51において、サーバ11は、解析対象情報の言語解析を行う。具体的には、言語解析モジュール113の言語解析部141は、管理部191を介して、解析対象情報のメタデータを記憶部195から取得する。言語解析部141は、例えば、記憶部142に予め記憶されている単語辞書を用いて、各解析対象情報のタイトル及び本文の形態素解析を行い、各情報のタイトル及び本文から単語を抽出する。
 なお、以下、単語辞書に登録されている単語の総数をMとし、各単語を単語wi(i=1,2,・・・,M)で表す。また、以下、解析対象情報の総数をNとし、各情報を情報dj(j=1,2,・・・,N)で表す。また、以下、単語wiを個々に区別する必要がない場合、単に単語w又は単語と称し、情報djを個々に区別する必要がない場合、単に情報d又は情報と称する。
 言語解析部141は、予め保持している単語辞書に登録されている各単語wiについて、tfi,j及びdfiを計算する。ここで、tfi,jは、情報djにおける単語wiの出現頻度(出現回数)である。また、dfiは、単語wiを含む情報dの数を表す。
 また、言語解析部141は、次式(1)に従って、各情報djにおける各単語wiのtfidfi,jを計算する。
Figure JPOXMLDOC01-appb-M000001
 さらに、言語解析部141は、次式(2)に従って、各情報djにおける各単語wiの重みからなる単語ベクトルAWVjを生成する。
AWVj={tfidf1,j,tfidf2,j,・・・,tfidfM,j
                          ・・・(2)
 すなわち、単語ベクトルAWVjは、各単語wiの重みに基づいて各情報djの特徴を表す特徴ベクトルである。従って、単語ベクトルAWVjにおいてtfidfi,jが大きい単語wiほど、情報djの特徴をより顕著に表す単語であるといえる。
 言語解析部141は、解析対象情報の言語解析結果を管理部191に供給し、管理部191は、各解析対象情報の言語解析結果を記憶部195に記憶させる。なお、各解析対象情報の言語解析結果は、各解析対象情報のtfi,j及びtfidfi,jの計算結果、並びに、単語ベクトルAWVjを含む。
 ステップS52において、サーバ11は、トピック解析を行う。具体的には、管理部191は、解析対象情報の言語解析結果をトピック解析モジュール114のトピック解析部151に供給する。トピック解析部151は、例えば、PLSA(Probabilistic Latent Semantic Analysis;確率的潜在意味解析)やLDA(Latent Dirichlet Allocation;潜在的ディリクレ配分法)等の確率的トピックモデルを用いて、解析対象情報のトピック解析を行う。
 例えば、トピック解析部151は、解析対象情報の言語解析結果であるtfi,j及びtfidfi,j、並びに、分類したいトピック(クラスタ)の数Kを入力とし、次式(3)で表されるPLSAを用いて、各情報djの各トピックzk(k=1,2,・・・,K)への帰属確率p(zk|dj)、及び、各トピックzkにおける各単語wiの生起確率p(wi|zk)を計算する。
Figure JPOXMLDOC01-appb-M000002
 なお、p(wi|dj)は、情報djにおける単語wiの生起確率である。
 さらに、トピック解析部151は、次式(4)に従って、各情報djの各トピックzkへのトピック帰属確率p(zk|dj)からなるトピックベクトルATVjを生成する。
ATVj={p(z1|dj),p(z2|dj),・・・,p(zK|dj)}
                           ・・・(4)
 すなわち、各情報dのトピックベクトルATVjは、各トピックzkに帰属する確率に基づいて各情報djの特徴を表す特徴ベクトルである。従って、トピックベクトルATVjにおいてp(zk|dj)が大きいトピックzkほど、情報djの内容により近いトピックであるといえる。
 また、トピック解析部151は、各単語のトピック解析を行う。例えば、トピック解析部151は、次式(5)に従って、各単語wiの各トピックzkへのトピック帰属確率からなるトピックベクトルWTVを生成する。
Figure JPOXMLDOC01-appb-M000003
 すなわち、各単語wのトピックベクトルWTVは、各情報djにおける各単語wiのtfidfi,jを重みとして、各情報djのトピックベクトルATVjを重み付け加算したものある。従って、トピックベクトルWTVは、各トピックzkに帰属する確率に基づいて各単語wの特徴を表す特徴ベクトルとなる。従って、トピックベクトルWTVにおける値が大きいトピックzkほど、単語wの重要度がより高いトピック(例えば、単語wがトピックの特徴をより顕著に表すトピック)であるといえる。
 トピック解析部151は、トピック解析結果を管理部191に供給し、管理部191は、トピック解析結果を記憶部195に記憶させる。なお、トピック解析結果は、各解析対象情報のトピックベクトルATVj及び各単語のトピックベクトルWTVを含む。
 なお、分類するトピックの数Kを増やすことにより、例えば、同じジャンルのトピックをさらに詳細に分類することができる。例えば、経済系のトピックを、株価系のトピック、専門的なトピック、入門的なトピック等に細かく分類することができる。
 また、PLSAの詳細については、"Thomas Hofmann, "Probabilistic latent semantic indexing", 1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval"等に記載されている。また、LDAの詳細については、"David M. Blei, Andrew Y. Ng, Michael I. Jordan, "Latent Dirichlet Allocation", 2003, Journal of Machine Learning Research, Volume 3"等に記載されている。
 また、以下、トピックzkを個々に区別する必要がない場合、単にトピックz又はトピックと称する。さらに、以下、単語ベクトルAWVj、トピックベクトルATVj、及び、トピックベクトルWTVを個々に区別する必要がない場合、それぞれ単に単語ベクトルAWV、トピックベクトルATV、及び、トピックベクトルWTVと称する。また、以下、トピック帰属確率p(zk|dj)を個々に区別する必要がない場合、単にトピック帰属確率p(z|d)と称する。
 ステップS53において、サーバ11は、関連性解析を行う。具体的には、管理部191は、トピック解析結果を関連性解析モジュール115の関連性解析部161に供給する。
 そして、関連性解析部161は、各解析対象情報間の関連度を計算する。例えば、関連性解析部161は、情報diと情報djの関連度rel(di,dj)として、情報diのトピックベクトルATVjと情報djのトピックベクトルATVとの間のコサイン距離を計算する。従って、関連度rel(di,dj)は、情報diと情報djのトピックの類似度が高いほど大きくなり、類似度が低いほど小さくなる。
 また、関連性解析部161は、解析対象情報に出現する全ての単語間の関連度を計算する。例えば、関連性解析部161は、単語wと単語wの関連度rel(w,w)として、単語wのトピックベクトルWTVと単語wのトピックベクトルWTVとの間のコサイン距離を計算する。従って、関連度rel(w,w)は、単語wの重要度が高い情報と単語wの重要度が高い情報とのトピックの類似度が高いほど大きくなり、類似度が低いほど小さくなる。
 関連性解析部161は、関連性解析結果を管理部191に供給し、管理部191は、関連性解析結果を記憶部195に記憶させる。なお、関連性解析結果は、各解析対象情報間の関連度rel(di,dj)、及び、各単語間の関連度rel(w,w)を含む。
 ステップS54において、情報統合モジュール117の管理部191は、閲覧対象情報の登録を行う。具体的には、管理部191は、各解析対象情報を、各情報のメタデータ、単語ベクトルAWVj、トピックベクトルATVj、関連度rel(di,dj)、及び、帰属確率最大トピックとともに、閲覧対象情報として登録する。
 ここで、帰属確率最大トピックとは、情報djのトピック帰属確率p(zk|dj)が最大となるトピックのことである。例えば、トピックの分類数(以下、総トピック数と称する)Kが10であり、情報d1のトピックベクトルATV1の値が{0.2,0.4,0.8,0.1,0.3,0.5,0.1,0.1,0.3,0.6}である場合、情報d1の帰属確率最大トピックは、トピックz3となる。すなわち、情報d1は、トピックz3に属する確率が最も高く、トピックz3に関する内容を最も多く含んでいると予測される。
 その後、情報解析処理は終了する。
(情報提示処理)
 次に、図6のフローチャートを参照して、情報処理システム1により実行される情報提示処理について説明する。なお、この処理は、例えば、ユーザがクライアント12の情報提示モジュール201の入力部211を用いて、サーバ11が提供する検索・推薦サービスを利用するための操作(例えば、検索・推薦サービスAPPの起動操作等)を行ったとき開始される。
 なお、以下、説明を分かりやすくするために、1人のユーザに注目し、そのユーザ(以下、注目ユーザと称する)に対する処理の説明を行う。ただし、実際には、以下に説明する処理が、複数のユーザに対して並行に実行される。
 ステップS101において、クライアント12の情報提示モジュール201の制御部212は、ユーザの操作を待つか否かを判定する。ユーザの操作を待つと判定された場合、処理はステップS102に進む。
 ステップS102において、情報処理システム1は、ユーザ操作情報を取得する。具体的には、注目ユーザがクライアント12の情報提示モジュール201の入力部211を用いて検索・推薦サービスに対する所定の操作を行った場合、入力部211は、その操作内容を示す情報を制御部212に供給する。
 この検索・推薦サービスに対する所定の操作には、例えば、検索・推薦サービスによる情報の提示を開始又は更新する操作や、検索・推薦サービスを終了させる操作が想定される。また、例えば、検索クエリの入力、情報を検索する期間(日時)の設定、情報に用いられている言語の設定、情報を配信するRSSサイトの選択等の情報の検索条件を設定する操作が想定される。なお、提示された情報に対する反応を示す操作については、後述するステップS112において検出される。
 制御部212は、注目ユーザの操作内容を示すユーザ操作情報を生成する。制御部212は、生成したユーザ操作情報を、管理部241、通信部242及びネットワーク13を介してサーバ11に送信する。サーバ11の情報統合モジュール117のユーザ情報取得部193は、クライアント12から送信されたユーザ操作情報を通信部194を介して受信し、管理部191に供給する。管理部191は、取得したユーザ操作情報を、必要に応じて各モジュールに供給する。
 その後、処理はステップS103に進む。
 一方、ステップS101において、ユーザの操作を待たないと判定された場合、ステップS102の処理はスキップされ、処理はステップS103に進む。これは、例えば、ユーザ操作なしに検索・推薦サービスによる情報の提示の開始又は更新を行う場合等である。
 ステップS103において、クライアント12のコンテクスト検出モジュール203のコンテクスト解析部233は、ユーザのコンテクストを検出するか否かを判定する。ユーザのコンテクストを検出すると判定された場合、処理はステップS104に進む。
 ステップS104において、コンテクスト検出モジュール203は、ユーザのコンテクストを検出する。具体的には、コンテクスト検出モジュール203の検出部232は、注目ユーザのコンテクストに関するデータを検出する。また、検出部232は、必要に応じて、外部の機器やセンサ等、又は、クライアント12で実行中の検索・推薦サービスAPP以外のサービスやアプリケーションプログラムから、注目ユーザのコンテクストに関するデータを取得する。検出部232は、検出及び取得したデータをコンテクスト解析部233に供給する。
 次に、コンテクスト解析部233は、取得したデータに基づいて、現在の注目ユーザのコンテクストを解析する。そして、コンテクスト解析部233は、必要に応じて現在の注目ユーザのコンテクストを所定の分類方法に従って分類する。
 なお、以下、注目ユーザのコンテクストが以下のように分類される場合について説明する。例えば、注目ユーザが使用しているクライアント12の種類が、ウェアラブルデバイス、スマートフォン、タブレット、又は、パーソナルコンピュータに分類される。現在の曜日が平日又は休日に分類される。現在の時間帯が、朝、昼又は夜に分類される。注目ユーザのいる場所が、自宅、会社、乗り物(例えば、電車等)の中、又は、外出先に分類される。現在の注目ユーザの行動が、立っている、座っている、又は、歩いているに分類される。
 また、注目ユーザが一緒にいる人が、1人もいない場合、妻である場合、子供である場合、又は、妻及び子供である場合に分類される。なお、コンテクスト解析部233は、例えば、注目ユーザの周囲を撮影した画像に基づいて、注目ユーザが1人でいるのか、或いは、他の人と一緒にいるのかを検出する。また、コンテクスト解析部233は、注目ユーザが他の人と一緒にいる場合、例えば、顔認識等の技術を用いて、一緒にいる人を特定する。或いは、コンテクスト解析部233は、例えば、SNS等のアプリケーションプログラムからの情報に基づいて、注目ユーザと一緒にいる人を検出する。
 さらに、コンテクスト解析部233は、注目ユーザの周囲の状況(例えば、混雑具合、騒音のレベル等)の解析を行う。
 なお、コンテクストの解析方法及び分類方法には、任意の方法を採用することが可能である。また、コンテクストの分類方法は、必ずしも固定する必要はなく、例えば、ユーザ毎に変更したり、状況に応じて変更したりすることが可能である。
 コンテクスト解析部233は、注目ユーザの現在のコンテクストを示すユーザコンテクスト情報を生成し、管理部241、通信部242及びネットワーク13を介して、サーバ11に送信する。サーバ11の情報統合モジュール117のユーザ情報取得部193は、クライアント12から送信されたユーザコンテクスト情報を通信部194を介して受信し、管理部191に供給する。管理部191は、取得したユーザコンテクスト情報を、必要に応じて各モジュールに供給したり、記憶部195に記憶させたりする。
 その後、処理はステップS105に進む。
 一方、ステップS103において、ユーザのコンテクストを検出しないと判定された場合、ステップS104の処理はスキップされ、処理はステップS105に進む。
 ステップS105において、サーバ11の情報個人化モジュール116の検索部181は、ユーザに提示する情報を検索するか否かを判定する。ユーザに提示する情報を検索すると判定された場合、処理はステップS106に進む。
 ステップS106において、検索部181は、ユーザに提示する情報の検索を行う。具体的には、検索部181は、管理部191を介して、閲覧対象情報を記憶部195から取得する。そして、検索部181は、例えば、注目ユーザにより指定された検索条件と合致する情報を、閲覧対象情報の中から検索する。検索部181は、検索結果を示す情報を管理部191に供給し、管理部191は、検索結果を示す情報を記憶部195に記憶させる。
 なお、以下、ステップS106の処理で検索された記事を検索情報と称する。
 その後、処理はステップS107に進む。
 一方、ステップS105において、ユーザに提示する情報を検索しないと判定された場合、ステップS106の処理はスキップされ、処理はステップS107に進む。
 ステップS107において、サーバ11の情報個人化モジュール116の推薦部182は、ユーザに情報を推薦するか否かを判定する。ユーザに情報を推薦すると判定された場合、処理はステップS108に進む。
 ステップS108において、推薦部182は、推薦情報抽出処理を実行する。ここで、図7のフローチャートを参照して、推薦情報抽出処理の詳細について説明する。
 ステップS151において、推薦部182は、意外性推薦情報を推薦するか否かを判定する。具体的には、推薦部182は、管理部191を介して、注目ユーザの提示情報履歴を記憶部195から取得する。そして、検索部181は、注目ユーザの提示情報履歴に基づいて、意外性情報を推薦するか否かを判定する。
 例えば、推薦部182は、注目ユーザが意外性推薦情報によくアクセスしている場合、意外性情報を推薦すると判定し、あまりアクセスしていない場合、意外性情報を推薦しないと判定する。なお、意外性推薦情報によくアクセスしているか否かは、例えば、直近の所定の期間内における注目ユーザの意外性推薦情報へのアクセス回数に基づいて判定される。
 また、例えば、推薦部182は、注目ユーザが意外性推薦情報に対してポジティブな反応を示している場合、意外性情報を推薦すると判定し、あまりポジティブな反応を示していない場合、意外性情報を推薦しないと判定する。なお、意外性推薦情報に対してポジティブな反応を示しているか否かは、例えば、直近の所定の期間内において、注目ユーザが意外性推薦情報に対してポジティブな反応を示した回数又は割合等に基づいて判定される。
 なお、意外性推薦情報が全く推薦されなくなるのを避けるために、意外性推薦情報を推薦しないという判定条件を満たす場合においても、時々は意外性推薦情報を推薦すると判定するようにすることが望ましい。
 そして、意外性推薦情報を推薦しないと判定された場合、処理はステップS152に進む。
 ステップS152において、推薦部182は、各閲覧対象情報の通常推薦スコアを算出する。具体的には、推薦部182は、管理部191を介して、閲覧対象情報、並びに、注目ユーザの単語嗜好ベクトル(以下、WPVと称する)及びトピック嗜好ベクトル(以下、TPVと称する)を記憶部195から取得する。
 ここで、WPVとは、注目ユーザの単語に対する嗜好を示すベクトルであり、TPVとは、注目ユーザのトピックに対する嗜好を示すベクトルである。後述するステップS114において、注目ユーザの全般的なWPV及びTPV、並びに、所定の基準により分類されたコンテクスト毎のWPV及びTPVが生成される。
 推薦部182は、例えば、注目ユーザの全般的なWPVと各閲覧対象情報の単語ベクトルAWVとの間の類似度、及び、注目ユーザの全般的なTPVと各閲覧対象情報のトピックベクトルATVとの間の類似度の少なくとも一方に基づいて、各閲覧対象情報に対する通常推薦スコアを算出する。
 なお、ベクトル間の類似度は、例えばコサイン距離等により算出され、通常推薦スコアは、ベクトル間の類似度が高くなるほど大きくなる。
 ステップS153において、推薦部182は、閲覧対象情報の中から通常推薦スコアが高い情報を通常推薦情報として抽出する。例えば、推薦部182は、閲覧対象情報のうち通常推薦スコアが上位A件の情報を通常推薦情報として抽出する。これにより、注目ユーザの嗜好度が高い情報が、優先的に通常推薦情報として抽出される。
 その後、推薦情報抽出処理は終了する。
 一方、ステップS151において、意外性推薦情報を推薦すると判定された場合、処理はステップS154に進む。
 ステップS154において、推薦部182は、意外性推薦情報の抽出方法を選択する。後述するように、意外性推薦情報の抽出方法には複数の方法がある。そこで、推薦部182は、複数の抽出方法の中から1つを選択する。
 例えば、推薦部182は、複数の抽出方法の中からランダムに1つを選択する。
 或いは、推薦部182は、注目ユーザの嗜好に基づいて、抽出方法を選択する。例えば、推薦部182は、管理部191を介して、注目ユーザの意外性推薦情報反応分布の集計結果を記憶部195から取得する。そして、推薦部182は、注目ユーザがポジティブな反応を示した回数又は割合に基づいて、意外性推薦情報の各種類に対して重み付けを行う。例えば、注目ユーザがポジティブな反応を示した回数が多い意外性推薦情報の種類ほど重みが大きくなり、注目ユーザがポジティブな反応を示した回数が少ない意外性推薦情報の種類ほど重みが小さくなる。また、例えば、注目ユーザがポジティブな反応を示した割合が高い意外性推薦情報の種類ほど重みが大きくなり、注目ユーザがポジティブな反応を示した割合が低い意外性推薦情報の種類ほど重みが小さくなる。
 そして、推薦部182は、設定した重みに従って、注目ユーザに推薦する意外性推薦情報の種類を選択する。すなわち、重みが大きい種類ほど選択される確率が高くなり、重みが小さい種類ほど選択される確率が低くなる。そして、推薦部182は、選択した種類の意外性推薦情報の抽出に用いる抽出方法を選択する。
 ステップS155において、推薦部182は、意外性推薦情報抽出処理を実行し、推薦情報抽出処理は終了する。ここで、図8乃至図21を参照して、意外性推薦情報抽出処理の詳細について説明する。
(意外性推薦情報抽出処理の第1の実施の形態)
 まず、図8及び図9を参照して、意外性推薦情報抽出処理の第1の実施の形態について説明する。図8は、意外性推薦情報抽出処理の第1の実施の形態を説明するためのフローチャートである。図9は、各情報の関係を示す図である。
 ステップS201において、図7のステップS152の処理と同様に、各閲覧対象情報の通常推薦スコアが算出される。
 ステップS202において、推薦部182は、閲覧対象情報の中から通常推薦スコアが高い情報を通常推薦対象情報として抽出する。例えば、推薦部182は、閲覧対象情報のうち通常推薦スコアが上位A件の情報を通常推薦対象情報として抽出する。
 ステップS203において、推薦部182は、通常推薦対象情報の中から特に通常推薦スコアが高い情報を関連性シード情報として抽出する。例えば、推薦部182は、通常推薦対象情報のうち通常推薦スコアが上位S件の情報を関連性シード情報として抽出する。これにより、注目ユーザの嗜好度が特に高い情報が、優先的に関連性シード情報として抽出される。
 ステップS204において、推薦部182は、通常推薦対象情報から関連性シード情報を除いた情報を意外性対象情報とする。
 ステップS205において、推薦部182は、関連性シード情報のトピック解析を行う。例えば、推薦部182は、次式(6)に従って、関連性シードトピックベクトルSTVを計算する。
Figure JPOXMLDOC01-appb-M000004
 なお、SNjは、関連性シード情報に含まれる情報djの通常推薦スコアである。従って、関連性シードトピックベクトルSTVは、各トピックzkに帰属する確率に基づいて、関連性シード情報の全般的な特徴を表す特徴ベクトルとなる。換言すれば、関連性シードトピックベクトルSTVは、関連性シード情報の全般的なトピックの傾向を表す。
 ステップS206において、推薦部182は、関連性シード情報とのトピックの類似度に基づいて、意外性対象情報のシード推薦スコアを算出する。例えば、推薦部182は、意外性対象情報に含まれる各情報djのトピックベクトルATVjと関連性シードトピックベクトルSTVとのコサイン距離を、各情報djのシード推薦スコアとして算出する。各情報djのシード推薦スコアは、情報djのトピックと関連性シード情報のトピックとの類似度が高いほど大きくなり、類似度が低いほど小さくなる。換言すれば、各情報djのシード推薦スコアは、情報djのトピックと関連性シード情報のトピックとの関連性が高いほど大きくなり、関連性が低いほど小さくなる。
 ステップS207において、推薦部182は、意外性対象情報の中からシード推薦スコアが低い情報を意外性推薦情報として抽出する。例えば、推薦部182は、意外性対象情報のうちシード推薦スコアが下位B件の情報を意外性推薦情報として抽出する。これにより、意外性対象情報のうち、関連性シード情報のトピックと類似度が低いトピックに関する情報が、優先的に意外性推薦情報として抽出される。
 ステップS208において、推薦部182は、通常推薦対象情報から意外性推薦情報を除外した情報を通常推薦情報とする。
 推薦部182は、通常推薦情報及び意外性推薦情報の抽出結果を示す情報を管理部191に供給し、管理部191は、抽出結果を示す情報を記憶部195に記憶させる。
 その後、意外性推薦情報抽出処理は終了する。
 この第1の実施の形態では、注目ユーザの嗜好度が高い情報のうち、注目ユーザの嗜好度が特に高い情報(関連性シード情報)との間でトピックの類似度(関連性)が低い情報が、優先的に意外性推薦情報として抽出される。また、注目ユーザの嗜好度が高い情報(通常推薦対象情報)から意外性推薦情報を除いた情報が、通常推薦情報として抽出される。
 例えば、通常推薦スコアが上位の情報にスポーツに関する情報が多い場合、関連性シード情報は、スポーツに関する情報が中心になる。一方、意外性推薦情報は、スポーツ以外のトピックに関する情報で注目ユーザの嗜好に合う情報が中心になる。従って、後述するように、通常推薦情報及び意外性対象情報を推薦することにより、幅広いトピックの情報を注目ユーザに提示することができる。
(意外性推薦情報抽出処理の第2の実施の形態)
 次に、図10及び図11を参照して、意外性推薦情報抽出処理の第2の実施の形態について説明する。図10は、意外性推薦情報抽出処理の第2の実施の形態を説明するためのフローチャートである。図11は、各情報の関係を示す図である。
 ステップS251において、図7のステップS152の処理と同様に、各閲覧対象情報の通常推薦スコアが算出される。
 ステップS252において、図7のステップS153の処理と同様に、閲覧対象情報の中から通常推薦スコアが高い情報が通常推薦情報として抽出される。
 ステップS253において、図8のステップS203と同様の処理により、通常推薦情報の中から特に通常推薦スコアが高い情報が関連性シード情報として抽出される。
 ステップS254において、推薦部182は、閲覧対象情報から関連性シード情報を除いた情報を意外性対象情報とする。
 ステップS255において、推薦部182は、関連性シード情報の単語解析を行う。例えば、推薦部182は、次式(7)に従って、関連性シード単語ベクトルSWVを計算する。
Figure JPOXMLDOC01-appb-M000005
 関連性シード単語ベクトルSWVは、関連性シード情報に含まれる各情報における各単語の重みに基づいて、関連性シード情報の全般的な特徴を表す特徴ベクトルとなる。換言すれば、関連性シード単語ベクトルSWVは、関連性シード情報における各単語の重要度を表す。
 ステップS256において、推薦部182は、関連性シード情報の特徴を表す重要な単語を関連性シード単語群として抽出する。例えば、推薦部182は、関連性シード単語ベクトルSWVにおいてtfidfが上位W個の単語を関連性シード単語群として抽出する。
 ステップS257において、推薦部182は、意外性対象情報から関連性シード単語群をいずれも含まない情報を除外する。これにより、意外性対象情報から、関連性シード単語群に含まれる単語が1つも出現しない情報が除外される。
 ステップS258乃至S260において、図8のステップS205乃至S207と同様の処理が実行される。なお、ステップS260において、推薦部182は、通常推薦情報及び意外性推薦情報の抽出結果を示す情報を管理部191に供給し、管理部191は、抽出結果を示す情報を記憶部195に記憶させる。
 その後、意外性推薦情報抽出処理は終了する。
 この第2の実施の形態は、第1の実施の形態と比較して、通常推薦情報及び意外性推薦情報の抽出方法が異なっている。すなわち、注目ユーザの嗜好度が高い情報が、優先的に通常推薦情報として抽出される。また、注目ユーザの嗜好度が特に高い情報(関連性シード情報)の特徴を表す重要な単語を含む情報のうち、関連性シード情報との間でトピックの類似度(関連性)が低い情報が、優先的に意外性推薦情報として抽出される。
 例えば、通常推薦スコアが上位の情報にスポーツに関する情報が多い場合、関連性シード情報は、スポーツに関する情報が中心になる。また、関連性シード単語群は、スポーツに関する単語が中心になる。
 例えば、関連性シード単語群として「サッカー選手A」や「野球チームB」が抽出された場合、「サッカー選手A」又は「野球チームB」を含むが、スポーツ以外のトピックに関する情報が、意外性推薦情報として抽出される。例えば、サッカー選手Aの応援ソングに関する音楽情報、野球チームBの経営を分析したビジネス情報等が、意外性推薦情報として抽出される。
(意外性推薦情報抽出処理の第3の実施の形態)
 次に、図12及び図13を参照して、意外性推薦情報抽出処理の第3の実施の形態について説明する。図12は、意外性推薦情報抽出処理の第3の実施の形態を説明するためのフローチャートである。図13は、各情報の関係を示す図である。
 図12のフローチャートを図8の第1の実施の形態のフローチャートを比較すると、ステップS303の処理のみが異なっている。
 すなわち、図8のステップS203においては、通常推薦対象情報の中から特に通常推薦スコアが高い情報が関連性シード情報として抽出される。
 一方、ステップS303においては、推薦部182は、ユーザが直近にアクセスした情報を関連性シード情報として抽出する。例えば、推薦部182は、注目ユーザが過去にアクセスした情報のうち最新のS件の情報を関連性シード情報として抽出する。或いは、例えば、推薦部182は、注目ユーザが直近の所定の期間内にアクセスした情報を関連性シード情報として抽出する。これにより、注目ユーザがアクセスした時期が現在に近い情報が、優先的に関連性シード情報として抽出される。
 なお、注目ユーザがアクセスした情報には、例えば、注目ユーザが自らの操作でクライアント12に提示させた情報、注目ユーザの操作によらずにクライアント12に提示された情報のうち注目ユーザが反応を示した情報(例えば、評価を入力した情報)等が含まれる。
 このように、第3の実施の形態は、第1の実施の形態と比較して、関連性シード情報の抽出方法のみが異なる。すなわち、第3の実施の形態では、注目ユーザが直近にアクセスした情報が関連性シード情報として抽出される。
 従って、第3の実施の形態では、注目ユーザの嗜好度が高い情報のうち、注目ユーザが直近にアクセスした情報(関連性シード情報)との間でトピックの類似度が低い情報が、優先的に意外性推薦情報として抽出される。
 これにより、例えば、注目ユーザが最近興味を持っているトピックとは異なるが、注目ユーザの嗜好と合うトピックに関する情報が、意外性推薦情報として抽出される。例えば、注目ユーザが直近に経済に関する情報を中心にアクセスしていた場合、経済以外のトピックに関する情報で、ユーザの嗜好に合う情報が、優先的に意外性推薦情報として抽出される。
(意外性推薦情報抽出処理の第4の実施の形態)
 次に、図14及び図15を参照して、意外性推薦情報抽出処理の第4の実施の形態について説明する。図14は、意外性推薦情報抽出処理の第4の実施の形態を説明するためのフローチャートである。図15は、各情報の関係を示す図である。
 図14のフローチャートを図10の第2の実施の形態のフローチャートと比較すると、ステップS353の処理のみが異なっている。
 すなわち、図10のステップS253においては、通常推薦対象情報の中から特に通常推薦スコアが高い情報が関連性シード情報として抽出される。
 一方、ステップS353においては、図12のステップS303の処理と同様に、ユーザが直近にアクセスした情報が関連性シード情報として抽出される。
 このように、第4の実施の形態は、第2の実施の形態と比較して、関連性シード情報の抽出方法のみが異なる。すなわち、第4の実施の形態では、注目ユーザが直近にアクセスした情報が関連性シード情報として抽出される。そして、注目ユーザが直近にアクセスした情報(関連性シード情報)の特徴を表す重要な単語を含む情報のうち、関連性シード情報との間でトピックの類似度が低い情報が、優先的に意外性推薦情報として抽出される。
 例えば、注目ユーザが直近に「映画A」及び「俳優B」に関連する映画の情報に多くアクセスしている場合、「映画A」又は「俳優B」を含むが、映画以外のトピックに関する情報が、意外性推薦情報として抽出される。例えば、「映画A」のロケ地の歴史に関する情報、「俳優B」の趣味の登山に関する情報等が、意外性推薦情報として抽出される。
(意外性推薦情報抽出処理の第5の実施の形態)
 次に、図16及び図17を参照して、意外性推薦情報抽出処理の第5の実施の形態について説明する。図16は、意外性推薦情報抽出処理の第5の実施の形態を説明するためのフローチャートである。図17は、各情報の関係を示す図である。
 ステップS401において、推薦部182は、ユーザの現在のコンテクストに基づいて、各閲覧対象情報のコンテクスト推薦スコアを算出する。具体的には、推薦部182は、管理部191を介して、閲覧対象情報、並びに、注目ユーザのWPV及びTPVを記憶部195から取得する。
 上述したように、後述するステップS114において、注目ユーザの全般的なWPV及びTPVだけでなく、所定の基準により分類されたコンテクスト毎のWPV及びTPVも生成される。
 例えば、注目ユーザの平日のWPV及びTPV、並びに、休日のWPV及びTPVが生成される。また、注目ユーザの朝のWPV及びTPV、昼のWPV及びTPV、並びに、夜のWPV及びTPVが生成される。さらに、注目ユーザの自宅におけるWPV及びTPV、会社におけるWPV及びTPV、乗り物内におけるWPV及びTPV、並びに、外出先におけるWPV及びTPVが生成される。また、注目ユーザが立っている場合のWPV及びTPV、座っている場合のWPV及びTPV、並びに、歩いている場合のWPV及びTPVが生成される。さらに、注目ユーザと一緒にいる人が、1人もいない場合のWPV及びTPV、妻である場合のWPV及びTPV、子供である場合のWPV及びTPV、並びに、妻及び子供である場合のWPV及びTPVが生成される。
 推薦部182は、これらのコンテクストの分類単位毎のWPV及びTPVのうち注目ユーザの現在のコンテクストに対応するWPV及びTPVを用いて、注目ユーザの現在のコンテクストに応じたWPV(以下、統合WPVと称する)及びTPV(以下、統合TPVと称する)を生成する。例えば、注目ユーザが平日の朝に電車内で立っている場合、推薦部182は、注目ユーザの平日のWPV、朝のWPV、乗り物内におけるWPV、及び、立っている場合のWPVを加算することにより、統合WPVを生成する。同様に、推薦部182は、注目ユーザの平日のTPV、朝のTPV、乗り物内におけるTPV、及び、立っている場合のTPVを加算することにより、統合TPVを生成する。
 また、例えば、注目ユーザが自宅で子供といる場合、推薦部182は、注目ユーザの自宅におけるWPV、及び、一緒にいる人が子供である場合のWPVを加算することにより、統合WPVを生成する。同様に、推薦部182は、注目ユーザの自宅におけるTPV、及び、一緒にいる人が子供である場合のTPVを加算することにより、統合TPVを生成する。
 そして、推薦部182は、例えば、注目ユーザの統合WPVと各閲覧対象情報の単語ベクトルとの間の類似度、及び、注目ユーザの統合TPVと各閲覧対象情報のトピックベクトルとの間の類似度の少なくとも一方に基づいて、各閲覧対象情報に対するコンテクスト推薦スコアを算出する。
 なお、ベクトル間の類似度は、例えばコサイン距離等により算出され、コンテクスト推薦スコアは、ベクトル間の類似度が高くなるほど大きくなる。
 ステップS402において、推薦部182は、閲覧対象情報の中からコンテクスト推薦スコアが高い情報を通常推薦情報として抽出する。例えば、推薦部182は、閲覧対象情報のうちコンテクスト推薦スコアが上位A件の情報を通常推薦情報として抽出する。これにより、現在のコンテクストにおいて注目ユーザの嗜好度が高い情報が、優先的に通常推薦情報として抽出される。
 ステップS403において、推薦部182は、通常推薦情報の中からコンテクスト推薦スコアが特に高い情報を関連性シード情報として抽出する。例えば、推薦部182は、通常推薦情報のうちコンテクスト推薦スコアが上位S件の情報を関連性シード情報として抽出する。これにより、現在のコンテクストにおいて注目ユーザの嗜好度が特に高い情報が、優先的に関連性シード情報として抽出される。
 ステップS404において、推薦部182は、ユーザの現在のコンテクストとは異なる条件で、各閲覧対象情報の意外性推薦スコアを算出する。例えば、推薦部182は、ユーザの現在のコンテクストとは異なるコンテクストに基づいて、ステップS401と同様の処理により、各閲覧対象情報の推薦スコアを算出し、算出した推薦スコアを意外性推薦スコアとする。或いは、推薦部182は、図7のステップS152の処理と同様に、各閲覧対象情報の通常推薦スコアを算出し、算出した通常推薦スコアを意外性推薦スコアとする。
 ステップS405において、推薦部182は、閲覧対象情報の中から意外性推薦スコアが高い情報を意外性対象情報として抽出する。例えば、推薦部182は、閲覧対象情報のうち意外性推薦スコアが上位T件の情報を意外性対象情報として抽出する。これにより、現在のコンテクストとは異なる条件において注目ユーザの嗜好度が高い情報が、優先的に意外性対象情報として抽出される。
 ステップS406乃至S408において、図10の第2の実施の形態のステップS258乃至S260と同様の処理が実行される。
 その後、意外性推薦情報抽出処理は終了する。
 この第5の実施の形態では、現在のコンテクストにおいて注目ユーザの嗜好度が高い情報が、優先的に通常推薦情報として抽出される。一方、現在のコンテクストとは異なるコンテクストにおいて注目ユーザの嗜好度が高い情報、又は、コンテクスとは無関係に全般的に注目ユーザの嗜好度が高い情報のうち、現在のコンテクストにおいて特に注目ユーザの嗜好度が高い情報(関連性シード情報)との間でトピックの類似度が低い情報が、優先的に意外性推薦情報として抽出される。
 例えば、注目ユーザが平日の朝の電車内で経済に関する情報によくアクセスしている場合、平日の朝の電車内において、経済に関する情報が通常推薦情報として抽出される。一方、例えば、注目ユーザが休日に音楽に関する情報によくアクセスしている場合、平日の朝の電車内において、音楽に関する情報が意外性推薦情報として抽出される。
(意外性推薦情報抽出処理の第6の実施の形態)
 次に、図18及び図19を参照して、意外性推薦情報抽出処理の第6の実施の形態について説明する。図18は、意外性推薦情報抽出処理の第6の実施の形態を説明するためのフローチャートである。図19は、各情報の関係を示す図である。
 ステップS451乃至S455において、図16の第5の実施の形態のステップS401乃至S405と同様の処理が実行される。
 ステップS456乃至S461において、図10の第2の実施の形態のステップS255乃至S260と同様の処理が実行される。
 その後、意外性推薦情報抽出処理は終了する。
 このように、第6の実施の形態は、第2の実施の形態と第5の実施の形態とを組み合わせた実施の形態である。具体的には、第6の実施の形態は、第5の実施の形態と比較して、通常推薦情報の抽出方法は同様であるが、意外性推薦情報の抽出方法が異なっている。すなわち、第6の実施の形態では、第5の実施の形態と比較して、意外性推薦情報が、現在の注目ユーザのコンテクストにおいて特に嗜好度が高い情報(関連性シード情報)の特徴を表す重要な単語を含む情報にさらに絞り込まれる。
 例えば、注目ユーザが平日の朝の電車内で経済に関する情報によくアクセスしている場合、平日の朝の電車内において、経済に関する情報が通常推薦情報として抽出される。一方、例えば、注目ユーザが休日に音楽に関する情報によくアクセスしており、かつ、「会社S」及び「景気」が関連性シード単語群として抽出された場合、平日の朝の電車内において、会社Sがスポンサの音楽イベントに関する情報、音楽業界の景気を分析した情報等が意外性推薦情報として抽出される。
(意外性推薦情報抽出処理の第7の実施の形態)
 次に、図20のフローチャートを参照して、意外性推薦情報抽出処理の第7の実施の形態について説明する。
 ステップS501乃至S507において、図10の第2の実施の形態のステップS251乃至S257と同様の処理が実行される。
 ステップS508において、推薦部182は、関連性シード単語群の各単語を含む情報の主観タイプに対するユーザの嗜好を分析する。
 ここで、各情報は、特開2010-272004号公報(以下、特許文献2と称する)や、「N. Kobayashi他, "Opinion Mining from Web documents: Extraction and Structurization", 人工知能学会論文誌, Vol.22, No.2, March 2007, pp.227-238」(以下、非特許文献1と称する)等に開示されている主観判別の手法を用いることにより、主観性に基づいて2以上の主観タイプに分類することができる。例えば、各情報は、主観的な情報と客観的な(中立的な)情報の2種類に分類することができる。また、例えば、主観的な情報は、ポジティブな情報とネガティブな情報に分類することができる。
 ここで、主観的な情報とは、例えば、主観的な表現(例えば、思考、意見、感情等)を含む情報のことであり、特許文献2の意見文に該当する。一方、客観的な情報とは、例えば、主観的な表現を含まず、客観的な事実のみを含む情報であり、特許文献2の非意見文に該当する。また、ポジティブな情報とは、例えば、ポジティブな表現を含む情報のことである。一方、ネガティブな情報とは、例えば、ネガティブな表現を含む情報のことである。
 このように、各情報は、主観判別の手法を用いて、ポジティブな情報、ネガティブな情報、及び、客観的な情報の3種類の主観タイプに分類することができる。
 そこで、まず、推薦部182は、主観判別により各関連性シード情報をポジティブな情報、ネガティブな情報、及び、客観的な情報の3つの主観タイプに分類する。
 次に、推薦部182は、関連性シード単語群の中から単語を1つ選択し、選択した単語を含む情報を関連性シード情報の中から抽出し、抽出した情報を主観タイプにより分類する。そして、推薦部182は、最も情報の数が多い主観タイプを、選択した単語を含む情報に対して注目ユーザが好む主観タイプであると推定する。
 例えば、関連性シード単語群に「サッカー」が含まれ、関連性シード情報のうち「サッカー」を含む情報を主観タイプにより分類したところ、ポジティブな情報の数が最も多い場合、注目ユーザは、「サッカー」を含む情報のうちポジティブな情報を好むと推定される。
 推薦部182は、関連性シード単語群の全ての単語について、同様の処理を行う。これにより、関連性シード単語群に含まれる単語毎に、各単語を含む情報の主観タイプに対する注目ユーザの嗜好が推定される。
 ステップS509において、推薦部182は、意外性対象情報からユーザの嗜好と一致する主観タイプの情報を除外する。
 まず、推薦部182は、主観判別により各意外性対象情報をポジティブな情報、ネガティブな情報、及び、客観的な情報の3つの主観タイプに分類する。
 次に、推薦部182は、関連性シード単語群の中から単語を1つ選択し、選択した単語を含む情報を意外性対象情報から抽出する。そして、推薦部182は、抽出した情報の中から、選択した単語を含む情報について注目ユーザが好む主観タイプと一致する主観タイプの情報を、意外性対象情報から除外する。
 例えば、注目ユーザが「サッカー」を含むポジティブな情報を好む場合、「サッカー」を含むポジティブな情報が、意外性対象情報から除外される。
 推薦部182は、関連性シード単語群の全ての単語について、同様の処理を行う。これにより、関連性シード単語群のいずれかを含み、各単語について注目ユーザが好む主観タイプと一致する主観タイプの情報が、意外性対象情報から除外される。
 なお、関連性シード単語群に含まれる単語を2つ以上含み、一部の単語については注目ユーザが好む主観タイプと一致し、一部の単語については注目ユーザが好む主観タイプと異なる情報が存在する場合が想定される。例えば、注目ユーザが、「サッカー」を含むポジティブな情報を好み、「選手A」を含むネガティブな情報を好む場合、「サッカー」及び「選手A」を含むポジティブな情報又はネガティブな情報が、これに該当する。この場合、推薦部182は、該当する情報を意外性対象情報から除外するようにしてもよいし、除外しないようにしてもよい。
 例えば、推薦部182は、対象となる情報の主観タイプと注目ユーザが好む主観タイプとが一致する単語(以下、主観一致単語と称する)と、対象となる情報の主観タイプと注目ユーザが好む主観タイプとが一致しない単語(以下、主観不一致単語と称する)の数を比較する。例えば、注目ユーザが、「サッカー」を含むポジティブな情報を好み、「選手A」を含むネガティブな情報を好み、「チームB」を含むネガティブな情報を好む場合、「サッカー」、「選手A」、「チームB」を含むポジティブな情報において、「サッカー」は主観一致単語となり、「選手A」、「チームB」は主観不一致単語となる。そして、推薦部182は、主観一致単語の方が主観不一致単語より多い情報を意外性対象情報から除外し、主観不一致単語の方が主観一致単語より多い情報を意外性対象情報から除外しないようにする。なお、主観一致単語と主観不一致単語の数が同じ情報については、除外するようにしてもよいし、除外しないようにしてもよい。
 ステップS510において、推薦部182は、意外性対象情報の中から通常推薦スコアが高い情報を意外性推薦情報として抽出する。例えば、推薦部182は、意外性対象情報のうち通常推薦スコアが上位B件の情報を意外性推薦情報として抽出する。推薦部182は、通常推薦情報及び意外性推薦情報の抽出結果を示す情報を管理部191に供給し、管理部191は、抽出結果を示す情報を記憶部195に記憶させる。
 その後、意外性推薦情報抽出処理は終了する。
 この第7の実施の形態は、第2の実施の形態と比較して、通常推薦情報の選択方法は同様であるが、意外性推薦情報の選択方法が異なっている。すなわち、第7の実施の形態では、注目ユーザの嗜好度が高い情報のうち、注目ユーザの嗜好度が特に高い情報(関連性シード情報)の特徴を表す重要な単語を含み、かつ、関連性シード情報とは主観タイプが異なる(主観タイプの類似度が低い)情報が、優先的に意外性推薦情報として抽出される。
 例えば、注目ユーザが「国家A」を含むネガティブな情報を好む場合、「国家A」を含むポジティブな情報又は客観的な情報が意外性推薦情報として抽出される。例えば、注目ユーザが、「国家A」を批判する情報をよく見ている場合、「国家A」を評価する情報、「国家A」の客観的データに関する情報等が、意外性推薦情報として抽出される。
 なお、ステップS510の処理は省略することも可能である。すなわち、注目ユーザの嗜好を考慮せずに、関連性シード情報と主観タイプが異なる情報を注目ユーザに提示するようにしてもよい。
(意外性推薦情報抽出処理の第8の実施の形態)
 次に、図21のフローチャートを参照して、意外性推薦情報抽出処理の第8の実施の形態について説明する。
 図21のフローチャートを図20の第7のフローチャートと比較すると、ステップS553の処理のみが異なっている。
 すなわち、図20のステップS503においては、通常推薦情報の中から特に通常推薦スコアが高い情報が関連性シード情報として抽出される。
 一方、ステップS553においては、図12の第3の実施の形態のステップS303の処理と同様に、ユーザが直近にアクセスした情報が関連性シード情報として抽出される。
 このように、第8の実施の形態は、第7の実施の形態と比較して、関連性シード情報の抽出方法のみが異なる。すなわち、第8の実施の形態では、注目ユーザが直近にアクセスした情報が関連性シード情報として抽出される。
 従って、第8の実施の形態では、注目ユーザの嗜好度が高い情報のうち、注目ユーザが直近にアクセスした情報(関連性シード情報)の特徴を表す重要な単語を含み、かつ、関連性シード情報とは主観タイプが異なる情報が、優先的に意外性推薦情報として抽出される。
 例えば、注目ユーザが「製品A」の購入を検討しており、「製品A」を称賛する情報ばかり見ている場合、「製品A」を批判する情報や、「製品A」の客観的データに関する情報等が、意外性推薦情報として抽出される。
 なお、ステップS550の処理は省略することも可能である。すなわち、注目ユーザの嗜好を考慮せずに、関連性シード情報と主観タイプが異なる情報を注目ユーザに提示するようにしてもよい。
 なお、以下、ステップS108の推薦情報抽出処理でユーザに推薦する情報として抽出された情報を推薦情報と総称する。すなわち、推薦情報は、通常推薦情報を必ず含み、意外性推薦情報を含む場合がある。
 図6に戻り、一方、ステップS107において、ユーザに情報を推薦しないと判定された場合、ステップS108の処理はスキップされ、処理はステップS109に進む。
 ステップS109において、サーバ11の情報統合モジュール117の提示制御部192は、ユーザに情報を提示するか否かを判定する。ユーザに情報を提示すると判定された場合、処理はステップS110に進む。
 ステップS110において、情報処理システム1は、ユーザに情報を提示する。具体的には、サーバ11の情報統合モジュール117の管理部191は、注目ユーザに対する検索情報及び推薦情報の選択結果を示す情報、並びに、検索情報及び推薦情報のメタデータを記憶部195から取得する。管理部191は、取得した情報及びデータを提示制御部192に供給する。
 提示制御部192は、検索情報及び推薦情報の中から注目ユーザに提示する情報を選択する。そして、提示制御部192は、選択した情報を注目ユーザのクライアント12において提示させるための情報提示制御データを生成する。
 提示制御部192は、通信部194及びネットワーク13を介して、情報提示制御データをクライアント12に送信する。
 クライアント12の情報提示モジュール201の制御部212は、通信部242及び管理部241を介して、サーバ11から情報提示制御データを受信する。制御部212は、情報提示制御データに基づいて、サーバ11により選択された情報を提示部213に提示させる。
 図22は、このとき提示部213に表示される画面の例を示している。
 まず、ウインドウ301が提示部213に表示される。ウインドウ301には、タイトル行311及び情報表示部312a乃至312eが、縦方向に並ぶように配置されている。
 タイトル行311には、ウインドウ301内におすすめ記事が表示されていることが示されている。
 情報表示部312a乃至312eには、例えば、通常推薦情報に抽出された記事の一部又はヘッドラインが表示される。この例では、情報表示部312a乃至312eには全てスポーツ関連の記事が表示されており、注目ユーザがスポーツに強い関心を持っていることが伺える。
 注目ユーザは、入力部121を介して、情報表示部312a乃至312eを選択するためのカーソルを動かしたり、選択を確定したりすることができる。そして、情報表示部312a乃至312eのうちのいずれか1つに対する選択が確定した場合、ウインドウ321及びボタン322が表示される。なお、この図では、ウインドウ301内の情報表示部312aの選択が確定された場合の例が示されている。
 ウインドウ321内には、ウインドウ301において選択された記事の詳細が表示されている。この例では、ウインドウ301内には、サッカー選手Aの活躍に関する記事が表示されている。また、例えば、ウインドウ301内の記事の特徴を表す重要な単語が、他の単語と区別できるように強調して表示されている。この例では、「イタリア」、「サッカー選手A」が強調して表示されている。例えば、上述した意外性推薦情報抽出処理において抽出された関連性シード単語群に含まれる単語が、強調して表示される。
 ボタン322は、ウインドウ321内の記事と意外な関連性を持つ記事を表示させるためのボタンである。ボタン322が押下されると、ウインドウ331が表示される。
 ウインドウ331内には、タイトル行341及び情報表示部342a乃至342cが縦方向に並ぶように配置されている。
 タイトル行341には、ウインドウ331内に意外なおすすめ記事が表示されていることが示されている。
 情報表示部342a乃至342cには、意外性推薦情報として抽出された記事の一部又はヘッドラインが表示されている。より具体的には、ウインドウ321内の記事と意外な関連性を持つ記事の一部又はヘッドラインが表示されている。例えば、情報表示部342aには、サッカー選手Aに関連する記事ではあるが、サッカーとはあまり関係のないサッカー選手Aの応援ソングに関する記事が表示されている。情報表示部342bには、サッカー選手Aに関連する記事ではあるが、サッカーとはあまり関係のないサッカー選手Aの故郷の天候に関する記事が表示されている。情報表示部342cには、イタリアに関連する記事ではあるが、サッカーとはあまり関係のないイタリアの景気に関する記事が表示されている。
 注目ユーザは、入力部121を介して、情報表示部342a乃至342cを選択するためのカーソルを動かしたり、選択を確定したりすることができる。そして、情報表示部342a乃至342cのうちのいずれか1つに対する選択が確定した場合、選択した記事の詳細が表示される。
 なお、例えば、ウインドウ321内の強調された単語を選択できるようにししてもよい。そして、単語が選択された場合、意外性推薦情報として抽出された記事の中から、選択された単語を含む記事に絞り込んで、ウインドウ331内に表示するようにしてもよい。また、単語は、1つずつ選択できるようにしてもよいし、一度に複数選択できるようにしてもよい。
 また、例えば、図23に示されるように、ユーザに提示する情報内の意外な単語の組み合わせを抽出して、ユーザに提示するようにしてもよい。
 具体的には、図23のウインドウ301は、図22のウインドウ301と同じものである。そして、ウインドウ301内の情報表示部312a乃至312eのうちのいずれか1つに対する選択が確定した場合、ウインドウ401乃至403、及び、ボタン404が表示される。なお、この図では、ウインドウ301内の情報表示部312dの選択が確定された場合の例が示されている。
 ウインドウ401内には、ウインドウ301において選択された記事の詳細が表示されている。この例では、ウインドウ401内には、アイドルグループXYZがプロ野球の始球式に登場すること、及び、始球式を務めるのはアイドルグループXYZのメンバーDであることが表示されている。また、ウインドウ401内には、メンバーDが薬膳コーディネーターの資格を取得したことで話題になったことが表示されている。また、ウインドウ401内の記事の特徴を表す重要な単語である「アイドルグループXYZ」及び「薬膳」が、他の単語と区別できるように強調して表示されている。
 ウインドウ402には、下方のウインドウ403内及びボタン404内に、意外な関連性を持つ単語のペアが表示されていることが示されている。
 ウインドウ403とボタン404には、ウインドウ401内の記事に含まれる単語のうち意外な関連性を持つ単語のペアが表示される。この図では、ウインドウ403内に「アイドルグループXYZ」が表示され、ボタン404内に「薬膳」が表示されている。また、ウインドウ403とボタン404が横に並べられ、点線で結ばれるとともに、ウインドウ402内に「意外な関連性」の文字が表示されることにより、注目ユーザは、「アイドルグループXYZ」と「薬膳」が意外な関連性を持つことを容易に認識することができる。そして、ボタン404が押下されると、ウインドウ421が表示される。
 ウインドウ421内には、タイトル行431及び情報表示部432a乃至432cが縦方向に並ぶように配置されている。
 タイトル行431には、ウインドウ421内に意外なおすすめ記事が表示されていることが示されている。
 情報表示部432a乃至432cには、「薬膳」に関する記事の一部又はヘッドラインが表示されている。なお、ウインドウ431内には、例えば、意外性推薦情報のうち「薬膳」を含む記事が表示される。或いは、例えば、単語「薬膳」により検索された記事が表示される。この場合、検索された記事を、さらにユーザの嗜好に基づいて絞り込むようにしてもよい。
 注目ユーザは、入力部121を介して、情報表示部432a乃至432cを選択するためのカーソルを動かしたり、選択を確定したりすることができる。そして、情報表示部432a乃至432cのうちのいずれか1つに対する選択が確定した場合、選択した記事の詳細が表示される。
 なお、例えば、ウインドウ402をボタンにして、当該ボタンを押下することにより、ウインドウ421を表示できるようにしてもよい。
 また、ウインドウ403をボタンにし、当該ボタンを押下することにより、ボタン404を押下した場合と同様に、「アイドルグループXYZ」に基づく意外なおすすめ記事をウインドウ421内に表示するようにしてもよい。
 さらに、例えば、意外な関連性を持つ単語のペアを複数表示するようにしてもよい。この場合、例えば、複数のペアの中から選択されたペアの単語に基づく意外なおすすめ記事をウインドウ421内に表示するようにすればよい。
 ここで、図24のフローチャートを参照して、「アイドルグループXYZ」と「薬膳」のように意外な関連性を持つ単語のペアを抽出するための意外性単語ペア抽出処理について説明する。
 ステップS601において、サーバ11の推薦部182は、提示する情報の特徴を表す重要な単語を複数抽出する。例えば、推薦部182は、提示する情報の単語ベクトルAWVにおいてtfidfの値が上位の単語をX個(X>2)抽出する。或いは、例えば、推薦部182は、提示する情報の単語ベクトルAWVにおいてtfidfの値が所定の閾値以上の単語を複数抽出する。
 ステップS602において、推薦部182は、抽出した単語の全ペアの中から関連性の低いペアを抽出する。例えば、推薦部182は、抽出した単語の全てのペアについて、関連度rel(w,w)を算出する。そして、推薦部182は、関連度rel(w,w)の値が下位のY個のペアを抽出する。或いは、推薦部182は、関連度rel(w,w)の値が所定の閾値以下のペアを抽出する。これにより、抽出した単語の全ペアの中から、単語間の関連性の低いペアが優先的に抽出される。
 そして、抽出された単語のペアが、図23の「アイドルグループXYZ」と「薬膳」のペアのように表示される。
 なお、例えば、抽出した単語のペアのうちtfidfの値が大きい方の単語が、主の単語として図23の左側のウインドウ403内に表示される。一方、tfidfの値が小さい方の単語が、従の単語として右側のウインドウ404内に表示される。これにより、抽出したペアのうち、提示する情報のトピックとの関連度が高い単語が、主の単語として表示されやすくなり、提示する情報のトピックとの関連度が低い単語が、従の単語として表示されやくなる。
 なお、意外な単語の組み合わせに含まれる単語の数は、2つに限定されるものではなく、例えば、3つ以上の単語を含む組み合わせを抽出するようにしてもよい。
 以上のようにして、通常推薦情報と意外性推薦情報を関連付けて、注目ユーザに提示することができる。
 図6に戻り、その後、処理はステップS111に進む。
 一方、ステップS109において、ユーザに情報を提示しないと判定された場合、ステップS110の処理はスキップされ、処理はステップS111に進む。
 ステップS111において、クライアント12の反応検出モジュール202の反応解析部223は、ユーザの反応を検出するか否かを判定する。ユーザの反応を検出すると判定された場合、処理はステップS112に進む。
 ステップS112において、クライアント12の反応検出モジュール202は、ユーザの反応を検出する。例えば、注目ユーザが、提示された情報に対するフィードバック(例えば、提示された情報の選択や評価等)を、入力部221を介して入力した場合、入力部221は、入力されたフィードバックの内容を示す情報を反応解析部223に供給する。ここで、注目ユーザのフィードバックは、明示的なものであっても暗黙的なものであってもよい。
 また、検出部222は、提示された情報に対する注目ユーザの反応を示す情報を検出し、検出した情報を反応解析部223に供給する。ここで、注目ユーザの反応を示す情報とは、注目ユーザの表情の検出結果や、注目ユーザの生体情報(例えば、脈拍、発汗量等)等である。
 反応解析部223は、注目ユーザのフィードバックを示す情報、及び、注目ユーザの反応を示す情報に基づいて、提示された情報に対するユーザの反応を解析する。例えば、反応解析部223は、提示された情報に対して、注目ユーザがポジティブな反応、ネガティブな反応、又は、中立の反応のいずれを示したかを解析する。なお、反応解析部223は、注目ユーザのポジティブ又はネガティブな反応の度合いまで解析するようにしてもよい。例えば、反応解析部223は、注目ユーザが実際に情報にアクセスしたか、又は、注目ユーザが良い評価を与えたか等によりポジティブな反応の度合いを解析する。
 なお、以下、注目ユーザがポジティブな反応を示した情報を、ポジティブ反応情報と称する。注目ユーザがポジティブな反応を示した情報とは、例えば、注目ユーザが良い評価を与えた情報、提示された情報に対して実際にアクセスした情報、ポジティブな生体反応を示した情報等である。また、以下、注目ユーザがネガティブな反応を示した情報を、ネガティブ反応情報と称する。なお、注目ユーザがネガティブな反応を示した情報とは、例えば、注目ユーザが悪い評価を与えた情報、アクセスしなかった情報、ネガティブな生体反応を示した情報等である。また、以下、注目ユーザがポジティブ又はネガティブな反応を示した情報を、ユーザ反応情報と称する。
 反応解析部223は、注目ユーザの反応の解析結果を示すユーザ反応解析情報を生成し、生成したユーザ反応解析情報を、管理部241、通信部242及びネットワーク13を介してサーバ11に送信する。
 サーバ11の情報統合モジュール117のユーザ情報取得部193は、通信部194を介して、クライアント12から送信されたユーザ反応解析情報を受信し、管理部191に供給する。管理部191は、ユーザ反応解析情報に基づいて、注目ユーザの提示情報履歴を更新する。管理部191は、更新した提示情報履歴を記憶部195に記憶させる。
 その後、処理はステップS113に進む。
 一方、ステップS111において、ユーザの反応を検出しないと判定された場合、ステップS112の処理はスキップされ、処理はステップS113に進む。
 ステップS113において、サーバ11の情報個人化モジュール116の学習部172は、ユーザの嗜好を学習するか否かを判定する。ユーザの嗜好を学習すると判定された場合、処理はステップS114に進む。
 ステップS114において、学習部172は、ユーザの嗜好を学習する。具体的には、学習部172は、管理部191を介して、注目ユーザの提示情報履歴を記憶部195から取得する。そして、学習部172は、注目ユーザが反応を示した情報(ユーザ反応情報)の単語ベクトル及びトピックベクトルに基づいて、注目ユーザのWPV及びTPVを生成する。例えば、学習部172は、ユーザ反応情報の単語ベクトルを加算することによりWPVを生成する。同様に、例えば、学習部172は、ユーザ反応情報のトピックベクトルを加算することによりTPVを生成する。
 ここで、学習部172は、注目ユーザの全般的なWPV及びTPVだけでなく、注目ユーザに情報を提示したときのコンテクスト毎のWPV及びTPVを生成する。
 例えば、学習部172は、注目ユーザに平日に提示した情報、及び、注目ユーザに休日に提示した情報にユーザ反応情報を分類する。そして、学習部172は、分類したグループ毎に各ユーザ反応情報の単語ベクトル及びトピックベクトルをそれぞれ加算することによりWPV及びTPVを生成する。これにより、注目ユーザの平日のWPV及びTPV、並びに、休日のWPV及びTPVが生成される。
 また、例えば、学習部172は、注目ユーザに朝に提示した情報、注目ユーザに昼に提示した情報、及び、注目ユーザに夜に提示した情報にユーザ反応情報を分類する。そして、学習部172は、分類したグループ毎に各ユーザ反応情報の単語ベクトル及びトピックベクトルをそれぞれ加算することによりWPV及びTPVを生成する。これにより、注目ユーザの朝のWPV及びTPV、昼のWPV及びTPV、並びに、夜のWPV及びTPVが生成される。
 さらに、例えば、学習部172は、注目ユーザに自宅で提示した情報、注目ユーザに会社で提示した情報、注目ユーザに乗り物内で提示した情報、及び、注目ユーザに外出先で提示した情報にユーザ反応情報を分類する。そして、学習部172は、分類したグループ毎に各ユーザ反応情報の単語ベクトル及びトピックベクトルをそれぞれ加算することによりWPV及びTPVを生成する。これにより、注目ユーザの自宅におけるWPV及びTPV、会社におけるWPV及びTPV、乗り物内におけるWPV及びTPV、並びに、外出先におけるWPV及びTPVが生成される。
 また、例えば、学習部172は、注目ユーザが立っている場合に提示した情報、注目ユーザが座っている場合に提示した情報、又は、注目ユーザが歩いている場合に提示した情報にユーザ反応情報を分類する。そして、学習部172は、分類したグループ毎に各ユーザ反応情報の単語ベクトル及びトピックベクトルをそれぞれ加算することによりWPV及びTPVを生成する。これにより、注目ユーザが立っている場合のWPV及びTPV、座っている場合のWPV及びTPV、並びに、歩いている場合のWPV及びTPVが生成される。
 さらに、例えば、学習部172は、注目ユーザが一人でいる場合に提示した情報、注目ユーザが妻といる場合に提示した情報、注目ユーザが子供といる場合に提示した情報、又は、注目ユーザが妻及び子供といる場合に提示した情報にユーザ反応情報を分類する。そして、学習部172は、分類したグループ毎に各ユーザ反応情報の単語ベクトル及びトピックベクトルをそれぞれ加算することによりWPV及びTPVを生成する。これにより、注目ユーザと一緒にいる人が、1人もいない場合のWPV及びTPV、妻である場合のWPV及びTPV、子供である場合のWPV及びTPV、並びに、妻及び子供である場合のWPV及びTPVが生成される。
 このようにして、注目ユーザのコンテクスト毎の嗜好が学習される。
 なお、学習部172は、例えば、注目ユーザの反応の種類や度合いによって、各ユーザ反応情報の単語ベクトル及びトピックベクトルを、重みをつけて加算するようにしてもよい。例えば、学習部172は、注目ユーザの反応がポジティブかネガティブか等により異なる重みをつけたり、注目ユーザの反応の度合いより異なる重みをつけたりするようにしてもよい。
 また、例えば、学習部172は、注目ユーザがポジティブな反応を示した情報(ポジティブ反応情報)の単語ベクトル及びトピックベクトルのみに基づいて、WPV及びTPVを生成するようにしてもよい。
 さらに、WPV及びTPVの生成に用いる提示情報履歴の対象期間は、任意の期間に設定することができる。例えば、学習部172は、これまで注目ユーザが検索・推薦サービスを利用した全期間の提示情報履歴を用いたり、或いは、直前の所定の期間(例えば、1日、1週間、1か月、1年等)内の提示情報履歴を用いたりする。
 また、学習部172は、注目ユーザの意外性推薦情報の種類に対する嗜好を学習する。具体的には、例えば、学習部172は、注目ユーザがポジティブな反応を示した意外性推薦情報の種類の分布を示す意外性推薦情報反応分布を集計する。
 なお、意外性推薦情報反応分布の集計期間は、任意の期間に設定することができる。例えば、意外性推薦情報反応分布の集計期間は、これまで注目ユーザが検索・推薦サービスを利用した全期間、又は、直前の所定の期間(例えば、1週間、1か月、1年等)に設定される。
 学習部172は、注目ユーザのWPV及びTPV、並びに、意外性推薦情報反応分布の集計結果を、管理部191を介して記憶部195に記憶させる。
 その後、処理はステップS115に進む。
 一方、ステップS113において、ユーザの嗜好を学習しないと判定された場合、ステップS114の処理はスキップされ、処理はステップS115に進む。
 ステップS115において、クライアント12の情報提示モジュール201の制御部212は、情報の提示を終了するか否かを判定する。例えば、制御部212は、ステップS102の処理で取得したユーザの操作内容が、検索・推薦サービスを終了させる操作でない場合、情報の提示を継続すると判定し、処理はステップS101に戻る。
 その後、ステップS115において、情報の提示を終了すると判定されるまで、ステップS101乃至S115の処理が繰り返し実行される。
 一方、ステップS115において、クライアント12の情報提示モジュール201の制御部212は、例えば、ステップS102の処理で取得したユーザの操作内容が、検索・推薦サービスを終了させる操作である場合、情報の提示を終了すると判定する。その後、処理はステップS116に進む。
 ステップS116において、クライアント12は、情報の提示を終了する。例えば、クライアント12の情報提示モジュール201の制御部212は、検索・推薦サービスAPPの実行を終了する。
 その後、情報提示処理は終了する。
 以上のようにして、ユーザが意外性を感じる内容を含む情報を提示することができる。
 例えば、ユーザの嗜好、ユーザの直近にアクセスした情報、及び、ユーザのコンテクストのうち少なくとも1つに基づいて、意外な関連性を持つ情報の組み合わせを抽出し、抽出した情報を関連付けてユーザに提示することができる。
 また、例えば、情報内の意外な関連性を持つ単語の組み合わせを抽出し、抽出した単語を関連づけてユーザに提示することができる。さらに、抽出した単語の組み合わせに基づいて、さらに意外な関連性を持つ情報の組み合わせを抽出し、ユーザに提示することができる。
 また、同じトピックに関して異なる主観性を持つ情報をユーザに提示することができる。
 これにより、ユーザは、アクセスする情報の範囲を広げたり、様々な視点の情報に触れたりすることが容易になる。その結果、例えば、ユーザは、知識を広げたり、物事を多面的に捉えたり、新たな気付きや視点を得たりすることができる。また、情報の検索や閲覧を行う際に、ユーザに飽きの来ない体験をさせることができる。
 また、ユーザに様々なタイプの情報を提示し、提示した情報に対するユーザからのフィードバックを得ることにより、ユーザの嗜好の学習速度や学習精度を高めることができる。
<2.変形例>
 以下、上述した本技術の実施の形態の変形例について説明する。
{推薦情報の抽出に関する変形例}
 例えば、通常推薦情報、通常推薦対象情報、関連性シード情報、及び、意外性推薦情報を抽出する場合に、各スコアの上位の所定の件数の情報ではなく、スコアが所定の閾値以上の情報を抽出するようにしてもよい。
 また、例えば、意外性推薦情報抽出処理の第2の実施の形態(図10)、第5の実施の形態(図16)、第6の実施の形態(図18)、及び、第7の実施の形態(図20)において、通常推薦情報を全て関連性シード情報に設定するようにしてもよい。
 さらに、例えば、意外性推薦情報抽出処理の第2の実施の形態(図10)、第5の実施の形態(図16)、及び、第8の実施の形態(図21)において、例えば、直近に注目ユーザがアクセスした情報の代わりに、直近に注目ユーザがポジティブな反応を示した情報、又は、直近に注目ユーザに提示した情報等を関連性シード情報に用いるようにしてもよい。
 また、例えば、意外性推薦情報抽出処理の第5の実施の形態(図16)、及び、第6の実施の形態(図18)において、注目ユーザの嗜好を考慮せずに、注目ユーザのコンテクストのみに基づいて推薦する情報を抽出するようにすることも可能である。例えば、通常推薦情報を現在の注目ユーザのコンテクストのみに基づいて抽出し、意外性対象情報を現在の注目ユーザのコンテクストと異なるコンテクストのみに基づいて抽出するようにしてもよい。
 さらに、例えば、意外性推薦情報抽出処理の第7の実施の形態(図20)及び第8の実施の形態(図21)において、関連性シード情報の代わりに、通常推薦情報を用いて、主観タイプに対するユーザの嗜好を分析するようにしてもよい。
 また、例えば、関連性シード単語ベクトルSWVにおいてtfidfが所定の閾値以上に単語を、関連性シード単語群として抽出するようにしてもよい。
 さらに、意外性情報抽出処理の各実施の形態は、必要に応じて組み合わせることが可能である。例えば、シード推薦スコアが低い情報の中から、さらに関連性シード情報と主観タイプが異なる情報を意外性推薦情報として抽出するようにしてもよい。
 また、例えば、推薦部182は、閲覧対象情報ではなく、検索部181により検索された検索情報の中から推薦情報を抽出するようにしてもよい。
 さらに、注目ユーザの検索・推薦サービスの利用回数が少なく、提示情報履歴のデータ量が十分でない場合、例えば、推薦部182は、他のユーザの嗜好に基づいて、注目ユーザに推薦する情報を抽出するようにしてもよい。例えば、推薦部182は、全ユーザのWPV及びTPVの平均値、又は、注目ユーザと類似するユーザのWPV及びTPVの平均値を用いて、注目ユーザに推薦する情報を抽出するようにしてもよい。
{提示方法に関する変形例}
 情報の提示方法は、上述した例に限定されるものではなく、視覚的又は聴覚的に様々な方法で提示することが可能である。
 例えば、クライアント12において情報の提示を行うだけでなく、クライアント12から他の装置(例えば、携帯情報端末やウェアラブルデバイス等)に情報を転送して、他の装置が、転送された情報を提示するようにすることも可能である。
 また、例えば、通常推薦情報と意外性対象情報を関連付けて提示しないようにしたり、意外性対象情報のみを提示したりすることも可能である。
{提示対象に関する変形例}
 以上の説明では、ユーザに提示する提示対象を記事とする例を示したが、記事以外の情報を提示対象とする場合にも、本技術を適用することが可能である。
 なお、動画、画像、音声等のテキスト情報以外の情報(以下、非テキスト情報と称する)を提示対象とする場合、例えば、解析部102は、非テキスト情報に関連するテキスト情報に基づいて、上述した潜在トピックモデル用いて、各非テキスト情報を複数のクラスタに分類することができる。この場合、例えば、非テキスト情報のメタデータ(例えば、タイトル、アーティスト、出演者、ジャンル、生成場所、生成日時等)、非テキスト情報に関する評論文、感想文、記事等に含まれるテキスト情報に基づいて、クラスタリングが行われる。
 また、例えば、解析部102は、非テキスト情報の属性や、非テキスト情報自身の特徴量(例えば、動画、画像、音声等の特徴量)に基づいて、非テキスト情報を複数のクラスタに分類することができる。例えば、解析部102は、楽曲データの特徴量に基づいて、楽曲データを複数のクラスタ(例えば、ジャンル)に分類することが可能である。
 さらに、本技術は、例えば、商品、行動、場所、人等に関する情報を提示する場合にも適用することができる。なお、商品等についても、上述したように、関連するテキスト情報や、商品等自身の特徴量に基づいて、クラスタリングを行うことが可能である。
 また、本技術においては、上述した潜在トピックモデル以外の任意のクラスタリング手法を採用することも可能である。さらに、例えば、本技術に採用するクラスタリング手法は、階層的手法であってもよいし、非階層的手法であってもよい。また、例えば、本技術に採用するクラスタリング手法は、ソフトクラスタリングであってもよいし、ハードクラスタリングであってもよい。或いは、人がマニュアルで提示対象のクラスタリングを行うようにしてもよい。
{機能分担等に関する変形例}
 上述したサーバ11とクライアント12の機能の分担は、その一例であり、任意に変更することが可能である。
 例えば、情報個人化モジュール116の全部又は一部の機能をクライアント12に設けてもよい。
 また、例えば、反応検出モジュール202の全部又は一部の機能をサーバ11に設けてもよい。例えば、反応解析部223の機能をサーバ11に設け、サーバ11が、クライアント12で収集された情報及びデータに基づいて、各ユーザの反応を解析するようにしてもよい。
 さらに、例えば、コンテクスト解析モジュール203の全部又は一部の機能をサーバ11に設けてもよい。例えば、コンテクスト解析部233の機能をサーバ11に設け、サーバ11が、クライアント12で収集された情報及びデータに基づいて、各ユーザのコンテクストを解析するようにしてもよい。また、サーバ11が、各ユーザのコンテクストに関するデータの一部を検出するようにしてもよい。
 また、例えば、情報個人化モジュール116の機能の全部又は一部を、クライアント12に設け、クライアント12が、ユーザの嗜好の学習等を行うようにしてもよい。
 さらに、例えば、学習部172をサーバ11の外部に設け、サーバ11が、ユーザの嗜好の学習結果を外部から取得するようにしてもよい。
 また、例えば、提示制御部192の機能の全部又は一部をクライアント12に設け、クライアント12が、提示方法の制御を行うようにしてもよい。
 さらに、例えば、反応検出モジュール202の検出部222の機能の全部又は一部をクライアント12の外部に設けて、ユーザの反応を示す情報の全部又は一部をクライアント12の外部で検出するようにしてもよい。
 また、例えば、コンテクスト検出モジュール203の検出部232の機能の全部又は一部をクライアント12の外部に設けて、ユーザのコンテクストに関するデータの全部又は一部をクライアント12の外部で検出するようにしてもよい。
 さらに、例えば、適宜各モジュールを統合したり、分離したりすることも可能である。例えば、複数のモジュールの入力部、表示部、記憶部を、適宜共用することが可能である。
 また、例えば、サーバ11の機能を複数のサーバで分担するようにしてもよい。
 さらに、本技術は、例えば、クライアント12が自ら情報を収集し、クラスタリングする場合にも適用することができる。
{コンピュータの構成例}
 上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
 図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
 コンピュータにおいて、CPU(Central Processing Unit)601,ROM(Read Only Memory)602,RAM(Random Access Memory)603は、バス604により相互に接続されている。
 バス604には、さらに、入出力インタフェース605が接続されている。入出力インタフェース605には、入力部606、出力部607、記憶部608、通信部609、及びドライブ610が接続されている。
 入力部606は、キーボード、マウス、マイクロフォンなどよりなる。出力部607は、ディスプレイ、スピーカなどよりなる。記憶部608は、ハードディスクや不揮発性のメモリなどよりなる。通信部609は、ネットワークインタフェースなどよりなる。ドライブ610は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア611を駆動する。
 以上のように構成されるコンピュータでは、CPU601が、例えば、記憶部608に記憶されているプログラムを、入出力インタフェース605及びバス604を介して、RAM603にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ(CPU601)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア611に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブルメディア611をドライブ610に装着することにより、入出力インタフェース605を介して、記憶部608にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部609で受信し、記憶部608にインストールすることができる。その他、プログラムは、ROM602や記憶部608に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 さらに、例えば、本技術は以下のような構成も取ることができる。
(1)
 ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出部と、
 前記第1の提示情報の提示を制御する提示制御部と
 を備える情報処理装置。
(2)
 前記抽出部は、前記ユーザの嗜好に基づいて前記ユーザに提示する第2の提示情報を抽出し、
 前記提示制御部は、前記第1の提示情報と前記第2の提示情報とを関連付けて提示するように制御する
 前記(1)に記載の情報処理装置。
(3)
 前記抽出部は、前記第2の提示情報の特徴を表す単語の組み合わせのうち単語間の関連性が低い組み合わせを優先的に抽出し、
 前記提示制御部は、前記第2の提示情報とともに抽出された単語の組み合わせを提示するように制御する
 前記(2)に記載の情報処理装置。
(4)
 前記提示制御部は、提示した前記単語の組み合わせの中から選択された単語を含む前記第1の提示情報を提示するように制御する
 前記(3)に記載の情報処理装置。
(5)
 前記抽出部は、所定の複数のトピックのそれぞれに対する重要度に基づいて各単語の特徴を表すベクトル間の距離に基づいて、各単語間の関連性を計算する
 前記(3)又は(4)に記載の情報処理装置。
(6)
 前記提示制御部は、前記第2の提示情報の特徴を表す単語を他の単語と区別して提示するとともに、前記特徴を表す単語の中から選択された単語を含む前記第1の提示情報を提示するように制御する
 前記(2)乃至(5)のいずれかに記載の情報処理装置。
(7)
 前記抽出部は、前記第2の提示情報から前記シード情報を抽出する
 前記(2)乃至(6)のいずれかに記載の情報処理装置。
(8)
 前記抽出部は、前記ユーザの嗜好に基づいて抽出した情報から前記第1の提示情報を除く情報を前記第2の提示情報として抽出する
 前記(2)乃至(7)のいずれかに記載の情報処理装置。
(9)
 前記抽出部は、前記ユーザの嗜好に基づいて抽出した情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先して前記第1の提示情報として抽出する
 前記(1)乃至(8)のいずれかに記載の情報処理装置。
(10)
 前記抽出部は、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
 前記(1)乃至(9)のいずれかに記載の情報処理装置。
(11)
 前記抽出部は、前記ユーザの現在のコンテクストにおける前記ユーザの嗜好に基づいて前記シード情報を抽出し、前記ユーザの現在のコンテクストと異なるコンテクストにおける前記ユーザの嗜好、又は、前記ユーザの全般的な嗜好に基づいて抽出した情報である抽出情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
 前記(1)乃至(10)のいずれかに記載の情報処理装置。
(12)
 前記抽出部は、前記抽出情報のうち前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
 前記(11)に記載の情報処理装置。
(13)
 前記抽出部は、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報と前記主観タイプが異なる情報を優先的に前記第1の提示情報として抽出する
 前記(1)乃至(12)のいずれかに記載の情報処理装置。
(14)
 前記抽出部は、前記ユーザの嗜好度が高い情報を優先的に前記シード情報として抽出する
 前記(1)乃至(13)のいずれかに記載の情報処理装置。
(15)
 前記抽出部は、前記ユーザがアクセスした時期が現在に近い情報を優先的に前記シード情報として抽出する
 前記(1)乃至(14)のいずれかに記載の情報処理装置。
(16)
 前記抽出部は、所定の複数のトピックにそれぞれ帰属する確率に基づいて情報の特徴を表すベクトル間の距離に基づいて、前記シード情報と対象となる情報との間のトピックの類似度を計算する
 前記(1)乃至(15)のいずれかに記載の情報処理装置。
(17)
 前記抽出部は、複数の方法により前記第1の提示情報を抽出することが可能であり、
 前記複数の方法によりそれぞれ抽出された前記第1の提示情報に対する前記ユーザの嗜好を学習する学習部を
 さらに備え、
 前記抽出部は、前記学習部の学習結果に基づいて、前記第1の提示情報を抽出する方法を選択する
 前記(1)乃至(16)のいずれかに記載の情報処理装置。
(18)
 ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、
 前記第1の提示情報の提示を制御する提示制御ステップと
 を含む情報処理方法。
(19)
 ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、
 前記第1の提示情報の提示を制御する提示制御ステップと
 含む処理をコンピュータに実行させるためのプログラム。
 1 情報処理システム, 11 サーバ, 12 クライアント, 102 解析部, 103 提示情報抽出部, 113 言語解析モジュール, 114 トピック解析モジュール, 115 関連性解析モジュール, 116 情報個人化モジュール, 117 情報統合モジュール, 141 言語解析部, 151 トピック解析部, 161 関連性解析部, 171 抽出部, 172 学習部, 181 検索部, 182 推薦部, 191 管理部, 192 提示制御部, 193 ユーザ情報取得部, 201 情報提示モジュール, 202 反応検出モジュール, 203 コンテクスト検出モジュール, 204 情報統合モジュール, 212 制御部, 213 提示部, 221 入力部, 222 検出部, 223 反応解析部, 232 検出部, 233 コンテクスト解析部, 241 管理部

Claims (19)

  1.  ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出部と、
     前記第1の提示情報の提示を制御する提示制御部と
     を備える情報処理装置。
  2.  前記抽出部は、前記ユーザの嗜好に基づいて前記ユーザに提示する第2の提示情報を抽出し、
     前記提示制御部は、前記第1の提示情報と前記第2の提示情報とを関連付けて提示するように制御する
     請求項1に記載の情報処理装置。
  3.  前記抽出部は、前記第2の提示情報の特徴を表す単語の組み合わせのうち単語間の関連性が低い組み合わせを優先的に抽出し、
     前記提示制御部は、前記第2の提示情報とともに抽出された単語の組み合わせを提示するように制御する
     請求項2に記載の情報処理装置。
  4.  前記提示制御部は、提示した前記単語の組み合わせの中から選択された単語を含む前記第1の提示情報を提示するように制御する
     請求項3に記載の情報処理装置。
  5.  前記抽出部は、所定の複数のトピックのそれぞれに対する重要度に基づいて各単語の特徴を表すベクトル間の距離に基づいて、各単語間の関連性を計算する
     請求項3に記載の情報処理装置。
  6.  前記提示制御部は、前記第2の提示情報の特徴を表す単語を他の単語と区別して提示するとともに、前記特徴を表す単語の中から選択された単語を含む前記第1の提示情報を提示するように制御する
     請求項2に記載の情報処理装置。
  7.  前記抽出部は、前記第2の提示情報から前記シード情報を抽出する
     請求項2に記載の情報処理装置。
  8.  前記抽出部は、前記ユーザの嗜好に基づいて抽出した情報から前記第1の提示情報を除く情報を前記第2の提示情報として抽出する
     請求項2に記載の情報処理装置。
  9.  前記抽出部は、前記ユーザの嗜好に基づいて抽出した情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先して前記第1の提示情報として抽出する
     請求項1に記載の情報処理装置。
  10.  前記抽出部は、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
     請求項1に記載の情報処理装置。
  11.  前記抽出部は、前記ユーザの現在のコンテクストにおける前記ユーザの嗜好に基づいて前記シード情報を抽出し、前記ユーザの現在のコンテクストと異なるコンテクストにおける前記ユーザの嗜好、又は、前記ユーザの全般的な嗜好に基づいて抽出した情報である抽出情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
     請求項1に記載の情報処理装置。
  12.  前記抽出部は、前記抽出情報のうち前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報との間でトピックの類似度が低い情報を優先的に前記第1の提示情報として抽出する
     請求項11に記載の情報処理装置。
  13.  前記抽出部は、前記シード情報の特徴を表す単語を含む情報の中から、前記シード情報と前記主観タイプが異なる情報を優先的に前記第1の提示情報として抽出する
     請求項1に記載の情報処理装置。
  14.  前記抽出部は、前記ユーザの嗜好度が高い情報を優先的に前記シード情報として抽出する
     請求項1に記載の情報処理装置。
  15.  前記抽出部は、前記ユーザがアクセスした時期が現在に近い情報を優先的に前記シード情報として抽出する
     請求項1に記載の情報処理装置。
  16.  前記抽出部は、所定の複数のトピックにそれぞれ帰属する確率に基づいて情報の特徴を表すベクトル間の距離に基づいて、前記シード情報と対象となる情報との間のトピックの類似度を計算する
     請求項1に記載の情報処理装置。
  17.  前記抽出部は、複数の方法により前記第1の提示情報を抽出することが可能であり、
     前記複数の方法によりそれぞれ抽出された前記第1の提示情報に対する前記ユーザの嗜好を学習する学習部を
     さらに備え、
     前記抽出部は、前記学習部の学習結果に基づいて、前記第1の提示情報を抽出する方法を選択する
     請求項1に記載の情報処理装置。
  18.  ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、
     前記第1の提示情報の提示を制御する提示制御ステップと
     を含む情報処理方法。
  19.  ユーザの嗜好及び前記ユーザがアクセスした情報のうち少なくとも一方に基づいて抽出した情報であるシード情報との間で、トピック及び主観タイプのうち少なくとも一方の類似度が低い情報を優先的に前記ユーザに提示する第1の提示情報として抽出する抽出ステップと、
     前記第1の提示情報の提示を制御する提示制御ステップと
     含む処理をコンピュータに実行させるためのプログラム。
PCT/JP2016/064831 2015-06-01 2016-05-19 情報処理装置、情報処理方法、及び、プログラム WO2016194621A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015111337 2015-06-01
JP2015-111337 2015-06-01

Publications (1)

Publication Number Publication Date
WO2016194621A1 true WO2016194621A1 (ja) 2016-12-08

Family

ID=57441081

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/064831 WO2016194621A1 (ja) 2015-06-01 2016-05-19 情報処理装置、情報処理方法、及び、プログラム

Country Status (1)

Country Link
WO (1) WO2016194621A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229700A (zh) * 2017-05-24 2017-10-03 成都明途科技有限公司 一种政务资料与新闻的智能推荐系统
WO2018225429A1 (ja) * 2017-06-09 2018-12-13 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020149456A (ja) * 2019-03-14 2020-09-17 日本放送協会 投票集計装置及びプログラム
WO2023181382A1 (ja) * 2022-03-25 2023-09-28 シャープNecディスプレイソリューションズ株式会社 情報処理装置、表示システム、情報処理方法
JP7400944B2 (ja) 2020-03-18 2023-12-19 日本電気株式会社 推薦制御装置、システム、方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069386A (ja) * 2013-09-27 2015-04-13 大日本印刷株式会社 サーバ装置、プログラム及び通信方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069386A (ja) * 2013-09-27 2015-04-13 大日本印刷株式会社 サーバ装置、プログラム及び通信方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUSUKE YAMAMOTO ET AL.: "WebAlert:Web Joho no Insho Shuyaku o Riyo shita Etsuran Page Naiyo ni Taisuru Hantai Iken Teiji", JOURNAL OF THE DBSJ, vol. 7, no. 1, 27 June 2008 (2008-06-27), pages 251 - 256 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229700A (zh) * 2017-05-24 2017-10-03 成都明途科技有限公司 一种政务资料与新闻的智能推荐系统
WO2018225429A1 (ja) * 2017-06-09 2018-12-13 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JPWO2018225429A1 (ja) * 2017-06-09 2020-04-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US11270682B2 (en) 2017-06-09 2022-03-08 Sony Corporation Information processing device and information processing method for presentation of word-of-mouth information
JP2020149456A (ja) * 2019-03-14 2020-09-17 日本放送協会 投票集計装置及びプログラム
JP7257825B2 (ja) 2019-03-14 2023-04-14 日本放送協会 投票集計装置及びプログラム
JP7400944B2 (ja) 2020-03-18 2023-12-19 日本電気株式会社 推薦制御装置、システム、方法及びプログラム
WO2023181382A1 (ja) * 2022-03-25 2023-09-28 シャープNecディスプレイソリューションズ株式会社 情報処理装置、表示システム、情報処理方法

Similar Documents

Publication Publication Date Title
CN108351870B (zh) 根据活动模式的计算机语音识别和语义理解
TWI636416B (zh) 內容個人化之多相排序方法和系統
US10528572B2 (en) Recommending a content curator
US8612866B2 (en) Information processing apparatus, information processing method, and information processing program
US8839303B2 (en) System and method for enhancing user search results by determining a television program currently being displayed in proximity to an electronic device
JP6405704B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US20180049001A1 (en) Method of and server for processing wireless device sensor data to generate an entity vector associated with a physical location
WO2016194621A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
TWI533246B (zh) 使用者未知興趣之探索方法與系統
US20180316976A1 (en) Computerized system and method for determining media based on selected motion video inputs
WO2016117382A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
US10163041B2 (en) Automatic canonical digital image selection method and apparatus
US10430718B2 (en) Automatic social media content timeline summarization method and apparatus
US20150161249A1 (en) Finding personal meaning in unstructured user data
JP7197930B2 (ja) ロケーションベースの個人用コンテンツを提供する方法及びシステム
US20140074828A1 (en) Systems and methods for cataloging consumer preferences in creative content
US8838435B2 (en) Communication processing
CN114514517A (zh) 用于基于知识图谱来提供内容的方法和装置
CN110020156B (zh) 信息推荐方法、前端实现方法、装置、设备和存储介质
US10474899B2 (en) Social engagement based on image resemblance
JP2014203442A (ja) レコメンド情報生成装置及びレコメンド情報生成方法
CN114564666A (zh) 百科信息展示方法、装置、设备和介质
US20170249325A1 (en) Proactive favorite leisure interest identification for personalized experiences
JP2019036191A (ja) 判定装置、判定方法及び判定プログラム
EP2677484B1 (en) System and method for making personalised recommendations to a user of a mobile computing device, and computer program product

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16803056

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16803056

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP