WO2021246248A1 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
WO2021246248A1
WO2021246248A1 PCT/JP2021/019875 JP2021019875W WO2021246248A1 WO 2021246248 A1 WO2021246248 A1 WO 2021246248A1 JP 2021019875 W JP2021019875 W JP 2021019875W WO 2021246248 A1 WO2021246248 A1 WO 2021246248A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
user
content
information processing
success
Prior art date
Application number
PCT/JP2021/019875
Other languages
English (en)
French (fr)
Inventor
恵祐 東山
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Publication of WO2021246248A1 publication Critical patent/WO2021246248A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • This disclosure relates to an information processing device and an information processing method.
  • a distribution service that distributes various contents such as songs and movies to users.
  • the user can search for the content to be viewed from a large amount of content by, for example, a search query specifying the name (attribute value) of the desired content.
  • a search query specifying the name (attribute value) of the desired content.
  • the number of hits is large in one search query, for example, when there are a plurality of contents having the same name
  • the user needs to add a search query in order to narrow down the contents.
  • the user does not know what kind of search query should be given, there are cases where the content cannot be narrowed down properly even if the search query is added.
  • the speed at which the user reaches the desired content is not considered. Specifically, whether or not the variance of the attribute value of a certain attribute item is large is not directly related to the number of contents having the same attribute value as the attribute value of the content desired by the user of the attribute item. Therefore, even if the variance of the attribute values is large, it may be necessary to add many search queries before the user can reach the desired content.
  • the information processing apparatus includes an additional attribute item determination unit and a presentation unit.
  • the additional attribute item determination unit determines the additional attribute item, which is the attribute item of the search query to be added, based on the search log data when the user presented with the search result cannot reach the desired content from the search result. do.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the search log data is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the presentation unit presents the determined additional attribute item to the user.
  • the information processing apparatus includes a narrowing section and a presenting section.
  • the narrowing section narrows down the search results based on the search log data.
  • the search log data is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the presentation unit presents the narrowed search results to the user.
  • Embodiment 1-1 Outline of information processing according to the embodiment 1-2. Functional configuration of the information processing system according to the embodiment 1-2-1. Search query attribute items 1-2-2. Search results presented to users 1-2-3. Presentation of additional attribute items 1-3. Information processing procedure according to the embodiment 1-4. Hardware configuration 2. Effect of information processing system related to this disclosure
  • the present embodiment exemplifies an information processing system as a search system for searching content data desired by a user from a plurality of contents in a distribution service that distributes various contents such as songs and movies to the user.
  • a search system for searching content data desired by a user from a plurality of contents in a distribution service that distributes various contents such as songs and movies to the user.
  • FIG. 1 is a diagram showing an outline of information processing executed by the information processing system according to the embodiment.
  • the information processing according to the embodiment includes a content search process S1, a search result filter process S2, and an additional attribute item presentation process S3.
  • the content search process S1 is a process of searching for the desired content of the user according to the search query input by the user.
  • the search query is data indicating a search condition for searching the content data desired by the user from a plurality of contents. More specifically, the search query includes attribute items and attribute values.
  • the attribute item is data indicating a category for classifying various information related to the content to be searched, such as a title and a genre.
  • the attribute value is data indicating the value of an attribute item such as, for example, the genre is JAZZ.
  • the search query is data indicating that the content of the genre JAZZ is the content to be searched.
  • the content search process S1 starts from the process S11 in which a search query is input by the user. For example, the user selects an attribute item and inputs an attribute value that is the value of the attribute item.
  • the process S12 for collating (matching) the content data matching the input search query is executed. More specifically, the process S12 is a process of referring to the content metadata DM and extracting the content matching the search query.
  • the content metadata DM is metadata of a plurality of content data indicating a plurality of contents such as music and movies.
  • the content metadata DM according to the embodiment can be expressed as data indicating the correspondence between each of the plurality of contents and the plurality of attribute items and their attribute values related to each content. Therefore, by matching the search query with the content metadata DM, the content requested by the search query can be obtained as the search result.
  • the process S13 for presenting the search result to the user is executed.
  • the user can reach the desired content from the presented search result, the user can obtain (for example, view) the desired content in the distribution service by selecting the content.
  • the process S14 for adding the search query is executed by the user, and the processes S12 and S13 are executed again based on the added search query.
  • the search result filtering process S2 is a process of narrowing down the search results obtained by the matching process S12 of the search query of the content search process S1 and the content metadata DM. More specifically, in the search result filtering process S2, the content extracted as the search result is narrowed down based on the search log data DL.
  • the search log data DL is historical data collected in the past search process S1. More specifically, the search log data DL includes search success / failure information indicating whether or not the user who has been extracted for the search query, that is, presented with the hit matching result, has reached the desired content. That is, the search result filter process S2 can be expressed as a process of narrowing down the search results to the contents in which the user is likely to reach the desired contents.
  • the search result presented to the user in the process S13 is the search result after the narrowing down is executed by the filter process S2 of the search result.
  • the user can reach the desired content efficiently, that is, at an earlier timing, so that the speed at which the user can reach the desired content can be improved.
  • the search results narrowed down by the search result filter processing S2 may be one content or a plurality of two or more contents.
  • these contents may be ranked, that is, ranked based on, for example, the search log data DL.
  • the presentation process S3 of the additional attribute item gives the user the attribute item of the search query recommended from the viewpoint of the speed at which the user arrives at the desired content based on the search log data DL collected in the past content search. This is the process to be presented.
  • the additional attribute item presentation process S3 includes a process S21 for determining the success or failure of the search, a process S22 for determining the additional search attribute, and a process S23 for presenting the additional search attribute to the user.
  • the process S21 for determining the success or failure of the search is a process for determining whether or not the user has reached the desired content from the search result presented in the process S13.
  • the "success" of the search means that the content desired by the user is included in the search result.
  • the "failure” of the search means that the search result does not include the content desired by the user. If there is a large amount of content matched to the search query, if at least one content presented to the user among these plurality of contents includes the content desired by the user, " It is "success", and if it is not included, it is "failure”.
  • the success or failure of the search can be determined according to the user's input.
  • a question such as "Is this the content you are looking for (listening / viewing)?" Is displayed (or voice output) along with the search results, and the user is asked to answer Yes / No. Methods are available. If the user's answer is Yes, it can be determined that the search was successful. As another example, it can be determined that the search failed in response to the user entering an additional search query.
  • the success or failure of the search can be estimated according to whether or not the user presented with the search result clicks (selects) the content.
  • the user clicks (selects) the content the user includes playing the content.
  • the success or failure of the search can be estimated according to whether or not the user presented with the search result has played the content. In this case, when the user plays the content, it can be determined that the search is successful. Similarly, when the user does not play the content, it can be determined that the search has failed.
  • the success or failure of the search can be estimated depending on whether or not the user presented with the search result has played the content for a predetermined length (for example, 30 seconds) or longer.
  • a predetermined length for example, 30 seconds
  • the user does not play the content for a predetermined length or longer it can be determined that the search has failed.
  • it is not limited to the length (time) of playback and can be estimated according to whether or not the user has played the content to the end.
  • the result of this process S21 is stored (collected) as search log data DL in association with the search query used for the search as success / failure information.
  • the process S22 for determining the additional search attribute is executed when the search fails. That is, the process S22 for determining the additional search attribute is executed when the user cannot reach the desired content from the search result presented in the process S13 because the number of hits in the search is too large.
  • the process S22 for determining the additional search attribute is a process for determining the attribute item of the search query recommended from the viewpoint of the speed at which the user arrives at the desired content based on the search log data DL. More specifically, the process S22 for determining the additional search attribute is an attribute item that is likely to reach the desired content by the user among the attribute items that are not used in the search query at that time, that is, the additional search attribute. Is the process of determining.
  • the process S23 for presenting the additional search attribute to the user is a process for presenting the additional search attribute determined in the process S22 for determining the additional search attribute to the user.
  • the process S23 for presenting the additional search attribute to the user is executed when it is determined in the process S21 for determining the success or failure of the search that the search has failed. That is, the presentation of the additional search attribute to the user is executed when the user inputs an instruction from the user, for example, that the search result does not include the desired content in the process S21 for determining the success or failure of the search. ..
  • the additional search attribute may be presented to the user by always presenting a screen such as "Please add this search query" when a search failure is presumed, regardless of the user's instructions. It doesn't matter if it is executed.
  • FIG. 2 is a diagram showing an outline of processing when the search log data DL including success / failure information is not used, which is different from the information processing according to the embodiment.
  • Each process S1', S11', S12', S13', S14'exemplified in FIG. 2 is the same as each process S1, S11, S12, S13, S14 according to the embodiment illustrated in FIG. 1, respectively.
  • the content metadata DM'exemplified in FIG. 2 is the same as the content metadata DM according to the embodiment illustrated in FIG.
  • the user when the desired content is determined, it is common for the user to input the name of the content as the attribute value of the search query to perform a search.
  • a search query other than the name of the content is requested in the process S11'.
  • the number of hits may increase and the search result may not be uniquely obtained.
  • the search log data DL including the success / failure information when the search log data DL including the success / failure information is not used, the user can perform the search to be added in the process S14', unlike the information processing according to the embodiment. You need to determine the attribute items of the query yourself.
  • the information processing according to the embodiment has a speed at which the user reaches the desired content based on the past search log data DL when the search result cannot be uniquely narrowed down only by the search query given by the user.
  • the index of the speed at which the user arrives at the desired content is not limited to the number of turns, but it is also possible to use the time until the user arrives at the desired content (correct answer). Further, not only the index of the speed at which the user arrives at the desired content but also the attribute item of the recommended search query to be presented to the user can be determined from the index of the efficiency until the user arrives at the desired content. good.
  • the input result of the evaluation scale such as "Is it easy to understand" or "Is there a sense of conviction" by the user may be accumulated in the search log data DL.
  • FIG. 3 is a block diagram showing an example of the functional configuration of the information processing system 1 including the information processing apparatus 10 according to the embodiment of the present disclosure.
  • the information processing system 1 includes an information processing device 10 and an external server 20.
  • the information processing apparatus 10 and the external server 20 are communicably connected via the network N.
  • the information processing device 10 is a device that executes the above-mentioned information processing (processes S1, S2, S3) according to the present disclosure.
  • the information processing device 10 may be, for example, a general-purpose computer or a server.
  • the information processing apparatus 10 functions as the information processing apparatus 10 according to the present disclosure by executing a program (application) for realizing the information processing according to the present disclosure.
  • the information processing apparatus 10 includes an input unit 11, a communication unit 12, a storage unit 13, an acquisition unit 14, a search unit 15, and an output unit 16.
  • the input unit 11 is a device for receiving various operations from the user.
  • the input unit 11 is realized by a keyboard, a mouse, a touch panel, or the like.
  • the input unit 11 may be realized by a microphone or the like and may be configured to enable voice input.
  • the communication unit 12 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the external server 20 via the network N.
  • the storage unit 13 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk.
  • the storage unit 13 has, for example, search log data 131, content metadata 132, and content data 133.
  • the search log data 131 corresponds to the above-mentioned search log data DL.
  • the content metadata 132 corresponds to the above-mentioned content metadata DM and is the metadata of the content data 133.
  • the search log data 131 may be included in the content metadata 132.
  • the content data 133 is data of contents such as music and movies distributed to users in the distribution service realized by the information processing system 1 (search system) according to the embodiment.
  • the storage unit 13 stores a control program (application) for realizing the information processing according to the present disclosure.
  • a control program application for realizing the information processing according to the present disclosure.
  • the search log data 131, the content metadata 132, and the content data 133 may be stored in the external server 20. That is, these pieces of information may be temporarily acquired prior to the information processing according to the present disclosure, or may be acquired each time necessary for the information processing according to the present disclosure.
  • the acquisition unit 14 is a processing unit that acquires various types of information.
  • the acquisition unit 14 receives input of a search query from the user via the input unit 11. That is, the acquisition unit 14 executes a part of the processes S11 and S14 in which the search query is input by the user. Further, the acquisition unit 14 receives various information from, for example, the external server 20 via the communication unit 12.
  • the search unit 15 executes the information processing (processes S1, S2, S3) related to the above-mentioned disclosure.
  • the search unit 15 includes a collation unit 151, a success / failure determination unit 152, an additional attribute item determination unit 153, a narrowing unit 154, and a presentation unit 155.
  • the collation unit 151 executes the processes S11 and S14 in which the search query is input by the user, and the process S12 in which the search query and the content metadata 132 are matched.
  • the success / failure determination unit 152 executes the process S21 for determining the success / failure of the search. Further, the success / failure determination unit 152 updates the search log data 131 using the success / failure determination result of the search.
  • the additional attribute item determination unit 153 executes the process S22 for determining the additional search attribute.
  • the narrowing-down unit 154 executes the search result filtering process S2.
  • the presentation unit 155 executes a process S13 for presenting the search result to the user and a process S23 for presenting the additional search attribute to the user.
  • the output unit 16 is a mechanism for outputting various information.
  • the output unit 16 is a display device such as a display or a projector.
  • the output unit 16 displays the search results, additional search attributes, and the like transmitted from the search unit 15.
  • the output unit 16 may be a speaker that outputs voice data indicating search results, additional search attributes, etc. transmitted from the search unit 15. Further, the output unit 16 may be a device interface for outputting video or audio to another computer, an external display, or the like.
  • the external server 20 is a device including storage such as a non-volatile memory for storing various information.
  • the external server 20 can store, for example, data for updating the search log data 131, the content metadata 132, and the content data 133, and supply the data to the information processing apparatus 10.
  • the external server 20 can store, for example, dynamic data among the attribute items of the search query and supply it to the information processing apparatus 10.
  • the external server 20 or the storage such as the non-volatile memory may be configured to be directly connected to the information processing apparatus 10 without going through the network N.
  • the external server 20 may be configured to store the search log data 131 collected by the plurality of information processing devices 10.
  • the search log data 131 stored in the external server 20 is supplied to each information processing apparatus 10 via, for example, the network N.
  • the external server 20 may be configured to be able to realize some functions of the information processing apparatus 10. Further, the information processing device 10 and the external server 20 may be realized as one device. Further, the information processing device 10 and the external server 20 may be realized by a plurality of devices, respectively.
  • FIG. 4 is a diagram showing an example of attribute items of a search query used for music content in the information processing according to the embodiment of the present disclosure.
  • FIG. 5 is a diagram showing an example of attribute items of a search query used for video content in the information processing according to the embodiment of the present disclosure.
  • Static data is static information that does not change, mainly defined by the content.
  • Static data includes those that can be uniquely determined and those that cannot be uniquely determined.
  • Static data that can be uniquely determined is static information that does not change, as defined by the content.
  • Static data that cannot be uniquely determined is content and static information that does not change, as defined by external factors for the content.
  • static data that cannot be uniquely determined for example, as illustrated in FIGS. 4 and 5, there are subjective expressions such as mood and atmosphere held by the content.
  • Dynamic data is time-varying dynamic information defined by external factors for the content. As described above, the attribute value of the attribute item of the dynamic data can be appropriately supplied from the external server 20. The attribute items of the search query can be appropriately set according to the content to be searched.
  • static data that can be uniquely determined for music content includes bibliographic information, waveform analysis information, genre, version, etc. of music content.
  • bibliographic information for example, attribute items such as title, artist name, album name, track number, release date, performance time, lyrics, songwriting, composition and arrangement, performer, conductor, jacket photo, etc. can be used as appropriate.
  • waveform analysis information for example, attribute items such as melody, accompaniment, chord progression, music composition, timbre, tempo, and time signature can be appropriately used.
  • the waveform analysis information may be included in the content metadata 132 after each content data 133 has been analyzed in advance.
  • the collation unit 151 analyzes the content data 133 at the time of matching according to a search query. May be obtained by.
  • categories (attribute items) such as original, cover, and live can be appropriately used.
  • tie-up record and performance record of music content For example, as illustrated in FIG. 4, as dynamic data related to music content, tie-up record and performance record of music content, personal playback record, ranking, registered playlist, reference in SNS (Social Networking Service), etc.
  • SNS Social Networking Service
  • attribute items such as TV programs, movies, commercials, and events can be appropriately used.
  • performance results for example, attribute items such as live performances and song programs can be appropriately used.
  • personal reproduction record for example, attribute items such as date and time and user name can be appropriately used.
  • static data that can be uniquely determined for video content includes the title, performer, director / director, original author, genre / category, year of publication, country of production, and production company of the video content.
  • Photographer, image quality, language, and other attribute items are available as appropriate.
  • the dynamic data related to the video content includes the playback record of the video content, the personal playback record, the ranking, the registered playlist, the reference in the SNS, and the like.
  • attribute items such as date and time, place, and channel can be appropriately used.
  • attribute items such as date and time and user name can be appropriately used.
  • the search result presented to the user in the process S13 is the search result after the narrowing down is executed based on the search log data 131 by the search result filter process S2.
  • FIG. 6 is a diagram showing an example of search log data 131 including success / failure information in the information processing according to the embodiment of the present disclosure.
  • the search log data 131 illustrated in FIG. 6 includes information such as a content ID, an artist name, an album name, a song name, a genre, a degree of popularity, and a correct answer example for each content.
  • the content ID is information for uniquely identifying each content.
  • the artist name, album name, song name, genre, and popularity are examples of attribute items.
  • the correct answer case is an example of success / failure information.
  • the search log data 131 illustrated in FIG. 6 the content whose content ID is "108" has one correct answer when the above two search queries are given, that is, the content is the content desired by the user. , 045. Similarly, the contents having the content IDs "267", “22054" and “49284" indicate that the correct answer cases are 2,604 cases, 312 cases and 989 cases, respectively. Further, in the search log data 131 illustrated in FIG. 6, the total number of correct answer cases that the user has reached the desired content (correct answer content) when the above two search queries are given is 252,369. Is shown. As described above, the search log data 131 holds the number of correct answer cases (success / failure information) as an example.
  • the collation unit 151 executes matching between the search query and the content metadata 132 based on whether or not the attribute values match between the search query and the content metadata 132.
  • a criterion for determining whether or not there is a match an exact match, a prefix match, a partial match, or any combination thereof can be appropriately used.
  • the collation unit 151 may determine whether or not the match is based on the match of another name or another notation.
  • the alias means, for example, a nickname or an abbreviation.
  • the separate notation refers to, for example, Chinese characters, hiragana, katakana, alphabets, full-width characters, half-width characters, uppercase letters, lowercase letters, and the like.
  • the narrowing unit 154 narrows down the matching result by the matching unit 151 that hits the search query based on the search log data 131. More specifically, the narrowing-down unit 154 ranks a plurality of hit contents for the search query based on the success / failure information of whether or not the hit search result is the desired content.
  • the narrowing down unit 154 outputs c 1 satisfying the following equation (1) as a narrowing down result (search result).
  • the presentation unit 155 presents c 1 satisfying the following equation (1) to the user as a search result.
  • score_A () of the formula (1) a, v, c and C indicate the attribute item of the search query, the attribute value of the search query, the content and the set of contents, respectively.
  • a 0 , a 1 , v 0 and v 1 represent "release year”, “song title”, “2000s” and "LOVE", respectively.
  • the score function score_A () of the equation (1) for example, the number of correct answer cases can be used as it is.
  • the score function score_A () is not limited to the case where the number of correct answer cases is used as it is.
  • the score function may be set to calculate a score that takes into account information associated with each content such as the popularity of each content and prior information (user profile) such as a user's favorite genre.
  • the score function for example, a value obtained by normalizing each information, performing predetermined weighting, and adding the values of the weighted information can be used. If the number of correct answer cases is used as it is, processing such as normalization may not be performed.
  • the search log data 131 may hold the number of failed cases in place of the number of correct answer cases or in addition to the number of correct answer cases.
  • the number of failure cases is expressed by ( ⁇ i E i ) -E i, where E i (i is a natural number) is the number of correct answers for each content.
  • search results presented to the user are not limited to one content, but may be two or more plurality of contents.
  • the content may be selected as the content to be presented to the user in order from the content having the highest score calculated as described above.
  • the search fails, that is, if the user cannot reach the desired content from the presented search results, it is necessary to add a search query to further narrow down the search results. Will be.
  • the search result presented to the user that is, the content desired by the user because the content with a high score does not include the content desired by the user or because the number of search hits is large. Including the case where is buried.
  • a method of selecting the attribute item that maximizes the dispersion of the search results according to the attribute value of the search query is known.
  • whether or not the variance of the attribute value of a certain attribute item is large is not directly related to the number of contents having the same attribute value as the attribute value of the content desired by the user of the attribute item. Therefore, when using the method of narrowing down the search results according to the distribution of the search results by the attribute value of the search query, many search queries are added before the user reaches the desired content even if the distribution is large. May be necessary.
  • a technique related to collaborative filtering that can determine contents having a high correlation with a user's search history by using a search log.
  • content having a high correlation with the user can be determined using the similarity between items (similarity matrix).
  • the search log used in collaborative filtering is different from the search log data 131 according to the embodiment, and the relationship between the search query (attribute item / attribute value) and the success or failure of the search in the search query, that is, the search. It does not include success / failure information. Therefore, even if collaborative filtering is used, it is not possible to present (or determine) recommended attribute items based on the success / failure information in the search query, or to narrow down the search results.
  • the information processing according to the embodiment presents to the user additional attribute items recommended from the viewpoint of the speed at which the user can reach the desired content so that the user can efficiently reach the desired content. More specifically, the information processing according to the embodiment determines the attribute item that the user can reach the desired content with a small number of additions of the search query based on the search log data 131.
  • the small number of search query additions is an example of an indicator of how quickly a user can reach the desired content.
  • FIG. 7 is a diagram showing an example of search log data 131 including success / failure information in the information processing according to the embodiment of the present disclosure.
  • the search log data 131 is an additional search query (attribute item) newly added to the search query, as illustrated in FIG. 7, in addition to the above-mentioned search query (attribute item, attribute value) for which the search was performed. , Attribute value) is also included.
  • FIG. 7 illustrates "POPS", “JAZZ” and "R & B” as attribute values of the attribute item "genre”. Further, FIG. 7 exemplifies "television programs", "commercial” and “movies” as attribute values of the attribute item "tie-up”.
  • the search log data 131 includes the number of "correct answers” cases in which the user arrives at the desired content when a search is performed by further using an additional search query in addition to the above two search queries. Includes the number of cases of "failure” that did not occur (number of additional attributes: 0).
  • attribute value JAZZ
  • the number of cases of "correct answer” and "failure” is 545 and 1,253, respectively.
  • attribute value R & B
  • the number of cases of "correct answer” and “failure” is 365 and 1,489, respectively.
  • attribute value TV program
  • the number of cases of "correct answer” and “failure” is 2,033 and 256, respectively.
  • the search log data 131 further includes the number of cases of "correct answer” and the number of cases of "failure” when n types of search queries are further added to the case of "number of additional attributes: 0" ().
  • Number of additional attributes: n, n are natural numbers).
  • the number of "correct answer” and “failure” of "number of additional attributes: 1" is 246 and 2, respectively. , 299 cases.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2" is 335 and 1,964, respectively.
  • attribute value JAZZ
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 1" is 254 and 999, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2" is 225 and 774, respectively.
  • attribute value R & B
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 1” is 792 and 697, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2" is 554 and 143, respectively.
  • the total number of "correct answers” and “failures” of "number of additional attributes: 2” is 2,159 and 2,932, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2" is 33 and 43, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 1" is 212 and 764, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2" is 53 and 711, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 1” is 650 and 937, respectively.
  • the number of cases of "correct answer” and “failure” of "number of additional attributes: 2” is 556 and 381, respectively.
  • the total number of "correct answers” and “failures” of "number of additional attributes: 2” is 1,098 and 2,259, respectively.
  • the search log data 131 further includes the number of cases of "correct answer” and "failure”, which is the total number of each additional attribute.
  • the total number of “correct answers” and “failures” of “number of additional attributes: 0” is 353,241 and 244,323, respectively.
  • the total number of "correct” and “failed” cases of "number of additional attributes: 1” is 104,254 and 140,069, respectively.
  • the total number of "correct” and “failed” cases of "number of additional attributes: 2” is 84,925 and 55,144, respectively.
  • the search log data 131 for example, when the attribute item is "genre" and the attribute value is "POPS", there are 1,402 correct answer cases and 2,545 failure cases at that time. It shows that it was. Further, the search log data 131 indicates that the number of correct answer cases was 246 and the number of failed cases was 2,299 when one additional attribute was added. Note that FIG. 7 exemplifies some attribute items, attribute values, and the number of additional attributes, but in the search log data 131, the same applies to various other attribute items, attribute values, and the number of additional attributes. Suppose a number is available.
  • the attribute items of the search query presented to the user are determined by the score function generated based on these search log data 131.
  • This score function is expressed by the following equation (2) as an example. That is, additional attribute item determining unit 153 determines a 2 satisfying the following equation (2) as an additional attribute item to be presented to the user.
  • score_B () of the formula (2) a, A, v and c indicate the attribute item of the search query, the set of the attribute items of the search query, the attribute value and the content of the search query, respectively.
  • FIG. 8 is a diagram showing an example of a search tree relating to information processing according to the embodiment of the present disclosure.
  • the search tree of FIG. 8 shows an example of the connection between the nodes N11 to N17, N21 to N27, N311 to N313, N321 to N323 of the content metadata 132, and the nodes.
  • each node N11 to N17 of the attribute item "release year” is “1950s", “1960s”, “1970s”, “1980s”, “1990s”, “2000s” and “2010s”, respectively. It is a node corresponding to the attribute value of.
  • the nodes N21 to N27 of the attribute item “song title” are "tomorrow morning”, “LOVE”, “spread wings”, “shaking heart”, “friendship and affection", “want to meet” and “want to meet”, respectively. It is a node corresponding to the attribute value of "friend”.
  • the score function score_B () of the equation (2) for example, a ratio (correct answer rate) that becomes a correct answer when the number of additional attributes is "0" can be used.
  • the number of correct answers is 4,529 and the number of failures is 9,524, so the correct answer rate is 32.2%.
  • the additional attribute item determination unit 153 determines as an additional attribute item that presents a “tie-up” with a high accuracy rate to the user.
  • the collation unit 151 identifies the node N321 based on the attribute value and the search log data 131.
  • the node N321 corresponding to the attribute value of the “television program” having the largest number of correct answer cases is specified.
  • the correct answer rate when the number of additional attributes is "1" can be further used.
  • the correct answer rate is 63.7%.
  • the additional attribute item determination unit 153 determines the “genre” having a high correct answer rate as the additional attribute item to be presented to the user. Similarly, the correct answer rate in the case of a plurality of additional attributes of 2 or more can be further used.
  • the ratio of the number of correct answers for each attribute (correct answer rate) to the total number of correct answers (353,241) can also be used. For example, when “genre” is presented as an additional attribute item, the total number of correct answers for which the number of additional attributes is "0" is 4,529, so the correct answer rate is 1.28%. On the other hand, when “tie-up” is presented as an additional attribute item, the total number of correct answers for which the number of additional attributes is "0" is 3,923, so the correct answer rate is 1.11%. Therefore, the additional attribute item determination unit 153 determines the “genre” having a high correct answer rate as the additional attribute item to be presented to the user.
  • the score function for example, the value itself of the number of correct answer cases can be used as in the above-mentioned narrowing process.
  • the score function is set to calculate a score that takes into account information associated with each content such as the popularity of each content and prior information (user profile) such as a user's favorite genre. I do not care.
  • the score function score_B for example, a value obtained by normalizing each information, performing predetermined weighting, and adding the values of the weighted information can be used.
  • the success / failure determination unit 152 determines whether or not the search result c 2 according to the attribute value v 2 of the search query specified by the user for the obtained attribute item a 2 is the content desired by the user (
  • the search log data 131 is updated by returning feedback (correct answer or failure).
  • the search log data 131 illustrated in FIGS. 6 and 7 is merely an example, and may be appropriately set according to various requests for the information processing system 1 and the type of content.
  • the search log data 131 can be prepared for each user attribute according to the user profile.
  • the updated search log data 131 may be shared among a plurality of information processing devices 10, and may be used as search log data 131 specific to the information processing device 10, that is, suitable for a user who actually uses the information processing device 10. It may be held by each information processing apparatus 10.
  • the search log data 131 may accumulate an index of the speed at which the user arrives at the desired content in addition to or instead of the success / failure information.
  • FIG. 9 is a flowchart showing an example of information processing according to the embodiment of the present disclosure.
  • the user inputs the first search query into the input unit 11. Further, the acquisition unit 14 acquires the search query input by the user from the input unit 11. Further, the collation unit 151 acquires the search query input by the user from the acquisition unit 14 (S101).
  • the collation unit 151 executes matching between the search query input by the user and the content metadata 132 (S102).
  • the narrowing down unit 154 narrows down the matching result (search result) based on the search log data 131 (S103).
  • the presentation unit 155 outputs the search results narrowed down by the filter processing of the search results to the output unit 16. Further, the output unit 16 presents the search result from the presentation unit 155 to the user (S104).
  • the success / failure determination unit 152 determines whether or not the search result presented to the user includes the desired content, that is, whether or not the user has arrived at the desired content (S105).
  • the success / failure determination unit 152 updates the number of correct answer cases in the search log data 131 (S106). After that, the flow of FIG. 9 ends.
  • the success / failure determination unit 152 updates the number of failure cases of the search log data 131 (S107).
  • the additional attribute item determination unit 153 determines the attribute item (additional search attribute) of the search query recommended to the user from the viewpoint of the speed at which the user arrives at the desired content based on the search log data 131. Further, the presentation unit 155 outputs the determined attribute item to the output unit 16. Further, the output unit 16 presents the attribute item from the presentation unit 155 to the user (S108).
  • the attribute value of the attribute item (additional search attribute) presented by the user, that is, the search query is input to the input unit 11. Further, the acquisition unit 14 acquires the search query input by the user from the input unit 11. Further, the collation unit 151 acquires the search query input by the user from the acquisition unit 14 (S109). After that, the flow of FIG. 9 returns to the process of S102. After that, the processes of S102 to S109 are repeated until the user arrives at the desired content (S105: Yes).
  • the process of narrowing down the search results (S103) using the search log data 131 does not necessarily have to be executed. For example, it is possible to improve the speed at which the user can reach the desired content by simply presenting the additional attribute item.
  • the search log data 131 is not sufficiently collected, such as at the start stage of the distribution service using the information processing system 1 (search system) according to the embodiment. In this case, the search log data 131 is not used in matching (S102) or determination of additional attribute items (S108) until the search log data 131 is sufficiently collected, and the search log data 131 is sufficiently accumulated.
  • the configuration may be such that the search log data 131 is switched to be used at that time.
  • FIG. 10 is a block diagram showing an example of the hardware configuration of each device of the information processing system 1 according to the embodiment of the present disclosure.
  • Information devices such as the devices (information processing device 10 and external server 20) of the information processing system 1 according to the above-described embodiment are realized by, for example, a computer 1000 having a configuration as shown in FIG.
  • the computer 1000 has a CPU 1100, a RAM 1200, a ROM (Read Only Memory) 1300, an HDD (Hard Disk Drive) 1400, a communication interface 1500, and an input / output interface 1600. Each part of the computer 1000 is communicably connected by the bus 1050.
  • the CPU 1100 operates based on the program stored in the ROM 1300 or the HDD 1400, and controls each part. For example, the CPU 1100 loads a program stored in the ROM 1300 or the HDD 1400 into the RAM 1200, and executes processing corresponding to various programs (information processing according to the present disclosure).
  • the ROM 1300 stores a boot program such as a BIOS (Basic Input Output System) executed by the CPU 1100 when the computer 1000 is started, a program depending on the hardware of the computer 1000, and the like.
  • BIOS Basic Input Output System
  • the HDD 1400 is a computer-readable recording medium that non-temporarily records a program executed by the CPU 1100 and data used by such a program.
  • the communication interface 1500 is an interface for the computer 1000 to connect to the network N and the external network 1550 (for example, the Internet).
  • the CPU 1100 receives data from another device or transmits data generated by the CPU 1100 to another device via the communication interface 1500.
  • the input / output interface 1600 is an interface for connecting the input / output device 1650 and the computer 1000.
  • the CPU 1100 receives data from an input device such as a keyboard or mouse via the input / output interface 1600. Further, the CPU 1100 transmits data to an output device such as a display, a speaker, or a printer via the input / output interface 1600. Further, the input / output interface 1600 may function as a media interface for reading a program or the like recorded on a predetermined recording medium (media).
  • the media is, for example, an optical recording medium such as DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory.
  • an optical recording medium such as DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk)
  • a magneto-optical recording medium such as MO (Magneto-Optical disk)
  • tape medium such as DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk)
  • MO Magneto-optical disk
  • the CPU 1100 of the computer 1000 realizes each function of the information processing apparatus 10 by executing a program loaded on the RAM 1200.
  • the HDD 1400 stores a program for realizing each function according to the present disclosure and data in the storage unit 13.
  • the HDD 1400 is a recording medium for recording various data including the above-mentioned search log data 131, content metadata 132, and content data 133.
  • the CPU 1100 reads the program data 1450 from the HDD 1400 and executes the program, but as another example, these programs may be acquired from another device via the external network 1550.
  • the information processing apparatus 10 includes an additional attribute item determination unit 153 and a presentation unit 155.
  • the additional attribute item determination unit 153 is an attribute item of the search query to be added based on the search log data 131 (DL) when the user presented with the search result cannot reach the desired content from the search result. Determine additional attribute items.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the search log data 131 is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the presentation unit 155 presents the determined additional attribute item to the user.
  • the information processing apparatus 10 presents to the user the attribute items of the search query recommended from the viewpoint of the speed at which the user arrives at the desired content in the content search in which the user searches for the desired content from a plurality of contents. can do.
  • the information processing apparatus 10 may reach the search result quickly for a user who does not know what kind of search query should be given to obtain the desired content from a large amount of content at the earliest possible timing.
  • High attribute items can be presented. That is, according to the information processing apparatus 10, it is possible to realize a content search in consideration of the speed at which the user arrives at the desired content.
  • Content search that considers the speed at which users can reach the desired content can be achieved by adding search queries to the dark clouds or searching for the desired content while checking a large number of search results in order. It contributes to the reduction of time and effort consumed by the user to reach the destination.
  • the success / failure information includes the number of correct answer cases corresponding to each of the plurality of attribute items.
  • the additional attribute item determination unit 153 determines the additional attribute item based on the number of correct answer cases or the correct answer rate calculated from the number of correct answer cases.
  • the information processing apparatus 10 can present to the user a case in which the search was successful in the past or an attribute item having a high ratio thereof.
  • the information processing device 10 further includes a success / failure determination unit 152.
  • the success / failure determination unit 152 determines the success / failure of the search indicating whether or not the user presented with the search result has reached the desired content.
  • the information processing apparatus 10 selects an appropriate attribute item at an appropriate timing, such as when the user cannot reach the desired content, that is, when the search result cannot be uniquely narrowed down only by the search query given by the user. Can be presented to.
  • the success / failure determination unit 152 determines when the user does not select the content indicated by the search result, when the user does not reproduce the content indicated by the search result for a predetermined length or longer, and when the user does not reproduce the content indicated by the search result. It is determined that the user could not reach the desired content from the search result at any one of the times when the indicated content was not played to the end.
  • the information processing apparatus 10 can appropriately determine whether or not the search result cannot be uniquely narrowed down only by the search query given by the user.
  • the success / failure determination unit 152 updates the search log data 131 by using the relationship between the search query input by the user and the determination result of the success / failure of the search.
  • the information processing apparatus 10 can appropriately update the search log data 131 according to the actual situation of the content search by the user. It is also possible to realize a content search that matches the user's search tendency.
  • the information processing device 10 further includes a narrowing section 154.
  • the narrowing down unit 154 narrows down the search results indicating at least one content based on the search log data 131.
  • the information processing apparatus 10 can reduce the possibility that the content desired by the user is buried in a large amount of search results even when the number of hits corresponding to the search query is large, for example. Further, the information processing apparatus 10 can preferentially present the content that is highly likely to be the content desired by the user to the user while leaving the content of another candidate.
  • the success / failure information includes the number of correct answer cases corresponding to each of the plurality of search queries.
  • the narrowing-down unit 154 narrows down the search results indicating at least one content based on the number of correct answer cases or the correct answer rate calculated from the number of correct answer cases.
  • the information processing apparatus 10 gives priority to the cases in which the search was successful in the past or the content having a high ratio, that is, the content having a high track record of being the content desired by the user, in the content search using the search query input by the user. Can be presented to the user.
  • the information processing device 10 includes a narrowing-down unit 154 and a presenting unit 155.
  • the narrowing down unit 154 narrows down the search results based on the search log data 131.
  • the search log data 131 is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the presentation unit 155 presents the narrowed search results to the user.
  • the information processing apparatus 10 preferentially gives priority to the content having a high track record of being the content desired by the user with respect to the search query input by the user. Can be presented to. That is, the information processing apparatus 10 can realize a content search in consideration of the speed at which the user arrives at the desired content.
  • the information processing method determines an additional attribute item, which is an attribute item of the search query to be added, based on the search log data 131 when the user presented with the search result cannot reach the desired content from the search result. This includes presenting the determined additional attribute items to the user.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the search log data 131 is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the attribute items that are likely to be reached at an earlier timing in the search results are presented. can do. That is, according to the information processing method, it is possible to realize a content search in consideration of the speed at which the user arrives at the desired content.
  • the information processing method includes narrowing down the search results based on the search log data 131 and presenting the narrowed down search results to the user.
  • the search log data 131 is data in which the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query is accumulated.
  • the search result indicates at least one content identified from a plurality of contents by matching using a search query input by the user.
  • the present technology can also have the following configurations.
  • (1) When the user who is presented with a search result indicating at least one content specified from a plurality of contents by matching using a search query entered by the user cannot reach the desired content from the search results, a search is performed. With the additional attribute item determination unit that determines the additional attribute item that is the attribute item of the search query to be added based on the search log data in which the relationship between the query and the success / failure information indicating the success / failure of the search using the search query is accumulated. , An information processing device including a presentation unit that presents the determined additional attribute item to the user. (2) The success / failure information includes the number of correct answer cases corresponding to each of the plurality of attribute items.
  • the additional attribute item determination unit determines the additional attribute item based on the number of correct answer cases or the correct answer rate calculated from the number of correct answer cases.
  • the information processing device according to (1) above.
  • (3) The information processing apparatus according to (1) or (2), further comprising a success / failure determination unit for determining the success / failure of a search indicating whether or not the user who is presented with the search result has reached a desired content.
  • (4) In the success / failure determination unit when the user does not select the content indicated by the search result, when the user does not reproduce the content indicated by the search result for a predetermined length or longer, and when the user does not reproduce the content indicated by the search result, the user determines the search result.
  • the information processing apparatus according to (3), wherein it is determined that the user could not reach the desired content from the search result at any one of the times when the indicated content was not played to the end.
  • the information processing apparatus according to any one of (1) to (5), further comprising a narrowing section for narrowing down search results indicating at least one content based on the search log data.
  • the success / failure information includes the number of correct answer cases corresponding to each of the plurality of search queries.
  • the narrowing-down unit narrows down the search results indicating at least one content based on the number of correct answer cases or the correct answer rate calculated from the number of correct answer cases.
  • the information processing apparatus according to (6).
  • (8) At least identified from multiple contents by matching using the search query entered by the user based on the search log data that accumulates the relationship between the search query and the success / failure information indicating the success / failure of the search using the search query.
  • a narrowing section that narrows down search results that indicate one content An information processing device including a presentation unit that presents the narrowed-down search results to the user.
  • Information processing system 10 Information processing device 11 Input unit 12 Communication unit 13 Storage unit 131 Search log data 132 Content metadata 133 Content data 14 Acquisition unit 15 Search unit 151 Matching unit 152 Success / failure judgment unit 153 Additional attribute item determination unit 154 Narrowing unit 155 Presentation section 16 Output section 20 External server DL search log data DM Content metadata

Abstract

本開示に係る情報処理装置は、追加属性項目決定部と、提示部とを備える。前記追加属性項目決定部は、検索結果を提示されたユーザが、前記検索結果から所望のコンテンツに辿り着けなかったとき、検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定する。前記検索結果は、前記ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。前記検索ログデータは、検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。前記提示部は、決定された前記追加属性項目を前記ユーザに提示する。

Description

情報処理装置及び情報処理方法
 本開示は、情報処理装置及び情報処理方法に関する。
 例えば楽曲や映画などの様々なコンテンツをユーザに配信する配信サービスがある。このような配信サービスにおいて、ユーザは、例えば所望のコンテンツの名称(属性値)を指定した検索クエリにより、大量にあるコンテンツの中から視聴したいコンテンツを検索することができる。一方で、例えば同一名称を持つ複数のコンテンツが存在する場合など、1つの検索クエリではヒット件数が多い場合には、ユーザは、コンテンツを絞り込むために、検索クエリを追加する必要がある。ところが、どのような検索クエリを与えればよいかユーザが分からない場合などには、検索クエリを追加してもコンテンツを適切に絞り込むことができない場合があった。
 このような中、ヒット件数を減少させるために、各コンテンツに対応付けられた複数の属性項目のうちの属性値の分散が大きい属性項目を、検索クエリの属性項目としてユーザに提示する技術が知られている。
特開2006-133939号公報
Greg Linden, Brent Smith, and Jeremy York, "Amazon.com Recommendations: Item-to-Item Collaborative Filtering", IEEE Internet Computing vol. 7, no. 1 (January 2003), pp. 76-80.
 しかしながら、上記の従来技術では、ユーザが所望のコンテンツに到達する速さについては考慮されていない。具体的には、ある属性項目の属性値の分散が大きいか否かと、その属性項目のユーザ所望のコンテンツの属性値と同一の属性値を有するコンテンツの数とは、直接的に関係しない。このため、属性値の分散が大きい場合であっても、ユーザが所望のコンテンツに辿り着くまでに多くの検索クエリの追加が必要な場合もあり得る。
 そこで、本開示では、ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索を実現することができる情報処理装置及び情報処理方法を提案する。
 本開示によれば、情報処理装置は、追加属性項目決定部と、提示部とを備える。追加属性項目決定部は、検索結果を提示されたユーザが、検索結果から所望のコンテンツに辿り着けなかったとき、検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定する。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。検索ログデータは、検索クエリと検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。提示部は、決定された追加属性項目をユーザに提示する。
 また、本開示によれば、情報処理装置は、絞り込み部と、提示部とを備える。絞り込み部は、検索ログデータに基づいて、検索結果を絞り込む。検索ログデータは、検索クエリと検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。提示部は、絞り込まれた検索結果をユーザに提示する。
本開示の実施形態に係る情報処理システムにより実行される情報処理の概要を示す図である。 本開示の実施形態に係る情報処理とは異なる、成否情報を含む検索ログデータが使用されない場合の処理の概要を示す図である。 本開示の実施形態に係る情報処理装置を含む情報処理システムの機能構成の一例を示すブロック図である。 本開示の実施形態に係る情報処理において、音楽コンテンツに対して使用される検索クエリの属性項目の一例を示す図である。 本開示の実施形態に係る情報処理において、動画コンテンツに対して使用される検索クエリの属性項目の一例を示す図である。 本開示の実施形態に係る情報処理における、成否情報を含む検索ログデータの一例を示す図である。 本開示の実施形態に係る情報処理における、成否情報を含む検索ログデータの一例を示す図である。 本開示の実施形態に係る情報処理に関する、検索ツリーの一例を示す図である。 本開示の実施形態に係る情報処理の一例を示すフローチャートである。 本開示の実施形態に係る情報処理システムの各装置のハードウェア構成の一例を示すブロック図である。
 以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。
 以下に示す項目順序に従って本開示を説明する。
 1.実施形態
  1-1.実施形態に係る情報処理の概要
  1-2.実施形態に係る情報処理システムの機能構成
  1-2-1.検索クエリの属性項目
  1-2-2.ユーザに提示される検索結果
  1-2-3.追加属性項目の提示
  1-3.実施形態に係る情報処理の手順
  1-4.ハードウェア構成
 2.本開示に係る情報処理システムの効果
(1.実施形態)
[1-1.実施形態に係る情報処理の概要]
 本実施形態は、例えば楽曲や映画などの様々なコンテンツをユーザに配信する配信サービスにおいて、複数のコンテンツの中からユーザの希望するコンテンツデータを検索する検索システムとしての情報処理システムを例示する。以下、図1及び図2を用いて、実施形態に係る情報処理の概要を説明する。
 図1は、実施形態に係る情報処理システムにより実行される情報処理の概要を示す図である。図1に示すように、実施形態に係る情報処理は、コンテンツ検索処理S1と、検索結果のフィルタ処理S2と、追加属性項目の提示処理S3とを含む。
 コンテンツ検索処理S1は、ユーザにより入力された検索クエリに応じて、ユーザの所望のコンテンツを検索する処理である。ここで、検索クエリとは、複数のコンテンツの中からユーザの希望するコンテンツデータを検索するための検索条件を示すデータであるとする。より具体的には、検索クエリは、属性項目と、属性値とを含む。属性項目は、例えばタイトルやジャンルなどの検索対象のコンテンツに関する各種の情報を分類する区分を示すデータである。属性値は、例えばジャンルがJAZZであるなどの属性項目の値を示すデータである。一例として、検索クエリは、ジャンルがJAZZのコンテンツが検索対象のコンテンツであることを示すデータである。
 コンテンツ検索処理S1は、図1に示すように、ユーザにより検索クエリが入力される処理S11から開始する。例えばユーザは、属性項目を選択し、その属性項目の値である属性値を入力する。その後、入力された検索クエリに合致するコンテンツデータを照合(マッチング)する処理S12が実行される。より具体的には、処理S12は、コンテンツメタデータDMを参照し、検索クエリに合致するコンテンツを抽出する処理である。ここで、コンテンツメタデータDMとは、例えば楽曲や映画などの複数のコンテンツを示す複数のコンテンツデータのメタデータである。実施形態に係るコンテンツメタデータDMは、複数のコンテンツの各々と、各コンテンツに関する複数の属性項目及びその属性値との対応を示すデータであると表現することができる。したがって、検索クエリとコンテンツメタデータDMとのマッチングにより、検索クエリが要求するコンテンツを検索結果として得ることができる。
 その後、検索結果をユーザに提示する処理S13が実行される。ユーザは、提示された検索結果から所望のコンテンツに辿り着くことができる場合には、そのコンテンツを選択することにより、配信サービスにおいて、所望のコンテンツを得る(例えば視聴する)ことができる。あるいは、検索結果の数、すなわち検索によるヒット数が多すぎるなどの理由から、検索結果から所望のコンテンツに辿り着くことができない場合がある。このような場合、ユーザにより検索クエリを追加する処理S14が実行され、追加された検索クエリに基づいて、処理S12及び処理S13が再び実行される。
 検索結果のフィルタ処理S2は、コンテンツ検索処理S1の検索クエリとコンテンツメタデータDMとのマッチングの処理S12により得られた検索結果を絞り込む処理である。より具体的には、検索結果のフィルタ処理S2では、検索ログデータDLに基づいて、検索結果として抽出されたコンテンツを絞り込む。ここで、検索ログデータDLは、過去の検索処理S1において収集された履歴データである。より詳細には、検索ログデータDLは、検索クエリに対して抽出された、すなわちヒットしたマッチング結果を提示されたユーザが、所望のコンテンツに辿り着けたか否かを示す検索の成否情報を含む。つまり、検索結果のフィルタ処理S2は、検索結果を、検索結果のうちのユーザが所望のコンテンツに到達できる可能性が高いコンテンツに絞り込む処理であると表現できる。したがって、処理S13でユーザに提示される検索結果は、検索結果のフィルタ処理S2により絞り込みが実行された後の検索結果である。これにより、ユーザは、所望のコンテンツに効率的に、すなわちより早いタイミングで辿り着けるようになるため、ユーザが所望のコンテンツに辿り着く速さを向上させることができる。
 なお、検索結果のフィルタ処理S2により絞り込まれた検索結果としては、1つのコンテンツであってもよいし、2つ以上の複数のコンテンツであってもよい。絞り込みにより得られた検索結果が2つ以上の複数のコンテンツを含む場合、これらのコンテンツは、例えば検索ログデータDLに基づいて、ランキング、すなわち順位付けされても構わない。
 追加属性項目の提示処理S3は、過去のコンテンツ検索において収集された検索ログデータDLに基づいて、ユーザが所望のコンテンツに辿り着く速さの観点から推奨される検索クエリの属性項目を、ユーザに提示する処理である。追加属性項目の提示処理S3は、図1に示すように、検索の成否を判定する処理S21と、追加検索属性を決定する処理S22と、追加検索属性をユーザに提示する処理S23とを含む。
 検索の成否を判定する処理S21は、ユーザが処理S13で提示された検索結果から所望のコンテンツに辿り着けたか否かを判定する処理である。ここで、検索の「成功」とは、検索結果の中にユーザ所望のコンテンツが含まれていることを言う。また、検索の「失敗」とは、検索結果の中にユーザ所望のコンテンツが含まれないことを言う。なお、検索クエリに対してマッチしたコンテンツが大量にある場合には、これらの複数のコンテンツのうちのユーザに対して提示された少なくとも1つのコンテンツに、ユーザ所望のコンテンツが含まれていれば「成功」であり、含まれていなければ「失敗」である。
 一例として、ユーザの入力に応じて検索の成否を決定することができる。この場合、例えば検索結果とともに「あなたが探している(聴きたい/見たい)コンテンツはこれですか?」などの問いを表示(あるいは音声出力)し、ユーザにYes/Noで回答してもらうといった方法が利用可能である。ユーザの回答がYesであれば、検索に成功したと判定することができる。別の一例として、ユーザが追加の検索クエリを入力したことに応じて、検索に失敗したと決定することもできる。
 別の一例として、検索結果を提示されたユーザがコンテンツをクリック(選択)したか否かに応じて検索の成否を推定することができる。ユーザがコンテンツをクリック(選択)するとは、ユーザがそのコンテンツを再生することを含む。この場合、ユーザがコンテンツをクリック(選択)したとき、検索に成功したと判定することができる。同様に、ユーザがコンテンツをクリック(選択)しなかったとき、検索に失敗したと判定することができる。別の一例として、検索結果を提示されたユーザがコンテンツを再生したか否かに応じて検索の成否を推定することができる。この場合、ユーザがコンテンツを再生したとき、検索に成功したと判定することができる。同様に、ユーザがコンテンツを再生しなかったとき、検索に失敗したと判定することができる。別の一例として、検索結果を提示されたユーザが所定の長さ(例えば30秒)以上コンテンツを再生したか否かに応じて検索の成否を推定することができる。この場合、ユーザが所定の長さ(例えば30秒)以上コンテンツを再生したとき、検索に成功したと判定することができる。同様に、ユーザが所定の長さ以上コンテンツを再生しなかったとき、検索に失敗したと判定することができる。また、再生した長さ(時間)に限らず、ユーザがそのコンテンツを最後まで再生したか否かに応じて推定することもできる。
 なお、これらの判定方法は、適宜組合せ可能である。この処理S21の結果は、成否情報として、その検索に使用された検索クエリと対応付けられて、検索ログデータDLとして蓄積(収集)される。
 追加検索属性を決定する処理S22は、検索に失敗した場合に実行される。つまり、追加検索属性を決定する処理S22は、検索によるヒット数が多すぎるなどの理由から、ユーザが処理S13で提示された検索結果から所望のコンテンツに辿り着けなかった場合に実行される。追加検索属性を決定する処理S22は、検索ログデータDLに基づいて、ユーザが所望のコンテンツに辿り着く速さの観点から推奨される検索クエリの属性項目を決定する処理である。より具体的には、追加検索属性を決定する処理S22は、その時点で検索クエリに使用されていない属性項目のうちのユーザが所望のコンテンツに到達できる可能性が高い属性項目、すなわち追加検索属性を決定する処理である。
 追加検索属性をユーザに提示する処理S23は、追加検索属性を決定する処理S22で決定された追加検索属性をユーザに提示する処理である。これにより、ユーザは、処理S13で提示された検索結果から所望のコンテンツに辿り着けなかった場合であっても、処理S23で提示された属性項目の属性値を処理S14において入力することにより、所望のコンテンツに効率的に辿り着けるようになる。
 なお、追加検索属性をユーザに提示する処理S23は、検索の成否を判定する処理S21において検索に失敗したと判定された場合に実行される。つまり、追加検索属性のユーザへの提示は、ユーザからの指示、例えば検索成否を判定する処理S21において検索結果に所望のコンテンツが含まれていないことをユーザが入力したことを契機として実行される。あるいは、追加検索属性のユーザへの提示は、ユーザの指示によらず、例えば検索の失敗が推定された場合に「こちらの検索クエリを追加してください」のような画面を常に提示することにより実行されても構わない。
 一方で、成否情報を含む検索ログデータDLが使用されない場合には、ユーザは、追加する検索クエリの属性項目を自身で決定する必要がある。図2は、実施形態に係る情報処理とは異なる、成否情報を含む検索ログデータDLが使用されない場合の処理の概要を示す図である。図2に例示する各処理S1´,S11´,S12´,S13´,S14´は、それぞれ図1に例示する実施形態に係る各処理S1,S11,S12,S13,S14と同様である。また、図2に例示するコンテンツメタデータDM´は、図1に例示する実施形態に係るコンテンツメタデータDMと同様である。
 例えば、所望のコンテンツが決まっている場合には、ユーザがコンテンツの名称を検索クエリの属性値として入力して検索を行うことが一般的である。しかしながら、コンテンツの名称を思い出せない場合や名称を知らない場合もあり得る。この場合、コンテンツの名称以外の検索クエリが処理S11´において要求される。また、同一名称を持つ複数のコンテンツ、すなわち同一の検索クエリにより処理S12´のマッチングでヒットするコンテンツが存在する場合、ヒット件数が多くなり、一意に検索結果を得ることができないおそれがある。この場合であっても、図2に示すように、成否情報を含む検索ログデータDLが使用されない場合には、ユーザは、実施形態に係る情報処理とは異なり、処理S14´において、追加する検索クエリの属性項目を自身で決定する必要がある。
 このような中、例えば図2に例示するような従来の検索システムにおいては、どのような検索クエリを追加すれば所望のコンテンツに早いタイミングで辿り着くことができるかは、ユーザは把握できなかった。このため、ユーザは、闇雲に検索クエリを追加したり、大量の検索結果を順番に確認しながら所望のコンテンツを探したりするなど、所望のコンテンツに辿り着くために多くの時間を消費してしまう場合があった。
 そこで、実施形態に係る情報処理は、ユーザが与えた検索クエリだけでは検索結果を一意に絞り込めない場合に、過去の検索ログデータDLに基づいて、ユーザが所望のコンテンツに到達する速さの観点から推奨される検索クエリの属性項目をユーザに提示する。これにより、ユーザは、より早いタイミングで所望のコンテンツに辿り着くことができる。
 ここで、ユーザが所望のコンテンツに辿り着く速さの指標は、一例として、ユーザが所望のコンテンツ(正解)に辿り着くまでのターン数が利用可能であるとする。1つのターンは、検索クエリの入力(S11,S14)から検索結果の提示(S13)までのコンテンツ検索処理S1の一連の流れであるとする。
 なお、ユーザが所望のコンテンツに辿り着く速さの指標としては、ターン数に限らず、ユーザが所望のコンテンツ(正解)に辿り着くまでの時間を用いることも可能である。また、ユーザが所望のコンテンツに辿り着く速さの指標に限らず、ユーザが所望のコンテンツに辿り着くまでの効率の指標から、ユーザに提示する推奨される検索クエリの属性項目を決定してもよい。この場合、例えばユーザの「分かりやすかったか」や「納得感はあるか」といった評価尺度の入力結果が検索ログデータDLに蓄積されてもよい。
[1-2.実施形態に係る情報処理システムの機能構成]
 図3を用いて、実施形態に係る情報処理システム1の機能構成の一例を説明する。図3は、本開示の実施形態に係る情報処理装置10を含む情報処理システム1の機能構成の一例を示すブロック図である。
 図3に示すように、実施形態に係る情報処理システム1は、情報処理装置10及び外部サーバ20を含む。情報処理装置10及び外部サーバ20は、ネットワークNを介して通信可能に接続される。
 情報処理装置10は、上述した本開示に係る情報処理(処理S1,S2,S3)を実行する装置である。情報処理装置10は、例えば汎用のコンピュータやサーバ等であってもよい。情報処理装置10は、本開示に係る情報処理を実現するためのプログラム(アプリケーション)を実行することにより、本開示に係る情報処理装置10として機能する。
 情報処理装置10は、図3に示すように、入力部11、通信部12、記憶部13、取得部14、検索部15及び出力部16を含む。
 入力部11は、ユーザから各種操作を受け付けるためのデバイスである。例えば、入力部11は、キーボードやマウス、タッチパネル等によって実現される。入力部11は、マイク等によって実現され、音声入力可能に構成されていても構わない。
 通信部12は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、外部サーバ20との間で情報の送受信を行う。
 記憶部13は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子や、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態では、記憶部13は、例えば、検索ログデータ131、コンテンツメタデータ132及びコンテンツデータ133を有する。検索ログデータ131は、上述の検索ログデータDLに対応する。コンテンツメタデータ132は、上述のコンテンツメタデータDMに対応し、コンテンツデータ133のメタデータである。なお、検索ログデータ131は、コンテンツメタデータ132に含まれていても構わない。コンテンツデータ133は、実施形態に係る情報処理システム1(検索システム)により実現される配信サービスにおいてユーザに配信される、例えば楽曲や映画などのコンテンツのデータである。また、記憶部13は、本開示に係る情報処理を実現するための制御プログラム(アプリケーション)を記憶する。なお、検索ログデータ131、コンテンツメタデータ132及びコンテンツデータ133のうちの少なくとも1つの情報が、外部サーバ20に格納されていても構わない。つまり、これらの情報は、本開示に係る情報処理に先立って一時的に取得されてもよいし、本開示に係る情報処理において必要なタイミングで都度取得されても構わない。
 取得部14は、各種情報を取得する処理部である。取得部14は、入力部11を介して、ユーザからの検索クエリの入力を受け付ける。つまり、取得部14は、ユーザにより検索クエリが入力される処理S11,S14の一部を実行する。また、取得部14は、通信部12を介して、例えば外部サーバ20から各種情報を受信する。
 検索部15は、上述した本開示に係る情報処理(処理S1,S2,S3)を実行する。検索部15は、照合部151、成否判定部152、追加属性項目決定部153、絞り込み部154及び提示部155を含む。照合部151は、ユーザにより検索クエリが入力される処理S11,S14と、検索クエリとコンテンツメタデータ132とのマッチングの処理S12とを実行する。成否判定部152は、検索の成否を判定する処理S21を実行する。また、成否判定部152は、検索の成否の判定結果を用いて検索ログデータ131を更新する。追加属性項目決定部153は、追加検索属性を決定する処理S22を実行する。絞り込み部154は、検索結果のフィルタ処理S2を実行する。提示部155は、検索結果をユーザに提示する処理S13と、追加検索属性をユーザに提示する処理S23とを実行する。
 出力部16は、種々の情報を出力するための機構である。出力部16は、例えばディスプレイやプロジェクタなどの表示装置である。出力部16は、検索部15から送信された検索結果や追加検索属性などを表示する。なお、出力部16は、検索部15から送信された検索結果や追加検索属性などを示す音声データを音声出力するスピーカーであってもよい。また、出力部16は、他のコンピュータや外部ディスプレイなどに映像又は音声出力するためのデバイスインタフェースであっても構わない。
 外部サーバ20は、各種の情報を記憶する不揮発性メモリ等のストレージを含む装置である。外部サーバ20は、例えば検索ログデータ131やコンテンツメタデータ132、コンテンツデータ133の更新用のデータを格納し、情報処理装置10に供給することができる。外部サーバ20は、検索クエリの属性項目のうちの、例えば動的データを格納し、情報処理装置10に供給することができる。なお、外部サーバ20あるいは当該不揮発性メモリ等のストレージは、ネットワークNを介さず、情報処理装置10に直接接続されるように構成されていてもよい。
 なお、外部サーバ20は、複数の情報処理装置10で収集された検索ログデータ131を蓄積するように構成されていてもよい。この場合、外部サーバ20に蓄積された検索ログデータ131は、例えばネットワークNを介して、各情報処理装置10に供給される。
 なお、外部サーバ20は、情報処理装置10の一部の機能を実現可能に構成されていても構わない。また、情報処理装置10及び外部サーバ20は、1つの装置として実現されても構わない。また、情報処理装置10及び外部サーバ20は、それぞれ複数の装置により実現されてもよい。
[1-2-1.検索クエリの属性項目]
 ここで、図4及び図5を用いて、コンテンツの検索に使用される検索クエリの属性項目について、より詳細に説明する。
 図4は、本開示の実施形態に係る情報処理において、音楽コンテンツに対して使用される検索クエリの属性項目の一例を示す図である。図5は、本開示の実施形態に係る情報処理において、動画コンテンツに対して使用される検索クエリの属性項目の一例を示す図である。
 図4及び図5に例示するように、検索クエリの属性項目としては、静的データと動的データとがある。静的データは、主にコンテンツにより規定される、変化しない静的な情報である。静的データは、一意に決定できるものと、一意に決定できないものとを含む。一意に決定できる静的データは、コンテンツにより規定される、変化しない静的な情報である。一意に決定できない静的データは、コンテンツ及びコンテンツに対する外的要因により規定される、変化しない静的な情報である。一意に決定できない静的データとしては、例えば図4及び図5に例示するように、そのコンテンツに対して抱かれるムードや雰囲気などの主観的表現がある。動的データは、コンテンツに対する外的要因により規定される、時間変化する動的な情報である。上述したように、動的データの属性項目の属性値は、適宜、外部サーバ20から供給され得る。なお、検索クエリの属性項目は、検索対象のコンテンツに応じて適宜設定され得る。
 例えば、図4に例示するように、音楽コンテンツに関して一意に決定できる静的データとしては、音楽コンテンツの書誌情報や波形解析情報、ジャンル、バージョンなどがある。書誌情報としては、例えば、タイトルやアーティスト名、アルバム名、トラック番号、発売年月日、演奏時間、歌詞、作詞作曲編曲者、演奏者、指揮者、ジャケット写真などの属性項目が適宜利用可能である。波形解析情報としては、例えば、メロディーや伴奏、コード進行、楽曲構成、音色、テンポ、拍子などの属性項目が適宜利用可能である。なお、波形解析情報は、予め各コンテンツデータ133が解析されてコンテンツメタデータ132に含まれていてもよいし、例えば照合部151により検索クエリに応じてマッチングの際にコンテンツデータ133を解析することにより取得されても構わない。バージョンとしては、例えば、オリジナル、カバー、ライブといった区分(属性項目)が適宜利用可能である。
 例えば、図4に例示するように、音楽コンテンツに関する動的データとしては、音楽コンテンツのタイアップ実績や演奏実績、個人再生実績、ランキング、登録プレイリスト、SNS(Social Networking Service)等での言及などがある。タイアップ実績としては、例えば、テレビ番組や映画、コマーシャル、イベントなどの属性項目が適宜利用可能である。演奏実績としては、例えば、ライブや歌番組などの属性項目が適宜利用可能である。個人再生実績としては、例えば、日時やユーザ名などの属性項目が適宜利用可能である。
 例えば、図5に例示するように、動画コンテンツに関して一意に決定できる静的データとしては、動画コンテンツのタイトルや出演者、監督/演出、原作者、ジャンル/カテゴリー、発表年、制作国、制作会社、撮影者、画質、言語などの属性項目が適宜利用可能である。例えば、動画コンテンツに関する動的データとしては、動画コンテンツの再生実績や個人再生実績、ランキング、登録プレイリスト、SNS等での言及などがある。再生実績としては、例えば、日時や場所、チャネルなどの属性項目が適宜利用可能である。個人再生実績としては、例えば、日時やユーザ名などの属性項目が適宜利用可能である。
 なお、以下の説明では、音楽コンテンツの場合を例示するが、動画コンテンツなどの他の種類のコンテンツであっても同様である。
[1-2-2.ユーザに提示される検索結果]
 ここで、図6を用いて、ユーザに提示される検索結果について、より詳細に説明する。
 図1を参照して上述したように、処理S13においてユーザに提示される検索結果は、検索結果のフィルタ処理S2により検索ログデータ131に基づいて絞り込みが実行された後の検索結果である。図6は、本開示の実施形態に係る情報処理における、成否情報を含む検索ログデータ131の一例を示す図である。
 図6は、検索クエリとして「属性項目=発売年,属性値=2000年代」及び「属性項目=曲名,属性値=LOVE」が与えられている場合の検索ログデータ131を例示する。図6に例示する検索ログデータ131は、各コンテンツに関して、コンテンツID、アーティスト名、アルバム名、曲名、ジャンル、人気度及び正解事例等の情報を含む。コンテンツIDは、各コンテンツを一意に特定するための情報である。アーティスト名、アルバム名、曲名、ジャンル及び人気度は、属性項目の一例である。正解事例は、成否情報の一例である。
 図6に例示する検索ログデータ131は、コンテンツIDが「108」のコンテンツは、上記の2つの検索クエリが与えられた場合にこのコンテンツが正解、すなわちユーザ所望のコンテンツであった正解事例が1,045件であることを示す。同様に、コンテンツIDが「267」、「22054」及び「49284」のコンテンツは、それぞれ、正解事例が2,604件、312件及び989件であることを示す。また、図6に例示する検索ログデータ131は、上記の2つの検索クエリが与えられた場合にユーザが所望のコンテンツ(正解コンテンツ)に辿りついた合計の正解事例が252,369件であることを示す。このように、検索ログデータ131は、一例として、正解事例数(成否情報)を保持する。
 一例として、照合部151は、検索クエリとコンテンツメタデータ132との間で属性値が一致するか否かに基づいて、検索クエリとコンテンツメタデータ132とのマッチングを実行する。ここで、一致するか否かを判断する基準としては、値の完全一致や前方一致、部分一致、あるいはこれらの任意の組合せなどが適宜利用可能である。なお、照合部151は、別名や別表記の一致を基準として一致するか否かを判断してもよい。ここで、別名とは、例えば愛称や略称などを言う。また、別表記とは、例えば漢字やひらがな、カタカナ、アルファベット、全角文字、半角文字、大文字、小文字などを言う。
 図6に例示するように、検索クエリとして「属性項目=発売年,属性値=2000年代」及び「属性項目=曲名,属性値=LOVE」の2つの検索クエリが与えられる場合、2000年代に発売され、かつ、曲名がLOVEである(あるいは曲名にLOVEが含まれている)楽曲がヒットする。このため、上述したように、ヒット件数が多い場合には、ユーザ所望のコンテンツが提示された大量の検索結果に埋もれてしまう可能性が高い。
 そこで、絞り込み部154は、検索クエリに対してヒットした照合部151によるマッチングの結果を、検索ログデータ131に基づいて絞り込む。より具体的には、絞り込み部154は、ヒットした検索結果が所望のコンテンツであったか否かの成否情報に基づいて、検索クエリに対してヒットした複数のコンテンツに対するランキングを行う。
 一例として、絞り込み部154は、以下の式(1)を満たすcを絞り込みの結果(検索結果)として出力する。換言すれば、提示部155は、以下の式(1)を満たすcを検索結果としてユーザに提示する。式(1)のスコア関数score_A()において、a、v、c及びCは、それぞれ、検索クエリの属性項目、検索クエリの属性値、コンテンツ及びコンテンツの集合を示す。
Figure JPOXMLDOC01-appb-M000001
 ここでは、図6に例示するように、2つの検索クエリが与えられている場合を説明する。つまり、式(1)におけるa及びvは、例えば「属性項目=発売年,属性値=2000年代」の検索クエリに対応するものとする。また、式(1)におけるa及びvは、例えば「属性項目=曲名,属性値=LOVE」の検索クエリに対応するものとする。このとき、a、a、v及びvは、それぞれ、「発売年」、「曲名」、「2000年代」及び「LOVE」を表現する。
 式(1)のスコア関数score_A()としては、例えば、正解事例数をそのまま用いることができる。なお、スコア関数score_A()は、正解事例数をそのまま用いる場合に限らない。例えば、スコア関数は、各コンテンツの人気度など、各コンテンツに付随する情報や、ユーザの好みのジャンルなどの事前情報(ユーザプロファイル)を加味したスコアを算出するように設定されても構わない。この場合、スコア関数としては、例えば、各情報を正規化した上で所定の重み付けを行い、重み付けされた各情報の値を加算した値を用いることができる。なお、正解事例数をそのまま用いる場合には、正規化などの処理は実施されなくてもよい。
 また、正解事例数を用いる場合を例示したが、これに限らない。例えば、検索ログデータ131は、正解事例数に代えて、あるいは正解事例数に加えて、失敗事例数を保持していてもよい。失敗事例数は、各コンテンツの正解件数をE(iは自然数)とすると、(Σ)-Eで表現される。例えば、図6に示す例において、コンテンツIDが「108」のコンテンツの失敗事例数は、251,324(=252,369-1,045)である。また、正解事例数(失敗事例数)を全事例数で除して算出される正解率(失敗率)を用いてスコアを算出することもできる。
 なお、ユーザに提示される検索結果は、1件のコンテンツに限らず、2件以上の複数のコンテンツであってもよい。複数のコンテンツ、すなわち候補をユーザに提示する場合は、例えば上述のようにして算出されるスコアが上位のコンテンツから順にユーザに提示するコンテンツとして選択すればよい。
[1-2-3.追加属性項目の提示]
 ここで、図7及び図8を用いて、ユーザへの追加属性項目(追加検索属性)の提示について、より詳細に説明する。
 図1を参照して上述したように、検索に失敗した場合、すなわち提示された検索結果からユーザが所望のコンテンツに辿り着けなかった場合、検索結果をさらに絞り込むために、検索クエリの追加が必要となる。ユーザが所望のコンテンツに辿り着けなかった場合とは、ユーザに提示した検索結果、すなわちスコアが上位のコンテンツにユーザ所望のコンテンツが含まれていない場合や検索ヒット件数が多いためにユーザ所望のコンテンツが埋もれている場合を含む。
 検索結果をさらに絞り込む手法としては、検索クエリの属性値による検索結果の分散がもっとも大きくなる属性項目を選択する手法が知られている。これは、分散が大きいことが特定の属性値(属性項目)に検索結果候補のコンテンツ数が偏っていないことを示すため、いずれの属性項目の値を入力しても検索結果候補数が減ることが期待できるからである。しかしながら、ある属性項目の属性値の分散が大きいか否かと、その属性項目のユーザ所望のコンテンツの属性値と同一の属性値を有するコンテンツの数とは、直接的に関係しない。このため、検索クエリの属性値による検索結果の分散に応じて検索結果を絞り込む手法を用いる場合、分散が大きい場合であっても、ユーザが所望のコンテンツに辿り着くまでに多くの検索クエリの追加が必要な場合もあり得る。
 また、検索ログを利用して、ユーザの検索履歴との相関が高いコンテンツを決定することができる協調フィルタリングに係る技術が知られている。協調フィルタリングによれば、ユーザ(検索履歴)との相関が高いコンテンツを、アイテム間の類似度(類似度行列)を使用して決定することができる。しかしながら、協調フィルタリングで使用される検索ログは、実施形態に係る検索ログデータ131とは異なり、検索クエリ(属性項目/属性値)と、その検索クエリでの検索の成否との関係、すなわち検索の成否情報を含むものではない。このため、協調フィルタリングを用いても、その検索クエリでの成否情報に基づいて推奨される属性項目を提示(あるいは決定)したり、検索結果を絞り込んだりすることはできなかった。
 そこで、実施形態に係る情報処理は、ユーザが所望のコンテンツに効率的に辿り着けるように、ユーザが所望のコンテンツに辿り着く速さの観点から推奨される追加属性項目をユーザに提示する。より具体的には、実施形態に係る情報処理は、検索ログデータ131に基づいて、少ない検索クエリの追加回数でユーザが所望のコンテンツに辿り着くことができる属性項目を決定する。少ない検索クエリの追加回数は、ユーザが所望のコンテンツに辿り着く速さを示す指標の一例である。
 図7は、本開示の実施形態に係る情報処理における、成否情報を含む検索ログデータ131の一例を示す図である。図7は、図6と同様に、検索クエリとして「属性項目=発売年,属性値=2000年代」及び「属性項目=曲名,属性値=LOVE」が与えられている場合の検索ログデータ131を例示する。つまり、図7は、これら2つの検索クエリを用いて検索が行われた場合に関する検索ログデータ131を例示する。より具体的には、図7は、上記の2つの検索クエリを用いた検索で正解に辿り着かなった場合に、属性項目としてジャンル又はタイアップが追加された場合の検索ログデータ131を例示する。
 検索ログデータ131は、検索を行った上記の検索クエリ(属性項目,属性値)に加えて、図7に例示するように、当該検索クエリに対して新たに追加された追加検索クエリ(属性項目,属性値)をさらに含む。図7は、属性項目「ジャンル」の属性値として、「POPS」、「JAZZ」及び「R&B」を例示する。また、図7は、属性項目「タイアップ」の属性値として、「テレビ番組」、「コマーシャル」及び「映画」を例示する。
 また、検索ログデータ131は、上記の2つの検索クエリに加えて追加検索クエリをさらに用いて検索が行われた場合にユーザが所望のコンテンツに辿り着いた「正解」の事例数と、辿り着かなかった「失敗」の事例数とを含む(追加属性数:0)。図7に示す例では、「属性項目=ジャンル,属性値=POPS」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ1,402件及び2,545件である。また、「属性項目=ジャンル,属性値=JAZZ」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ545件及び1,253件である。また、「属性項目=ジャンル,属性値=R&B」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ365件及び1,489件である。また、「属性項目=ジャンル」の合計の「正解」及び「失敗」の事例数は、それぞれ4,529件及び9,524件である。また、「属性項目=タイアップ,属性値=テレビ番組」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ2,033件及び256件である。また、「属性項目=タイアップ,属性値=コマーシャル」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ1,589件及び976件である。また、「属性項目=タイアップ,属性値=映画」の追加検索クエリの場合、「正解」及び「失敗」の事例数は、それぞれ502件及び1,587件である。また、「属性項目=タイアップ」の合計の「正解」及び「失敗」の事例数は、それぞれ3,923件及び4,882件である。
 また、検索ログデータ131は、「追加属性数:0」の場合に対してn種類の検索クエリをさらに追加した場合の「正解」の事例数と、「失敗」の事例数とをさらに含む(追加属性数:n,nは自然数)。図7に示す例では、「属性項目=ジャンル,属性値=POPS」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ246件及び2,299件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ335件及び1,964件である。また、「属性項目=ジャンル,属性値=JAZZ」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ254件及び999件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ225件及び774件である。また、「属性項目=ジャンル,属性値=R&B」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ792件及び697件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ554件及び143件である。また、「属性項目=ジャンル」の「追加属性数:1」の合計の「正解」及び「失敗」の事例数は、それぞれ4,433件及び5,091件である。また、「追加属性数:2」の合計の「正解」及び「失敗」の事例数は、それぞれ2,159件及び2,932件である。また、「属性項目=タイアップ,属性値=テレビ番組」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ180件及び76件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ33件及び43件である。また、「属性項目=タイアップ,属性値=コマーシャル」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ212件及び764件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ53件及び711件である。また、「属性項目=タイアップ,属性値=映画」の追加検索クエリの場合、「追加属性数:1」の「正解」及び「失敗」の事例数は、それぞれ650件及び937件である。また、「追加属性数:2」の「正解」及び「失敗」の事例数は、それぞれ556件及び381件である。また、「属性項目=タイアップ」の「追加属性数:1」の合計の「正解」及び「失敗」の事例数は、それぞれ1,525件及び3,357件である。また、「追加属性数:2」の合計の「正解」及び「失敗」の事例数は、それぞれ1,098件及び2,259件である。
 また、検索ログデータ131は、各追加属性数の合計の「正解」及び「失敗」の事例数をさらに含む。図7に示す例では、「追加属性数:0」の合計の「正解」及び「失敗」の事例数は、それぞれ353,241件及び244,323件である。また、「追加属性数:1」の合計の「正解」及び「失敗」の事例数は、それぞれ104,254件及び140,069件である。また、「追加属性数:2」の合計の「正解」及び「失敗」の事例数は、それぞれ84,925件及び55,144件である。
 このように、検索ログデータ131は、例えば、属性項目が「ジャンル」の属性値が「POPS」だった場合、その時点での正解事例が1,402件であり、失敗事例が2,545件であったことを示す。また、検索ログデータ131は、さらに何らかの属性を1つ追加した場合の正解事例数が246件であり、失敗事例数が2,299件であったことを示す。なお、図7は一部の属性項目、属性値及び追加属性数に関して例示するが、検索ログデータ131においては、他の様々な属性項目、属性値及び追加属性数に対しても同様に各事例数が用意されているとする。
 ユーザに提示される検索クエリの属性項目は、これらの検索ログデータ131に基づいて生成されたスコア関数により決定される。このスコア関数は、一例として、以下の式(2)により表現される。つまり、追加属性項目決定部153は、以下の式(2)を満たすaをユーザに提示する追加属性項目として決定する。式(2)のスコア関数score_B()において、a、A、v及びcは、それぞれ、検索クエリの属性項目、検索クエリの属性項目の集合、検索クエリの属性値及びコンテンツを示す。
Figure JPOXMLDOC01-appb-M000002
 ここでは、図6と同様に、2つの検索クエリが与えられている場合を説明する。つまり、式(2)におけるa及びvは、例えば1つ目に与えられた検索クエリ「属性項目=発売年,属性値=2000年代」であるとする。また、式(2)におけるa及びvは、例えば2つ目に与えられた検索クエリ「属性項目=曲名,属性値=LOVE」であるとする。このとき、a、a、v及びvは、それぞれ、「発売年」、「曲名」、「2000年代」及び「LOVE」を表現する。
 図8は、本開示の実施形態に係る情報処理に関する、検索ツリーの一例を示す図である。図8は、図7と同様に、検索クエリとして「属性項目=発売年,属性値=2000年代」及び「属性項目=曲名,属性値=LOVE」が与えられている場合の追加属性項目の決定の流れを例示する。図8の検索ツリーは、コンテンツメタデータ132の各ノードN11~N17,N21~N27,N311~N313,N321~N323と、ノード間の接続の一例を示す。例えば、属性項目「発売年」の各ノードN11~N17は、それぞれ「1950年代」、「1960年代」、「1970年代」、「1980年代」、「1990年代」、「2000年代」及び「2010年代」の属性値に対応するノードである。また、例えば属性項目「曲名」のノードN21~N27は、それぞれ「明日の朝」、「LOVE」、「翼を広げて」、「震える心」、「友情と愛情」、「会いたい」及び「ともだち」の属性値に対応するノードである。
 ここで、1つ目に与えられた検索クエリ「属性項目=発売年,属性値=2000年代」に応じて照合部151によりノードN16が特定されているとする。また、2つ目に与えられた検索クエリ「属性項目=曲名,属性値=LOVE」に応じて照合部151によりノードN22が特定されているとする。
 式(2)のスコア関数score_B()としては、例えば、追加属性数が「0」の場合に正解となる割合(正解率)を用いることができる。例えば、追加属性項目として「ジャンル」を提示した場合、正解件数は4,529件であり、失敗件数は9,524件であるから、その正解率は32.2%である。一方、追加属性項目として「タイアップ」を提示した場合、正解件数は3,923件であり、失敗件数は4,882件であるから、その正解率は50.2%である。したがって、追加属性項目決定部153は、正解率の高い「タイアップ」をユーザに提示する追加属性項目として決定する。その後、3つ目の検索クエリとして「タイアップ」の属性値が入力された場合、照合部151は、その属性値や検索ログデータ131に基づいてノードN321を特定する。図8に示す例では、一例として、正解事例数が最も大きい「テレビ番組」の属性値に対応するノードN321が特定されている。
 また、スコア関数としては、追加属性数が「0」の場合に加えて、追加属性数が「1」の場合の正解率をさらに用いることもできる。例えば、追加属性項目として「ジャンル」を提示した場合、追加属性数が「0」及び「1」の場合の合計の正解件数は8,962(=4,529+4,433)件であるから、その正解率は63.7%である。ここでは、一例として、追加属性数が「0」の場合の合計の件数である14,053(=4,529+9,524)件に対する正解率を用いている。一方、追加属性項目として「タイアップ」を提示した場合、追加属性数が「0」及び「1」の場合の合計の正解件数は5,448(=3,923+1,525)件であるから、その正解率は61.8%である。ここでは、一例として、追加属性数が「0」の場合の合計の件数である8,805(=3,923+4,882)件に対する正解率を用いている。したがって、追加属性項目決定部153は、正解率の高い「ジャンル」をユーザに提示する追加属性項目として決定する。同様にして、2以上の複数の追加属性数の場合の正解率をさらに用いることもできる。
 また、スコア関数としては、全正解件数(353,241)に対する各属性の正解件数の割合(正解率)を用いることもできる。例えば、追加属性項目として「ジャンル」を提示した場合、追加属性数が「0」の合計の正解件数は4,529件であるから、その正解率は1.28%である。一方、追加属性項目として「タイアップ」を提示した場合、追加属性数が「0」の合計の正解件数は3,923件であるから、その正解率は1.11%である。したがって、追加属性項目決定部153は、正解率の高い「ジャンル」をユーザに提示する追加属性項目として決定する。
 また、スコア関数としては、例えば、上述した絞り込みの処理と同様に、正解事例数の値そのものを用いることもできる。
 また、スコア関数としては、例えば、各コンテンツの人気度など、各コンテンツに付随する情報や、ユーザの好みのジャンルなどの事前情報(ユーザプロファイル)を加味したスコアを算出するように設定されても構わない。この場合、スコア関数score_B()としては、例えば、各情報を正規化した上で所定の重み付けを行い、重み付けされた各情報の値を加算した値を用いることができる。
 成否判定部152は、例えば、得られた属性項目aに対して、ユーザが指定した検索クエリの属性値vに応じた検索の結果cが、ユーザ所望のコンテンツであるか否か(正解か失敗か)のフィードバックを返すことにより検索ログデータ131を更新する。
 なお、図6及び図7に例示する検索ログデータ131は、あくまで一例であり、情報処理システム1に対する各種の要求やコンテンツの種類などに応じて、適宜設定され得る。例えば、検索ログデータ131は、ユーザプロファイルに応じて、ユーザの属性ごとに用意することもできる。また、更新された検索ログデータ131は、複数の情報処理装置10の間で共有されてもよいし、その情報処理装置10に特有の、すなわち実際に利用するユーザに適合した検索ログデータ131として各情報処理装置10でそれぞれ保持されてもよい。また、検索ログデータ131は、成否情報に加えて、あるいは代えて、ユーザが所望のコンテンツに辿り着く速さの指標を蓄積してもよい。
[1-3.実施形態に係る情報処理の手順]
 次に、図9を用いて、実施形態に係る情報処理の手順について説明する。
 図9は、本開示の実施形態に係る情報処理の一例を示すフローチャートである。
 まず、ユーザが最初の検索クエリを入力部11に入力する。また、取得部14は、入力部11からユーザが入力した検索クエリを取得する。また、照合部151は、取得部14からユーザが入力した検索クエリを取得する(S101)。
 照合部151は、ユーザが入力した検索クエリと、コンテンツメタデータ132とのマッチングを実行する(S102)。絞り込み部154は、検索ログデータ131に基づいて、マッチングの結果(検索結果)を絞り込む(S103)。提示部155は、検索結果のフィルタ処理により絞り込まれた検索結果を出力部16に出力する。また、出力部16は、提示部155からの検索結果をユーザに提示する(S104)。
 成否判定部152は、ユーザに提示された検索結果にユーザが所望のコンテンツが含まれているか否か、すなわちユーザが所望のコンテンツに辿り着いたか否かを判定する(S105)。
 ユーザが所望のコンテンツに辿り着いたとき(S105:Yes)、成否判定部152は、検索ログデータ131の正解事例数を更新する(S106)。その後、図9の流れは終了する。
 一方で、ユーザが所望のコンテンツに辿り着かなかったとき(S105:No)、成否判定部152は、検索ログデータ131の失敗事例数を更新する(S107)。追加属性項目決定部153は、検索ログデータ131に基づいて、ユーザが所望のコンテンツに辿り着く速さの観点からユーザに推奨する検索クエリの属性項目(追加検索属性)を決定する。また、提示部155は、決定された属性項目を出力部16に出力する。また、出力部16は、提示部155からの属性項目をユーザに提示する(S108)。
 その後、ユーザが提示された属性項目(追加検索属性)の属性値、すなわち検索クエリを入力部11に入力する。また、取得部14は、入力部11からユーザが入力した検索クエリを取得する。また、照合部151は、取得部14からユーザが入力した検索クエリを取得する(S109)。その後、図9の流れはS102の処理へ戻る。以降、ユーザが所望のコンテンツに辿り着く(S105:Yes)まで、S102~S109の処理を繰り返す。
 なお、検索ログデータ131を用いた検索結果の絞り込みの処理(S103)は、必ずしも実行されなくても構わない。例えば、追加属性項目の提示だけであっても、ユーザが所望のコンテンツに辿り着く速さを向上させることができる。また、実施形態に係る情報処理システム1(検索システム)を用いた配信サービスの開始段階など、検索ログデータ131が十分に収集されていない場合もあり得る。この場合には、検索ログデータ131が十分に収集されるまではマッチング(S102)や追加属性項目の決定(S108)においても検索ログデータ131を利用せず、検索ログデータ131が十分に蓄積した時点で検索ログデータ131を利用するように切り替える構成とすればよい。
 また、検索ログデータ131の成否情報に意図しない偏りが生じる場合もあり得る。つまり、収集された検索ログデータ131によっては、検索ログデータ131を用いた絞り込み(S103)や追加属性項目の提示(S108)に係る精度が低下するおそれもある。このような場合も、検索ログデータ131の利用の有無を任意に変更可能な構成とすることは有意である。
[1-4.ハードウェア構成]
 図10は、本開示の実施形態に係る情報処理システム1の各装置のハードウェア構成の一例を示すブロック図である。上述してきた実施形態に係る情報処理システム1の各装置(情報処理装置10及び外部サーバ20)等の情報機器は、例えば図10に示すような構成のコンピュータ1000によって実現される。
 コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス1500、及び入出力インターフェイス1600を有する。コンピュータ1000の各部は、バス1050によって通信可能に接続される。
 CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1300又はHDD1400に格納されたプログラムをRAM1200にロードし、各種プログラムに対応した処理(本開示に係る情報処理)を実行する。
 ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
 HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。
 通信インターフェイス1500は、コンピュータ1000がネットワークNや外部ネットワーク1550(例えばインターネット)と接続するためのインターフェイスである。例えば、CPU1100は、通信インターフェイス1500を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
 入出力インターフェイス1600は、入出力デバイス1650とコンピュータ1000とを接続するためのインターフェイスである。例えば、CPU1100は、入出力インターフェイス1600を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力インターフェイス1600を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス1600は、所定の記録媒体(メディア)に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
 例えば、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、情報処理装置10の有する各機能を実現する。また、HDD1400には、本開示に係る各機能を実現するためのプログラムや、記憶部13内のデータが格納される。具体的には、HDD1400は、上述の検索ログデータ131、コンテンツメタデータ132及びコンテンツデータ133を含む各種データを記録する記録媒体である。なお、CPU1100は、プログラムデータ1450をHDD1400から読み取って実行するが、他の例として、外部ネットワーク1550を介して、他の装置からこれらのプログラムを取得してもよい。
(2.本開示に係る情報処理システムの効果)
 情報処理装置10は、追加属性項目決定部153と、提示部155とを備える。追加属性項目決定部153は、検索結果を提示されたユーザが、検索結果から所望のコンテンツに辿り着けなかったとき、検索ログデータ131(DL)に基づいて、追加する検索クエリの属性項目である追加属性項目を決定する。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。検索ログデータ131は、検索クエリと検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。提示部155は、決定された追加属性項目をユーザに提示する。
 これにより、情報処理装置10は、複数のコンテンツからユーザが所望のコンテンツを検索するコンテンツ検索において、ユーザが所望のコンテンツに辿り着く速さの観点から推奨される検索クエリの属性項目をユーザに提示することができる。換言すれば、情報処理装置10は、どのような検索クエリを与えれば大量のコンテンツの中から所望のコンテンツをなるべく早いタイミングで得られるか分からないユーザに対して、検索結果に速く辿り着ける可能性の高い属性項目を提示することができる。つまり、情報処理装置10によれば、ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索を実現することができる。ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索は、闇雲に検索クエリを追加したり、大量の検索結果を順番に確認しながら所望のコンテンツを探したりするなど、所望のコンテンツに辿り着くためにユーザが消費する時間や手間の低減に寄与する。
 情報処理装置10において、成否情報は、複数の属性項目の各々に対応する正解事例数を含む。追加属性項目決定部153は、正解事例数又は正解事例数から算出された正解率に基づいて、追加属性項目を決定する。
 これにより、情報処理装置10は、過去に検索に成功した事例又はその割合が高い属性項目をユーザに提示することができる。
 情報処理装置10は、成否判定部152をさらに備える。成否判定部152は、検索結果を提示されたユーザが所望のコンテンツに辿り着けたか否かを示す検索の成否を判定する。
 これにより、情報処理装置10は、ユーザが所望のコンテンツに辿り着けない場合、すなわちユーザが与えた検索クエリだけでは検索結果を一意に絞り込めない場合など、適切なタイミングで適切な属性項目をユーザに提示することができる。
 情報処理装置10において、成否判定部152は、ユーザが検索結果の示すコンテンツを選択しなかったとき、ユーザが検索結果の示すコンテンツを所定の長さ以上再生しなかったとき及びユーザが検索結果の示すコンテンツを最後まで再生しなかったときのうちのいずれか1つのときに、ユーザが検索結果から所望のコンテンツに辿り着けなかったと判定する。
 これにより、情報処理装置10は、ユーザが与えた検索クエリだけでは検索結果を一意に絞り込めない状況であるか否かを適切に判断することができる。
 情報処理装置10において、成否判定部152は、ユーザにより入力された検索クエリと、検索の成否の判定結果との関係を用いて、検索ログデータ131を更新する。
 これにより、情報処理装置10は、ユーザによるコンテンツ検索の実情に合わせて検索ログデータ131を適宜更新することができる。また、ユーザの検索の傾向に適合したコンテンツ検索を実現することもできる。
 情報処理装置10は、絞り込み部154をさらに備える。絞り込み部154は、検索ログデータ131に基づいて、少なくとも1つのコンテンツを示す検索結果を絞り込む。
 これにより、情報処理装置10は、例えば検索クエリに応じたヒット件数が多い場合であっても、ユーザ所望のコンテンツが大量の検索結果に埋もれてしまう可能性を低減することができる。また、情報処理装置10は、他の候補のコンテンツを残しつつ、ユーザ所望のコンテンツである可能性が高いコンテンツを優先的にユーザに提示することができる。
 情報処理装置10において、成否情報は、複数の検索クエリの各々に対応する正解事例数を含む。絞り込み部154は、正解事例数又は正解事例数から算出された正解率に基づいて、少なくとも1つのコンテンツを示す検索結果を絞り込む。
 これにより、情報処理装置10は、ユーザが入力した検索クエリを用いたコンテンツ検索において、過去に検索に成功した事例又はその割合が高い、すなわちユーザ所望のコンテンツであった実績が高いコンテンツを優先的にユーザに提示することができる。
 情報処理装置10は、絞り込み部154と、提示部155とを備える。絞り込み部154は、検索ログデータ131に基づいて、検索結果を絞り込む。検索ログデータ131は、検索クエリとその検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。提示部155は、絞り込まれた検索結果をユーザに提示する。
 これにより、情報処理装置10は、複数のコンテンツからユーザが所望のコンテンツを検索するコンテンツ検索において、ユーザが入力した検索クエリに対してユーザ所望のコンテンツであった実績が高いコンテンツを優先的にユーザに提示することができる。つまり、情報処理装置10は、ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索を実現することができる。
 情報処理方法は、検索結果を提示されたユーザが、検索結果から所望のコンテンツに辿り着けなかったとき、検索ログデータ131に基づいて、追加する検索クエリの属性項目である追加属性項目を決定することと、決定された追加属性項目をユーザに提示することとを含む。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。検索ログデータ131は、検索クエリとその検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。
 これにより、複数のコンテンツからユーザが所望のコンテンツを検索するコンテンツ検索において、ユーザが所望のコンテンツに辿り着く速さの観点から推奨される検索クエリの属性項目をユーザに提示することができる。換言すれば、どのような検索クエリを与えれば大量のコンテンツの中から所望のコンテンツをなるべく速く得られるか分からないユーザに対して、検索結果により早いタイミングで辿り着ける可能性の高い属性項目を提示することができる。つまり、情報処理方法によれば、ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索を実現することができる。
 情報処理方法は、検索ログデータ131に基づいて、検索結果を絞り込むことと、絞り込まれた検索結果をユーザに提示することとを含む。検索ログデータ131は、検索クエリとその検索クエリを用いた検索の成否を示す成否情報との関係が蓄積されたデータである。検索結果は、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す。
 これにより、複数のコンテンツからユーザが所望のコンテンツを検索するコンテンツ検索において、ユーザが入力した検索クエリに対してユーザ所望のコンテンツであった実績が高いコンテンツを優先的にユーザに提示することができる。つまり、情報処理方法によれば、ユーザが所望のコンテンツに辿り着く速さが考慮されたコンテンツ検索を実現することができる。
 なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
 なお、本技術は以下のような構成も取ることができる。
(1)
 ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を提示された前記ユーザが、前記検索結果から所望のコンテンツに辿り着けなかったとき、検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定する追加属性項目決定部と、
 決定された前記追加属性項目を前記ユーザに提示する提示部と
 を備える情報処理装置。
(2)
 前記成否情報は、複数の属性項目の各々に対応する正解事例数を含み、
 前記追加属性項目決定部は、前記正解事例数又は前記正解事例数から算出された正解率に基づいて、前記追加属性項目を決定する、
 前記(1)に記載の情報処理装置。
(3)
 前記検索結果を提示された前記ユーザが所望のコンテンツに辿り着けたか否かを示す検索の成否を判定する成否判定部をさらに備える、前記(1)又は(2)に記載の情報処理装置。
(4)
 前記成否判定部は、前記ユーザが前記検索結果の示すコンテンツを選択しなかったとき、前記ユーザが前記検索結果の示すコンテンツを所定の長さ以上再生しなかったとき及び前記ユーザが前記検索結果の示すコンテンツを最後まで再生しなかったときのうちのいずれか1つのときに、前記ユーザが前記検索結果から所望のコンテンツに辿り着けなかったと判定する、前記(3)に記載の情報処理装置。
(5)
 前記成否判定部は、前記ユーザにより入力された検索クエリと、前記検索の成否の判定結果との関係を用いて、前記検索ログデータを更新する、前記(3)又は(4)に記載の情報処理装置。
(6)
 前記検索ログデータに基づいて、前記少なくとも1つのコンテンツを示す検索結果を絞り込む絞り込み部をさらに備える、前記(1)~(5)のいずれかに記載の情報処理装置。
(7)
 前記成否情報は、複数の検索クエリの各々に対応する正解事例数を含み、
 前記絞り込み部は、前記正解事例数又は前記正解事例数から算出された正解率に基づいて、前記少なくとも1つのコンテンツを示す検索結果を絞り込む、
 (6)に記載の情報処理装置。
(8)
 検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を絞り込む絞り込み部と、
 絞り込まれた前記検索結果を前記ユーザに提示する提示部と
 を備える情報処理装置。
(9)
 ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を提示された前記ユーザが、前記検索結果から所望のコンテンツに辿り着けなかったとき、検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定することと、
 決定された前記追加属性項目を前記ユーザに提示することと
 を含む情報処理方法。
(10)
 検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を絞り込むことと、
 絞り込まれた前記検索結果を前記ユーザに提示することと
 を含む情報処理方法。
  1   情報処理システム
  10  情報処理装置
  11  入力部
  12  通信部
  13  記憶部
  131 検索ログデータ
  132 コンテンツメタデータ
  133 コンテンツデータ
  14  取得部
  15  検索部
  151 照合部
  152 成否判定部
  153 追加属性項目決定部
  154 絞り込み部
  155 提示部
  16  出力部
  20  外部サーバ
  DL  検索ログデータ
  DM  コンテンツメタデータ

Claims (10)

  1.  ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を提示された前記ユーザが、前記検索結果から所望のコンテンツに辿り着けなかったとき、検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定する追加属性項目決定部と、
     決定された前記追加属性項目を前記ユーザに提示する提示部と
     を具備する情報処理装置。
  2.  前記成否情報は、複数の属性項目の各々に対応する正解事例数を含み、
     前記追加属性項目決定部は、前記正解事例数又は前記正解事例数から算出された正解率に基づいて、前記追加属性項目を決定する、
     請求項1に記載の情報処理装置。
  3.  前記検索結果を提示された前記ユーザが所望のコンテンツに辿り着けたか否かを示す検索の成否を判定する成否判定部をさらに備える、請求項1に記載の情報処理装置。
  4.  前記成否判定部は、前記ユーザが前記検索結果の示すコンテンツを選択しなかったとき、前記ユーザが前記検索結果の示すコンテンツを所定の長さ以上再生しなかったとき及び前記ユーザが前記検索結果の示すコンテンツを最後まで再生しなかったときのうちのいずれか1つのときに、前記ユーザが前記検索結果から所望のコンテンツに辿り着けなかったと判定する、請求項3に記載の情報処理装置。
  5.  前記成否判定部は、前記ユーザにより入力された検索クエリと、前記検索の成否の判定結果との関係を用いて、前記検索ログデータを更新する、請求項3に記載の情報処理装置。
  6.  前記検索ログデータに基づいて、前記少なくとも1つのコンテンツを示す検索結果を絞り込む絞り込み部をさらに備える、請求項1に記載の情報処理装置。
  7.  前記成否情報は、複数の検索クエリの各々に対応する正解事例数を含み、
     前記絞り込み部は、前記正解事例数又は前記正解事例数から算出された正解率に基づいて、前記少なくとも1つのコンテンツを示す検索結果を絞り込む、
     請求項6に記載の情報処理装置。
  8.  検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を絞り込む絞り込み部と、
     絞り込まれた前記検索結果を前記ユーザに提示する提示部と
     を具備する情報処理装置。
  9.  ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を提示された前記ユーザが、前記検索結果から所望のコンテンツに辿り着けなかったとき、検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、追加する検索クエリの属性項目である追加属性項目を決定することと、
     決定された前記追加属性項目を前記ユーザに提示することと
     を含む情報処理方法。
  10.  検索クエリと当該検索クエリを用いた検索の成否を示す成否情報との関係が蓄積された検索ログデータに基づいて、ユーザにより入力された検索クエリを用いたマッチングにより複数のコンテンツから特定された少なくとも1つのコンテンツを示す検索結果を絞り込むことと、
     絞り込まれた前記検索結果を前記ユーザに提示することと
     を含む情報処理方法。
PCT/JP2021/019875 2020-06-03 2021-05-25 情報処理装置及び情報処理方法 WO2021246248A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020097116 2020-06-03
JP2020-097116 2020-06-03

Publications (1)

Publication Number Publication Date
WO2021246248A1 true WO2021246248A1 (ja) 2021-12-09

Family

ID=78831029

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/019875 WO2021246248A1 (ja) 2020-06-03 2021-05-25 情報処理装置及び情報処理方法

Country Status (1)

Country Link
WO (1) WO2021246248A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169519A (ja) * 2008-01-11 2009-07-30 Nec Corp 情報提示装置、情報提示方法、および情報提示用プログラム
JP2014501422A (ja) * 2010-12-31 2014-01-20 アリババ・グループ・ホールディング・リミテッド ユーザ意図の有無に基づく検索キーワードの推薦
JP2016038667A (ja) * 2014-08-06 2016-03-22 日本電信電話株式会社 情報提供装置、情報提供方法、および情報提供プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169519A (ja) * 2008-01-11 2009-07-30 Nec Corp 情報提示装置、情報提示方法、および情報提示用プログラム
JP2014501422A (ja) * 2010-12-31 2014-01-20 アリババ・グループ・ホールディング・リミテッド ユーザ意図の有無に基づく検索キーワードの推薦
JP2016038667A (ja) * 2014-08-06 2016-03-22 日本電信電話株式会社 情報提供装置、情報提供方法、および情報提供プログラム

Similar Documents

Publication Publication Date Title
US10152517B2 (en) System and method for identifying similar media objects
US7849092B2 (en) System and method for identifying similar media objects
US20070276733A1 (en) Method and system for music information retrieval
US7533091B2 (en) Methods, systems, and computer-readable media for generating a suggested list of media items based upon a seed
US20090254554A1 (en) Music searching system and method
US7680824B2 (en) Single action media playlist generation
Lee Analysis of user needs and information features in natural language queries seeking music information
US10504156B2 (en) Personalized media stations
US20090158155A1 (en) Playlist generation, delivery and navigation
US20090055376A1 (en) System and method for identifying similar media objects
US8364669B1 (en) Popularity of content items
US8468046B2 (en) Playlist-based detection of similar digital works and work creators
US20070282860A1 (en) Method and system for music information retrieval
US20060083119A1 (en) Scalable system and method for predicting hit music preferences for an individual
US20220035858A1 (en) Generating playlists using calendar, location and event data
US7636728B2 (en) Media difference files for compressed catalog files
JP2007524955A (ja) 階層的プレイリスト生成装置
WO2006063447A1 (en) Probabilistic audio networks
JP4981630B2 (ja) 感性マッチング方法、装置及びコンピュータ・プログラム
Schedl et al. A model for serendipitous music retrieval
US20190294690A1 (en) Media content item recommendation system
Hertzum et al. Music questions in social Q&A: an analysis of Yahoo! Answers
JP4599141B2 (ja) 情報提供システム,情報提供サーバおよびコンピュータプログラム
JP2007233515A (ja) 情報処理装置および情報処理方法、提供装置および提供方法、並びにプログラム
WO2021246248A1 (ja) 情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21817405

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21817405

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP