WO2007066607A1 - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
WO2007066607A1
WO2007066607A1 PCT/JP2006/324157 JP2006324157W WO2007066607A1 WO 2007066607 A1 WO2007066607 A1 WO 2007066607A1 JP 2006324157 W JP2006324157 W JP 2006324157W WO 2007066607 A1 WO2007066607 A1 WO 2007066607A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
sex
content
latent
sex information
Prior art date
Application number
PCT/JP2006/324157
Other languages
English (en)
French (fr)
Inventor
Kei Tateno
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to EP06823564A priority Critical patent/EP1959358A4/en
Priority to US11/815,538 priority patent/US8478781B2/en
Publication of WO2007066607A1 publication Critical patent/WO2007066607A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set

Definitions

  • the present invention relates to an information processing apparatus method and a program, and particularly to an information processing apparatus method and a program capable of giving an optimum keyword to an information processing apparatus.
  • the information processing device disclosed in the 96 65 report estimates the keyword using the quantity 1 class, but the quantity 111 class can be used only for qualitative data. Therefore, for example, a word that appears multiple times in a text for a song is considered to be important, but it cannot be weighted.
  • the method disclosed in the above 2 2 4 573 is a method of clustering an integer keyword, but a cluster with an assigned keyword showing an attribute is used. I can't do ngde.
  • the method disclosed in the 2 75676 report recommends the content according to the context of the The, but it is separated from the Zapuy created by accumulating the highly evaluated content data. Used the method of recommending the content in the near future, and could not be said to recommend the optimum content because it did not take into account the information such as the newsletter.
  • the step of extracting 013 which is an information processing device having a step of calculating the lamellas representing the quality of each cloth and a step of accumulating the emitted lamellas, and the sex information.
  • the parameter can be calculated from the extracted attribute information and the extracted sex information.
  • a sentence written in natural language can be divided into words or groups of words.
  • a second stage for calculating which indicates the and of the above-mentioned, based on the above-mentioned lams issued, and a display means for controlling the above-mentioned, based on the above-mentioned issued.
  • the column 016 there are two numbers common to each of the usage information indicating the, the sex information, or the information regarding the use of the content according to, and two parameters indicating the cloth quality of each of the sex information and the sex information. It is possible to calculate the above and accumulate the above-mentioned emitted 2 lams.
  • the second lamella can be calculated from the above-mentioned, the sex information, or the issued use information.
  • the lamella of the above 3 can be calculated from the above, the sex information, or the issued report.
  • the number of features common to the sex information indicating the sex of the feature related to the content and the sex information indicating the quality of each cloth of the sex information are issued and output.
  • the lamellas of the selected are stacked.
  • the extracted conversion means for converting so that it is placed between the latent areas and the conversion information converted during the interval and the sex information that is inherently linked to
  • the information processing apparatus includes a calculation step and a selection step for selecting a property corresponding to the item based on the above-mentioned output.
  • the sex corresponding to the content it is possible to select the property that the released distance is less than or equal to a predetermined value, or the predetermined number of sexes in which the distance is higher.
  • the characteristics related to the content are identified, and the latent number, the characteristic, and the traits indicating the quality of each cloth of the sex information are common to the sex information indicating the sex of the characteristic content.
  • the extracted features are transformed so as to be placed between the latents, and the features transformed during the latents are separated from the sex information that is inherently linked to the features by the number of latents. Based on the distance released, the sex corresponding to the content is selected.
  • the sex information is latent.
  • Conversion means for converting so as to be arranged in between, and a step for calculating the distance between the sex information converted during the space and the sex information that is inherently linked to the sex information by the number.
  • An information processing device comprising: a selection stage that selects an item corresponding to the sex information based on the released distance.
  • the content corresponding to the sex information the content that the released distance is less than or equal to a predetermined value, or a predetermined number of the content that is higher in the distance can be selected.
  • the sex information is latent based on the latent number common to the sex information indicating the sex of the above-mentioned sex, and the latency indicating the quality of each cloth of the sex information.
  • the sex information based on the latent numbers, characteristics, and the lamellas that represent the quality of each cloth of sex information, which are common to the sex information indicating the sex of the sex information related to the content. Are converted so that they are placed between latents, and the sex information converted during the latents is separated from the characteristics that are inherently linked to the sex information by the latent number. Based on this, the content corresponding to the sex information is selected.
  • the optimum keyword can be given to the contents.
  • FIG. 13 is a block diagram for explaining an example of the configuration of a door for a device.
  • 2 is a functional block diagram showing the performance of the two devices.
  • FIG. 4 is a diagram showing an example of the content of four contents.
  • FIG. 5 is a diagram showing an example of information about 5 contents.
  • Fig. 7 is a diagram showing an example of a glycode when the number of composite normals (G) according to 7 tens and the number of s according to the labeling are common.
  • FIG. 11 is a diagram showing an example of variance for 11
  • FIG. 13 is a diagram showing an example of average vector 2 calculated by 13.
  • FIG. 15 is a diagram showing an example of the distance from the content calculated by the distance between 15 units.
  • 17 is a diagram showing an example of the distance from the content calculated by the distance between 17 points.
  • 18 is a block diagram for explaining another example of the functional example of the device.
  • FIG. 10 is a diagram showing an example of text information related to 20 content. It is a figure which shows the example of the intertext expression of 21 text information.
  • 22 is a block diagram for explaining another example of the functional example of the device.
  • FIG. 8 is a diagram showing an example of information on 24 contents.
  • FIG. 26 is a diagram showing an example of gender of 26 contexts.
  • 27 is a block diagram for explaining another example of the functional configuration of the device.
  • 31 is a block diagram for explaining another example of the functional configuration of the device.
  • Fig. 35 is a diagram showing an example of a display unit for displaying chapters such as a content sentence.
  • 039 is a block diagram explaining an example of how to create a door.
  • R 3 also contains data necessary for P to perform various functions.
  • the interface 5 includes an input 6 composed of a keyboard, a mouse, etc., an output 7 composed of a display such as a speaker, a C (d C sasa), a record 8 composed of a disk, etc., and an Internet etc.
  • a communication unit 9 that controls the processing with other devices via the network is connected.
  • a dry 2 is also connected to the counter 005, and the media 2 such as a magnetic disk, a disk, a magneto-optical disk, or a semiconductor memory is connected. Are loaded, and the read-out programs are installed in record 8 if necessary.
  • 004 252 is a functional block diagram showing the performance of the contents.
  • 004 is a device that performs a certain function such as extracting features from recorded contents, and extracting extracted features (corresponding to the described keyword (the described function), It is an example of the Ming information processing device.
  • Nten 004 is compatible with Nten 5, Nten 52, Nten 53, Lab 54, Lab 55.
  • 004 52 extracts the content stored in content 5 (). Content 52 accumulates () in the extracted content 53.
  • the term “tenten” refers to various information, such as a set of televisions, movies, photographs, and music (images, still images, voices, or a combination thereof), which are commonly recorded. Text, books, databases, etc. are also included. In the following, in the present embodiment, music, which is music, will be described as an example.
  • 00500 is a numerical value of the characteristics of a certain content. If the song is a music item, for example, the song's speed (tempo) and brightness (for example, a major song becomes a light song, an indian song becomes a dark song, or a (soundless state By comparison, it is a numerical value of the addition when there is sound.
  • Label 54 extracts information about contents stored in (5). The label 54 accumulates () the extracted information in the information 55.
  • the label report is a report showing the nature of the information. Labels, for example, words, symbols, tags, etc., that are contained in bi-lyrics, content tights, or moving image steps, can be used to give weights to content. It is a report that shows the unique sex.
  • 0053 56 is the information stored in
  • the correspondence report is a report for dealing with the information. , For example, by linking with content by latent z described later.
  • the extracted information is converted so that it is placed in the latent area.
  • the interface 59 supplies the converted result to the inter-space 6.
  • An inter-distance of 6 was supplied by the station 59, converted to be located throughout the station and
  • the distance from the content is calculated.
  • the distance 6 is supplied to the base 62 which is the result of the separation.
  • Label 00 62 selects the label based on the distance supplied from the latent distance 6.
  • Label 6 is Label 58 Based on the corresponding correspondence information, the target urine is converted so that it is placed in the latent space. Lab 6 feeds the transformed result to interspace 6.
  • Interval 6 is the label supplied by Label 6 with the label information converted and placed in between.
  • the distance from the service is calculated based on the correspondence information accumulated in 57.
  • the distance 6 supplies the separated distance to the antenna 63.
  • nte 63 selects nte based on the distance supplied from the latent distance 6.
  • step 006 the contents 52 are
  • the content 52 is the music content stored in content 5, the speed, brightness, and Extracts the pressure and other contents, and accumulates in those extracted contents.
  • 006 644 is a diagram showing an example of the content amount related to music content.
  • the music contents accumulated in 5 are shown, and the name of the contents to the contents is shown in the fth eye: speed, brightness, and.
  • the content 52 is, as shown in 4, the speed of (2) to 7 is 7, the brightness of 52, and the speed of 2 (3) to 5 3; A brightness of 65 and a speed of 67, 3 (4) to 47, a brightness of 75 and a brightness of 5 and a speed of 4 (5) to 59, 55 , And each of 48 are output as the content.
  • content 52 is a speed of 5 (6) to 57, a brightness of 52, and a brightness of 59, 6 (7 to 39, a speed of 39, a brightness of 39.
  • And 3 and 7 (8) et. , 55, and 4 are output as input.
  • the input 52 is 34 from 8 (9).
  • Brightness, and each of which is 46 are output as an input.
  • the contents 52 store the extracted contents (4) in the contents 53, respectively.
  • the content 52 by extracting the content of the information that has been accumulated in content 5, the content 52 also stores the content in content 5 3 for that content. I can say.
  • the contents extracted from the music contents are described as an example.
  • the contents are not limited thereto, and, for example, If it is a feature related to music content, such as a musical instrument or.
  • the label 54 extracts the label information and accumulates the extracted label information in the label 55 (). For example, in step S2, the label 54 extracts the information such as the degree of a single word included in the sentence from the sentence of the musical sentence accumulated in the sentence 5, The extracted information is stored in the information 55.
  • the words are extracted by morphological analysis, and the words are counted to extract the information shown in 5.
  • 00785 is a diagram showing an example of information about music information.
  • the eye is shown, is shown the music information accumulated in content 5
  • the f is the information about the music, that is, the text of the music content.
  • the included words are ,,,,,,, and are indicated in 0080.
  • the item of the fth day in the second sentence from the left side, It shows the value of how many times a certain word appears, and similarly, the value of how many times a certain word appears in the third sentence from the left.
  • the bi-statement also shows the value of the number of times these words occur.
  • Lab 54 has 5 (6f) bi-sentences without light words, 6 (7f) bi-sentences without overlapping words, 7 (8f) From the bi-statement of each, state that the word that is a gag has appeared.
  • the word that is a gage appears from the bitext of 8 (9), the word that is a two appears, and the word that is a gage appears from the bitext of 9 (f), From the bitext of (f), each of the two words that appear to be tangled appears.
  • the labeling reports are ,,,,, Although, and have been described as examples, but is not limited to, as long as it is a single word included in a sentence of a music item, such as ,, or S.
  • Response 56 manages the publication of information and information. 56 shows the results obtained by the process of issuing the report with the report
  • Step 2 Response 56 calculates the information stored in the content 53 and the information stored in the label 55.
  • the 0090 general normal (G) is represented by the observation (in practice, and is generally estimated based on its existing distribution parameters.
  • the method for determining the basic parameters is (ec aoa za o) Asm is a typical example, but there are other Bayesian methods that use the isometric method.
  • PS Pulbab scae Se acass
  • the PS expresses documents and words as a contingent rate of latent numbers, and also estimates these contingent rates based on them.
  • 00974 is a diagram showing an example of a glycode when the number of composite normals (G) according to the report and the number of PS according to the lab report are common.
  • z (z z2 z3 z (of a number) indicates a latent (below, referred to as latent) by, is an integer (below, also referred to as an integer s), and is
  • (sz) represents the rate of the contents of the content
  • (z) represents the rate of the contents of the label, and (sz) of them.
  • (z) have a common latent z determined by (z) 0096 That is, the content s is multiplied by the latent z.
  • the latent z is determined by the conditional P (z) of the latent z, while the average of the mean vector variances of the latent z corresponding to the latent z (for example, And the matrix s
  • S denotes the variance (below, also known as the variance) corresponding to the latent z
  • c (S) indicates the carousel or weight in the content s
  • ( ⁇ ) indicates the lamella at the turn of the eye.
  • step 2 the correspondence 56 is that by using () and (8),
  • 01158 is a diagram showing an example of the inter-content expression. 8 shows the latency representation of the song, that is, an example of the value by conditional P (z S).
  • the music contents accumulated in 5 are shown, and in the f-th, 2 of the contents (, latent z2) are shown.
  • the correspondence 56 has the potential of (2
  • 9 is a diagram showing an example of an expression between labels (). 9 shows an example of an inter-word expression included in a music sentence, that is, a conditional (z) value.
  • the f-th shows two (, latent 2 for Noh.
  • the prior P (z) has a P (z) of -48 when it is latent and a P (z) of -52 when it is latent 2.
  • the correspondence 56 calculates, as the correspondence information, for example, the average vector and.
  • the correspondence information for example, the average vector and.
  • 0132 is a diagram showing an example of variance with respect to latent.
  • the music contents accumulated in 5 are shown, and similarly, in the fth eye, the contents are shown.
  • Correspondence 56 for example, is distributed as shown on day 2.
  • the speed and speed are set to 8, the speed is set to 3, and the speed is set to 5, respectively.
  • the correspondence 56 outputs "spide 3 (which is the same as the third from the left on the 2nd day)" as the variance.
  • correspondence 56 shows that, as shown in the 4th day, as the variance, and the speed are 5 (the same as the 4th from the left of the 2nd day) and (the 4th from the left of the 3rd day). (The same as the fourth one),
  • 2 is a diagram showing an example of the variance with respect to the latent z2.
  • 01382 since it is the same as that of the day, its description is omitted.
  • Correspondence 56 is distributed as shown on the 2nd day of 2.
  • Correspondence 56 shows that, as shown in the 3rd day of 2nd, as a variance, "the speed is 3 (which is the same as the third from the left of 2nd day), and 9 is [0141] Further, similarly, for example, Correspondence 56, as shown in the 4th day of 2 as, for example, is as the variance of and the speed (which is the same as the 4th from the left of the 2nd day, The 4th from the left on the 3rd day is the same,
  • 3 is a diagram showing an example of the average vector for the latent and the average vector 2 for the latent z2.
  • Corresponding 56 corresponds to the average vector for the latent as Set the dot (2) to 58, the brightness 3) to 63, and the (4) to 59.
  • the correspondence 56 outputs the average vector 2 to the latent 2 as speed (2) 42, brightness 3 39, and (4) 4 as shown in 3, respectively. To do.
  • the correspondence 56 is the variance for the latent latent z2.
  • the method for determining the lamella is not limited to the above-mentioned asm, and other methods may be used.
  • the response 56 reports the reported latency.
  • the response 56 is the response report.
  • step 23 the response 56 is accumulated in the report 58 regarding the information on the issued information and the latent information, and the issue of the response information is completed.
  • step 23 the response 56 outputs P (z) and P (z) for all combinations as response information.
  • the label 58 is, for example, the product of latent and 2 and P (z) of Y ,,,,, and, and (z) of, as shown in 9. To be done. [0151] At this time, P (z)
  • the content is learned by the learning process.
  • Corresponding information will be accumulated in each of the 57 and 58.
  • nte integrates nte information that has different distributions with the latent in between.
  • nte will correspond to nte.
  • step 3 Is extracted and accumulated in the extracted contents 53 ().
  • step 3 the item 52 is
  • the content 52 is a newly added music content S
  • the extracted contents are converted so that they are placed in the latent space, and the converted results are supplied to the distance 6.
  • step 32 for example,
  • step 33 the latent distance 6 is
  • the distance from the interface is calculated based on the response supplied from 59, converted so as to be placed in the room, and accumulated in the board 58, and the calculated distance is calculated. Supply.
  • 0170 As a whole, it is calculated by () using the rate of separation from the environment, for example, the rate of labeling.
  • Calculator is calculated by, for example, ().
  • 0179 5 is a diagram showing an example of the distance from the interface calculated by the latent distance 6.
  • Fig. 58 Shown in Fig. 58 is the accumulated weight (), 2, and the distance from the antenna calculated by the latent distance 6. In the example of 5, we use (2) to calculate S).
  • the latent distance 6 is, as shown in 5, the music content SW and the word that is sloppy and S (2) is 3, the word that is the music content SW and S () is 9, and the music is Issue that the word is SW and the S (4) is ⁇ 9 respectively.
  • the latent distance 6 is, as shown in 5, a word that is a music content SW and S (5) is • 2 5 and a word that is a music content SW and S (6). Each of the following shows that it becomes 53.
  • the latent distance 6 is calculated as the distance from the content shown in 5, and is supplied to the base 62 which is the result of the calculated distance.
  • the label 62 selects the label based on the distance supplied from the latent distance 6 and finishes the labeling.
  • the label 62 determines that the distance S supplied from the latent distance 6 is closer to those S distances if the distance is 5 S, 53). ⁇ 9 2 is selected as the one to be added to the added music content SW.
  • the number of the music to be added to the newly added music content SW is not limited to 2 described above, but may be, for example, The distance from and may be less than or equal to a predetermined value, or (ha) may be selected such that the distance is 0187. It may be displayed directly on the screen, or may be stored as meta data and used, for example, for searching content.
  • the content gives a content more optimally to a content.
  • the target urine is converted so that it is placed in the latent space, and the converted result is supplied to the inter-space 6.
  • Step 4 if Lab 6 is instructed by, then P z) P (z) for all the sums stored in Lab 5 8 Based on this, the result (P (z) is supplied to the latent distance 6 by transforming (pping) so that R is located in the latent space.
  • step 42 the latent distance 6 is
  • the distance from the interface was calculated, and the result of the distance released was calculated.
  • step 42 the latent distance 6 is
  • the method is not limited to the genre separation in (2), but can be, for example, a label condition (()) or a click liar ( ()), Or you can use a separate gear.
  • 01997 is the potential distance when the
  • FIG. 6 is a diagram showing an example of the distance from the content calculated by 6.
  • the JS (2) is ⁇ 3, the JS 3 ⁇ 5 with Ru 2 and the JS (4) with Ru 3 are ⁇ 22, and the JS (5) with Ru 4 is ⁇ 4, We say that J (6) with 5 is 2547.
  • the latent distance 6 is as shown in 7.
  • the latent distance 6 is, as shown on the 2nd day of 7th, by the reason of the chart of 4, the music content SW to which is attached is Calculate that the JS separation is ⁇ 49.
  • the latent distance 6 is
  • step 43 the content 63 selects content based on the distance supplied from the latent distance 6 and terminates content.
  • step 43 the content 63 is closer to those JS distances if the distance provided by the latent distance 6 is 7 distances away, 3US ⁇ 22), S ⁇ 49), Select S ⁇ 5 3 as the content that corresponds to R, and display it on the output 7 screen.
  • the number of contents selected is not limited to the above-mentioned three, and, for example, if the distance from the contents is a predetermined value or less,
  • Data for example, the data in the region
  • a data (de) containing more
  • the knowledge specified in the knowledge box (appears in You may choose to use the closest one as an alternative.
  • the content retrieves the content corresponding to the label.
  • Raventen can be associated with a textual information described later, or Raventen can be described later.
  • 02138 is a check diagram for explaining another example of an active example of content.
  • the 0215 text extracts the text information about the content accumulated in content 5.
  • the context stores the extracted context information in context 2 ().
  • the text information is information other than the content when experiencing content.
  • Context such as the time, season, place, weather, mood, and people you have been with.
  • 0217 56 calculates the information that is stored in the content of 53 and the information that is stored in the label 55. 56 shows the response information
  • Correspondence 56 calculates a report stored in the label 55 and a report stored in the context 2. 56 reports the response information issued.
  • the response 56 calculates the information stored in the content 53 and the content information stored in the text 2. 56 indicates the response information that has been issued.
  • the latent z connects each of the content, the label, or the context.
  • step S5 and step S52 Since each of the processes of step S5 and step S52 is similar to each of the process of step 3 and step S2, the description thereof will be omitted.
  • step S53 the text extracts the text information about the content stored in the content 5, and stores the extracted text information in the content 2 ().
  • the context extracts, for the music content stored in content 5, the content information indicating in which zone the music was listened to, or where the music was listened to. Then, the extracted text information is stored in text 2.
  • the context extracts the context information as shown in the example of 2.
  • 02262 is a diagram showing an example of text information about music contents.
  • the music contents stored in 5 are displayed, and in the f-th, the text information about the contents of, i.e., whether they are heard during the morning, morning, day, or evening, and whether they are at home, outdoors, or commuting. It was shown that it was heard at the place.
  • 5 (6) is 4 in the morning, 2 in the day, 3 in the evening, 2 at home, 2 outdoors, 4 commute, and 6 (7).
  • the response 56 is based on the information accumulated in the node 53, the information accumulated in the label 55, or the information accumulated in the context 2. Then, these reports are calculated and the corresponding reports are
  • the representation between the contents, the label information, or the text information has the same z as in the relation with the contents information described above, and further, using different fractions, the method described above is used. It can be calculated in the same way (for step S 3 of 3). [0233] That is, the correspondence 56 calculates the content of the content, the label, or the text in the same manner as in the case of Step 3 of 3.
  • 02352 is a diagram showing an example of an inter-text expression of text information.
  • the eye is shown, is the context, and the f is the 2 of the context (
  • Correspondence 56 is, as shown in 2, the potential of (2
  • It may be related to the text information, or it may be the sum of the text information from multiple sources.
  • [0246] 22 is a check diagram for explaining another example of the active example.
  • the information is information about only the information by.
  • 0250 56 is the information stored in nte 53
  • the response 56 calculates the report stored in the label 55 and the report stored in the label 52.
  • the response 56 is stored in each of the correspondence reports 58 and 53 (). [0252] Furthermore, the response 56 calculates the content stored in the content 53 and the content stored in the content 52. 56 shows the response information issued.
  • Deviations of 58 and 53 will accumulate all the information.
  • step S6 and step S62 Since each of the processes of step S6 and step S62 is the same as each of the process of step 3 and step S2, the description thereof will be omitted.
  • step S63 the 5 extracts the information about the contents accumulated in the contents 5 and outputs the extracted information.
  • step S63 5 indicates (for example ,, 2, 3, 4, and 5) information for the music item stored in content 5. Information is extracted and those extracted information is stored in 52.
  • [0259] 24 is a diagram showing an example of information about music information.
  • the eye shows, the music contents stored in the contents i5 are shown, and the day shows information about the contents of, i.e., 2, 3 for those contents. , 4, and 5 (for example, in 24, a song that feels rough, a 5th floor rating that gives a 5 to the song that feels) is shown.
  • 5 is 5 (6), as shown in 24, is 4 and the 2 is 2, 3 is 3, 4 is 2, and 5 is 4 respectively.
  • 6 (7) is 2, 2 is 3, 3 is 4, 4 is 3, and 5 is 2, and for 7 (8) is 3, 2 is 3, 3 is 3 , 4 valued 3 and 5 valued 2 respectively.
  • step 64 the response 56 is based on the information accumulated in the node 53, the information accumulated in the label 55, or the information accumulated in 52. , Calculate those reports, and report the corresponding reports.
  • the correspondence 56 calculates the contents, the label, or the information of the report in the same manner as the process of Step 3 of 3.
  • the response 56 is the response (4), lab (5), and (24). Corresponding information is calculated based on this.
  • 2526 is a diagram showing an example of an inter-report expression.
  • the eye is shown, is shown in the report (evaluated content), and in the f is 2 (, latent 2) related to the content is shown.
  • each of the reports, The, The2, The3, The4, and The5, will be supported or supported by the latent z2. 0274
  • Ming for example, as in 24 examples,
  • Correspondence 56 is a context related to music content.
  • 0282 26 is a diagram showing an example of the gender of the context.
  • the correspondence 56 is, as shown in 26, for (2) a feature of 5 for day 3 of the day, a feature of 389 for night (4) of 46.
  • the value of the feature is 389 for the home (5), for the 389 feature, for the outdoors (6), for the 3 feature, and for the (7), and 675. Issue each.
  • the contexts of (text value of 675) and (the value of sex of 5) of the text information of 6 are characteristic (the value of the sex is Big, that is, it has a strong influence on the way the music is played).
  • the context of does not affect the way the music is played, so when the Z is outside, other meta-descriptive information is recommended, or the context of the Therefore, it is possible to ignore other contexts and recommend music content that is only in the context of, which is only in the latent area.
  • the above information can be provided. It can also be said that it is a characteristic report that is related to features, features, high notes, and content. For example, select the relevant report and highlight it. It can also assist the music content solution for those reading chapters such as music content, bi-text, etc.
  • sentence 7 is provided so that label 54 is connected.
  • sentence information which is the information about the sentences accumulated in the sentence 5, for example, sentences written in words such as impression sentences (). 7 supplies the document information to lab 54 at the request of lab 54.
  • Label 54 divides the sentence information accumulated in sentence 7 into words or units that are meaningful to humans, for example, by morphological analysis, and forms words.
  • the label 54 supplies the information such as the morphemes obtained by the morphological analysis to the response 56 as the label information.
  • a morpheme is a technique of natural science using a computer such as a computer, and a sentence written in a natural language is a morpheme (( oee), or roughly speaking, it is the work of dividing into columns of), which have little meaning in the language, and distinguishing parts of speech.
  • a morphological analyzer that divides Japanese into morphemes (for example, (C aSe) developed at the Narabata Institute of Science and Technology graduate School) is used. Wakuru Chiyanka (for example, a C a etc.) is used to make a meaningful group.
  • sentences such as English are deleted by plural forms and tenses, leaving only the stem, and ea za o is extracted.
  • the response 56 reads the accumulated contents and the information and calculates the information.
  • step S3 of step 3 Since it is the same as that of step S7, step S3 of step 3,
  • step 72 the label 54 performs the labeling process to extract the text information stored in the text 7 from the text information.
  • step S8 the label 54 reads the text information stored in the text 7.
  • 03 01 the label 54 is a morpheme to the read text information.
  • 03023 is a diagram for explaining an example of morphological analysis performed by the label 54.
  • the sentence information that is a bright song is accumulated in the sentence 7, the label 54, the bright song is a bright song.
  • the morphological result shown in is obtained by the morpheme with respect to the sentence information.
  • a sentence in which a bright song is ... is shown in Fig.3, and as shown in Fig.3, is found to be general, and is analyzed in general.
  • Is analyzed as an adverb is as an adjective, for is an adjective / auo, and as is, and is analyzed as a verb for.
  • Particles are analyzed as being general.
  • the label 54 is a word that is considered to be obviously important in morphological analysis, that is, in the result of the morphological analysis shown in 3, for example, It is also possible to delete words such as “ga” according to a predefined strike.
  • step 83 the label 54 supplies the morpheme obtained by the morphological analysis to the response 56 as the label information, the labeling is completed, and the processing is 28.
  • step 72 the process of step 73 is executed.
  • the label 54 has the morpheme of the result of the morphological analysis shown in 3 such as 3, from the left side, from the left side, earnestly ,,,, and so on. Then, the labe 54 supplies the morphemes that are only ,,, to the response 5 6 as labe reports.
  • step 73 as in step 3 of step 3, response 56 issues an information report, and that information is sent to information 57 and page 57.
  • Correspondence 56 gives the mean vector and the variance P (z) as reports when the latent z is based on the contents and the reports. Correspondence 56 is then stored as correspondence information, for example, latent, z, variance, and vector in instance 57, for example, latent
  • n can be learned by learning.
  • Attributes can be added to an item by simply describing only the text without paying special attention to the item. Also, with the features Therefore, it is possible to reduce the cost of adding data to the site by using them.
  • 03153 is a block diagram for explaining another example of the functional composition of the information.
  • the features 8'i 82 ', 83' and 84 ' are provided compared to the 27's.
  • 0317 8 is the 57
  • 03188 calculates, using (4), the value indicating the “Z”.
  • Characteristic 8 supplies the generated feature and the corresponding feature to feature 82. Characteristic 8 also supplies to Z83 the divided text information.
  • the 039's 82 selects a feature that is a characteristic from the features corresponding to the feature, based on the value of the feature supplied from the feature 8. 82 Select the selected features.
  • the feature value calculated by 8 is a feature value that exceeds a predetermined value, or if the feature value values are arranged in descending order, It can be used as a feature.
  • 0321s 83 is a feature supplied by Features 82
  • the display control is performed such that the text information divided from the text 8 that is supplied from the feature 8 is displayed in the display 84 by highlighting the feature-matching data.
  • 0322 84 corresponds to 7 of 7 and displays, for example, a sentence based on the sentence according to the control of 83.
  • step S9 Feature 8 was reported in the text
  • the sentence that is a bright song is ...
  • the sentence that is reported is a straight line, that is, a label.
  • the probability distribution lamellas () for P, and P (z z2) for latent, 2 are calculated as in 33 and the results are reported.
  • 0326 33 is a diagram showing an example of the inter-expression of z (labe). 33 shows, for example, an inter-z representation, that is, an example of a value with conditional P (z).
  • the reported information such as the text of the sentence, etc. is shown, and the 2nd (, latent 2) related to the information is shown in the fth.
  • each of the earnest, ru ,,,, ... Is music content-enabled by the latent z.
  • conditional P (z corresponding to either latent or latent 2 is large.
  • the feature shown in 34 is calculated by using (4) based on the correspondence information corresponding to the gap shown in 33.
  • 033434 is a figure which shows the example of the sex of a lab.
  • the characteristic values are 859 for 7 8 and 3), 859 for (4), 8 6 for (4 T), and 699 for (5 T), respectively.
  • step 92 the feature 82 selects the feature from the reported texts.
  • the feature 82 is a feature whose value of feature is greater than 8 and is selected as the feature.
  • the features 82 also selects the ones that are closely related to the content by selecting the ones for which the lamella () of the probability distribution is greater than and. Mari, 34's In the example of the gender, the characteristic value increases in the order of (699), (7 8), (86), and (859). The larger the data (), the larger the characteristics.
  • the feature value is set to be larger than 8 when the feature value is larger than the predetermined value, and the feature value is higher than the predetermined value. You may also select o () as the feature.
  • z 83 highlights the feature-matched parts of the text-reported parts, displays it in display 84, and ends the process. .
  • 0342 For example, in the display 83, among the reported texts such as the music content's bibliography, the one selected by the feature s 82 is highlighted and displayed in the display 84.
  • 0343 35 is a diagram showing an example of a display 84 for displaying chapters such as music information sentences.
  • a sentence with a bright song is ...
  • a feature value of a sentence is larger than that of other letters. It is displayed so that the size becomes larger.
  • the feature value which is a large feature value, is displayed such that the background is different from other characters.
  • the size of the characters of the features is changed or the background is changed, but the present invention is not limited to this.
  • the color of the features may be changed.
  • the point is that the indication of the characteristics should be changed to another one.
  • the stage and method are arbitrary.
  • cluster content for example.
  • the clustering of latently injured content can be performed by any clustering.
  • the content is expressed on the same, it is not limited to clustering by content or cluster by cluster, and cluster content and cluster content at the same time. It is possible to avoid it.
  • 0351 36 is a functional diagram showing the function of learning and learning.
  • the content of 0353 36 calculates the information with the content information accumulated in content 5 by performing the procedure of 3 and the response information is output as content content.
  • the content of 36 provides the operation data to the equipment (that is, the client 2 of 37, which will be described later).
  • FIG. 37 are functional block diagrams showing the functions of the client 2 that manages the operation.
  • Clients 2 are configured to include Content 52, Content 59, Label 6, Potential Distance 6, Label 62, and Content 63.
  • Client 2 is an example of my information processor.
  • the client 2 gives a reward to the newly added content by, for example, applying the treatment of 4 to the content. At this time, the client
  • 2 will obtain the data necessary for labeling processing from 36 contents, and process it.
  • the client 2 manages the content of 6, for example,
  • the client 2 acquires the data necessary for the processing of the content from the 36 content, for example, and processes it.
  • client 2 may, for example, only manage the reason of operation 4 and the reason of operation 6 in the case of operation.
  • the client 2 (37) can perform the same operation as described with reference to (35).
  • the programs that make up the software can be installed in the dedicated software, or by installing various programs. It is installed from the recording medium to, for example, a sound amplifier that can perform various functions.
  • 0369 This is a disc (including a disc) on which the program is recorded and a disc (CO (Co ac sc ead O eo)) (ae sa which is distributed to provide the program to the user separately from the computer. es))), a magneto-optical disk (including (sc) ()), or a medium 2 such as a semiconductor memory. It is composed of the O 2 record 8 of the recorded program, etc.
  • the program that executes the above-mentioned series of processes is transmitted via a wired or wireless body such as a network, an internet or a digital star broadcast via an interface such as a computer or a dem as necessary. You can even install it on your computer.
  • the steps for describing the programs to be stored in the recording medium are not limited to the steps described, but they are not necessarily processed but are executed in parallel or individually. It also includes reason.
  • the term "stem" refers to a device body composed of a plurality of devices.

Abstract

 本発明は、コンテンツに対して最適なキーワードを付与することができる情報処理装置および方法、並びにプログラムに関する。 コンテンツ特徴量抽出部52は、コンテンツに関係するコンテンツ特徴量を抽出し、ラベル情報抽出部54は、コンテンツの属性を示すラベル情報を抽出する。対応情報算出部56は、コンテンツ特徴量とラベル情報とに共通する潜在変数zK、コンテンツ特徴量、ラベル情報のそれぞれの確率分布の性質を表わすパラメータを算出し、コンテンツ特徴量-潜在空間対応情報蓄積部57またはラベル情報-潜在空間対応情報蓄積部58は、それぞれ、算出された潜在変数zKを蓄積することで、コンテンツに対して、最適なキーワードを付与することができるようになる。本発明は、情報処理装置に適用できる。

Description

, 処理装置 、
および方法、並びにプ グラム
術分野
0001 情報処理装置 方法、並びにプ グラムに関し、特に、 ンテ に 対して最適なキ ワ ドを付与することができる にした情報処理装置 方法 、並びにプ グラムに関する。
0002 、音楽 像の ンテ に対してキ ワ ドを付与することに 、それら の ンテ を検索したり 分類したりする 術がある。この キ ワ ドは、一般 的に、メタデ タ されるが、例えば、対象となるC (Co ac sc)に関する ア テイスト名などの 報を提供するC (C a a ase)の に、 ン テ に対してキ ワ ドを付与するためには、人手に 膨大な作業が必要とな て た。この 合、新 ンテ が登場するたびに、手作業に 、それらの ン テ に対してキ ワ ドを登録する作業が発生して た。
0003 また、特に、音楽の ンテン などでは、 の 曲の 徴を数値 する 術も開 発されて 、その数値 らキ ワ ドなどの タデ タを推測する 術もある。 0004 体的には、 析の 法である数量化11類に の ンテ に付与 されたキ ワ ドなどの を連続 間に配置し、その 間と特徴 の 間で 正 行 ことに 両者の 係を得て、その 係を用 て新規 ンテンツの 量 らキ ワ ドを推測する情報処理装置もある( えば、特許 )o
0005 また、 ンテ のクラスタ ング キ ワ ドをクラスタ ングする手法( えば、特 許 2)、 ンテ キ ワ ドとを同時にクラスタ ングする手法( えば、
)、または ザの 文脈( ンテクスト)に合わ て ンテ を推薦 する手法( えば、特許 3)も提案されて る。
1 96 65
2 2 2 4 573 3 2 75676
1 、松本裕治 、 類のための クラスタ ング 報処 理学会 o 44 o 2 2 3 2 発行
明の
明が解 しよ とする
0006 し しながら、 ンテン 増えるたびに、その ンテン キ ワ ドを付与 する人手に 膨大な作業が発生し、永続的に ストが ると 題があ た。 0007 また、従来の ンテン キ ワ ドを付与する手法であると、 ンテン 対して、 最適なキ ワ ドが付与されて るとは言えな た。
0008 えば、 96 65 報に開示されて る情報処理装置は、数量 1 類を用 てキ ワ ドを推測して るが、数量 111類は、質的なデ タに対しての み 用が可能であるため、例えば、ある楽曲に対する ビ 文にお て、複数回 出現して る単語は重要であると考えられるが、その 重み付けをすることはでき な 。
0009 また、例えば、 2 2 4 573 上記 に開示されて る 手法は、 ンテン キ ワ ドをクラスタ ングする手法であるが、 ンテン 徴 を示す 、それに付与されたキ ワ ドとの 方を用 てクラスタ ング デ をすることはできな 。
0010 さらに、例えば、 2 75676 報に開示されて る手法は、 ザの 文脈に合わ て ンテン 推薦して るが、高評価を得た ンテン タ デ タを蓄積して作成した ザプ アイ との 離が近 ンテン 推薦する 手法を用 ており、 の 報などの 布を考慮して な ために、最適な ンテン 、 推薦して るとは言えな た。
0011 はこの 状況に みてなされたものであり、 ンテン 対して最適なキ ワ ドを付与することができる にするものである。
題を解 するための
0012 明の の 、 ンテン 関係する特徴 前記 ンテン 性を示 す 性情報とに共通する の 数、前記 、 性情報のそ れぞれの 布の 質を表わす の ラメ タを算出する の 段と、 出された前記 の ラメ タを蓄積する 段とを備える情報処理装置である 0013 を抽出する の 段と、前記 性情報を抽出する 2の
段とをさらに設け、前記 の 段には、抽出された前記 、抽出された 前記 性情報と ら、前記 の ラメ タを算出さ ることができる。
00 4 2の 段には、自然 語によ て記述された文章を、単語または前記 語のまとまりである ズに分割さ ることができる。
0015 出された前記 の ラメ タに基 て、前記 ズの との を示す を算出する 2の 段と、 出された前記 に基 て、 前記 ズの 示を制御する表示 御手段とをさらに設けることができる。
0016 の 段には、前記 、前記 性情報、または による前記 ンテンツの 用に関する情報を示す利用情報のそれぞれに共通する 2の 数、前記 、および 性情報のそれぞれの 布の 質を表わす 2 の ラメ タを算出し、前記 、 出された前記 2の ラメ タを蓄積さ ることができる。
0017 用情報を抽出する 段をさらに設け、前記 の 段には、前記 、前記 性情報、または 出された前記 用情報 ら、前記 2の ラメ タ を算出さ ることができる。
0018 の 段には、前記 、前記 性情報、または前記 ンテ に 対する に関する情報を示す 報のそれぞれに共通する 3の 数、前記 、および 性情報のそれぞれの 布の 質を表わす 3の ラメ タを算出さ 、前記 段には、 出された前記 3の ラメ タを 蓄積さ ることができる。
0019 報を抽出する 段をさらに設け、前記 の 段には、前記 、前記 性情報、または 出された前記 報 ら、前記 3の ラメ タ を算出さ ることができる。
0020 明の の 、 ンテ に関係する特徴 前記 ンテ の 性を示 性情報とに共通する潜在 数、前記 、および 性情報のそれぞれ の 布の 質を表わす ラメ タを算出する ステップ 、 出された前記 ラメ タを蓄積する ステップとを含む情報処理方法である。
0021 明の の 、 ンテ に関係する特徴 前記 ンテ の 性を示 す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タを算出する ステップ 、 出された前記 ラ メ タを蓄積する ステップ を ンピ に実行さ るプ グラムである。
0022 明の の 面にお ては、 ンテンツに関係する特徴 ンテ の 性 を示す 性情報とに共通する の 数、特徴 、および 性情報のそれぞれ の 布の 質を表わす の ラメ タが 出され、 出された の ラメ タが 積される。
0023 明の 2の 、 ンテ に関係する特徴 を抽出する 段と、前記 前記 ンテ の 性を示す 性情報に共通する潜在 数、前記 、 および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、 抽出された前記 が潜在 間に配置されるよ に変換する変換手段と、前記 間中に変換された前記 、前記 数により前記 に対して 在的に結び付 て る前記 性情報との 離を算出する 段と、 出された前 記 離に基 て、前記 ンテ に対応する 性を選択する選択 段とを備える 情報処理装置である。
0024 段には、前記 ンテ に対応する 性として、 出された前記 離が 所定の 以下となる 性 、または前記 離の さが上位となる所定の 数の 性を選択するよ にすることができる。
0025 明の 2の 、 ンテ に関係する特徴 を抽出する ステップ 、 前記 前記 ンテ の 性を示す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された前記 が潜在 間に配置されるよ に変換する変換ステッ プ 、前記 間中に変換された前記 、前記 数により前記 に対して 在的に結び付 て る前記 性情報との 離を算出する ステップ 、 出された前記 離に基 て、前記 ンテ に対応する 性を選択する選択 ステップとを含む情報処理方法である。
0026 明の 2の 、 ンテ に関係する特徴 を抽出する ステップ 、 前記 前記 ンテ の 性を示す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された前記 が潜在 間に配置されるよ に変換する変換ステッ プ 、前記 間中に変換された前記 、前記 数により前記 に対して 在的に結び付 て る前記 性情報との 離を算出する ステップ 、 出された前記 離に基 て、前記 ンテ に対応する 性を選択する選択 ステップ を ンピ に実行さ るプ グラムである。
0027 明の 2の 面にお ては、 ンテンツに関係する特徴 出され、特徴 ンテ の 性を示す 性情報に共通する潜在 数、特徴 、および 性情 報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された特徴 が潜在 間に配置されるよ に変換され、潜在 間中に変換された特徴 、潜在 数により特徴 に対して 在的に結び付 て る 性情報との 離が 出され、 出された 離に基 て、 ンテ に対応する 性が選択される。
0028 明の 3の 、 ンテ に関係する特徴 前記 ンテ の 性を示 す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、前記 性情報が潜在 間に配置 されるよ に変換する変換手段と、前記 間中に変換された前記 性情報と、 前記 数により前記 性情報に対して 在的に結び付 て る前記 と の 離を算出する 段と、 出された前記 離に基 て、前記 性情報に 対応する ンテ を選択する選択 段とを備える情報処理装置である。
0029 段には、前記 性情報に対応する ンテ として、 出された前記 離が所定の 以下となる ンテ 、または前記 離の さが上位となる所定の 数の ンテ を選択さ ることができる。
0030 明の 3の 、 ンテ に関係する特徴 前記 ンテ の 性を示 す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、前記 性情報が潜在 間に配置 されるよ に変換する変換ステップ 、前記 間中に変換された前記 性情報と 、前記 数により前記 性情報に対して 在的に結び付 て る前記 と の 離を算出する ステップ 、 出された前記 離に基 て、前記 性情報 に対応する ンテンツを選択する選択ステップとを含む情報処理方法である。
0031 明の 3の 、 ンテ に関係する特徴 前記 ンテ の 性を示 す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、前記 性情報が潜在 間に配置 されるよ に変換する変換ステップ 、前記 間中に変換された前記 性情報と 、前記 数により前記 性情報に対して 在的に結び付 て る前記 と の 離を算出する ステップ 、 出された前記 離に基 て、前記 性情報 に対応する ンテンツを選択する選択ステップ を ンピ に実行さ るプ グラ ムである。
0032 明の 3の 面にお ては、 ンテンツに関係する特徴 ンテ の 性 を示す 性情報に共通する潜在 数、特徴 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、 性情報が潜在 間に配置されるよ に変換され、潜在 間中に変換された 性情報と、潜在 数により 性情報に対し て 在的に結び付 て る特徴 との 離が 出され、 出された 離に基 て 、 性情報に対応する ンテ が選択される。
明の
0033 上のよ に、 明の の 面によれば、 ンテ に対して最適なキ ワ ド を付与することができる。
0034 また、 明の 2の 面によれば、 ンテンツに対して最適なキ ワ ドを付与 することができる。
0035 明の 3の 面によれば、より確実に、キ ワ ドに対応する ンテ を検索 することができる。 0036 ンテン 置の ドウ アの 成の例を説明する ック図である。 2 ンテン 置の 能的 を示す機能 ック図である。
3 2の ンテン 置による、学習の 理に て説明する チヤ ト である。
4 ンテン 関する ンテン 量の例を示す図である。
5 ンテン 関するうベ 報の例を示す図である。
6 報の 出の 理の 細に て説明する チヤ トである。
7 ンテン による 合正規 (G )と、ラベ 報による s との 数を共通 したときのグラ イカ デ の例を示す図である。
8 ンテン 間表現の例を示す図である。
9ラベ の 間表現の例を示す図である。
10 の 前 率の例を示す図である。
11 に対する分散 の例を示す図である。
12 z2に対する分散 の例を示す図である。
13 により算出される、平均ベクト 平均ベクト 2の例を 示す図である。
14 ンテン 置による、ある ンテンツに対して、ラベ を付与する 理に て説明する チヤ トである。
15 間距離 により算出される、 ンテン との 離の例を示 す図である。
16 ンテン 置による、 ンテン の 理に て説明する チ ヤ トである。
17 間距離 により算出される、 ンテン との 離の例を示 す図である。
18 ンテン 置の 能的 例の他の例に て説明する ック図で ある。
19 8の ンテン 置による、学習の 理に て説明する チヤ トである。
20 ンテン 関する ンテクスト 報の例を示す図である。 21 ンテクスト 報の 間表現の例を示す図である。
22 ンテン 置の 能的 例の他の例に て説明する ック図で ある。
23 22の ンテン 置による、学習の 理に て説明する チヤ トである。
24 ンテン 関する 報の例を示す図である。
25 報の 間表現の例を示す図である。
26 ンテクストの 性の例を示す図である。
27 ンテン 置の 能的 成の他の例に て説明する ック図であ る。
28 27の ンテン 置による、学習の 理に て説明する チヤ トである。
29ラベ 出の 理の 細に て説明する チヤ トである。 30 態素 析の例に て説明する図である。
31 ンテン 置の 能的 成の他の例に て説明する ック図であ る。
32 3 の ンテン 置による、 ズ 示の 理に て説明する チヤ トである。
33ラベ の 間表現の例を示す図である。
34 ズの 性の例を示す図である。
35 ンテン ビ 文などの 章を表示する表示部の例を示す図であ る。
36 の 理を行 、 ンテン 置の 能的 を示す機能 ック図である。
37 の 理を行 、クライアント 置の 能的 を示す機能 ック図である。
号の
ンテン C 2 Ro 3 R 6 7 8 9 信部 2 ドライ 2 メディ ア 5 ンテンツ 52 ンテンツ 53 ンテン
54 ラベ 55 ラベ 56
57 ンテン 58 ラベ
59 ンテン 6 ラベ
6 間距離 62 ラベ
63 ンテン ンテクスト 2 ンテクスト
3 ンテクスト 5
52 53
7 8 82 ズ 83 フ ズ 84 2 クライアント
明を実施するための 良の
0038 下、図面を参照しながら 明の 施の 態に て説明する。
0039 は、 ンテン の ドウ アの 成の例を説明する ック図であ る。
0040 の ンテン にお て、CP (Ce a Pocess ) は
RO ( ead O e o ) 2に記憶されて るプ グラム、または記録 8 らR ( a do ccess e o ) 3に されたプ グラムに従 て各 種の 理を実行する。R 3にはまた、 P が各種の 理を実行する上にお て必要なデ タなども される。
0041 CP O 2、および 3は、 ス 4を介して相互に接続されて る。こ の 4にはまた、入出カインタ 5も 続されて る。
0042 カインタ 5には、キ ボ ド、 ウスなどよりなる入力 6、スピ カ、 C ( d C s a s a )などのディスプ イなどよりなる出力 7、 ドディス などより 成される記録 8、並びにインタ ネットなどのネットワ クを 介しての他の機器との 理を制御する通信部 9が接続されて る。
0043 カインタ 5にはまた、必要に応じてドライ 2 が接続され、磁気デ ィスク、 ディスク、光磁気ディスク、または半導体メ りなどの メディア2 が 着され、それら ら読み出された ンピ プ グラムが、必要に応じて 記録 8にインスト される。
0044 なお、 ンテン の ドウ アの 、 の例に限定されず、後述 する 2の 能的 成を少な とも有して ればよ 。
0045 2は、 ンテン の 能的 を示す機能 ック図である。
0046 ンテン は、例えば、記録して る ンテン ら特徴 を抽出し、抽 出した特徴 ( 述する ンテン キ ワ ド( 述するうベ とを対 応 けするなどの 定の 理を行 器であり、 明の 報処理装置の 例であ る。
0047 ンテン は、 ンテン 5 、 ンテン 52、 ン テン 53、ラベ 54、ラベ 55、対応
56、 ンテン 57、ラベ
58、 ンテン 59、ラベ
6 、潜在 間距離 6 、ラベ 62、および ンテン
63を含むよ にして構成される。
0048 ンテン 52は、 ンテン 5 に蓄積( )されて る ン テン ンテン を抽出する。 ンテン 52は、抽出した ンテン ンテン 53に蓄積( )さ る。
0049 ここで、 ンテン とは、 般的に ンテン されて る、例えば、テ ビジョン 組、映画、写真、楽曲( 画像、静止 、若し は音声、またはそれらの み合わ など)の 、各種の 報、文章、書籍、デ タベ スなども含んで るものとする。 なお、以下、本実施 にお ては、音楽である ンテン ( ンテン )を例にし て説明する。
0050 また、 ンテン とは、ある ンテンツの 徴を数値 したものである。 ンテ ン 、例えば、音楽 ンテン である場合、その曲のスピ ド(テンポ)、明る さ( えば、メジャ ドの曲は明る 曲となり、 イナ ドの曲は暗 曲となる 、または (音のな 状態 比較して音がある きに加わる などを数値化し たものとなる。 0051 ラベ 54は、 ンテ 5 に蓄積( )されて る ンテンツ に関するうベ 報を抽出する。ラベ 54は、抽出したうベ 報をう ベ 55に蓄積( )さ る。
0052 ここで、ラベ 報とは、 ンテ の 性を示す 報である。ラベ 、例え ば、 ビ 歌詞、 ンテ のタイト 、または動画像のテ ップなどに含まれ る単語や記号、タグなどの 能で、 、 ンテ に対して、重みなどを付ける ことができる、 ンテンツに固有な 性を示す 報となる。
0053 56は、 ンテ 53に蓄積されて る ンテ
、ラベ 55に蓄積されて るうベ 報との 報を算出する 。 56は、 出した対応 報を、 ンテン
57および 58のそれぞれに蓄積 さ る。
0054 ここで、詳細は後述するが、対応 報とは、 ンテ とを対応 けるため の 報である。 、例えば、後述する潜在 z により、 ンテンツ とを結び付ける。
0055 ンテ 59は、 ンテ
57に蓄積されて る対応 報を基に、抽出された ンテ が潜在 間中に配置されるよ に変換する。 ンテ 59は、変 換された結果を 間距離 6 に供給する。
0056 間距離 6 は、 ンテ 59 ら供給され た、 ンテ 間中に配置されるよ に変換した および ベ
58に蓄積されて る対応 報を基に、 ンテン との 離を算出する。 間距離 6 は、 出した 離の 果を うベ 62に供給する。
0057 ラベ 62は、潜在 間距離 6 ら供給された 離の 果を基に、 ラベ を選択する。
0058 ラベ 6 は、ラベ 58 れて る対応 報を基に、対象となるう が潜在 間中に配置されるよ に変換 する。ラベ 6 は、変換された結果を 間距離 6 に供給する。
0059 間距離 6 は、ラベ 6 ら供給された、ラ ベ 報を 間中に配置されるよ に変換した および ンテ
57に蓄積されて る対応 報を基に、 ンテ との 離を算出する。 間距離 6 は、 出した 離の 果を ンテ ン 63に供給する。
0060 ンテ 63は、潜在 間距離 6 ら供給された 離の 果を基 に、 ンテ を選択する。
0061 なお、上述した例にお ては、 ンテ 57 ベ 58とを にするとして説明したが、それら を にまとめることも可能である。そのとき、 ンテ
57および ベ 58の ずれ 一方が、両 方の 報を蓄積することになる。
0062 ころで、 ンテ が 理としては、大別すると、 に、 ンテンツ とうベ 報との けをするための 習を〒 ( 下、学習 とも する)と、 2に、学習 により、対応 けられた ンテ とうベ 報との 係を用 て、例えば、他の ンテンツに対してう を付与したり、 ン テ を検索するなどをして、実際の 用を〒 ( 下、運用 とも する )がある。 明細書にお ては、まず、 3 3を参照して、学習 に て説明し、その 、図 4 6を参照して、運用 に て説明する。 0063 まず、 3の チヤ トを参照して、 2の ンテ による、学習の 理に て説明する。
0064 ステップ にお て、 ンテ 52は、 ンテ ンテ
を抽出し、抽出した ンテン ンテ 53に蓄積( さ る。 えば、ステップ にお て、 ンテ 52は、 ンテン 5 に蓄積されて る音楽 ンテ ら、その曲の、スピ ド、明るさ、また は 圧などの ンテン を抽出し、抽出したそれらの ンテン ン テン 53に蓄積さ る。
0065 体的には、 ンテン 5 に蓄積されて る音楽 ンテン として、例えば 、 のそれぞれが 積されて る場合、 ンテン 52は、 4の例に示すよ な ンテン を抽出する。
0066 4は、音楽 ンテン 関する ンテン 量の例を示す図である。
0067 4で示される例にお て、 目を示し、 には、 ンテンツ
5 に蓄積されて る音楽 ンテン 示され、 f 目には、 ン テン 対する ンテンツ に関する名称、すなわち、スピ ド、明るさ、および が示されて る。
0068 また、 日の項目にお て、左 ら2 目のスピ ドである ンテン 、 抽出された ンテ 、 。
ン を数値 した値を示し、例えば、より に近 ほど 曲(テンポの 曲)となり、それに対して、より に近 ほどスピ ド の 曲(テンポの 曲)となることを意味して る。
0069 様に、左 ら3 目の るさである ンテン 、例えば、より に近 ほ ど暗 感じの ( イナ ドの )となり、それに対して、より に近 ほど る 感じの (メジヤ ドの )となることを意味して る。また、左 ら4 目の であ 、
る ンテン 、例えば、より に近 ほど が低 なり、それに 対して、より に近 ほど が高 なることを意味して る。
0070 すなわち、例えば、 ンテン 52は、 4に示すよ に、 (2 ) ら、7 であるスピ ド、52である明るさ、および58である 、 2(3 ) ら、5 3であるスピ ド、65である明るさ、および67である 、 3(4 ) ら、47であ るスピ ド、75である明るさ、および5 である 、並びに 4(5 ) ら、59であ るスピ ド、55である明るさ、および48である のそれぞれを、 ンテン と して 出する。
0071 また、同様に、例えば、 ンテン 52は、 5(6 ) ら、57である スピ ド、52である明るさ、および59である 、 6(7 ら、39であるスピ ド、39である明るさ、および3 である 、並びに 7(8 ) ら、45であるスピ 、55である明るさ、および4 である のそれぞれを、 ンテ として 出する。
0072 さらに、同様に、例えば、 ンテ 52は、 8(9 ) ら、34であ 。 るスピ ド、34である明るさ、および34である 、 9( ) ら、39である 、27である明るさ、および45である 、並びに ( f ) ら、36である スピ ド、45である明るさ、および46である のそれぞれを、 ンテ とし て 出する。
0073 そして、例えば、 ンテ 52は、 ら抽出した ンテ ン ( 4)を、それぞれ、 ンテ 53に蓄積さ る。
0074 言すれば、 ンテ 52は、 ンテ 5 に蓄積されて るうベ 報の 与された の ンテン ンテン を抽出するこ とにより、 の ン に対して、 クト を ンテ 5 3に蓄積さ て るとも言える。
0075 なお、上述した例にお ては、音楽 ンテ ら抽出する ンテ として 、 スピ ド、 るさ 、および を例にして説明したが、 はそれに限ら ず、例えば、対象となる音楽 ンテ の、 ド、 ド 、または の など、音楽 ンテ に関係する特徴 であればよ 。
0076 3の チヤ トに戻り、ステップ 2にお て、ラベ 54は、ラベ 報を抽出し、抽出したうベ 報をうベ 55に蓄積( )さ る。 えば、ステップS 2にお て、ラベ 54は、 ンテ 5 に蓄 積されて る音楽 ンテ の ビ 文 ら、それらの ビ 文に含まれて る単 語の 度などのうベ 報を抽出し、抽出したうベ 報をうベ 55に 蓄積さ る。
0077 体的には、例えば、 ンテ 5 に蓄積されて る音楽 ンテ として 、 のそれぞれが 積されて る場合、ラベ 54は、
のそれぞれの ビ 文に対して、形態素 析による単語 を行 て、その 語をカウントすることにより、 5に示すよ ベ 報を抽出する。
0078 5は、音楽 ンテ に関するうベ 報の例を示す図である。 0079 5で示される例にお て、 目を示し、 には、 ンテン 5 に蓄積されて る音楽 ンテ の 示され、 f 目には、 ン テ に関するうベ 報、すなわち、音楽 ンテ の ビ 文に含まれて 語として、 、 る 、 、 、および が示されて 0080 また、 f 日の項目にお て、左 ら2 目の げであるうベ 、ある 音楽 ンテン の ビ 文の中に、 げである単語が何回現れた の値を示 し、同様に、左 ら3 目の る であるうベ 、 ビ 文に、 る で ある単語が何回現れた の値を示して る。また、同様に、左 ら4 目の 、 左 ら5 目の 、および左 ら6 目の であるうベ 報にお ても、 ビ 文に、それらの 語が何回現れた の値を示して る。
0081 すなわち、例えば、ラベ 54は、 5に示すよ に、 (2 )の ビ 文 ら、 軽 である単語がそれぞれ2 ず 、 2(3 )の ビ 文 ら、 る 、 、 である単語がそれぞれ ず 、 3(4 )の ビ 文 ら、 る と である単語がそれぞれ2 ず 、 4(5f )の ビ 文 ら、 軽 である単語がそれぞれ ず れたことをそれぞれ 出する。
0082 また、同様に、例えば、ラベ 54は、 5(6f )の ビ 文 ら、 軽 である単語がそれぞれ ず 、 6(7f )の ビ 文 ら 、 重 である単語がそれぞれ ず 、 7(8f )の ビ 文 ら、 げである単語が 現れたことをそれぞれ 出する。
0083 さらに、同様に、例えば、ラベ 54は、 8(9 )の ビ 文 ら、 げである単語が 、 である単語が2 現れ、 9( f )の ビ 文 ら、 げである単語が 現れ、 ( f )の ビ 文 ら、 たげである単語が2 現れたことをそれぞれ 出する。
0084 ラベ 54は、 ら抽出したうベ ( 5)を、それぞ れ、ラベ 55に蓄積さ る。
0085 なお、上述した例にお ては、ラベ 報として、 、 る 、 、 、および を例にして説明したが、 はそれに限らず、例えば、 は 、 、またはス など、音楽 ンテ の ビ 文に含まれて る単 語であればよ 。
0086 3の チヤ トに戻り、ステップ 3にお て、対応 56は、 ンテ ン とうベ 報との 報の 出の 理を行 。 56は、 ンテン とうベ 報との 報の 出の 理により得られた結果を、 ンテ 57および ベ
58のそれぞれに蓄積さ て、学習の 終了する。
0087 ここで、ステップ 3における、対応 56による、対応 報の 出の 理 の 細に て、 6の チヤ トを参照して説明する。
0088 ステップ 2 にお て、対応 56は、 ンテン 53に蓄積 されて る ンテ 、ラベ 55に蓄積されて るうベ 報と の 報を算出する。
0089 ここで、 ンテ とうベ 報とを対応さ る対応 報の 細に て説 明する。 ンテ とうベ 報との 報であるが、 ンテ の 布とうベ 報の 布とは、一般的には異なる分布となるので、それらの 布を結 合さ る必要がある。特に、連続 離散 となる場合、同一の 間で には無理 があるので、異なる分布を持 2 の 間をどのよ にして結合する が問題となる。 えば、 ンテン が連続 となる場合、その 布を デ するためには、 主成分分析や 子分析、混合正規 (G (Ga ssa e ode))な どの 法が用 られてきた。
0090 合正規 (G )は、観測 ( 実施 では ンテ により 現され 、一般的に、その 在的な分布 ラメ タを に基 て推定する。 に基 ラメ タの 定方法には、例えば、 ( ec a o a za o )ア ズムが代表的であるが、他に イズ 定の え方を用 た ベイズ法などもあ る。
0091 方、例えば、音楽 ンテン ビ 文に含まれる単語の 度などのうベ 報の デ には、例えば、P S (Pobab s c a e Se a c a s s)がある。P S は、潜在 数の 件付き 率として、文書と 語との を表現し 、やはり に基 てこれらの 件付き 率を推定する。
0092 これらのア ズムに共通するのは、 ずれも 数を用 ることにより、分布 の ラメ タが決定される点である。したが て、 ンテ の 布を表現する ための 数と、ラベ 報の 布を表現するための 数とを共通 するこ とにより、それぞれの 布の 徴を反映した たちの 在的な 間を得ることが できる。
0093 よ て、本実施 にお ては、 ンテ の 関する 合正規 (G
)と、ラベ 報の 関するP S との、両者の 数を共通 した場合 の ア ズムによる ラメ タの 定を一例にして説明する。
0094 7は、 ンテ による 合正規 (G )と、ラベ 報によるP S との 数を共通 したときのグラ イカ デ の例を示す図である。 0095 7で示される例にお て、z ( z z2 z3 z ( 数の )、 一般的に、 により 潜在 ( 下、潜在 称する)を示し、 は ンテ ( 下、 ンテン s とも する)を示し、 は ベ ( 下、ラベ とも する)を示す。また、 (s z )は、 ンテンツの 現を示す 件付 率を表し、 ( z )は、ラベ の 現を示す 件付 率を表し、それらの (s z )と ( z )とでは、 (z )により決定される潜在 z が共通 されて ることになる。 0096 すなわち、 ンテン s とは、潜在 z により けられて ること になる。
0097 ここで、例えば、潜在 z らう の 、条件付 P( z )により 決定し、一方、 ンテ の 、潜在 z に対応する平均ベクト 分散 ( えば、 数の 、す ての 数との み合わ に て の 散を示す行列)により決定するとした場合、 ンテン s との
、 ( )により 現される。
0098 ( ) ZP( ) (s ) ( k) P( ) ( n k ・ ・ ・ ( 0099 ここで、 ( )にお ては、 (z ) であり、 (s z )は、 (2)により 現 される。
0100 2
p(s ) ( ; )
(2 ) 2 2 ex n n (2) 0101 なお、 (2)にお ては、f は 目の ンテンツの ンテ を示し
は潜在 z に対応する平均ベクト ( 下、平均ベクト とも する)を示し、 S は潜在 z に対応する分散 ( 下、分散 とも す る)を示し は ンテ の 元数を示す。
0102 この 合、 ア ズムのQ 、 (3)により 現される。
0103 3 (d ) G Sn p(Z S ; ) Og S ;㈲ k
) 0104 なお、c( S )は ンテン s におけるう の または重みを示し ㈲は 目の り返しにおける ラメ タを示す。
0105 したが て、 (3)より、 s e ( ec a o S e )は、 (4)により 現され る。
0106 4
P
Figure imgf000020_0001
4 0107 S e ( a za o S e )は、 (5) (6) (7) (8)により 現される。
0108 5 G( S )P(Z S ; )
1) nn
k (5
C( Sn)P(Z S ;8㈹) 0109 6 S ) ( ( )
Z f F F
k , Sn; )( n )( k) ( )
G S )P(Z S ; )
n
(6) 0110 7 ( ( )
S )P(Z S ; )
( ) n
k ・ 7
C( S ) 0111 8 G( S )P(Z S ; )
( ( ) n
Z ・ (8
C( S )P(Z S 6㈲
k ) 0112 すなわち、対応 報である、 ( ベクト )、S ( )、 P( z )は、それぞれ、 (5)、 (6)、 (7)、 (8)により算出される。 0113 えば、ステップ 2 にお て、対応 56は、 ( ) (8)を用 る ことにより、音楽 ンテ の ( )のそれぞれに対する、 ンテン
53に蓄積されて る、スピ ド、明るさ、および を示す ンテン ( 4)と、ラベ 55に蓄積されて る、 ゆ た る
、および を示すうベ ( 5)を基に、潜在 z が2 ( z z2)( 数が2 )であるときの 報として、 S ( z )をそれぞれ 出する。
0114 ここで、 8 3を参照して、対応 56により算出される対応 報に て、より具体的に説明する。まず、 8 を参照して、 ンテンツ との 上の配置の例に て説明する。
0115 8は、 ンテン 間表現の例を示す図である。 8は、曲の潜 間表 現、すなわち、条件付 P(z S )による値の例を示して る。
0116 8で示される例にお て、 目を示し、 には、 ンテンツ
5 に蓄積されて る音楽 ンテン 示され、 f 目には、 ン テン 関する2 の ( 、潜在 z2)が示されて る。
0117 えば、対応 56は、 8に示すよ に、潜在 の として、 (2
)を ・ 9、 2(3 )を ・ 7、 3(4 )を ・ 6、 4(Sf )を ・ 65、 ( 6 )を ・ 6、 6(7f )を ・ 2、 7(8f )を ・4、 8(9 )を ・ 、 ( )を ・ 3、および ( f )を ・4として、それぞれ 出する 0118 すなわち、 ( ンテン )のそれぞれは、潜在 により、ラベ 対応 けられることになる。
0119 また、同様に、例えば、対応 56は、 8に示すよ に、潜在 2の として、 (2 )を ・ 、 2(3 )を ・ 3、 3(4 )を ・4、 4(Sf ) を ・ 35、 5(6f )を ・4、 6(7f )を ・ 8、 7(8f )を ・ 6、 8(9 )を ・ 8、 9( f )を ・ 7、および ( f )を ・ 6として、それぞれ 出 する。
0120 すなわち、 ( ンテン )のそれぞれは、潜在 z2により、ラベ 対応 けられることになる。
0121 次に、 9は、ラベ ( )の 間表現の例を示す図である。 9は、音楽 ンテン ビ 文に含まれて る単語の 間表現、すなわち、条件付 (z )による値の例を示して る。
0122 9で示される例にお て、 目を示し、 には、 ンテンツ
5 に蓄積されて る音楽 ンテン ビ 文に含まれて るう が示さ 、 f 目には、 のう に関する2 の ( 、潜在 2 が示されて る。
0123 えば、対応 56は、 9に示すよ に、潜在 の として、 ゆ た (2 )を ・ 、 る 3f )を ・ 7、 (4 )を ・ 7、 (5 )を ・ 2、および (6 )を ・ 9として、それぞれ 出する。 0124 すなわち、 ゆ た 、 る 、 、 、および であるう の それぞれが、潜在 により、 ンテン ( ンテン ) 対応 けられることに なる。
0125 また、同様に、対応 56は、 9に示すよ に、潜在 2の として、 ゆ た (2 )を ・ 9、 る 3f )を ・ 3、 (4 )を ・ 3、
(5 )を ・ 8、および (6 )を ・ として、それぞれ 出する。
0 26 すなわち、 ゆ た 、 る 、 、 、および であるう の それぞれが、潜在 z2により、 ンテン ( ンテン ) 対応 けられることに なる。
0127 次に、 は、潜在 の 前 率の例を示す図である。 は、事前
(z ) による値の例を示して る。
0128 の2 日で示されるよ に、事前 P(z ) は、2 の の 、潜在 のとき、P(z )が ・48となり、潜在 2のとき、P(z )が ・ 52と なる。
0129 このよ に、対応 56は、潜在 を 潜在 2との2 とした場合、 ( ) (8)を用 て、 ンテン ( )とうベ ゆ た 、 る 、 、 、および を 間中に配置 さ て る。
0130 また、上述したよ に、対応 56は、対応 報として、例えば、平均ベクト および を算出する。 下、図 3を参照して、平 均ベクト および の 体的な例に て説明する。
0131 まず、 および 2を参照して、対応 56により算出される、潜在 z に対する分散 に て説明する。 0132 、潜在 に対する分散 の例を示す図である。
0133 示される例にお て、 目を示し、 には、 ンテンツ
5 に蓄積されて る音楽 ンテン ンテン (の )が示され、 同様に、 f 目には、 ンテン (の )が示されて る。
0134 えば、対応 56は、 2 日に示すよ に、分散
の として、 スピ ドと スピ ドとを8 、 スピ ド を 3 、および スピ とを5として、それぞれ 出する。
0135 また、同様に、例えば、対応 56は、 3 日に示すよ に、分散 の として、" スピ ド 3 (2 日の左 ら3 目と同一 となる)、 を 、 として、それぞれ 出する。
0136 さらに、同様に、例えば、対応 56は、 4 日に示すよ に、分散 の として、 と スピ ドとを5(2 日の左 ら4 目と同一と なる)、 を (3 日の左 ら4 目と同一となる)、
とを5 として、それぞれ 出する。
0137 また、 2は、潜在 z2に対する分散 の例を示す図である。 0138 2で示される例にお て、 日の 、 同様であるので、そ の 省略する。
0139 えば、対応 56は、 2の2 日に示すよ に、分散
の として、 スピ ドと スピ ドとを3 、 スピ ド とを3 、 スピ
として、それぞれ 出する。
0140 また、同様に、例えば、対応 56は、 2の3 日に示すよ に、分散 の として、" スピ ドとを3 (2 日の左 ら3 目と同一と なる)、 とを9 、 とを として、それぞれ 出する。 0141 さらに、同様に、例えば、対応 56は、 2の4 日に示すよ に、分散 の として、 と スピ ド (2 日の左 ら4 目と同一 となる 、 を (3 日の左 ら4 目 同一 なる 、
とを5 として、それぞれ 出する。 0142 次に、 3を参照して、対応 56により算出される、潜在 z に対す る平均ベクト に て説明する。すなわち、 3は、潜在 に対する平 均ベクト と、潜在 z2に対する平均ベクト 2との例を示して る図である 0143 えば、対応 56は、 3に示すよ に、潜在 に対する平均ベク ト の として、スピ ド(2 )を58、明るさ 3 )を63、 (4 )を59 として、それぞれ 出する。
0144 また、同様に、例えば、対応 56は、 3に示すよ に、潜在 2に 対する平均ベクト 2の として、スピ ド(2 )を42、明るさ 3 39、 (4 )を4 として、それぞれ 出する。
0145 このよ に、対応 56は、潜在 潜在 z2に対する、分散
、分散 、平均ベクト 、および ベクト 2のそれ ぞれを算出する。
0146 なお、上述した例にお て、対応 56による対応 出の 、混 合正規 (G )とP S との み合わ を一例として説明したが、 ンテ
の 正規 布などに限らず、例えば、S (S。 " c 。" o ode)や、他の メト ックな分布に対して適用 能となる。また、 ラメ タの 定方法にお ても、上述した ア ズムに限らず、他の手法により にし てもよ 。
0147 6の チヤ トに戻り、ステップ 22にお て、対応 56は、 出さ れた ンテ 潜在 間との 報を ンテ
57に蓄積さ る。
0148 えば、ステップ 22にお て、対応 56は、対応 報として、
z に対応する、 、分散 、および ベクト を ンテ
57に蓄積さ る。すなわち、上述した例の場合、 ンテ 57には、例えば、 の と 2、 の 、 2の S2、および 3の ベクト 平均ベクト 2がそれぞれ 積される。 0149 ステップ 23にお て、対応 56は、 出されたうベ 報と潜在 間 との 報をうベ 58に蓄積さ て、対応 報 の 出の 終了する。
0150 えば、ステップ 23にお て、対応 56は、対応 報として、す ての との み合わ に対する、P( z )と P(z )をうベ
58に蓄積さ る。すなわち、上述した例の場合 、ラベ 58には、例えば、 9に示す と同様の、 潜在 および 2と、 ゆ た 、 る 、 、 、および とのP( z )、並びに、 の (z )が 積される。 0151 なお、このとき、 ンテ との 上での 、それぞれ、P(z
S ) (z )( 2 )となる。
0 52 上のよ に、 ンテン は、学習の 理を行 ことにより、 ンテ
57 ベ 58の それぞれに、対応 報を蓄積することになる。
0153 言すれば、 ンテ は、学習の 理を行 ことにより、異なる分布を 持 て る ンテ とうベ 報とを、潜在 により の 間中 で統合さ る。その 果、 ンテ は、 ンテ とを対応 け ることになる。
0154 このよ に、学習 にお ては、異なる分布を持 て る、 ンテ
を の ( )により 合することができる。
0155 次に、上述したよ に、 4 6を参照して、運用 に て説明する 。また、運用 の 明では、最初に、ある ンテン ( ンテ に対して 、ラベ を付与する 理を説明し、その 、あるキ ワ ド(ラベ )に一致して る ンテ ( ンテ )を検索する 理を説明する。
0156 まず、 4の チヤ トを参照して、 ンテ による、ある音楽 ン に対して、ラベ を付与する 理に て説明する。なお、この 、例え ば、 により新規の ンテ が追加されたときに開始される。
0157 ステップ 3 にお て、 ンテ 52は、 ンテ ンテ を抽出し、抽出した ンテン ンテ 53に蓄積( )さ る。
0158 えば、ステップ 3 にお て、 ンテ 52は、新規に追加される テ 、
音楽 ン ン S W ら、 ンテ f W ( スピ ド るさ
) (55 65 45)を抽出し、抽出した ンテ f Wを ンテ
53に蓄積さ る。
0 59 言すれば、 ンテ ツ 52は、新規に追加される音楽 ンテ S
W ら ンテ を抽出することにより、 の ンテ に対して、 クト を ンテン 53に蓄積さ て るとも言える。
0160 ステップ 32にお て、 ンテ 59は、 ンテ
57に蓄積されて る対応 報を基に、抽出された ンテ が潜在 間中に配置されるよ に変換し、変換された結果を 間距離 6 に供給する。
0161 えば、ステップ 32にお て、 ンテ 59は、 ンテ
57に蓄積されて る、分散 S ( えば、 の S および 2の ) 平均ベクト ( 3の ベクト 平均ベクト )とを用 て、 ンテ f W (55 65 45)を 間中に配置されるよ 換する( ッピングする)。 0162 体的には、 ンテ 量 ら 間 の 、上述した学習 ズ(
3の チヤ トの )により得られた分布 ラメ タを利用することにより、例 えば、 (9)により算出される。
0163 9 p (ZZkkkkIS
Figure imgf000027_0001
( ; k k) ( 0164 すなわち、P(z S W) (z2 S W)のそれぞれは、 (9)を用 て、 下に示すよ にして 出される。
0165 (z S W) P(z ) (f W S ) 48X 48X 5 7 9 X 6
0166 (z2 S W) P(z2) (f W 2 S ) 52X2 98X 6 43 X 6
0167 上のよ にして 出された、P(z S W) 7・ gX 6と、P(z2 S W ・43X 6とを正規 することにより、P(z S W ( 83 ・ 7 が 出される。
0168 なお、音楽 ンテ の 前 P(s )は、一般に自明ではな ので、す て等 率として 、観測 体の 布を利用して計算するよ にしてもよ 。
0169 ステップ 33にお て、潜在 間距離 6 は、 ンテン
59 ら供給された、 ンテン 間中に配置されるよ に変換 した および ベ 58に蓄積されて る対 応 報を基に、 ンテ との 離を算出し、 出した 離の 果をうベ 62に供給する。
0170 体的には、 ンテ との 離の 、例えば、ラベ の 件付 率 を利用して、 ( )により算出される。
0171 10
Figure imgf000028_0001
oCZp Z ( n k) ・ ・ ( 0 0172 また、 ンテ との 離であるが、上述した式( )に限らず、例えば、 ンテ の 間中での 現、P(z S )と、ラベ の 間での P(z )とのカ ック ライ ラ ( bac ebe e e ce)や、ジ ンセン ヤノン (Je se a o e e ce)( 下、 S 離とも する )などを用 てもよ 。
0173 カ ック ライ ラ 、例えば、 ( )により算出される。
0174 11 p k S
( p( Z S n p Z )) n)
p( Z ) l O ) k p Zk )
0175 は ( 2)
0176 2
J (p( sn) p( )) ( sn) p( s )
Figure imgf000029_0001
Figure imgf000029_0002
) 0177 なお、実際には、潜在 ク ット 間とならな が、より簡略 するために、 ク ット ( 数の )に関する要素の差の総和などを用 るよ にしてもよ 。
0178 すなわち、例えば、潜在 間距離 6 は、 ンテ
59 ら供給されたP(z S W) ( 83 ・ 7)および ベ
58に蓄積されて るP( z )と P(z )を基に、 ( 2) を用 て、潜在 間中における、 ンテ との S )を算出する。 0179 5は、潜在 間距離 6 により算出される、 ンテ との 離の 例を示す図である。
0180 5で示される例にお て、 、例えば、ラベ
58に蓄積されて るうベ ( )を示し、2 、潜在 間距離 6 により算出される ンテ のう との 離を示す。なお、 5の例で は、 ( 2)を用 て、 ンテ との S )を算出して る。
0181 えば、潜在 間距離 6 は、 5に示すよ に、音楽 ンテン S Wと ゆ たげである単語と S (2 )が ・ 3 、音楽 ンテン S Wと る である単語と S ( )が ・ 9、音楽 ンテン S W げ である単語と S (4 )が ・ 9となることをそれぞれ 出する。
0182 また、同様に、例えば、潜在 間距離 6 は、 5に示すよ に、音楽 ンテ ン S Wと である単語と S (5 )が ・ 2 5 、音楽 ンテン S Wと である単語と S (6 )が ・ 53となることをそれぞれ 出す る。 0183 このよ に、例えば、潜在 間距離 6 は、 5に示される、 ンテン との 離を算出し、 出した 離の 果をうベ 62に供給する。 0184 4の チヤ トに戻り、ステップ 34にお て、ラベ 62は、潜在 間距離 6 ら供給された 離の 果を基に、ラベ を選択して、ラベ 与 の 終了する。
0185 えば、ステップ 34にお て、ラベ 62は、潜在 間距離 6 ら 供給された 離の 果が、 5の ンテン との 離である場合、それらの S 離のより近 、 S ・ 53) る S ・ 9 2 を、この 追加された音楽 ンテン S Wに付与するう として選択する 0186 なお、新規に追加された音楽 ンテン S Wに対して付与するう の数は、 上述した2 に限らず、例えば、 ンテン との 離が所定の 以下となる う 、または 離の う の ( は )を選択するなどしてもよ 0187 また、ラベ 62により選択された、 ンテン 付与されたう であるが、 例えば、出力 7の 面に表示さ ることで、直接 対して提示するよ にし てもよ 、また、メタデ タとして蓄積しておき、例えば、 ンテンツの 索などに用 るよ にしてもよ 。
0188 上のよ にして、 ンテン は、ある ンテン 対して、より最適となる う を付与する。
0189 このよ に、 ンテン とうベ 報のそれぞれの 布の 徴を反映した
( )により、ラベ を持 て な ンテン 対しても、その ンテン 、より最適なう を付与することができる。その 果、 ンテン キ ワ ド( ラベ )を付与する人手による作業がな なるので、 ストを削減することができる。 0190 次に、 6の チヤ トを参照して、 ンテン による、 ンテンツ の 理に て説明する。なお、この 、例えば、 により ザイン タ を介して、所定のう に適合する ンテン 索を指示されたとき に開始される。 0191 ステップ 4 にお て、ラベ 6 は、ラベ
58に蓄積されて る対応 報を基に、対象となるう が潜在 間中に配置されるよ に変換し、変換された結果を 間距離 6 に供給 する。
0192 えば、ステップ 4 にお て、ラベ 6 は、 により る であるう が指示された場合、ラベ 5 8に蓄積されて る、す ての との み合わ に対する、P z ) P(z )を基に、 る であるう が潜在 間中に配置される よ に変換( ッピング) 変換された結果(P(z を潜 間距離 6 に供給する。
0193 体的には、ラベ の 間 の 、例えば、 ( 3)により算出される。 0194 13
p( Zk) (Z
(zZ ・
p( i) oC ( Z ) (Z ) (13) 0195 なお、ここでは、ラベ ( )の 前 P( )は自明ではな ので、等 率とし たが、観測 の 布を用 るよ にしてもよ 。
0196 ステップ 42にお て、潜在 間距離 6 は、ラベ
6 ら供給された、ラベ 報を 間中に配置されるよ に変換した および ンテ 57に蓄積されて る対応 報を基に、 ンテ との 離を算出し、 出した 離の 果を ンテ
63に供給する。
0197 えば、ステップ 42にお て、潜在 間距離 6 は、ラベ
6 ら供給されたP(z )および ンテ
57に蓄積されて る、 に対応する、 、分散
、および ベクト を基に、上述した式( 2)を用 て、潜在 間中におけ る、 ンテ との 離を算出する。 0198 なお、 ンテ 、
ン との 離の 出方法であるが、 4のステップ 33の 理と同様に、 ( 2)のジ ンセン ヤノン 離に限らず、例えば、ラベ の 件付 ( ( ))、カ ック ライ ラ ( ( ))、または ク ット 離など を用 るよ にしてもよ 。
0199 7は、 る であるう が指示された場合の、潜在 間距離
6 により算出される、 ンテン との 離の例を示す図である。
0200 えば、潜在 間距離 6 は、 7に示すよ に、 る であるう
JS (2 )が ・ 3 、 る であるう 2とのJS 3 ・ 5 、 る であるう 3とのJS (4 )が ・ 22、 る であるう 4とのJS (5 )が ・ 4、 る であるう 5と のJ (6 )が ・ 2547となることをそれぞれ 出する。
0201 また、同様に、例えば、潜在 間距離 6 は、 7に示すよ に、 る
であるう 6 S (7 )が ・ 947、 る であるう 7とのJS (8 )が ・ 473、 る であるう 8とのJS (9 )が ・4 2 3、 る であるう 9とのJS ( )が ・ 9、 る であるう とのJS ( )が ・ 345 となることをそれぞれ 出する。
0202 さらに、同様に、例えば、潜在 間距離 6 は、 7の 2 日に示すよ に 、 4の チヤ トの 理により、 る であるう が付与された 音楽 ンテンツS Wを示す 、 る であるう のJS 離が ・ 49 となることを算出する。
0203 このよ に、例えば、潜在 間距離 6 は、 7に示される、 ンテン
との 離を算出し、 出した 離の 果を ンテン 63に供給する。
0204 6の チヤ トに戻り、ステップ 43にお て、 ンテンツ 63は、潜 在 間距離 6 ら供給された 離の 果を基に、 ンテン 選択して、 ンテン の 終了する。
0205 えば、ステップ 43にお て、 ンテンツ 63は、潜在 間距離 6 ら供給された 離の 果が、 7の ンテン との 離である場合、それ らのJS 離のより近 、 3US ・ 22)、 S ・ 49)、 S ・ 5 3 を、 る であるう に対応する ンテン として 選択して、出力 7の 面などに表示さ る。
0206 なお、選択される ンテンツの数は、上述した3 に限らず、例えば、 ンテ 、 ン との 離が所定の 以下 、
となる ンテン 、または 離の ンテン、 ( )を選択するなどしてもよ 。
0207 また、上述した 、
よ に、選択される ンテン 、学習 にお て利用した ン テ 限らず、運用 にお て、後 ら 加された テ ( えば、音楽 、
ンテン S W)も含んで るものとする。
0208 さらに、例えば、 により 定されたう が、ラベ
58に存在しな 場合、あら じめ別のデ タ( えば、ラベ が単語である 場合には、一般の スやその ンテン、
する 域での デ タなど)を利 用してより多 の を含むよ デ ( デ )を構築しておき、その デ の中の、 ( で登場した) 知のう の中で指定された 知のう 最も近 屹のを代替ク として使用するよ にしてもよ 。
0209 上のよ にして、 ンテン は、ラベ に対応する ンテンツを検索す る。
0210 このよ に、 ンテン とうベ 報のそれぞれの 布の 徴を反映した
( )により、キ ワ ド(ラベ ) ら ンテン 検索することができる 。その 果、 、所望の ンテ 、
ン 取得することができる。
0211 ころで、上述した例にお ては、 ンテ 、
ン とうベ 報との けに て説明してきたが、 はこれに限らず、例えば、ラベ ンテン 後述する ンテクスト 報とを対応 けしたり、ラベ ンテン 後述する 報とを対応 けしたりすることもできる。
0212 まず、 8 2 を参照して、ラベ および ンテン 、 ンテク スト 報との けに て説明する。
0213 8は、 ンテン の 能的 例の他の例に て説明する ッ ク図である。
0214 なお、 8では、 2 同様の 所には、同一の 号が付してありその 省略 する。すなわち、 8にお て、 ンテン は、 2の ック と比較し て、 ンテクスト 、 ンテクスト 2、および ンテクスト
3をさらに含むよ にして構成されて る。
0215 ンテクスト は、 ンテン 5 に蓄積されて る ンテンツに 関する ンテクスト 報を抽出する。 ンテクスト は、抽出した ンテ クスト 報を ンテクスト 2に蓄積( )さ る。
02 6 ここで、 ンテクスト 報とは、 ンテンツを体験する際の、 ンテン その もの 外の 報である。 ンテクスト 、例えば、 ンテン 体験した 時間、季節、場所、天候、気分、一緒に た人などとなる。
0217 56は、 ンテン 53に蓄積されて る ンテン 、ラベ 55に蓄積されて るうベ 報との 報を算出する 。 56は、 出した対応 報を、 ンテン
57および 58のそれぞれに蓄積 ( )さ る。
0218 また、対応 56は、ラベ 55に蓄積されて るうベ 報と 、 ンテクスト 2に蓄積されて る ンテクスト 報との 報を算出 する。 56は、 出した対応 報をうベ
58および ンテクスト 3のそれぞれに蓄 積( )さ る。
0219 さらに、対応 56は、 ンテン 53に蓄積されて る ン テン 、 ンテクスト 2に蓄積されて る ンテクスト 報との 報を算出する。 56は、 出した対応 報を ンテン
57および ンテクスト
3のそれぞれに蓄積( )さ る。
0220 なお、ここで、対応 、 ンテン 、ラベ 、または ンテクストのそれぞれを対 応 けるための 報となる。 、例えば、潜在 z により、 ンテン 、ラ ベ 、または ンテクストのそれぞれを結び付ける。
0221 また、上述した例にお ては、 ンテン 57 ラベ 58、および ンテクスト
3のそれぞれを にするとして説明したが、それらを にまとめ ることも可能である。そのとき、 ンテン 57、ラ ベ 58、および ンテクスト
3の ずれ が、す ての 報を蓄積することになる。
0222 次に、 9の チヤ トを参照して、 8の ンテン による、学習 の 理に て説明する。
0223 ステップS5 およびステップS52の 理のそれぞれは、 3のステップ および ステップS 2の 理のそれぞれと同様であるのでその 省略する。
0224 ステップS53にお て、 ンテクスト は、 ンテン 5 に蓄 積されて る ンテン 関する ンテクスト 報を抽出し、抽出した ンテクスト 報 を ンテクスト 2に蓄積( )さ る。 えば、ステップS53にお て、 ンテクスト は、 ンテン 5 に蓄積されて る音楽 ンテン 対して、その曲がどの 間帯に聴 れた 、またはその曲がどの 所で聴 れ た を示す ンテクスト 報を抽出し、抽出したそれらの ンテクスト 報を ンテクス ト 2に蓄積さ る。
0225 体的には、 ンテン 5 に蓄積されて る音楽 ンテン として、例えば 、 のそれぞれが 積されて る場合、 ンテクスト は、 2 の例に示すよ な ンテクスト 報を抽出する。
0226 2 は、音楽 ンテン 関する ンテクスト 報の例を示す図である。
0227 2 で示される例にお て、 目を示し、 には、 ンテンツ
5 に蓄積されて る音楽 ンテン 示され、 f 目には、 の ンテンツに関する ンテクスト 報、すなわち、それらの ンテン 、朝、 昼、晩のどの 間帯に聴 れた と、 自宅、屋外、通勤のどの 所で聴 れた が 示されて る。
0228 すなわち、例えば、 ンテクスト は、 2 に示すよ に、 (2 )が、時間帯ごとにみると、朝に3 、昼に4 、晩に2 ず れ、 、場所ごと にみると、 自宅で2 、屋外で3 、通勤 4 ず れ、 2(3 )が、朝に 5 、昼に4 、晩に2 ず れ、 、 自宅で3 、屋外で2 、通勤 3 ず れ、 3(4 )が、朝に3 、昼に3 、晩に ず れ、 、 自宅 で3 、屋外で3 、通勤 5 ず れ、 4(5 )が、朝に4 、昼に3 、 晩に2 ず れ、 、 自宅で2 、屋外で3 、通勤 3 ず れて ることを示す ンテクスト 報をそれぞれ 出する。
0229 また、同様に、例えば、 ンテクスト は、 5(6 )が、朝に4 、 昼に2 、晩に3 ず れ、 、自宅で2 、屋外で2 、通勤 4 ず れ、 6(7 )が、朝に2 、昼に3 、晩に4 ず れ、 、 自宅で3 、屋外で3 、通勤 2 ず れ、 7(8 )が、朝に3 、昼に 、晩 に3 ず れ、 、 自宅で3 、屋外で3 、通勤 2 ず れて ことを示す ンテクスト 報をそれぞれ 出する。
0230 さらに、同様に、例えば、 ンテクスト は、 8(9 )が、朝に 、昼に2 、晩に5 ず れ、 、 自宅で4 、屋外で3 、通勤 3 ず れ、 9( )が、朝に2 、昼に2 、晩に4 ず れ、 、 自宅で5 、屋外で2 、通勤 2 ず れて、 、朝に 、昼に2 、晩に3 ず れ、 自宅で4 、屋外で3 、通勤 3 ず れて ること を示す ンテクスト 報をそれぞれ 出する。
0231 9の チヤ トに戻り、ステップ 54にお て、対応 56は、 ン テ 53に蓄積されて る ンテ 、ラベ 55 に蓄積されて るうベ 報、または ンテクスト 2に蓄積されて ンテクスト 報を基に、それらの 報を算出し、 出した対応 報を、 ンテン
57、ラベ
58、または ンテクスト 3に蓄積さ て、学習の 終了する。
0232 ここで、 ンテ 、ラベ 報、または ンテクスト 報の 間表現は 、上述した ンテ とうベ 報との 係と同様に共通の z を持 ち 、さらに、それぞれ別の分 数を用 て、上述した方法( 3のステ プS 3 の ) 同様に算出することができる。 0233 すなわち、対応 56は、 3のステップ 3の 理と同様にして、 ンテ ンツ、ラベ 、または ンテクストの 報を算出する。
0234 体的には、例えば、 2 で示される ンテクスト 報のよ に、それらの ン テ が、朝、昼、晩のどの 間帯に聴 れた と、 自宅、屋外、通勤のどの 所で 聴 れた とを蓄積( )してお ことにより、対応 56は、 ンテ
( 4)、ラベ ( 5)、および ンテクスト ( 2 )を基に、対応 報を 算出する。
0235 2 は、 ンテクスト 報の 間表現の例を示す図である。
0236 2 で示される例にお て、 目を示し、 には、 ンテクス トが示され、 f 目には、 ンテクストに関する2 の (
、潜在 2)が示されて る。
0237 えば、対応 56は、 2 に示すよ に、潜在 の として、 (2
)を ・ 8、 (3 T )を ・ 7、 (4 )を ・ 23、 自宅(5 )を ・ 3、屋外(6 )を ・45、および (7 )を ・ 9として、それぞれ 出する。 0238 すなわち、朝、昼、晩、 自宅、屋外、および である ンテクストのそれぞれが、潜 在 により、 ンテン または 対応 けられることになる。
0239 また、同様に、例えば、対応 56は、 2 に示すよ に、潜在 2の として、 (2 )を ・ 2、 (3 T )を ・ 3、 (4 )を ・ 77、 自宅(5 ) を ・ 7、屋外(6 )を ・ 55、および (7 )を ・ 2として、それぞれ 出する 0240 すなわち、朝、昼、晩、 自宅、屋外、および である ンテクストのそれぞれが、潜 在 z2により、 ンテン または 対応 けられることになる。
0241 このよ に、 明では、例えば、音楽 ンテンツ( えば、 )のそれ ぞれを、 のどの 間帯に聴 た 、または のど の 所で聴 た を蓄積してお ことにより、上述した、 ンテ やうベ 報と組み合わ ることができる。そして、 ンテ 、ラベ 報、または ンテ クスト 報を組み合わ ることにより、それぞれの 布の 向が加味された 間 を生成することができ、 ンテクストは、例えば、 2 に示すよ に潜在 間に されることになる。
0242 これにより、運用 では、上述した、 6の チヤ ト 同様に、例えば、 により、 、 自宅で聴きた 音楽 ンテ を指示された場合、 ンテ は、 である ンテクスト 、 である ンテクストに近 音楽 ンテン 選択することになる。
0243 なお、 ンテクスト ンテ との 、 ンテクスト との 算 であるが、これも、 6のステップS42 同様に算出されることになる。
0244 また、 ンテ に対する ンテクスト 、 により異なるが、 人の
関する ンテクスト 報でもよ 、または複数の による ンテクスト 報を 加算したものであ てもよ 。
0245 次に、 22 25を参照して、ラベ および ンテ 、
報との けに て説明する。
0246 22は、 ンテ の 能的 例の他の例に て説明する ッ ク図である。
0247 なお、 22では、 2 同様の 所には、同一の 号が付してありその 省略 する。すなわち、 22にお て、 ンテ は、 2の ック と比較し て、 5 、 52、および
53をさらに含むよ にして構成されて る。
0248 5 は、 ンテンツ 5 に蓄積されて る ンテ に関す る 報を抽出する。 5 は、抽出した 報を
52に蓄積( )さ る。
0249 ここで、 報とは、 による ンテ の みに関する情報である。
、例えば、 による ンテ に関する評価を示す ( )などと なる。
0250 56は、 ンテ 53に蓄積されて る ンテ
、ラベ 55に蓄積されて るうベ 報との 報を算出する 。 56は、 出した対応 報を、 ンテン
57および ベ 58のそれぞれに蓄積 ( )さ る。
0251 また、対応 56は、ラベ 55に蓄積されて るうベ 報と 、 52に蓄積されて る 報との 報を算出する。
56は、 出した対応 報をうベ 58お よび 53のそれぞれに蓄積( )さ る。 0252 さらに、対応 56は、 ンテ 53に蓄積されて る ン テンツ 、 52に蓄積されて る 報との 報を算 出する。 56は、 出した対応 報を ンテ
57および 53のそれぞれに 蓄積( )さ る。
0253 なお、ここで、対応 、 ンテ 、ラベ 、または 報のそれぞれを対応 けるための 報となる。 、例えば、潜在 z により、 ンテ 、ラベ 、または 報のそれぞれを結び付ける。
0254 また、上述した例にお ては、 ンテン 57 ラベ 58、および
53のそれぞれを にするとして説明したが、それらを にまとめることも 可能である。そのとき、 ンテ 57、ラベ
58、および 5 3の ずれ が、す ての 報を蓄積することになる。
0255 次に、 23の チヤ トを参照して、 22の ンテ による、学習 の 理に て説明する。
0256 ステップS6 およびステップS62の 理のそれぞれは、 3のステップ および ステップS 2の 理のそれぞれと同様であるのでその 省略する。
0257 ステップS63にお て、 5 は、 ンテンツ 5 に蓄積され て る ンテ に関する 報を抽出し、抽出した 報を
52に蓄積( )さ る。 えば、ステップS63にお て、 5 は、 ンテンツ 5 に蓄積されて る音楽 ンテ に対して、 ( えば、 、 2、 3、 4、および 5)の 報を示す 報を抽出し、抽出したそれらの 報を 52に蓄積さ る。
0258 体的には、 ンテ 5 に蓄積されて る音楽 ンテ として、例えば 、 のそれぞれが 積されて る場合、 5 は、 24 の例に示すよ 報を抽出する。
0259 24は、音楽 ンテ に関する 報の例を示す図である。
0260 24で示される例にお て、 目を示し、 には、 ンテンツ i5 に蓄積されて る音楽 ンテ の 示され、 日には、 の ンテンツに関する 報、すなわち、それらの ンテ に対する、 、 2、 3、 4、および 5のそれぞれの ( えば、 24では、 まらな と感じた曲に 、 感じた曲に 5 を評価する5 階評 価)が示されて る。
0261 すなわち、例えば、 5 は、 24に示すよ に、 (2 )に対 して、 が3、 2が4、 3が2、 4が2、 5が4にそれぞ れ 価し、 2(3 )に対して、 が5、 2が4、 3が2、 4 が3、 5が3にそれぞれ 価し、 3(4 )に対して、 が3、 2 が3、 3が 、 4が3、 5が5にそれぞれ 価し、 4(5 )に対 して、 が4、 2が3、 3が2、 4が2、 5が3にそれぞ れ 価したことを示す 報をそれぞれ 出する。
0262 また、同様に、例えば、 5 は、 24に示すよ に、 5(6 ) に対して、 が4、 ザ2が2、 3が3、 4が2、 5が4にそ れぞれ 価し、 6(7 )に対して、 が2、 2が3、 3が4、 4が3、 5が2にそれぞれ 価し、 7(8 )に対して、 が3、 2が 、 3が3、 4が3、 5が2にそれぞれ 価したことを示す 報をそれぞれ 出する。
0263 さらに、同様に、例えば、 5 は、 24に示すよ に、 8(9 ) に対して、 が 、 ザ2が2、 3が5、 4が4、 5が3にそ れぞれ 価し、 9( に対して、 が2、 2が2、 3が4、 4が5、 5が2にそれぞれ 価し、 T )に対して、 が 、 2が2、 3が3、 4が4、 5が3にそれぞれ 価したことを示 す 報をそれぞれ 出する。
0264 23の チヤ トに戻り、ステップ 64にお て、対応 56は、 ン テ 53に蓄積されて る ンテ 、ラベ 55 に蓄積されて るうベ 報、または 52に蓄積されて る 報を基に、それらの 報を算出し、 出した対応 報を、 ンテ
57、ラベ 58、または
53に蓄積さ て、学習の 終了する。 0265 ここで、 ンテ 、ラベ 報、または 報の 間表現は、上述 した ンテ とうベ 報との 係と同様に共通の を持ち 、さらに、それぞれ別の分 数を用 て、上述した方法( 3のステップS 3の ) 同様に算出することができる。
0266 すなわち、対応 56は、 3のステップ 3の 理と同様にして、 ンテ ンツ、ラベ 、または 報の 報を算出する。
0267 体的には、例えば、 24で示される 報のよ に、 による評価 報 を蓄積( )してお ことにより、対応 56は、 ンテ ( 4)、ラ ベ ( 5)、および ( 24)を基に、対応 報を算出する。
0268 25は、 報の 間表現の例を示す図である。
0269 25で示される例にお て、 目を示し、 には、 報 の ( ンテ を評価した )が示され、 f 目には、 ンテンツ に関する2 の ( 、潜在 2)が示されて る。
0270 えば、対応 56は、 25に示すよ に、潜在 の として、
(2 )を ・ 8、 2(3 )を ・ 7、 3(4 )を ・ 3、 4(5 )を ・45、および 5(6 )を ・ 9として、それぞれ 出する。
0271 すなわち、 、 2、 3、 4、 5である 報のそれ ぞれが、潜在 により、 ンテ または 対応 けられることになる。 0272 また、同様に、例えば、対応 56は、 25に示すよ に、潜在 2の として、 ( )を ・ 2、 2(3 )を ・ 3、 3(4 )を ・ 7、 ザ4(5 )を ・ 55、および ザ5(6 )を ・ 2として、それぞれ 出 する。
0273 すなわち、 ザ 、 ザ2、 ザ3、 ザ4、 ザ5である 報のそれ ぞれが、潜在 z2により、 ンテ または 対応 けられることになる。 0274 このよ に、 明では、例えば、 24の例のよ に、5人の ザが、
に対して、それぞれ5 階評価をして る場合、この ンテ に関する ( 24)と、音楽 ンテ の ンテ ( 4)とを組み合わ ることにより 、 ザの の 向と ンテ の 向とが、相互に影響を及ぼしながら、 最適な ( z )が生成され、 25で示すよ ザの 報が 潜在 間に配置されることになる。
0275 また、 明では、例えば、 ンテ または ベ 報と共通の
z を持ちながら、別の分布の ラメ タ 定を〒 ことにより、 ザの の 向を反映し 、 ンテ そのものの 、 ( えば、権威者などによる ビ 文に含まれる単語などの) 観的なう の 向をも反映した 間を得ることが できる。
0276 これにより、運用 では、例えば、 ザ 報と ンテ との 間 中での 現を利用することにより、 ザ 体の の 報が加味された ザの クラスタ ング ンテ のクラスタ ング、さらに、 ザ ンテ との クラス タ ングも可能となる。
0277 このよ に、 明によれば、 ザの みにあ た ンテ を推薦することがで きる。
0278 なお、上述した例にお ては、5人の ザの 報を例にして説明したが、 ザの 何人でもよ 、例えば、 人の ザの 報を 元の 間とみな して、潜在 ( z )を算出するよ にしてもよ 。
0279 ころで、 明にお ては、上述した 間に グ 能となる、例えば、 ンテン 、ラベ 報、 ンテクスト 報、または 報などにおける特徴 を定義することもできる。 体的には、特徴 、例えば、潜在 間中に確率 布 として表現された対象の 、どのよ にその ント ピ に対して単調 さ るもの を、 ( 4)で定義することにより、 出することができる。
0280 14 C ) ( )
I gP(Z ) 4)
Figure imgf000043_0001
0281 すなわち、例えば、対応 56は、音楽 ンテン 関する ンテクスト
( 2 )を、 ( 4)を用 て定義することにより、後述する 26の ンテクストの を得ることができる。
0282 26は、 ンテクストの 性の例を示す図である。
0283 26で示される例にお て、 ンテクストを示し、2 特徴性の値を示 して る。
0284 えば、対応 56は、 26に示すよ に、 (2 )に対して、 ・ 5 である特徴 の 、昼 3 対して ・ 389である特徴 の 、晩(4 )に対 して、 ・46 である特徴 の 、 自宅(5 )に対して、 ・ 389である特徴 の 、屋外(6 )に対して、 ・ 3 である特徴 の 、および (7 )に対して、 ・ 675である特徴性の値をそれぞれ 出する。
0285 すなわち、例えば、 2 の ンテンツに関する ンテクスト 報の例における、 6 の ンテクスト 報の 、 ( 性の値が ・ 675)や ( 性 の値が ・ 5 )である ンテクストが、特徴的( 性の値が大き 、すなわち、音楽 の き方に強 影響して る)であることがわ る。この を用 ることにより、例 えば、 である ンテクストは、音楽の き方に影響を及ぼさな ので、 ザ が 外に るときには、その他の、メタデ タ ンテクスト 報を推薦したり、 である ンテクスト 、特徴 が強 ので、他の ンテクストは無視して、潜在 間中で、 である ンテクスト 報にのみ 距離となる音楽 ンテン 推薦 したりすることも可能となる。
0286 また、この 、上記 ベ 報に対しても ることができる。 まり、特徴 ,注の高 うベ 、 ンテンツの 関連の 、特徴的なうベ 報で あるとも言えるので、例えば、そのよ ベ 報を選択し、強調して表示すること で、音楽 ンテン、 ビ 文などの 章を読んで る ザの、音楽 ンテンツ の 解を補助することもできる。
0287 そこで、まず、 27 3 を参照して、 ンテン との けを
( ズ)に て説明し、その 、図3 35を参照して、対応 けら れた ンテン とうベ 報との 係を用 て、特徴 の うベ 報を 選択し、そのうベ 報を強調して表示する ( ズ)に て説明する 0288 27は、 ンテン の 能的 成の他の例に て説明する ック 図である。
0289 なお、 27では、 2 同様の 所には、同一の 号が付してあり、処理が同じ部 分に関しては、その 繰り返しになるので する。すなわち、 27にお て、 ンテン は、 2の ック と比較して、 ンテン
53、ラベ 55、 ンテン 59、ラベ
6 、潜在 間距離 6 、ラベ 62、および ンテン 63の わりに、ラベ 54 接続するよ にして、文章 7 が設けられて る。
0290 7 は、 ンテンツ 5 に蓄積されて る ンテン 関する、例 えば、 ビ 感想文などの 語によ て記述された文章の 報である文 章 報を蓄積( )する。 7 は、ラベ 54 らの 求に 応じて、文書 報をうベ 54に供給する。
0291 ラベ 54は、文章 7 に蓄積されて る文章 報を、単語また は、例えば、形態素 析によ て、人間にと て意味のある単位( ズ)に分割し て単語 する。ラベ 54は、形態素 析により得られた形態素などの 報を、ラベ 報として対応 56に供給する。
0292 なお、 ズとは、人間にと て意味のある単位に 切られた、 または である。
0293 また、詳細は後述するが、形態素 とは、 ンピ などの 算機を用 た、 わゆる自然 理の 術のひと で、 自然 語で書 れた文を形態素(( o e e)、おおま に言えば、言語で意味を持 小の )の列に分割 、品 詞を見分ける作業である。なお、一般的に、形態素 析にお ては、例えば、 日本 語 を形態素に分割する形態素 析器( えば、奈良 端科学技術大学院大 学 究室で開発された (C aSe ) など) 、形態素を意味のあるまとまり にする、 わゆるチヤンカ( えば、 a C a など)などが利用される。また、文章 が英語などの 、複数形や時制などによる を削除して語幹だけを残す 、 e a za o される単語の を取り出す 理などが行われる。
0294 56は、 ンテン 52 ら供給される ンテン
、ラベ 54 ら供給されるうベ 報との 報を算出する。
56は、 出した対応 報を、 ンテン
57および ベ 58のそれぞれに蓄積さ る。
0295 なお、説明を簡略化するために、 27には して な が、上述した場合と同 様に、 ンテン 52により 出された ンテン ンテン
53に蓄積さ 、ラベ 54により 出されたうベ 報をう ベ 55に蓄積さ てもよ 。その 合、対応 56は、 積さ れて る ンテン および ベ 報を読み出し、それらの 報を算出 する。
0296 次に、 28の チヤ トを参照して、 27の ンテン による、学習 の 理に て説明する。
0297 ステップS7 の 、 3のステップS の 理と同様であるので、その
省略する。
0298 ステップ 72にお て、ラベ 54は、文章 7 に蓄積されて る文章 報 らうベ 報を抽出する、ラベ 出の 理を行 。
0299 ここで、ステップ 72における、ラベ 54による、ラベ 出の 理の 細に て、 29の チヤ トを参照して説明する。
0300 ステップS8 にお て、ラベ 54は、文章 7 に蓄積されて る文章 報を読み出す。 0301 ステップ 82にお て、ラベ 54は、読み出した文章 報に対して、 形態素 。
0302 3 は、ラベ 54によ て行われる、形態素 析の例に て説明 する図である。
0303 3 の例にお て、 上 に示されるよ に、 ‥・ひたすら明る の曲が ‥・ である文章 報が文章 7 に蓄積されて るとき、ラベ 54 は、その ‥・ひたすら明る の曲が‥・ である文章 報に対して、形態素 ことで、 に示される形態素 析の 果を得る。
0304 3 の に示す 態素 析の 果にお ては、 6列で表される結果の 、 側 ら を示し、 2 を示し、3 を 示し、4 の を示し、5 用の を示し、6 用 形を示して る。
0305 まり、ラベ 54によ て、形態素 析が行われた結果、図3 の
に示すよ 、 ‥・ひたすら明る の曲が‥・ である文章 、 3 の に示すよ に、 ひたす である に ては、 が 、 がひたすら 、 の が 一般であると解析され、 る である に ては、 が 、 が る 、 の が 容詞 、 用の が 容詞・アウオ 、 用形 が であると 解析され、 である に ては、 が 、 が 、 の が 容動詞 であると解析される。
0306 また、同様に、 3 に示すよ に、 ‥・ひたすら明る の曲が‥・ である文 章 、 の である に ては、 が 、 が の 、 の が 連体げであると解析され、 である に ては、 が 、 が 、 の が 一般であると解析され、 が である に ては、 が 、 が が 、 の が
助詞 一般であると解析される。
0307 なお、ラベ 54は、形態素 析にお て明ら に重要でな と考えられる 単語、すなわち、 3 の に示す 態素 析の 果における、例えば、 の が などの 詞を、あら じめ定義されたストにしたが て削除することも可能で ある。
0308 29の チヤ トに戻り、ステップ 83にお て、ラベ 54は、形 態素 析により得られた形態素を、ラベ 報として対応 56に供給して 、ラベ 出の 終了し、処理は、 28のステップ 72に戻り、ステップ 7 3 降の 理が実行される。
0309 体的には、ラベ 54は、 3 の に示す 態素 析の 果の 、例えば、左側 ら3 、 ひたすら 、 る 、 、 、などの ( 前の原 )を、形態素とする。そして、ラベ 54は、 ひたす ら 、 る 、 、 である形態素を、ラベ 報として対応 5 6に供給する。
0310 ステップ 73にお て、 3のステップ 3の 理と同様に、対応 56に よ て、 ンテ とうベ 報との 報が 出され、その 報が ンテ 57および ベ
58のそれぞれに蓄積されて、学習の 終了する。
0311 えば、対応 56は、 ンテン および ベ 報を基に、潜在 z であるときの 報として、平均ベクト 、分散 P( z )をそれぞれ 出する。そして、対応 56は、対応 報として、例 えば、潜在 z に対応する、 、分散 、および ベクト を ンテ 57に蓄積さ 、例えば、潜在
との み合わ に対する、P( z )と P(z )をうベ
58に蓄積さ る。
0312 上のよ にして、 ン は、学習の 理を行 ことにより、 ンテン
57 ベ
58のそれぞれに、対応 報を蓄積することになる。
0313 このよ に、文章 報による自然 に含まれる ズを活用することで、
、 ンテ の 徴を特別に意識するこ な 、単に文章だけを記述さえすれば、 ン テ に属性( ズ)を付与することができる。また、特徴 ズとの が 出されるので、それらの を利用して、 ンテ に タデ タを付与する ストを軽減することもできる。
0314 次に、 3 35を参照して、 3 35を参照して、上記 習の 理に よ て対応 けられた ンテ とうベ 報との 係を用 て、 ズの ンテン との を示す の うベ 報を選択し、そのうベ 報を強調して表示する 理に て説明する。
0315 3 は、 ンテ の 能的 成の他の例に て説明する ック 図である。
0316 なお、 3 では、 27 同様の 所には、同一の 号が付してあり、処理が同じ 部分に関しては、その 繰り返しになるので する。すなわち、 3 に 、
お て、 ンテン 、 27の ック と比較して、特徴 8 ズ i 82、 ズ 83、および 84が設けられ て る。
0317 8 は、 ンテン 57および
58に蓄積されて る、上記 報が分割さ れた ズに対応する対応 報を取得する。
0318 8 は、取得した ズに対応する対応 報を基に、 ( 4)を 用 て、 ズの ンテ との を示す を算出する。
8 は、 出した特徴 、その に対応する ズを特徴 ズ 82に供給する。また、特徴 8 は、文章 報が分割された ズを ズ 83に供給する。
03 9 ズ 82は、特徴 8 ら供給される特徴性の値に基 て、特徴 に対応する ズのな ら、特徴的な ズである特徴 ズを選択する。 ズ 82は、選択した特徴 ズを ズ
83に供給する。
0320 なお、特徴 ズ 82による、特徴 ズの 法であるが、特徴
8 により算出された特徴性の値が、所定の値を超える ズを特徴 ズとしたり、特徴性の値が大き 順に並 られた ズのな ら、上位 ズを特徴 ズとしたりすることができる。
0321 ズ 83は、特徴 ズ 82 ら供給される特徴
ズに基 て、特徴 8 ら供給される、文章 報が分割された ズの 、特徴 ズ 致する ズが強調されて表示 84に表示されるよ に表示を制御する。
0322 84は、 の 7に相当し、 ズ 83の 御にした が て、例えば、文章 報による文章などを表示する。
0323 次に、 32の チヤ トを参照して、 3 の ンテ による、 ズ 示の 理に て説明する。
0324 ステップS9 にお て、特徴 8 は、文章 報 ら り出された
ズに対応する対応 報に基 て、上述した式( 4)を用 て、 ズごとの を算出する。
0325 なお、以下の 明では、上述した 3 の に示すよ 、 ‥・ひたすら明る の曲が‥・ である文章 報 ら り出された、 ひたすら 、 る 、 、 、・‥である ズ、すなわち、ラベ "" およびが などの 除 対して、潜在 、 2に対する確率 布の ラメ タ( )であるP( )とP(z z2 )とが、 33のよ に求められ、それらの 報がうベ
58に蓄積されて るとして説明する。
0326 33は、 ズ(ラベ )の 間表現の例を示す図である。 33は、例え ば、 ズの 間表現、すなわち、条件付 P(z )による値の例を示 して る。
0327 33で示される例にお て、 目を示し、 にはうベ
54によ て 出された、 ンテ の ビ 文などの 報 ら り出さ れた ズが示され、 f 目には、 ズに関する2 の ( 、潜在 2)が示されて る。
0328 えば、ラベ 58にお ては、 33に示すよ に、潜在 の として、 ひたす (2 に対して ・4、 る (3 に 対して ・ 8、 (4 )に対して ・ 7、 (5 )に対して ・ 5が、それぞ 積されて る。
0329 すなわち、 ひたすら 、 る 、 、 、・‥である ズのそれぞれ が、潜在 z により、音楽 ンテン 対応 けられて る。
0330 また、同様に、ラベ 58にお ては、 33に示 すよ に、潜在 z2の として、 ひたす (2 )に対して ・ 6、 る 3 )に対して ・ 2、 (4 )に対して ・ 3、 (5 )に対して ・ 5が、そ れぞれ 積されて る。
0331 すなわち、 ひたすら 、 る 、 、 、・‥である ズのそれぞれ が、潜在 z2により、音楽 ンテン 対応 けられて る。
0332 また、 33に示すよ に、例えば、 る 、音楽 ンテン
容に密接に関係して る ズは、潜在 または潜在 2のどちら の 数に対応する条件付 P(z の値が大き なる。
0333 すなわち、特徴 8 は、例えば、 33に示される ズに対応する 対応 報を基に、 ( 4)を用 て、 34に示すよ 特徴 を算出する。
0334 34は、 ズ(ラベ )の 性の例を示す図である。
0335 34で示される例にお て、 ズを示し、2 特徴性の値を示し て る。
0336 えば、特徴 8 は、 34に示すよ に、 ひたす (2 )に対して
7 8、 る 3 )に対して ・ 859、 (4 )に対して ・ 8 6、 (5 T )に対して ・ 699である特徴性の値を、それぞれ 出する。
0337 32の チヤ トに戻り、ステップ 92にお て、特徴 ズ 82は、 文章 報 ら り出された ズのな ら、特徴 ズを選択する。
0338 えば、特徴 ズ 82は、 34に示すよ 、 ひたすら 、 る 、 、 、・‥のな ら、特徴性の値が ・ 8よりも大き 、 る および である ズを、特徴 ズとして選択する。
0339 言すれば、特徴 ズ 82は、確率 布の ラメ タ( )がより て る、 る および である ズを選択することで、 ンテン 容に密接に関係する ズを選択して るとも言える。 まり、 34の ズ の 性の例にお ては、 ( 699)、 ひたす ( 7 8)、 ( 8 6 )、 る ( 859)の順に、特徴性の値が大き な ており、例えば、 る や の 確率 布の ラメ タ( )がより て る ズの が 、より大き 特徴 を持 て る。
0340 なお、上述した例では、特徴性の値が ・ 8より大き ズを特徴 ズとした が、特徴 ズの 、上記のよ に特徴性の値が所定の を超える ズ 、特徴性の値が上位 o( の ズを、特徴 ズとして 選択してもよ 。
0341 32の チヤ トに戻り、ステップ 93にお て、 ズ 83は、 文章 報 ら り出された ズの 、特徴 ズ 一致する ズを強調 して表示 84に表示さ て、 ズ 示の 、終了する。
0342 えば、 ズ 83は、音楽 ンテン の ビ 文などの 報 ら り出された ズのな ら、特徴 ズ 82により選択された、 る および げである ズを強調して表示 84に表示さ る。 0343 35は、音楽 ンテン ビ 文などの 章を表示する表示 84の例を示 す図である。
0344 84にお ては、 35の に示すよ に、 ‥・ひたすら明る の 曲が‥・ である文章の 、特徴性の値の大き 、 る と である特徴 ズが他の文字よりも、文字の きさが大き なるよ に表示されて る。 0345 また、表示 84にお ては、 35の に示すよ に、特徴性の値の大き 、 る と である特徴 ズが他の文字と背景の 様が異なるよ に表示 されて る。
0346 これにより、 ンテン の 関連の ズが強調 示されるので、 ザは、その ンテン ビ 文などの 章を読むとき、その 示された ズを注目して むことができる。
0347 なお、上述した例では、特徴 ズの 字の きさを大き したり、背景の 様を 変える例に て説明したが、それに限らず、例えば、特徴 ズの色を変えても よ 。要は、特徴 ズの 示の 方を他の ズ 変えればよ のであ て、 その 段、方法は、任意である。
0348 また、 明にお ては、例えば、 ンテン などをクラスタ ングすることも 可能である。 えば、潜在 間 の けがなされた ンテン のクラス タ ングは、任意のクラスタ ングア ズムにより実行 能となる。また、このとき、 例えば、 ンテンツ とは、同一の 上に表現されて るので、 ンテン ま たは ごとのクラスタ ングに限らず、 ンテン とを同時にクラスタ ング して、それぞれのクラスタに ンテン とを混在さ ることも可能となる。
0349 これにより、例えば、 6の チヤ トにより 明した、 ンテン の 理 では、 ンテン の 理を個別に行わずに、同一のクラスタに入 て る ンテン とを、それに対する検索 果とみなすこともできる。その 果、 、 速に所望の ンテン 取得することができる。
0350 また、上述した例にお ては、 ンテン は、学習 で行われる 理と、運用 で行われる 理の 方を行 として説明したが、学習 運 用 の 理を別 の 置により にしてもよ 。 下、図36および 37 を参照して、学習 運用 の 理を別 に 、 ンテン
に て説明する。
0351 36は、学習 の 理を行 、 ンテン の 能的 を示す 機能 ック図である。
0352 36では、 2 同様の 所には、同一の 号が付してありその 省略する。
すなわち、 36の ンテン は、学習 の 理を行 、 ンテンツ 5 、 ンテン 52、 ンテン 53、ラベ
54、ラベ 55、対応 56、 ンテン
57、および ベ 58を含むよ にして構成される。
0353 36の ンテン は、例えば、 3の 習の 理を行 ことにより、 ン テン 5 に蓄積されて る ンテン ンテン とうベ 報との 報を算出し、 出した対応 報を、 ンテンツ
57および ベ 58のそれぞれに蓄積する。 0354 すなわち、 36の ンテン は、運用 の 理を〒 機器( え ば、後述する 37のクライアント 2 に対して、自分が 積して るデ タを提供することになる。
0355 方、図37は、運用 の 理を行 、クライアント 2 の 能的 を示す機能 ック図である。
0356 37では、 2 同様の 所には、同一の 号が付してありその 省略する。
すなわち、 37のクライアント 2 は、 ンテンツ 52、 ンテ ン 59、ラベ 6 、潜在 間距 離 6 、ラベ 62、および ンテンツ 63を含むよ にして構成さ れる。クライアント 2 は、 明の 報処理装置の 例である。
0357 クライアント 2 は、例えば、 4のうベ 与の 理を〒 ことにより、 新規に追加する ンテンツに対してう を付与する。このとき、クライアント
2 は、例えば、 36の ンテンツ ら、ラベ 与の 理に必要とな るデ タを取得して処理を〒 ことになる。
0358 また、クライアント 2 は、例えば、 6の ンテン の 理を〒 こ 、
とにより、 36の ンテン が 積して る ンテン 取得する。このと き、クライアント 2 は、例えば、 36の ンテン ら、 ンテ ン の 理に必要となるデ タを取得して処理を〒 ことになる。
0359 このよ に、 明では、学習 運用 の 理を別 の 置で行 こ とができる。
0360 なお、クライアント 2 は、例えば、運用 の 理の ち、 4のう 与の 理のみを〒 よ にしてもよ し、また、 6の ンテン の 理 のみを〒 よ にしてもよ 。
0361 また、 27 35を参照して説明した 理の ち、 27 3 を参照して説 明した学習 の 理を、 36の ンテン が行 て、 3
35を参照して説明した運用 の 理を、 37のクライアント 2 が 行 よ にしてもよ 。
0362 上のよ に、 明によれば、 ンテン 対して最適なキ ワ ドを付与すること ができる
0363 また、 明によれば、 ンテン とうベ 報のそれぞれの 布の 徴を 反映した 間により、ラベ を持たな ンテン 対しても、その ンテン 対してう を付与したり、または ンテン 検索することができる。 0364 さらに、 明によれば、 ンテン やうベ 報の他に、 験に 間により、従来手法では発見することのできな た相互の を発見す ることができ、例えば、 ンテンツを推薦する ステムなどに適用することができる。 0365 なお、本実施の 態では、対応 、 ンテ とを対応 けるための 報、すなわち、具体的には、例えば、 ( ベクト )、S ( ) ( z )などであるとして説明したが、これらは、 ンテ 、ラベ 報、潜在 数のそれぞれの 布の 質を表わす( 布の) ラメ タで あるとも言える。 まり、対応 56は、対応 報として、これらの ラメ タ を算出して る。
0366 また、 ンテ 、ラベ 報、 ンテクスト 報、 、それぞれ、 ンテ 52、ラベ 54、 ンテクスト 、
5 が 出するとして説明したが、それらは、 ンテ に より 出されるのではな 、例えば、外部の他の機器や、 ザによ て付与するよ にしてもよ 。
0367 さらにまた、上述した例にお ては、説明を分 り するために、 を減らして 曲で説明して るが、実際には、数千曲 位で行 のが望まし 、 が増えた場 合でも、同様に処理が行われる。
0368 述した一連の 、 ドウ アにより実行さ ることもできるが、ソ トウ ア により実行さ ることもできる。 連の 理をソ トウ アにより実行さ る場合には、 そのソ トウ アを構成するプ グラムが、専用の ドウ アに組み込まれて る ンピ タ、または、各種のプ グラムをインスト することで、各種の 能を実行 することが可能な、例えば 用の ソナ ンピ などに、記録 体 らインス ト される。 0369 この 、 ンピ とは別に、 ザにプ グラムを提供するために配布 される、プ グラムが記録されて る ディスク( キ ディス を含む)、 ディスク(C O (Co ac sc ead O e o ) ( a e sa e s ))を含む)、光磁気ディスク( ( sc)( )を含 む)、若し は半導体メ りなどよりなる の メディア2 により 成され るだけでな 、 ンピ に み込まれた状態で ザに提供される、プ グラ ムが記録されて る の O 2 記録 8などで構成される。
0370 また、上述した一連の 理を実行さ るプ グラムは、必要に応じて タ、 デム などのインタ を介して、 カ アネットワ ク、インタ ネット、デジタ 星放送と た、有線または無線の 体を介して ンピ にインスト されるよ にしてもよ 。
0371 なお、本明細書にお て、記録 体に 納されるプ グラムを記述するステップは 、記載された 沿 て に行われる はもちろん、必ずしも に処理されな とも、並列 ある は個別に実行される 理をも含むものである。 0372 また、本明細書にお て、 ステムとは、複数の 置により 成される装置 体を 表すものである。
0373 なお、 明の 施の 、上述した実施の 態に限定されるものではな 、 明の 旨を逸脱しな 範囲にお て の 更が可能である。

Claims

求の
ンテ に関係する特徴 前記 ンテ の 性を示す 性情報とに共通する の 数、前記 、および 性情報のそれぞれの 布の 質 を表わす の ラメ タを算出する の 段と、
出された前記 の ラメ タを蓄積する 段と
を備える情報処理装置。
2 を抽出する の 段と、
前記 性情報を抽出する 2の 段と
をさらに備え、
前記 の 、抽出された前記 、抽出された前記 性情報と ら 、前記 の ラメ タを算出する
の 報処理装置。
3 2の 、 自然 語によ て記述された文章を、単語または前記 語のまとまりである ズに分割する
2の 報処理装置。
4 出された前記 の ラメ タに基 て、前記 ズの との
を示す を算出する 2の 段と、
出された前記 に基 て、前記 ズの 示を制御する表示 御手段 をさらに備える 3の 報処理装置。
5 の 、前記 、前記 性情報、または による前記 ンテ の 用に関する情報を示す利用情報のそれぞれに共通する 2の 数、前記 、および 性情報のそれぞれの 布の 質を表わす 2 の ラメ タを算出し、 前記 、 出された前記 2の ラメ タを蓄積 する
の 報処理装置。
6 用情報を抽出する 段をさらに備え、
前記 の 、前記 、前記 性情報、または 出された前記 報 ら、前記 2の ラメ タを算出する
5の 報処理装置。
7 の 、前記 、前記 性情報、または前記 ンテ に対 する ザの に関する情報を示す 報のそれぞれに共通する 3の 数、前記 、および 性情報のそれぞれの 布の 質を表わす 3の ラメ タを算出し、
前記 、 出された前記 3の ラメ タを蓄積する
の 報処理装置。
8 報を抽出する 段をさらに備え、
前記 の 、前記 、前記 性情報、または 出された前記 報 ら、前記 3の ラメ タを算出する
7の 報処理装置。
9 ンテ に関係する特徴 前記 ンテ の 性を示す 性情報とに共通する 潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わ す ラメ タを算出する ステップ 、
出された前記 ラメ タを蓄積する ステップと
を含む情報処理方法。
0 ンテ に関係する特徴 前記 ンテ の 性を示す 性情報に共通する 潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わ す ラメ タを算出する ステップ 、
出された前記 ラメ タを蓄積する ステップ
を ンピ に実行さ るプ グラム。
ンテ に関係する特徴 を抽出する 段と、
前記 前記 ン の 性を示す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された前記 が潜在 間に配置されるよ に変換する変換手段と
前記 間中に変換された前記 、前記 数により前記 に対 して 在的に結び付 て る前記 性情報との 離を算出する 段と、 出された前記 離に基 て、前記 ンテン 対応する 性を選択する選択 段と
を備える情報処理装置。
2 、前記 ンテン 対応する 性として、 出された前記 離が所 定の 以下となる 性 、または前記 離の さが上位となる所定の 数の 性 を選択する の 報処理装置。
3 ンテン 関係する特徴 を抽出する ステップ 、
前記 前記 ンテン 性を示す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された前記 が潜在 間に配置されるよ に変換する変換ステッ プ 、
前記 間中に変換された前記 、前記 数により前記 に対 して 在的に結び付 て る前記 性情報との 離を算出する ステップ 、 出された前記 離に基 て、前記 ンテン 対応する 性を選択する選択 ステップと
を含む情報処理方法。
4 ンテン 関係する特徴 を抽出する ステップ 、
前記 前記 ンテン 性を示す 性情報に共通する潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わす ラメ タに基 て、抽出された前記 が潜在 間に配置されるよ に変換する変換ステッ プ 、
前記 間中に変換された前記 、前記 数により前記 に対 して 在的に結び付 て る前記 性情報との 離を算出する ステップ 、 出された前記 離に基 て、前記 ンテン 対応する 性を選択する選択 ステップ
を ンピ に実行さ るプ グラム。
5 ンテン 関係する特徴 前記 ンテン 性を示す 性情報に共通する 数、前記 、および 性情報のそれぞれの 布の 質を表わ す ラメ タに基 て、前記 性情報が潜在 間に配置されるよ に変換する変 換手段と、
前記 間中に変換された前記 性情報と、前記 数により前記 性情 報に対して 在的に結び付 て る前記 との 離を算出する 段と、 出された前記 離に基 て、前記 性情報に対応する ンテンツを選択する 選択 段と
を備える情報処理装置。
6 、前記 性情報に対応する ンテ として、 出された前記 離が所定の 以下となる ンテ 、または前記 離の さが上位となる所定の 数の ンテ を選択する
5の 報処理装置。
7 ンテ に関係する特徴 前記 ンテ の 性を示す 性情報に共通する 潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わ す ラメ タに基 て、前記 性情報が潜在 間に配置されるよ に変換する変 換ステップ 、
前記 間中に変換された前記 性情報と、前記 数により前記 性情 報に対して 在的に結び付 て る前記 との 離を算出する ステップ 出された前記 離に基 て、前記 性情報に対応する ンテンツを選択する 選択ステップと
を含む情報処理方法。
8 ンテ に関係する特徴 前記 ンテ の 性を示す 性情報に共通する 潜在 数、前記 、および 性情報のそれぞれの 布の 質を表わ す ラメ タに基 て、前記 性情報が潜在 間に配置されるよ に変換する変 換ステップ 、
前記 間中に変換された前記 性情報と、前記 数により前記 性情 報に対して 在的に結び付 て る前記 との 離を算出する ステップ 出された前記 離に基づ て、前記 性情報に対応する ンテンツを選択する 選択ステップ
を ンピ に実行さ るプ グラム。
PCT/JP2006/324157 2005-12-05 2006-12-04 情報処理装置および方法、並びにプログラム WO2007066607A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP06823564A EP1959358A4 (en) 2005-12-05 2006-12-04 APPARATUS, METHOD AND PROGRAM FOR INFORMATION PROCESSING
US11/815,538 US8478781B2 (en) 2005-12-05 2006-12-04 Information processing apparatus, information processing method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005350824 2005-12-05
JP2005-350824 2005-12-05

Publications (1)

Publication Number Publication Date
WO2007066607A1 true WO2007066607A1 (ja) 2007-06-14

Family

ID=38122753

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/324157 WO2007066607A1 (ja) 2005-12-05 2006-12-04 情報処理装置および方法、並びにプログラム

Country Status (4)

Country Link
US (1) US8478781B2 (ja)
EP (1) EP1959358A4 (ja)
CN (1) CN101116073A (ja)
WO (1) WO2007066607A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010262436A (ja) * 2009-05-01 2010-11-18 Sony Corp 情報処理装置および方法、並びにプログラム
JP2011108192A (ja) * 2009-11-20 2011-06-02 Denso It Laboratory Inc マルチメディア分類システム及びマルチメディア検索システム
JP2011248829A (ja) * 2010-05-31 2011-12-08 Sony Corp 評価予測装置、評価予測方法、及びプログラム
JP2012108738A (ja) * 2010-11-17 2012-06-07 Sony Corp 情報処理装置、潜在特徴量算出方法、及びプログラム
JP5533880B2 (ja) * 2009-10-26 2014-06-25 日本電気株式会社 コンテンツ推薦システム、推薦方法及び推薦プログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101316259B (zh) * 2007-05-30 2012-03-21 华为技术有限公司 内容过滤的方法、装置及系统
EP2083416A1 (en) * 2008-01-23 2009-07-29 Sony Corporation Method for deriving animation parameters and animation display device
CN102262659B (zh) * 2011-07-15 2013-08-21 北京航空航天大学 一种基于内容计算的音频标签传播方法
JP5596649B2 (ja) 2011-09-26 2014-09-24 株式会社東芝 文書マークアップ支援装置、方法、及びプログラム
JP6590477B2 (ja) * 2014-11-28 2019-10-16 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
TWI640877B (zh) * 2017-06-14 2018-11-11 財團法人資訊工業策進會 語意分析裝置、方法及其電腦程式產品
CN112052882B (zh) * 2020-08-14 2023-08-22 北京师范大学 磁共振脑结构影像的分类模型构建、分类与可视化方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3530996B2 (ja) 1997-09-22 2004-05-24 ミノルタ株式会社 情報処理装置
JP3674430B2 (ja) 1999-12-20 2005-07-20 日本ビクター株式会社 情報提供サーバ及び情報提供方法
JP3654850B2 (ja) 2000-05-17 2005-06-02 松下電器産業株式会社 情報検索システム
US6687696B2 (en) 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
JP2006048288A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048289A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048286A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048287A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AKO S. AND KAMIWASHI T.: "D-4-1 Junjoretsu kara no Gakushu", THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, 2002, pages 37, XP008097835 *
IDE I. ET AL.: "Gengo Joho o Tomonau Gazo no Gazoteki Tokuchoryo o Gogi no Tokeiteki Taiotsuke", INFORMATION PROCESSING SOCIETY OF JAPAN KENKYU HOKOKU, vol. 99, no. 3, 1999, pages 137 - 143, XP003011791 *
KITA K., TSUDA K., SHISHIBORI M.: "Joho Kensaku Algorithm", SHOHAN, KYORITSU SHUPPAN CO. LTD., 2002, pages 79 - 80, XP008097921 *
See also references of EP1959358A4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010262436A (ja) * 2009-05-01 2010-11-18 Sony Corp 情報処理装置および方法、並びにプログラム
US9973815B2 (en) 2009-05-01 2018-05-15 Sony Corporation Apparatus, method, and program for processing information
JP5533880B2 (ja) * 2009-10-26 2014-06-25 日本電気株式会社 コンテンツ推薦システム、推薦方法及び推薦プログラム
JP2011108192A (ja) * 2009-11-20 2011-06-02 Denso It Laboratory Inc マルチメディア分類システム及びマルチメディア検索システム
JP2011248829A (ja) * 2010-05-31 2011-12-08 Sony Corp 評価予測装置、評価予測方法、及びプログラム
JP2012108738A (ja) * 2010-11-17 2012-06-07 Sony Corp 情報処理装置、潜在特徴量算出方法、及びプログラム

Also Published As

Publication number Publication date
EP1959358A1 (en) 2008-08-20
CN101116073A (zh) 2008-01-30
EP1959358A4 (en) 2010-04-07
US8478781B2 (en) 2013-07-02
US20090106195A1 (en) 2009-04-23

Similar Documents

Publication Publication Date Title
WO2007066607A1 (ja) 情報処理装置および方法、並びにプログラム
US7624093B2 (en) Method and system for automatic summarization and digest of celebrity news
US7310601B2 (en) Speech recognition apparatus and speech recognition method
JP5662961B2 (ja) レビュー処理方法およびシステム
US8325189B2 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
US20030172349A1 (en) Apparatus and method for evaluating web pages
US8332208B2 (en) Information processing apparatus, information processing method, and program
JP2005165632A (ja) 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
Van Hooland et al. Between commodification and engagement: On the double-edged impact of user-generated metadata within the cultural heritage sector
Chetail et al. What can megastudies tell us about the orthographic structure of English words?
JP5442401B2 (ja) 行動情報抽出システム及び抽出方法
US11714963B2 (en) Content modification using natural language processing to include features of interest to various groups
US11334715B2 (en) Topic-identifying information processing device, topic-identifying information processing method, and topic-identifying computer program product
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
JP2019211974A (ja) 企業分析装置
Spolaôr et al. A video indexing and retrieval computational prototype based on transcribed speech
KR102028356B1 (ko) 코멘트 기반의 광고 추천 장치 및 방법
JP5478146B2 (ja) 番組検索装置および番組検索プログラム
JP2011180901A (ja) 経験情報の再利用性評価装置及び方法及びプログラム
WO2016190063A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
JP2014049044A (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
JP7375096B2 (ja) 分散表現生成システム、分散表現生成方法及び分散表現生成プログラム
Francombe et al. Automatic text clustering for audio attribute elicitation experiment responses
KR20230013287A (ko) 텍스트 음성 합성 시 텍스트 분석을 통한 사용자 맞춤 광고 제공 시스템 및 방법

Legal Events

Date Code Title Description
REEP Request for entry into the european phase

Ref document number: 2006823564

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2006823564

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 200680004028.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 11815538

Country of ref document: US