WO2020179525A1 - モデル学習装置、ラベル推定装置、それらの方法、およびプログラム - Google Patents

モデル学習装置、ラベル推定装置、それらの方法、およびプログラム Download PDF

Info

Publication number
WO2020179525A1
WO2020179525A1 PCT/JP2020/007287 JP2020007287W WO2020179525A1 WO 2020179525 A1 WO2020179525 A1 WO 2020179525A1 JP 2020007287 W JP2020007287 W JP 2020007287W WO 2020179525 A1 WO2020179525 A1 WO 2020179525A1
Authority
WO
WIPO (PCT)
Prior art keywords
label
data
learning
model
feature data
Prior art date
Application number
PCT/JP2020/007287
Other languages
English (en)
French (fr)
Inventor
歩相名 神山
厚志 安藤
哲 小橋川
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/437,017 priority Critical patent/US20220180188A1/en
Publication of WO2020179525A1 publication Critical patent/WO2020179525A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Definitions

  • the present invention relates to model learning and label estimation.
  • Non-patent document 1 In the test to improve conversation skills by evaluating impressions of telephone voice (Non-patent document 1) and good pronunciation and fluency of foreign language (Non-patent document 2), a quantitative impression on the voice was obtained. A value (for example, a five-level rating from “good” to “bad”, a five-level rating from “high” to “low”, and a five-level rating from "high” to “low” naturalness) is given. It
  • a label for example, an impression value
  • data for example, voice data
  • a learning process in which a set of data and a label given to the data is used as learning data is used. Then, a model for estimating the label for the input data may be generated.
  • multiple evaluators In order to learn a model that estimates a label that averages the values of labels by multiple evaluators, multiple evaluators give labels to the same data and label them by averaging those values.
  • the set with the data may be used as training data.
  • Evaluators include those with high evaluation ability and those who are not.
  • the number of evaluators per data is large, even if the evaluators with low evaluation ability are mixed, the label of the learning data is corrected to some extent by the label given by the evaluator with high evaluation ability.
  • the label error of the learning data becomes large due to the lack of the evaluator's evaluation ability, and it may not be possible to learn a model for estimating a highly accurate label.
  • the present invention has been made in view of such a point, and it is possible to learn a model that can perform label estimation with high accuracy even when using learning data with a small number of evaluators per data. It is to provide the technology.
  • the learning data including the learning feature data and the label data representing the label given to the learning feature data by the evaluator is input, and the label estimation model for estimating the probability distribution of the labels given to the feature data is used as the feature data.
  • Update the ability data and label estimation model to update the ability data so that the error value that represents the error of the estimated observation label probability value, which is the weighted sum of the estimated label probability values from the data, with respect to the label represented by the label data, becomes small. Obtain an update label estimation model.
  • the learning data with a small number of evaluators per data is used. Even if there is, it is possible to learn a model capable of performing label estimation with high accuracy.
  • FIG. 1 is a block diagram illustrating a functional configuration of the model learning device of the first embodiment.
  • FIG. 2 is a diagram illustrating the configuration of the learning label data.
  • FIG. 3 is a diagram illustrating the structure of the evaluator ability data.
  • FIG. 4 is a diagram illustrating the structure of learning feature data.
  • FIG. 5 is a flow chart for explaining the model learning method of the first embodiment.
  • FIG. 6 is a block diagram illustrating the functional configuration of the label estimation device of the first and second embodiments.
  • FIG. 7 is a block diagram illustrating the functional configuration of the model learning device of the second embodiment.
  • FIG. 8 is a diagram illustrating the neural network of the second embodiment.
  • FIG. 9 is a flow chart for explaining the model learning method of the second embodiment.
  • the model learning device 1 of the present embodiment has a learning label data storage unit 111, a learning feature data storage unit 112, an ability data storage unit 113, an evaluation label estimation unit 114, and an observation label estimation unit. 115, an error evaluation unit 116, an ability learning unit 117, an estimation model learning unit 118, and a control unit 119.
  • the ability data storage unit 113, the evaluation label estimation unit 114, the observation label estimation unit 115, the error evaluation unit 116, the ability learning unit 117, the estimation model learning unit 118, and the control unit 119 correspond to the update unit.
  • the label estimation device 12 of this embodiment includes a model storage unit 131 and an estimation unit 122.
  • the learning label data is stored in the learning label data storage unit 111, the learning feature data is stored in the learning feature data storage unit 112, and the ability data is the ability data. It is stored in the storage unit 113.
  • the learning label data includes label data representing the value of the label given to each of the plurality of learning feature data by each of the plurality of evaluators (label data representing the label given to the learning feature data by the evaluator).
  • the label is attached to the learning feature data by the evaluator who perceives "human perceptible information (for example, voice, music, text, image, video, etc.)" corresponding to the learning feature data. This is the correct label given.
  • the value of the label may be a numerical value or may be an alphabet or other symbol.
  • the label is a numerical value (for example, a numerical value representing an impression) representing an evaluation result given by evaluating the information by an evaluator who perceives "information perceptible by humans" corresponding to the learning feature data.
  • the learning feature data is the learning feature data.
  • the feature data may be data representing human-perceptible information (for example, voice data, music data, text data, image data, moving image data, etc.), and such human-perceptible information features may be used. It may be representative data (for example, feature amount data).
  • the ability data is data representing the probability that each of a plurality of evaluators gives a correct label and the probability that an incorrect label is given to the feature data.
  • the capability data may be a set of numerical values, alphabets or other symbols, or may be a function such as a probability density function.
  • FIG. 2 shows an example of learning label data
  • FIG. 3 shows an example of learning feature data
  • FIG. 4 shows an example of ability data.
  • these are examples and do not limit the present invention.
  • the learning label data illustrated in FIG. 2 includes a label data number i, an evaluator number k(i), and label data y(i).
  • the evaluator number k(i) and the label data y(i) are associated with the label data number i.
  • the label data number i ⁇ ⁇ 1, ..., I ⁇ is a pair of each learning feature data and the evaluator who gave the label (that is, each learning feature data and the evaluator who evaluated it).
  • a number that identifies a pair A single evaluator may give a label to one learning feature data set, or a plurality of evaluators may give a label to the same learning feature data set.
  • the label data y (i) ⁇ ⁇ 1, ..., C ⁇ represents a label given to the learning feature data x (i) corresponding to the label data number i by the evaluator corresponding to the label data number i.
  • C is an integer greater than or equal to 2.
  • Example of feature data for learning The learning feature data x(i) corresponding to the label data numbers i ⁇ 1,..., I ⁇ illustrated in FIG. 3 are associated with the corresponding label data numbers i ⁇ 1,..., I ⁇ . ing.
  • the learning feature data x(i) illustrated in FIG. 3 is, for example, a voice signal or a feature amount such as a vector having a feature extracted from the voice signal as an element.
  • the same learning feature data may be labeled by two or more evaluators. In such a case, exactly the same learning feature data are identified by different label data numbers i.
  • the capability data a(k, c, c′) illustrated in FIG. 4 is a label in which the evaluator with the evaluator number k ⁇ 1,..., K ⁇ is represented by label data c ⁇ 1,..., C ⁇ . It represents the probability of assigning the label represented by the label data c' ⁇ ⁇ 1, ..., C ⁇ to the feature data of.
  • the ability data a (k, c, c') is the label data c' ⁇ ⁇ 1 when the evaluator corresponding to the evaluator number k evaluates the feature data of the label represented by the label data c.
  • C ⁇ represents the probability of giving a label.
  • the label data c represents the correct label of the feature data
  • the label data c' represents the label given to the feature data by the evaluator
  • the ability data a (k, c, c') for c c'is evaluated.
  • the evaluator of the person number k (i) represents the probability of giving the correct label represented by the label data c
  • the ability data a (k, c, c') for c ⁇ c' is the evaluator number k (i). Represents the probability that an evaluator will give the wrong label represented by the label data c'.
  • the ability data a(k, c, c′) is associated.
  • the ability data a(k,c,c') in the example of FIG. 4 is 0 or more and 1 or less so that a(k,c,1)+...+a(k,c,C) becomes 1. Normalized to a range.
  • the initial value of the ability data a (k, c, c') may be set at random, or a test is conducted in which each evaluator tests whether or not the characteristic data can be given the correct label, and based on the result. May be set to. For example, in this test, a plurality of evaluators evaluate the same feature data and give a label to the feature data, and a label given by another evaluator who has evaluated the same feature data is a correct label.
  • the initial value of the capacity data a(k, c, c') may be set as it is.
  • the evaluator with the evaluator number k(i) ⁇ k′ other than the evaluator number k′ ⁇ 1,...,K ⁇ is the label.
  • the set of label data number i with It is written as.
  • the evaluator who evaluates the feature data has an evaluator with a label corresponding to the label data c′ and has a set of label data numbers i. It is written as.
  • the initial value of the capability data a(k,c,c') may be set as follows.
  • the update unit inputs learning data including learning feature data x (i) and label data y (i) representing a label given to the learning feature data by the evaluator. Then, the estimated label probability value h (i, c) obtained by applying the label estimation model ⁇ for estimating the probability distribution of the label given to the feature data to the learning feature data x (i) which is the feature data, and Ability data a (k, c, c') obtained from ability data a (k, c, c') representing the probability that the evaluator will give the correct label to the feature data and the probability of giving the wrong label.
  • the update capability data obtained by updating the capability data a(k, c, c′) and the updated label estimation model ⁇ obtained by updating the label estimation model ⁇ are obtained.
  • Step S114 ⁇ Process of Evaluation Label Estimating Unit 114 (Step S114)>>>
  • the label estimation model ⁇ output from the estimation model learning unit 118 and the learning feature data x(i) extracted from the learning feature data storage unit 112 are input to the evaluation label estimation unit 114.
  • Examples of the label estimation model ⁇ include a neural network, a hidden Markov model, and a support vector machine.
  • the initial value of the label estimation model ⁇ may be any value.
  • the evaluation label estimation unit 114 applies the label estimation model ⁇ to the learning feature data x(i) to estimate label probability values h(i,c) (where i ⁇ 1,..., I ⁇ , c ⁇ 1). , ..., C ⁇ ) and output.
  • the estimated label probability value h(i,c) represents the probability that the label data of the correct label of the learning feature data x(i) corresponding to the label data number i is c. That is, the estimated label probability value h(i,c) exemplified in the present embodiment is a probability distribution p(c
  • x (i), ⁇ ) is a probability distribution in which the label data of the correct label corresponding to the learning feature data x (i) is c ⁇ ⁇ 1, ..., C ⁇ in the label estimation model ⁇ . is there.
  • the observation label estimation unit 115 includes the estimated label probability value h (i, c) obtained in step S114, the evaluator number k (i) extracted from the learning label data storage unit 111, and the ability data storage unit 113.
  • the ability data a (k, c, c') extracted from is input.
  • the observation label estimation unit 115 uses the input estimated label probability value h (i, c), the evaluator number k (i), and the ability data a (k, c, c') to estimate the observation label probability value y ⁇ ( i, c') is obtained and output.
  • the estimated observation label probability value y ⁇ (i, c') is the weighted sum of the estimated label probability values h (i, c) based on the ability data a (k (i), c, c'). ..
  • the ability data a(k(i), c, c′) is obtained when the evaluator corresponding to the evaluator number k(i) evaluates the characteristic data of the label represented by the label data c. It represents the probability of assigning the label represented by the label data c' ⁇ ⁇ 1, ..., C ⁇ .
  • the probability that a label corresponding to the label data c′ is given to the learning feature data x(i) is reproduced from both aspects of the probability (probability of c ⁇ c′).
  • the observation label estimation unit 115 obtains and outputs the estimated observation label probability value y ⁇ (i, c') as follows. As shown in this equation, the upper right subscript " ⁇ " of "y ⁇ (i, c')" should be written directly above "y", but due to the limitation of the description notation, "y" May be listed in the upper right corner of.
  • step S116 Processing of error evaluation unit 116 (step S116) >> The estimated observation label probability value y ⁇ (i, c') obtained by the observation label estimation unit 115 and the label data y (i) extracted from the learning label data storage unit 111 are input to the error evaluation unit 116. It The error evaluation unit 116 obtains and outputs an error value L(i) representing the error of the estimated observed label probability value y ⁇ (i,c') with respect to the label represented by the label data y(i). The error value L(i) represents the deviation of the estimated observed label probability value y ⁇ (i,c') from the label represented by the label data y(i).
  • the error evaluation unit 116 between the label data y (i) and the estimated observed label probability value y ⁇ (i, c') based on the Categorical Cross-Entropy, which is an error value frequently used in class identification. Is evaluated to obtain an error value L(i) and output. For example, the error evaluation unit 116 calculates the error value L(i) according to the following. However, the following is satisfied.
  • Step S117 Processing of Ability Learning Unit 117
  • the estimated label probability value h(i,c) obtained in step S114, the estimated observed label probability value y ⁇ (i,c') obtained in step S115, and the estimated label probability value y ⁇ (i,c') obtained in step S116 are obtained.
  • the error value L (i), the evaluator number k (i) extracted from the learning label data storage unit 111, and the ability data a (k, c, c') extracted from the ability data storage unit 113 are input.
  • the ability learning unit 117 updates the ability data a(k, c, c′) using these to obtain the updated ability data a′(k, c, c′).
  • the ability learning unit 117 updates the ability data a (k, c, c') so that the error value L (i) becomes small, and obtains the update ability data a (k, c, c'). For example, the ability learning unit 117 first updates a(k, c, c′) as follows for all c ⁇ 1,..., C ⁇ . However, the following is satisfied. Further, ⁇ is a preset learning rate parameter. ⁇ is a positive real number, and when this processing is performed by the neural network, for example, a value of 0.01 or less is set as ⁇ .
  • the ability learning unit 117 After updating a (k, c, c') as described above for all c ⁇ ⁇ 1, ..., C ⁇ , the ability learning unit 117 will, for example, all c, c " ⁇ ⁇ 1, ..., C ⁇ is normalized so that a(k, c, c′′) becomes a probability value as follows, and update capability data a(k, c, c′′) is obtained.
  • the obtained update capability data a(k, c, c′′) is stored in the capability data storage unit 113 as new capability data a(k, c, c′′).
  • Step S118a ⁇ Process of Estimated Model Learning Unit 118 (Step S118a)>>>> The estimation model learning unit 118 is extracted from the estimated observation label probability value y ⁇ (i, c') obtained in step S115, the error value L (i) obtained in step S116, and the learning label data storage unit 111.
  • the evaluated evaluator number k(i) and the ability data a(k, c, c') updated in step S117 extracted from the ability data storage unit 113 are input.
  • the estimation model learning unit 118 uses these to obtain and output an updated label estimation model ⁇ that is an updated label estimation model ⁇ .
  • the estimation model learning unit 118 updates the label estimation model ⁇ so that the error value L (i) becomes small, and obtains the updated label estimation model ⁇ . For example, the estimation model learning unit 118 updates the parameters of the update label estimation model ⁇ so that the error value L (i) becomes smaller based on the following gradient.
  • the estimation model learning unit 118 updates the parameters of the label estimation model ⁇ based on the above gradient, for example, by the gradient descent method.
  • the estimation model learning unit 118 may update the parameters by obtaining the gradient of the parameter update based on the above gradient.
  • the updated label estimation model ⁇ obtained as described above is sent to the evaluation label estimation unit 114 as a new label estimation model ⁇ .
  • Step S119 ⁇ Process of Control Unit 119 (Step S119)>> The control unit 119 determines whether or not the end condition is satisfied.
  • the end conditions are not limited, but for example, the amount of change in the parameters of the label estimation model ⁇ before and after step S118a is less than or equal to a predetermined value (the parameters of the label estimation model ⁇ have sufficiently converged), and the label estimation.
  • the end condition can be that the update of the parameters of the model ⁇ has been executed a predetermined number of times. When it is determined that the ending condition is not satisfied, the process returns to step S114.
  • the update capacity data updated in step S117 is designated as new capacity data a (k, c, c')
  • the updated label estimation model updated in step S118a is designated as a new label estimation model ⁇
  • the subsequent steps S114 and subsequent steps is repeated again.
  • Step S118b ⁇ Process of Estimated Model Learning Unit 118 (Step S118b)>>
  • the estimation model learning unit 118 when it is determined in step S119 that the termination condition is satisfied, the estimation model learning unit 118 finally specifies the label estimation model ⁇ obtained in step S118a (to specify the updated label estimation model ⁇ . Information) is output.
  • the estimation model learning unit 118 may output a parameter (information for identifying the label estimation model ⁇ ) for identifying the label estimation model ⁇ before being finally updated in step S118a.
  • the parameters specifying the label estimation model ⁇ output from the model learning device 11 as described above are stored in the model storage unit 121 of the label estimation device 12 (FIG. 6).
  • the input feature data x of the same type as the above-mentioned learning feature data x(i) is input to the estimation unit 122.
  • the estimation unit 122 reads information that specifies the label estimation model ⁇ from the model storage unit 121, applies the input feature data x to the label estimation model ⁇ , estimates the label y for the input feature data x, and outputs the label y.
  • the estimation unit 122 may output a label y for the input feature data x, may output a plurality of labels y and their probabilities, or may output a plurality of labels y in descending order of probability. Good.
  • the second embodiment includes the ability data storage unit 113, the evaluation label estimation unit 114, the observation label estimation unit 115, the error evaluation unit 116, the ability learning unit 117, the estimation model learning unit 118, and the control unit 119 of the first embodiment.
  • the function of the updating unit including the above is implemented by one neural network.
  • differences from the first embodiment will be mainly described, and the same reference numerals will be used for the items described so far to simplify the description.
  • the model learning device 21 of the present embodiment includes a learning label data storage unit 111, a learning feature data storage unit 112, a loss function calculation unit 211, a parameter update unit 218, and a control unit 219.
  • the loss function calculation unit 211, the parameter updating unit 218, and the control unit 219 correspond to the updating unit.
  • the same label estimation device 12 as in the first embodiment is used.
  • the learning label data is stored in the learning label data storage unit 111
  • the learning feature data is stored in the learning feature data storage unit 112.
  • the difference from the first embodiment is that the ability data is stored in the ability data storage unit 113 in the pre-processing of the first embodiment, but this processing is not performed in the pre-processing of the present embodiment. Others are the same as the pretreatment of the first embodiment.
  • the first node N (1) single or multiple nodes, which is a normal neural network that functions as a label estimation model ⁇ , and the evaluator number k (i) are input to perform conversion by an embedded layer (Embedding layer) or the like.
  • the second node N (2) (single or plural nodes) that outputs the ability data a (k (i), c, c'), the estimated label probability value h (i, c), and the ability data a (k). (I), c, c') as input, conversion based on probability calculation
  • the error value is a loss function for the neural network including the third node N (3) (single or plural nodes) that outputs the estimated observation label probability value y ⁇ (i, c') obtained by performing the above.
  • the label estimation model ⁇ or the update label estimation model ⁇ obtained by performing the training process described above until a predetermined end condition is satisfied is output.
  • n is an integer of 1 or more, and k(i) ⁇ 1,...,K ⁇ , i ⁇ 1,...,I ⁇ , y(i) ⁇ 1,...,C ⁇ ,c ⁇ 1,..., C ⁇ , c′ ⁇ 1,..., C ⁇ .
  • Step S211 Processing of Loss Function Calculation Unit 211
  • the loss function calculation unit 211 inputs the learning feature data x (i) extracted from the learning feature data storage unit 112 into the first node N (1), and the evaluator number extracted from the learning label data storage unit 111.
  • the estimated observation label probability value y ⁇ (i, c') output from the third node N (3) by inputting k (i) to the second node N (2), and the learning label data storage unit 111.
  • the error value L(i) is obtained as described in step S116 of the first embodiment and is output as the loss function L(i).
  • the parameter update unit 218 takes the loss function L (i) obtained in step S211 as an input, and performs learning processing using the loss function L (i) to perform the first node N (1) and the second of the above-mentioned neural network.
  • the parameter (eg, at least one of the weight and the activation function) of the node N(2) is updated.
  • the parameter updating unit 218 updates the parameters of the first node N(1) and the second node N(2) so that the loss function L(i) becomes smaller.
  • An error back propagation method, a gradient descent method, or the like can be used to update this parameter.
  • the control unit 219 determines whether or not the end condition is satisfied.
  • the end condition is not limited, but for example, the estimated observation label probability value y ⁇ (i, c') obtained in the current step S211 with respect to the estimated observation label probability value y ⁇ (i, c') obtained in the previous step S211.
  • the amount of change in c') is less than or equal to a predetermined value (the estimated observation label probability values y ⁇ (i, c') have sufficiently converged), and the loss function L (i) obtained in the previous step S211.
  • the change amount of the loss function L (i) obtained in the current step S211 is less than or equal to a predetermined value (the loss function L (i) has sufficiently converged), and the parameters updated in the previous step S218a.
  • the amount of change in the parameters updated in step S218a this time was less than or equal to a predetermined value (the parameters of the label estimation model ⁇ were sufficiently converged), and the parameters were updated a predetermined number of times in step S218a.
  • Step S218b ⁇ Process of Parameter Updating Unit 218 (Step S218b)>>
  • the parameter update unit 218 identifies the parameter of the first node N (1) finally updated in step S218a to specify the label estimation model ⁇ . It is output as a parameter (information for specifying the updated label estimation model ⁇ ).
  • the parameter update unit 218 sets the parameter of the first node N (1) before the last update in step S218a to the parameter for specifying the label estimation model ⁇ (information for specifying the label estimation model ⁇ ). It may be output as.
  • the estimation process of this embodiment will be described.
  • the parameter for specifying the label estimation model ⁇ output from the model learning device 11 is stored in the model storage unit 121 of the label estimation device 12 (FIG. 6), but in the second embodiment, the model learning The parameter specifying the label estimation model ⁇ output from the device 21 is stored in the model storage unit 121 of the label estimation device 12.
  • Others are the same as the estimation process of the first embodiment.
  • the processing of the evaluation label estimation unit 114, the observation label estimation unit 115, the error evaluation unit 116, the ability learning unit 117, the estimation model learning unit 118, and the control unit 119 described in the first embodiment is executed by one processing unit.
  • one processing unit performs processing of a plurality of processing units included in the evaluation label estimation unit 114, the observation label estimation unit 115, the error evaluation unit 116, the ability learning unit 117, the estimation model learning unit 118, and the control unit 119.
  • the implementation method in this case is not limited to the neural network.
  • an update unit including an ability data storage unit 113, an evaluation label estimation unit 114, an observation label estimation unit 115, an error evaluation unit 116, an ability learning unit 117, an estimation model learning unit 118, and a control unit 119.
  • the functions of are implemented in one neural network, but these may be implemented together by other methods.
  • Each of the above devices is, for example, a general-purpose or dedicated computer including a processor (hardware processor) such as a CPU (central processing unit) and a memory such as a RAM (random-access memory) and a ROM (read-only memory). Is composed of executing a predetermined program.
  • This computer may be provided with one processor and memory, or may be provided with a plurality of processors and memory.
  • This program may be installed in a computer or may be recorded in a ROM or the like in advance.
  • some or all of the processing units are configured by using an electronic circuit that realizes a processing function without using a program, rather than an electronic circuit that realizes a functional configuration by reading a program like a CPU. May be.
  • the electronic circuit that constitutes one device may include a plurality of CPUs.
  • the processing contents of the functions that each device should have are described by a program.
  • the above processing function is realized on the computer.
  • the program describing the processing content can be recorded on a computer-readable recording medium.
  • An example of a computer-readable recording medium is a non-transitory recording medium. Examples of such recording media are magnetic recording devices, optical disks, opto-magnetic recording media, semiconductor memories, and the like.
  • Circulation of this program is carried out by selling, transferring or lending a portable recording medium such as a DVD or a CD-ROM in which the program is recorded. Further, the program may be stored in a storage device of a server computer and transferred from the server computer to another computer via a network to distribute the program.
  • a computer that executes such a program first stores, for example, the program recorded in a portable recording medium or the program transferred from the server computer in its own storage device. When executing the process, this computer reads the program stored in its own storage device and executes the process according to the read program. As another execution form of this program, the computer may directly read the program from the portable recording medium and execute processing according to the program, and further, each time the program is transferred from the server computer to this computer. , Sequentially, the processing according to the received program may be executed. Even if it is configured to execute the above-mentioned processing by a so-called ASP (Application Service Provider) type service that does not transfer the program from the server computer to this computer but realizes the processing function only by its execution instruction and result acquisition. Good.
  • ASP Application Service Provider
  • the processing functions of this device may not be realized by executing a predetermined program on a computer, but at least a part of these processing functions may be realized by hardware.
  • Model learning device 12 Label estimation device

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

1データあたりの評価者が少ない学習データを用いた場合であっても、高い精度でラベル推定を行うことが可能なモデルを学習する。学習用特徴データと、評価者が学習用特徴データに付与したラベルを表すラベルデータと、を含む学習データを入力とし、特徴データに付与されるラベルの確率分布を推定するラベル推定モデルを特徴データである学習用特徴データに適用して得られる推定ラベル確率値と、評価者が特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表す能力データとから得られる、能力データによる推定ラベル確率値の重み付け和である推定観測ラベル確率値、のラベルデータが表すラベルに対する誤差を表す誤差値が小さくなるように、能力データを更新した更新能力データおよびラベル推定モデルを更新した更新ラベル推定モデルを得る。

Description

モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
 本発明は、モデル学習およびラベル推定に関する。
 電話音声の好感度(非特許文献1)や外国語の発音の良さ・流暢さ(非特許文献2)等の印象を評価して会話の技能を図るテストでは、音声に対して定量的な印象値(例えば、「良い」から「悪い」の5段階評価、好感度が「高い」から「低い」の5段階評価、自然さが「高い」から「低い」の5段階評価等)が付与される。
 現在は、各技能の専門家が音声の印象を評価して印象値を付与し、合格・不合格の判定を行っている。しかし、音声の印象を自動推定して印象値が得られるようになると、それをテストの足切り判定等に活用したり、評価に不慣れな専門家(例えば評価者になりたての人物)への参考値として用いたりできる。
 機械学習を用いてデータ(例えば、音声データ)に対するラベル(例えば、印象値)の自動推定を実現するためには、データとそのデータに付与されたラベルとの組みを学習データとした学習処理を行い、入力データに対するラベルを推定するモデルを生成すればよい。
 しかし、評価者には個人差があり、またラベルを付与することに慣れていない評価者がデータにラベルを付与する場合もある。そのため、同じデータに対して異なる評価者が異なるラベルを付与することもある。
 複数の評価者によるラベルの値を平均したようなラベルを推定するモデルを学習するためには、同一のデータに対して複数人の評価者がラベルを付与し、それらの値を平均したラベルと当該データとの組を学習データとすればよい。平均的なラベルを安定して推定できるようになるには、できるだけ多人数の評価者が同一のデータにラベルを付与するとよい。例えば、非特許文献3では同一のデータに対して10名の評価者がラベルを付与している。
F. Burkhardt, B. Schuller, B. Weiss and F. Weninger, "Would You Buy a Car From Me?" On the Likability of Telephone Voices," In Proc. Interspeech, pp. 1557 - 1560, 2011. Kei Ohta and Seiichi Nakagawa, "A statistical method of evaluating pronunciation proficiency for Japanese words," INTERSPEECH2005, pp. 2233 - 2236. 籠宮隆之,山住賢司,槙洋一,"印象評定データの概要", [online], [平成31年2月25日検索],インターネット<http://pj.ninjal.ac.jp/corpus_center/csj/manu-f/impression.pdf>
 評価者の中には、評価能力の高い人物とそうではない人物が存在する。1データあたりの評価者が多い場合、評価能力の低い評価者が混在していても、評価能力の高い評価者が付与したラベルによって学習データのラベルはある程度正確なものに補正される。しかし、1データあたりの評価者が少ない場合、評価者の評価能力不足によって学習データのラベル誤りが大きくなり、精度の高いラベルを推定するモデルを学習できなくなる場合が生じる。
 本発明はこのような点に鑑みてなされたものであり、1データあたりの評価者が少ない学習データを用いた場合であっても、高い精度でラベル推定を行うことが可能なモデルを学習できる技術を提供することである。
 学習用特徴データと、評価者が学習用特徴データに付与したラベルを表すラベルデータと、を含む学習データを入力とし、特徴データに付与されるラベルの確率分布を推定するラベル推定モデルを特徴データである学習用特徴データに適用して得られる推定ラベル確率値と、評価者が特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表す能力データとから得られる、能力データによる推定ラベル確率値の重み付け和である推定観測ラベル確率値、のラベルデータが表すラベルに対する誤差を表す誤差値が小さくなるように、能力データを更新した更新能力データおよびラベル推定モデルを更新した更新ラベル推定モデルを得る。
 本発明では、評価者の能力を確率で表した能力データによる推定ラベル確率値の重み付け和を評価し、能力データおよびラベル推定モデルを更新するため、1データあたりの評価者が少ない学習データを用いた場合であっても、高い精度でラベル推定を行うことが可能なモデルを学習できる。
図1は、第1実施形態のモデル学習装置の機能構成を例示したブロック図である。 図2は、学習用ラベルデータの構成例示した図である。 図3は、評価者能力データの構成を例示した図である。 図4は、学習用特徴データの構成を例示した図である。 図5は、第1実施形態のモデル学習方法を説明するためのフロー図である。 図6は、第1,2実施形態のラベル推定装置の機能構成を例示したブロック図である。 図7は、第2実施形態のモデル学習装置の機能構成を例示したブロック図である。 図8は、第2実施形態のニューラルネットワークを例示した図である。 図9は、第2実施形態のモデル学習方法を説明するためのフロー図である。
 以下、図面を参照して本発明の実施形態を説明する。
 [第1実施形態]
 まず本発明の第1実施形態を説明する。
 <構成>
 図1に例示するように、本実施形態のモデル学習装置1は、学習用ラベルデータ記憶部111、学習用特徴データ記憶部112、能力データ記憶部113、評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119を有する。ここで、能力データ記憶部113、評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119が更新部に相当する。図6に例示するように、本実施形態のラベル推定装置12は、モデル記憶部131、および推定部122を有する。
 <前処理>
 モデル学習装置11によるモデル学習処理の前処理として、学習用ラベルデータが学習用ラベルデータ記憶部111に格納され、学習用特徴データが学習用特徴データ記憶部112に格納され、能力データが能力データ記憶部113に格納される。学習用ラベルデータは、複数の評価者それぞれが複数の学習用特徴データそれぞれに付与したラベルの値を表すラベルデータ(評価者が学習用特徴データに付与したラベルを表すラベルデータ)を含む。ラベルは、学習用特徴データに対応する「ヒトが知覚可能な情報(例えば、音声、楽曲、テキスト、画像、動画など)」を知覚した評価者が自らの判断でその学習用特徴データに対して付与した正解ラベルである。ラベルの値は、数値であってもよいし、アルファベットその他の記号であってもよい。例えば、ラベルは、学習用特徴データに対応する「ヒトが知覚可能な情報」を知覚した評価者がその情報を評価して付与した評価結果を表す数値(例えば、印象を表す数値)である。学習用特徴データは学習用の特徴データである。特徴データはヒトが知覚可能な情報を表すデータ(例えば、音声データ、楽曲データ、テキストデータ、画像データ、動画データなど)であってもよいし、このようなヒトが知覚可能な情報の特徴を表すデータ(例えば、特徴量のデータ)であってもよい。能力データは、複数の評価者それぞれが特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表すデータである。例えば、能力データは、数値やアルファベットその他の記号の集合であってもよいし、確率密度関数等の関数であってもよい。
 ≪学習用ラベルデータ・学習用特徴データ・能力データの例示≫
 図2に学習用ラベルデータの例を、図3に学習用特徴データの例を、図4に能力データの例をそれぞれ示す。ただし、これらは一例であって本発明を限定するものではない。
 学習用ラベルデータの例:
 図2に例示する学習用ラベルデータは、ラベルデータ番号i、評価者番号k(i)、およびラベルデータy(i)を含む。評価者番号k(i)およびラベルデータy(i)はラベルデータ番号iに対応付けられている。ここで、ラベルデータ番号i∈{1,…,I}は、各学習用特徴データとそれにラベルを付与した評価者との組(すなわち、各学習用特徴データとそれを評価した評価者との組)を識別する番号である。一つの学習用特徴データに対して単数の評価者がラベルを付与する場合もあるし、同じ学習用特徴データに対して複数の評価者がラベルを付与する場合もある。学習用特徴データが同一であっても評価者が異なれば、それらの組に対応するラベルデータ番号iは異なる。Iは2以上の整数である。評価者番号k(i)∈{1,…,K}は複数の評価者のそれぞれを識別する番号であり、各評価者番号k(i)は各評価者と一対一で対応する。Kは2以上の整数である。ラベルデータy(i)∈{1,…,C}は、ラベルデータ番号iに対応する評価者がラベルデータ番号iに対応する学習用特徴データx(i)に付与したラベルを表す。Cは2以上の整数である。
 学習用特徴データの例:
 図3に例示するラベルデータ番号i∈{1,…,I}に対応する学習用特徴データx(i)は、それぞれに対応するラベルデータ番号i∈{1,…,I}に対応付けられている。図3に例示する学習用特徴データx(i)は、例えば、音声信号や音声信号から抽出された特徴を要素とするベクトル等の特徴量である。前述のように、同じ学習用特徴データに対して2名以上の評価者がラベルを付する場合があり、そのような場合には全く同じ学習用特徴データが互いに異なるラベルデータ番号iで識別される。例えば、図3のx(1)およびx(2)は内容としては全く同一の学習用特徴データであるが、互いに異なる評価者番号k(1),k(2)に対応する2名の評価者がラベルを付しているため、互いに異なるラベルデータ番号i=1,2で識別される。
 能力データの例:
 図4に例示する能力データa(k,c,c’)は、評価者番号k∈{1,…,K}の評価者がラベルデータc∈{1,…,C}によって表されるラベルの特徴データにラベルデータc’∈{1,…,C}によって表されるラベルを付与する確率を表す。言い換えると、能力データa(k,c,c’)は、評価者番号kに対応する評価者がラベルデータcによって表されるラベルの特徴データを評価した際に、ラベルデータc’∈{1,…,C}によって表されるラベルを付与する確率を表す。すなわち、ラベルデータcは特徴データの正しいラベルを表し、ラベルデータc’は評価者が当該特徴データに付与するラベルを表し、c=c’に対する能力データa(k,c,c’)は評価者番号k(i)の評価者がラベルデータcによって表される正しいラベルを付与する確率を表し、c≠c’に対する能力データa(k,c,c’)は評価者番号k(i)の評価者がラベルデータc’によって表される誤ったラベルを付与する確率を表す。図4の例では、各評価者番号k∈{1,…,K}に対してラベルデータc∈{1,…,C}とラベルデータc’∈{1,…,C}の組に対する各能力データa(k,c,c’)が対応付けられている。図4の例の能力データa(k,c,c’)は、a(k,c,1)+・・・+a(k,c,C)が1になるように、0以上1以下の範囲に正規化されている。
 能力データa(k,c,c’)の初期値はランダムに設定されてもよいし、各評価者が特徴データに正しいラベルを付与できるのか否かを試す試験を行い、その結果をもとに設定されてもよい。例えば、この試験において、複数の評価者が同じ特徴データを評価して当該特徴データに対してラベルを付与することとし、同じ特徴データを評価した他の評価者によって付与されたラベルを正しいラベルとみなして能力データa(k,c,c’)の初期値が設定されてもよい。例えば、ラベルデータcに対応するラベルが付与されている特徴データの中で、評価者番号k’∈{1,…,K}以外の評価者番号k(i)≠k’の評価者がラベルを付与したラベルデータ番号iの集合を
Figure JPOXMLDOC01-appb-M000003
と表記する。また
Figure JPOXMLDOC01-appb-M000004
と同じ特徴データのうち、当該特徴データを評価した評価者番号k(i)=k’の評価者がラベルデータc’に対応するラベルを付与したものラベルデータ番号iの集合を
Figure JPOXMLDOC01-appb-M000005
と表記する。このとき、能力データa(k,c,c’)の初期値が以下のように設定されてもよい。
Figure JPOXMLDOC01-appb-M000006
ここで|・|は集合・の要素数を表し、
Figure JPOXMLDOC01-appb-M000007
はk’以外のものを示すシンボルである。
 <モデル学習処理>
 次に、本実施形態のモデル学習処理を説明する。
 本実施形態のモデル学習処理では、更新部が、学習用特徴データx(i)と、評価者が学習用特徴データに付与したラベルを表すラベルデータy(i)と、を含む学習データを入力とし、特徴データに付与されるラベルの確率分布を推定するラベル推定モデルλを特徴データである学習用特徴データx(i)に適用して得られる推定ラベル確率値h(i,c)と、評価者が特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表す能力データa(k,c,c’)とから得られる、能力データa(k,c,c’)による推定ラベル確率値h(i,c)の重み付け和である推定観測ラベル確率値y^(i,c’)、のラベルデータy(i)が表すラベルに対する誤差を表す誤差値L(i)が小さくなるように、能力データa(k,c,c’)を更新した更新能力データおよびラベル推定モデルλを更新した更新ラベル推定モデルλを得る。以下、図5を参照しながら詳細に説明する。
 ≪評価ラベル推定部114の処理(ステップS114)≫
 評価ラベル推定部114には、推定モデル学習部118から出力されたラベル推定モデルλと、学習用特徴データ記憶部112から抽出された学習用特徴データx(i)とが入力される。なお、ラベル推定モデルλの例は、ニューラルネットワーク、隠れマルコフモデル、サポートベクターマシンなどである。ラベル推定モデルλの初期値はどのようなものであってもよい。評価ラベル推定部114は、ラベル推定モデルλを学習用特徴データx(i)に適用して推定ラベル確率値h(i,c)(ただしi∈{1,…,I},c∈{1,…,C})を得て出力する。ここで推定ラベル確率値h(i,c)は、ラベルデータ番号iに対応する学習用特徴データx(i)の正しいラベルのラベルデータがcである確率を表す。すなわち、本実施形態で例示する推定ラベル確率値h(i,c)は、ラベル推定モデルλを学習用特徴データx(i)に適用して得られる確率分布p(c|x(i),λ)である。ただし、
Figure JPOXMLDOC01-appb-M000008
を満たす。p(c|x(i),λ)は、ラベル推定モデルλにおいて、学習用特徴データx(i)に対応する正しいラベルのラベルデータがc∈{1,…,C}である確率分布である。
 ≪観測ラベル推定部115の処理(ステップS115)≫
 観測ラベル推定部115には、ステップS114で得られた推定ラベル確率値h(i,c)、学習用ラベルデータ記憶部111から抽出された評価者番号k(i)、および能力データ記憶部113から抽出された能力データa(k,c,c’)が入力される。観測ラベル推定部115は、入力された推定ラベル確率値h(i,c)と評価者番号k(i)と能力データa(k,c,c’)とから推定観測ラベル確率値y^(i,c’)を得て出力する。前述のように、推定観測ラベル確率値y^(i,c’)は、能力データa(k(i),c,c’)による推定ラベル確率値h(i,c)の重み付け和である。これにより、評価者の能力によって評価値が真の値からぶれることを再現する。前述のように能力データa(k(i),c,c’)は、評価者番号k(i)に対応する評価者がラベルデータcによって表されるラベルの特徴データを評価した際に、ラベルデータc’∈{1,…,C}によって表されるラベルを付与する確率を表す。推定観測ラベル確率値y^(i,c’)は、評価者番号k(i)に対応する評価者が正しくラベルを付与する確率(c=c’の確率)と、誤ったラベルを付与する確率(c≠c’の確率)との両面から、学習用特徴データx(i)にラベルデータc’に対応するラベルが付与される確率を再現したものである。例えば、観測ラベル推定部115は、以下のように推定観測ラベル確率値y^(i,c’)を求めて出力する。
Figure JPOXMLDOC01-appb-M000009
なお、この式に示すように、「y^(i,c’)」の右上添え字の「^」は本来「y」の真上に記載すべきであるが、記載表記の制約上「y」の右上に記載する場合がある。
 ≪誤差評価部116の処理(ステップS116)≫
 誤差評価部116には、観測ラベル推定部115で得られた推定観測ラベル確率値y^(i,c’)、および学習用ラベルデータ記憶部111から抽出したラベルデータy(i)が入力される。誤差評価部116は、ラベルデータy(i)が表すラベルに対する推定観測ラベル確率値y^(i,c’)の誤差を表す誤差値L(i)を得て出力する。誤差値L(i)は、ラベルデータy(i)が表すラベルに対する推定観測ラベル確率値y^(i,c’)の乖離を表す。例えば、誤差評価部116は、クラス識別において頻繁に使用される誤差値であるCategorical Cross-Entropyに基づいてラベルデータy(i)と推定観測ラベル確率値y^(i,c’)との間の誤差を評価して誤差値L(i)を得て出力する。例えば、誤差評価部116は、以下に従って誤差値L(i)を求める。
Figure JPOXMLDOC01-appb-M000010
ただし、以下を満たす。
Figure JPOXMLDOC01-appb-M000011
 ≪能力学習部117の処理(ステップS117)≫
 能力学習部117には、ステップS114で得られた推定ラベル確率値h(i,c)、ステップS115で得られた推定観測ラベル確率値y^(i,c’)、ステップS116で得られた誤差値L(i)、学習用ラベルデータ記憶部111から抽出された評価者番号k(i)、および能力データ記憶部113から抽出された能力データa(k,c,c’)が入力される。能力学習部117は、これらを用いて能力データa(k,c,c’)を更新して更新能力データa’(k,c,c’)を得る。例えば、能力学習部117は、誤差値L(i)が小さくなるように能力データa(k,c,c’)を更新して更新能力データa(k,c,c’)を得る。例えば、能力学習部117は、まず、すべてのc∈{1,…,C}について以下のようにa(k,c,c’)を更新する。
Figure JPOXMLDOC01-appb-M000012
ただし、以下を満たす。
Figure JPOXMLDOC01-appb-M000013
またηは予め設定された学習率のパラメータである。ηは正の実数であり、ニューラルネットワークでこの処理を行う場合には、例えば、0.01以下の値がηとされる。すべてのc∈{1,…,C}について上記のようにa(k,c,c’)を更新した後、能力学習部117は、例えば、すべてのc,c”∈{1,…,C}について、以下のようにa(k,c,c”)が確率値となるように正規化して更新能力データa(k,c,c”)を得る。
Figure JPOXMLDOC01-appb-M000014
得られた更新能力データa(k,c,c”)は新たな能力データa(k,c,c”)として能力データ記憶部113に格納される。
 ≪推定モデル学習部118の処理(ステップS118a)≫
 推定モデル学習部118には、ステップS115で得られた推定観測ラベル確率値y^(i,c’)、ステップS116で得られた誤差値L(i)、学習用ラベルデータ記憶部111から抽出された評価者番号k(i)、および能力データ記憶部113から抽出されたステップS117での更新後の能力データa(k,c,c’)が入力される。推定モデル学習部118は、これらを用い、ラベル推定モデルλを更新した更新ラベル推定モデルλを得て出力する。例えば、推定モデル学習部118は、誤差値L(i)が小さくなるように、ラベル推定モデルλを更新して更新ラベル推定モデルλを得る。例えば、推定モデル学習部118は、下記の勾配に基づき、誤差値L(i)が小さくなるように、更新ラベル推定モデルλのパラメータを更新する。
Figure JPOXMLDOC01-appb-M000015
ラベル推定モデルλがニューラルネットワークの場合、推定モデル学習部118は、上記の勾配に基づき、例えば勾配降下法によってラベル推定モデルλのパラメータを更新する。ラベル推定モデルλがニューラルネットワークの場合、推定モデル学習部118が、上記の勾配に基づきパラメータ更新の勾配も求めてパラメータを更新してもよい。上述のように得られた更新ラベル推定モデルλは、新たなラベル推定モデルλとして評価ラベル推定部114に送られる。
 ≪制御部119の処理(ステップS119)≫
 制御部119は、終了条件を充足したか否かを判断する。終了条件に限定はないが、例えば、ステップS118aの前後でのラベル推定モデルλのパラメータの変化量が所定値以下となったこと(ラベル推定モデルλのパラメータが十分に収束したこと)、ラベル推定モデルλのパラメータの更新が所定回数実行されたことなどを終了条件とできる。終了条件を満たしていないと判断された場合にはステップS114に戻る。すなわち、ステップS117で更新された更新能力データを新たな能力データa(k,c,c’)とし、ステップS118aで更新された更新ラベル推定モデルを新たなラベル推定モデルλとし、ステップS114以降の処理が再び繰り返される。
 ≪推定モデル学習部118の処理(ステップS118b)≫
 一方、ステップS119で終了条件を満たしたと判断された場合には、推定モデル学習部118が最後にステップS118aで得たラベル推定モデルλを特定するためのパラメータ(更新ラベル推定モデルλを特定するための情報)を出力する。あるいは、推定モデル学習部118が、最後にステップS118aで更新される前のラベル推定モデルλを特定するためのパラメータ(ラベル推定モデルλを特定するための情報)が出力してもよい。
 <推定処理>
 次に、本実施形態の推定処理を説明する。
 上述のようにモデル学習装置11から出力されたラベル推定モデルλを特定するパラメータは、ラベル推定装置12(図6)のモデル記憶部121に格納される。推定部122には、上述した学習用特徴データx(i)と同じ種別の入力特徴データxが入力される。推定部122はモデル記憶部121からラベル推定モデルλを特定する情報を読み込み、ラベル推定モデルλに対して入力特徴データxを適用し、入力特徴データxに対するラベルyを推定して出力する。例えば、推定部122は入力特徴データxに対するラベルyを出力してもよいし、複数のラベルyとそれらの確率とを出力してもよいし、確率の高い順に複数のラベルyを出力してもよい。
 [第2実施形態]
 次に本発明の第2実施形態を説明する。第2実施形態は、第1実施形態の能力データ記憶部113、評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119を含む更新部の機能を一つのニューラルネットワークで実装するものである。以下では、第1実施形態との相違点を中心に説明し、これまでに説明した事項については同じ参照番号を用いて説明を簡略化する。
 <構成>
 図7に例示するように、本実施形態のモデル学習装置21は、学習用ラベルデータ記憶部111、学習用特徴データ記憶部112、損失関数計算部211、パラメータ更新部218、および制御部219を有する。ここで、損失関数計算部211、パラメータ更新部218、および制御部219が更新部に相当する。第2実施形態でも第1実施形態と同じラベル推定装置12を用いる。
 <前処理>
 モデル学習装置21によるモデル学習処理の前処理として、学習用ラベルデータが学習用ラベルデータ記憶部111に格納され、学習用特徴データが学習用特徴データ記憶部112に格納される。第1実施形態との相違点は、第1実施形態の前処理では、能力データが能力データ記憶部113に格納されたが本実施形態の前処理ではこの処理は行われない。その他は第1実施形態の前処理と同じである。
 <モデル学習処理>
 次に、図8および図9を用いて本実施形態のモデル学習処理を説明する。
本実施形態のモデル学習処理では、学習用特徴データx(i)=(x(i,1),…,x(i,n))を入力として推定ラベル確率値h(i,c)を得るラベル推定モデルλとして機能する通常のニューラルネットワークである第1ノードN(1)(単数または複数のノード)と、評価者番号k(i)を入力として埋め込み層(Embedding層)等による変換を行って能力データa(k(i),c,c’)を出力する第2ノードN(2)(単数または複数のノード)と、推定ラベル確率値h(i,c)および能力データa(k(i),c,c’)を入力として確率計算に基づく変換
Figure JPOXMLDOC01-appb-M000016
を行って得られた推定観測ラベル確率値y^(i,c’)を出力する第3ノードN(3)(単数または複数のノード)と、を含むニューラルネットワークに対し、誤差値を損失関数とした学習処理を所定の終了条件を満たすまで行って得たラベル推定モデルλまたは更新ラベル推定モデルλを出力する。ただし、nは1以上の整数であり、k(i)∈{1,…,K},i∈{1,…,I},y(i)∈{1,…,C},c∈{1,…,C},c’∈{1,…,C}である。
 ≪損失関数計算部211の処理(ステップS211)≫
 損失関数計算部211は、学習用特徴データ記憶部112から抽出した学習用特徴データx(i)を第1ノードN(1)に入力し、学習用ラベルデータ記憶部111から抽出した評価者番号k(i)を第2ノードN(2)に入力することによって第3ノードN(3)から出力される推定観測ラベル確率値y^(i,c’)、および学習用ラベルデータ記憶部111から抽出したラベルデータy(i)を用い、第1実施形態のステップS116で説明したように誤差値L(i)を求め、それを損失関数L(i)として出力する。
 ≪パラメータ更新部218の処理(ステップS218a)≫
 パラメータ更新部218は、ステップS211で得られた損失関数L(i)を入力とし、損失関数L(i)を用いた学習処理により、上述のニューラルネットワークの第1ノードN(1)および第2ノードN(2)のパラメータ(例えば、重みおよび活性化関数の少なくとも一方)を更新する。例えば、パラメータ更新部218は、損失関数L(i)が小さくなるように第1ノードN(1)および第2ノードN(2)のパラメータを更新する。このパラメータの更新には、誤差逆伝播法や勾配降下法などを用いることができる。
 ≪制御部219の処理(ステップS219)≫
 制御部219は、終了条件を充足したか否かを判断する。終了条件に限定はないが、例えば、前回のステップS211で得られた推定観測ラベル確率値y^(i,c’)に対する今回のステップS211で得られた推定観測ラベル確率値y^(i,c’)の変化量が所定値以下となったこと(推定観測ラベル確率値y^(i,c’)が十分に収束したこと)、前回のステップS211で得られた損失関数L(i)に対する今回のステップS211で得られた損失関数L(i)の変化量が所定値以下となったこと(損失関数L(i)が十分に収束したこと)、前回のステップS218aで更新されたパラメータに対する今回のステップS218aで更新されたパラメータの変化量が所定値以下となったこと(ラベル推定モデルλのパラメータが十分に収束したこと)、ステップS218aによるパラメータの更新が所定回数実行されたことなどを終了条件とできる。終了条件を満たしていないと判断された場合にはステップS211に戻し、ステップS211,S218a,S219の処理が再び実行される。一方、終了条件を満たしたと判断された場合には、パラメータ更新部218が第1ノードN(1)のパラメータをラベル推定モデルλのパラメータとして出力する。
 ≪パラメータ更新部218の処理(ステップS218b)≫
 一方、ステップS219で終了条件を満たしたと判断された場合には、パラメータ更新部218が、最後にステップS218aで更新した第1ノードN(1)のパラメータを、ラベル推定モデルλを特定するためのパラメータ(更新ラベル推定モデルλを特定するための情報)として出力する。あるいは、パラメータ更新部218が、最後にステップS218aで更新する前の第1ノードN(1)のパラメータを、ラベル推定モデルλを特定するためのパラメータ(ラベル推定モデルλを特定するための情報)として出力してもよい。
 <推定処理>
 次に、本実施形態の推定処理を説明する。第1実施形態では、モデル学習装置11から出力されたラベル推定モデルλを特定するパラメータがラベル推定装置12(図6)のモデル記憶部121に格納されたが、第2実施形態では、モデル学習装置21から出力されたラベル推定モデルλを特定するパラメータがラベル推定装置12のモデル記憶部121に格納される。その他は第1実施形態の推定処理と同一である。
 [その他の変形例等]
 なお、本発明は上述の実施形態に限定されるものではない。例えば、第1実施形態で説明した評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119の処理を1つの処理部で実行してもよい。あるいは、評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119に含まれる複数の処理部の処理を1つの処理部が行ってもよい。この場合の実装方法はニューラルネットワークに限られない。例えば、第2実施形態では、能力データ記憶部113、評価ラベル推定部114、観測ラベル推定部115、誤差評価部116、能力学習部117、推定モデル学習部118、および制御部119を含む更新部の機能を一つのニューラルネットワークで実装したが、他の方法でこれらをまとめて実装してもよい。
 上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
 上記の各装置は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。
 上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
 このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
 コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されるのではなく、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。
11,21 モデル学習装置
12 ラベル推定装置

Claims (9)

  1.  学習用特徴データと、評価者が前記学習用特徴データに付与したラベルを表すラベルデータと、を含む学習データを入力とし、特徴データに付与されるラベルの確率分布を推定するラベル推定モデルを前記特徴データである学習用特徴データに適用して得られる推定ラベル確率値と、評価者が前記特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表す能力データとから得られる、前記能力データによる前記推定ラベル確率値の重み付け和である推定観測ラベル確率値、の前記ラベルデータが表すラベルに対する誤差を表す誤差値が小さくなるように、前記能力データを更新した更新能力データおよび前記ラベル推定モデルを更新した更新ラベル推定モデルを得る更新部を有するモデル学習装置。
  2.  請求項1のモデル学習装置であって、
     前記更新能力データを新たな前記能力データとし、前記更新ラベル推定モデルを新たな前記ラベル推定モデルとし、所定の終了条件を満たすまで前記更新部の処理を繰り返して得た前記ラベル推定モデルまたは前記更新ラベル推定モデルを特定する情報を出力する、モデル学習装置。
  3.  請求項1または2のモデル学習装置であって、
     i∈{1,…,I}がラベルデータ番号であり、k(i)∈{1,…,K}が評価者番号であり、y(i)∈{1,…,C}、c∈{1,…,C}、およびc’∈{1,…,C}が前記ラベルデータであり、I,K,Cが2以上の整数であり、
     前記学習データは、ラベルデータ番号i∈{1,…,I}に対応する前記学習用特徴データx(i)と、評価者番号k(i)∈{1,…,K}の前記評価者が前記学習用特徴データx(i)に付与したラベルを表すラベルデータy(i)と、を含み、
     前記推定ラベル確率値h(i,c)は、前記ラベル推定モデルλを前記学習用特徴データx(i)に適用して得られる確率分布p(c|x(i),λ)であり、
     前記能力データa(k,c,c’)は、前記評価者番号k(i)の前記評価者が前記ラベルデータcによって表されるラベルの前記特徴データに前記ラベルデータc’によって表されるラベルを付与する確率を表し、
     前記推定観測ラベル確率値y^(i,c’)が
    Figure JPOXMLDOC01-appb-M000001
    である、モデル学習装置。
  4.  請求項1のモデル学習装置であって、
     i∈{1,…,I}がラベルデータ番号であり、k(i)∈{1,…,K}が評価者番号であり、y(i)∈{1,…,C}、c∈{1,…,C}、およびc’∈{1,…,C}が前記ラベルデータであり、I,K,Cが2以上の整数であり、
     前記学習データは、ラベルデータ番号i∈{1,…,I}に対応する前記学習用特徴データx(i)と、評価者番号k(i)∈{1,…,K}の前記評価者が前記学習用特徴データx(i)に付与したラベルを表すラベルデータy(i)と、を含み、
     前記推定ラベル確率値h(i,c)は、前記ラベル推定モデルλを前記学習用特徴データx(i)に適用して得られる確率分布p(c|x(i),λ)であり、
     前記能力データa(k,c,c’)は、前記評価者番号k(i)の前記評価者が前記ラベルデータcによって表されるラベルの前記特徴データに前記ラベルデータc’によって表されるラベルを付与する確率を表し、
     前記更新部は、前記学習用特徴データx(i)を入力として前記推定ラベル確率値h(i,c)を得る前記ラベル推定モデルλとして機能する第1ノードと、前記評価者番号k(i)を入力として前記能力データa(k(i),c,c’)を出力する第2ノードと、前記推定ラベル確率値h(i,c)および前記能力データa(k(i),c,c’)を入力として確率計算に基づく変換
    Figure JPOXMLDOC01-appb-M000002
    を行って前記推定観測ラベル確率値y^(i,c’)を出力する第3ノードと、を含むニューラルネットワークに対し、前記第3ノードから出力される前記推定観測ラベル確率値y^(i,c’)および前記ラベルデータy(i)を用いて得られた前記誤差値を損失関数とした学習処理を所定の終了条件を満たすまで行って得た前記ラベル推定モデルλまたは前記更新ラベル推定モデルλを特定する情報を出力する、モデル学習装置。
  5.  請求項1から4の何れかの前記モデル学習装置の前記更新部から出力された前記ラベル推定モデルまたは前記更新ラベル推定モデルに入力特徴データを適用し、前記入力特徴データに付与されるラベルを推定するラベル推定部を有する、ラベル推定装置。
  6.  学習用特徴データと、評価者が前記学習用特徴データに付与したラベルを表すラベルデータと、を含む学習データを入力とし、特徴データに付与されるラベルの確率分布を推定するラベル推定モデルを前記特徴データである学習用特徴データに適用して得られる推定ラベル確率値と、評価者が前記特徴データに対して正しいラベルを付与する確率および誤ったラベルを付与する確率を表す能力データとから得られる、前記能力データによる前記推定ラベル確率値の重み付け和である推定観測ラベル確率値、の前記ラベルデータが表すラベルに対する誤差を表す誤差値が小さくなるように、前記能力データを更新した更新能力データおよび前記ラベル推定モデルを更新した更新ラベル推定モデルを得る更新ステップ
    を有するモデル学習方法。
  7.  請求項1から4の何れかの前記モデル学習装置の前記更新部から出力された前記ラベル推定モデルに入力特徴データを適用し、前記入力特徴データに付与されるラベルを推定するラベル推定ステップを有する、ラベル推定方法。
  8.  請求項1から4の何れかのモデル学習装置としてコンピュータを機能させるためのプログラム。
  9.  請求項5のラベル推定装置としてコンピュータを機能させるためのプログラム。
PCT/JP2020/007287 2019-03-06 2020-02-25 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム WO2020179525A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/437,017 US20220180188A1 (en) 2019-03-06 2020-02-25 Model learning apparatus, label estimation apparatus, method and program thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-040240 2019-03-06
JP2019040240A JP7222274B2 (ja) 2019-03-06 2019-03-06 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム

Publications (1)

Publication Number Publication Date
WO2020179525A1 true WO2020179525A1 (ja) 2020-09-10

Family

ID=72337966

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/007287 WO2020179525A1 (ja) 2019-03-06 2020-02-25 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム

Country Status (3)

Country Link
US (1) US20220180188A1 (ja)
JP (1) JP7222274B2 (ja)
WO (1) WO2020179525A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580588A (zh) * 2022-05-06 2022-06-03 江苏省质量和标准化研究院 基于概率矩阵模型的uhf rfid群标签选型方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111492424A (zh) * 2018-10-19 2020-08-04 索尼公司 信息处理设备、信息处理方法以及信息处理程序
US20210304039A1 (en) * 2020-03-24 2021-09-30 Hitachi, Ltd. Method for calculating the importance of features in iterative multi-label models to improve explainability
CN116882713B (zh) * 2023-09-07 2023-11-28 江苏省特种设备安全监督检验研究院 一种特种设备的数据采集方法、装置和电子设备
CN117237426B (zh) * 2023-09-18 2024-03-22 北京大学第三医院(北京大学第三临床医学院) 一种基于腰椎双斜位x光片的椎骨配准方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097468A (ja) * 2016-12-09 2018-06-21 日本電信電話株式会社 文分類学習装置、文分類装置、文分類学習方法、及び文分類学習プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097468A (ja) * 2016-12-09 2018-06-21 日本電信電話株式会社 文分類学習装置、文分類装置、文分類学習方法、及び文分類学習プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HOSANA KAMIYAMA, ATSUSHI ANDO, RYO MASUMARA, SATOSHI KOBASHIKAWA, YUSHI AONO: "1-9-13 Likability estimation of contact center agents based on latent variables considering stability of labelers", LECTURE PROCEEDINGS OF 2019 SPRING RESEARCH CONFERENCE OF THE ACOUSTICAL SOCIETY OF JAPAN, 1 March 2019 (2019-03-01), JP , pages 1353 - 1356, XP009523445, ISSN: 1880-7658 *
KAMIYAMA, HOSANA ET AL.: "Likability Estimation of Call-center Agents by Suppressing Annotator Variability", PROCEEDINGS OF APSIPA ANNUAL SUMMIT AND CONFERENCE 2019, 18 November 2019 (2019-11-18), pages 911 - 916, XP033733080, ISBN: 978-1-7281-3248-8, DOI: 10.1109/APSIPAASC47483.2019.9023122 *
MICHAEL GRIMM , KRISTIAN KROSCHEL: "Evaluation of Natural Emotions Using Self Assessment Manikins", PROCEEDINGS OF THE 2005 IEEE AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING WORKSHOP, 1 December 2005 (2005-12-01), pages 381 - 385, XP010871231, DOI: 10.1109/ASRU.2005.1566530 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580588A (zh) * 2022-05-06 2022-06-03 江苏省质量和标准化研究院 基于概率矩阵模型的uhf rfid群标签选型方法

Also Published As

Publication number Publication date
JP2020144569A (ja) 2020-09-10
JP7222274B2 (ja) 2023-02-15
US20220180188A1 (en) 2022-06-09

Similar Documents

Publication Publication Date Title
WO2020179525A1 (ja) モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
JP7474517B2 (ja) 学習効率に基づいて個人カスタマイズ型教育コンテンツを提供するための機械学習方法、装置及びコンピュータプログラム
CN112070138B (zh) 多标签混合分类模型的构建方法、新闻分类方法及系统
CN111914885B (zh) 基于深度学习的多任务人格预测方法和系统
JP6807909B2 (ja) データ評価方法、装置、機器及び読み取り可能な記憶媒体
WO2020125404A1 (zh) 构建神经网络的方法、装置和计算机可读介质
CN110377733A (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN114254127A (zh) 学生能力画像方法、学习资源推荐方法及装置
JP6856503B2 (ja) 印象推定モデル学習装置、印象推定装置、印象推定モデル学習方法、印象推定方法、およびプログラム
JP6962123B2 (ja) ラベル推定装置及びラベル推定プログラム
US20220215255A1 (en) Learning content recommendation system for predicting probability of correct answer of user using collaborative filtering based on latent factor and operation method thereof
CN109086463A (zh) 一种基于区域卷积神经网络的问答社区标签推荐方法
CN112052663B (zh) 客服语句质检方法及相关设备
WO2020166321A1 (ja) モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
JP7067383B2 (ja) 画像認識器学習装置、画像認識器学習方法、及びプログラム
CN110717037A (zh) 对用户分类的方法和装置
WO2023017568A1 (ja) 学習装置、推定装置、学習方法、およびプログラム
Yurtkan et al. Student Success Prediction Using Feedforward Neural Networks
JP7111017B2 (ja) パラ言語情報推定モデル学習装置、パラ言語情報推定装置、およびプログラム
WO2021186662A1 (ja) モデル学習装置、その方法、およびプログラム
CN112348161A (zh) 神经网络的训练方法、神经网络的训练装置和电子设备
US11599836B2 (en) Assigning a tutor to a cohort of students
CN114020922B (zh) 文本分类方法、装置及存储介质
CN117273166A (zh) 一种信息处理方法及装置
Dureh et al. Comparing methods for testing association in tables with zero cell counts using logistic regression

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20765474

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20765474

Country of ref document: EP

Kind code of ref document: A1