WO2022144992A1 - 情報処理装置、情報処理方法、及びコンピュータプログラム - Google Patents

情報処理装置、情報処理方法、及びコンピュータプログラム Download PDF

Info

Publication number
WO2022144992A1
WO2022144992A1 PCT/JP2020/049173 JP2020049173W WO2022144992A1 WO 2022144992 A1 WO2022144992 A1 WO 2022144992A1 JP 2020049173 W JP2020049173 W JP 2020049173W WO 2022144992 A1 WO2022144992 A1 WO 2022144992A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
likelihood ratio
information processing
series data
processing apparatus
Prior art date
Application number
PCT/JP2020/049173
Other languages
English (en)
French (fr)
Inventor
章記 海老原
大輝 宮川
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2022572838A priority Critical patent/JPWO2022144992A1/ja
Priority to US18/269,681 priority patent/US20240061859A1/en
Priority to PCT/JP2020/049173 priority patent/WO2022144992A1/ja
Publication of WO2022144992A1 publication Critical patent/WO2022144992A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Definitions

  • This disclosure relates to, for example, the technical fields of information processing devices, information processing methods, and computer programs that process information related to classification.
  • Patent Document 1 discloses that it is determined whether or not a person is a person by calculating a likelihood ratio based on the degree of similarity between the acquired biological information and a plurality of registered biological information.
  • Patent Document 2 discloses that the log-likelihood ratio of the personal distribution and the distribution of others is obtained by using the collation score corresponding to the biological information.
  • Patent Document 3 discloses that the score distribution is obtained by collating the input face image with the face images of all the registrants, and the registrant with the highest score is estimated to be the person himself / herself. ing.
  • the integrated likelihood ratio is calculated from the first likelihood ratio and the second likelihood ratio, and the certainty of the facial posture candidates constituting the facial posture candidate group. It is disclosed to calculate the integrated likelihood representing.
  • This disclosure is intended to improve the related techniques mentioned above.
  • the series data is predetermined data based on an acquisition means for acquiring a plurality of elements included in the series data and at least two consecutive elements among the plurality of elements.
  • a calculation means for calculating the likelihood ratio indicating the likelihood of being derived from the same target as the above, and a determination to determine whether or not the series data is derived from the same target as the predetermined data based on the likelihood ratio.
  • the calculation means includes means, and the calculation means calculates the likelihood ratio by adding the degree of similarity or difference between the series data and the predetermined data.
  • One aspect of the information processing method of the present disclosure is to acquire a plurality of elements included in the series data, and the series data is the same object as a predetermined data based on at least two consecutive elements among the plurality of elements.
  • the likelihood ratio indicating the likelihood of origin is calculated, and based on the likelihood ratio, it is determined whether or not the series data is derived from the same object as the predetermined data, and the likelihood ratio is calculated. At the same time, the degree of similarity or difference between the series data and the predetermined data is added.
  • One aspect of the computer program of this disclosure is to acquire a plurality of elements contained in the series data, and the series data is derived from the same object as a predetermined data based on at least two consecutive elements among the plurality of elements.
  • the likelihood ratio indicating the likelihood of being At that time the computer is operated so as to take into account the degree of similarity or difference between the series data and the predetermined data.
  • FIG. 1 is a block diagram showing a hardware configuration of the information processing apparatus according to the first embodiment.
  • the information processing device 10 includes a processor 11, a RAM (Random Access Memory) 12, a ROM (Read Only Memory) 13, and a storage device 14.
  • the information processing device 10 may further include an input device 15 and an output device 16.
  • the processor 11, the RAM 12, the ROM 13, the storage device 14, the input device 15, and the output device 16 are connected via the data bus 17.
  • Processor 11 reads a computer program.
  • the processor 11 is configured to read a computer program stored in at least one of the RAM 12, the ROM 13, and the storage device 14.
  • the processor 11 may read a computer program stored in a computer-readable recording medium using a recording medium reading device (not shown).
  • the processor 11 may acquire (that is, read) a computer program from a device (not shown) arranged outside the information processing device 10 via a network interface.
  • the processor 11 controls the RAM 12, the storage device 14, the input device 15, and the output device 16 by executing the read computer program.
  • a functional block for executing the determination process using the likelihood ratio is realized in the processor 11.
  • processor 11 a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an FPGA (field-programmable get array), a DSP (Demand-Side Platform), an ASIC, and an ASIC.
  • processor 11 one of the above-mentioned examples may be used, or a plurality of processors 11 may be used in parallel.
  • the RAM 12 temporarily stores the computer program executed by the processor 11.
  • the RAM 12 temporarily stores data temporarily used by the processor 11 while the processor 11 is executing a computer program.
  • the RAM 12 may be, for example, a D-RAM (Dynamic RAM).
  • the ROM 13 stores a computer program executed by the processor 11.
  • the ROM 13 may also store fixed data.
  • the ROM 13 may be, for example, a P-ROM (Programmable ROM).
  • the storage device 14 stores data stored in the information processing device 10 for a long period of time.
  • the storage device 14 may operate as a temporary storage device of the processor 11.
  • the storage device 14 may include, for example, at least one of a hard disk device, a magneto-optical disk device, an SSD (Solid State Drive), and a disk array device.
  • the input device 15 is a device that receives an input instruction from the user of the information processing device 10.
  • the input device 15 may include, for example, at least one of a keyboard, a mouse and a touch panel.
  • the input device 15 may be a dedicated controller (operation terminal). Further, the input device 15 may include a terminal owned by the user (for example, a smartphone, a tablet terminal, or the like).
  • the input device 15 may be a device capable of voice input including, for example, a microphone.
  • the output device 16 is a device that outputs information about the information processing device 10 to the outside.
  • the output device 16 may be a display device (for example, a display) capable of displaying information about the information processing device 10.
  • the display device here may be a television monitor, a personal computer monitor, a smartphone monitor, a tablet terminal monitor, or another mobile terminal monitor.
  • the display device may be a large monitor, a digital signage, or the like installed in various facilities such as a store.
  • the output device 16 may be a device that outputs information in a format other than an image.
  • the output device 16 may be a speaker that outputs information about the information processing device 10 by voice.
  • FIG. 2 is a block diagram showing a functional configuration of the information processing apparatus according to the first embodiment.
  • the information processing apparatus 10 includes a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. ing.
  • Each of the data acquisition unit 50, the likelihood ratio calculation unit 100, and the determination unit 200 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the data acquisition unit 50 is configured to be able to acquire a plurality of elements included in the series data.
  • the data acquisition unit 50 may acquire data directly from an arbitrary data acquisition device (for example, a camera, a microphone, etc.), or may read data previously acquired by the data acquisition device and stored in the storage or the like. It may be a thing.
  • the data acquisition unit 50 may be configured to acquire data from each of the plurality of cameras.
  • the elements of the series data acquired by the data acquisition unit 50 are configured to be output to the likelihood ratio calculation unit 100.
  • the series data is data including a plurality of elements arranged in a predetermined order, and for example, time series data can be mentioned as an example. More specific examples of series data include, but are not limited to, video data and audio data.
  • the likelihood ratio calculation unit 100 is configured to be able to calculate the likelihood ratio based on at least two consecutive elements among the plurality of elements acquired by the data acquisition unit 50.
  • the "likelihood ratio" here is an index showing the likelihood that the series data is derived from the same target as the predetermined registered data.
  • the likelihood ratio may be calculated, for example, as a log-likelihood cost (LLR: Log Likelihood Ratio). Further, the likelihood ratio may be calculated as an integrated likelihood ratio in which individual likelihood ratios calculated from two consecutive elements are integrated.
  • the likelihood ratio calculation unit 100 can appropriately read information about the registered data from the registered data storage unit 300 that stores the registered data.
  • the likelihood ratio calculation unit 100 according to the present embodiment is configured to be able to calculate the likelihood ratio, in particular, taking into account the degree of similarity or difference between the series data and the registered data. A specific method for calculating the likelihood ratio will be described in detail in other embodiments described later.
  • the determination unit 200 determines whether or not the series data is derived from the same target as the registered data based on the likelihood ratio calculated by the likelihood ratio calculation unit 100. When the calculated likelihood ratio reaches a predetermined threshold value, the determination unit 200 may determine that the series data and the registered data are derived from the same target. Further, the determination unit 200 may determine that the series data is not derived from the same target as the registered data when the calculated likelihood ratio reaches another predetermined threshold value.
  • FIG. 3 is a flowchart showing an operation flow of the information processing apparatus according to the first embodiment.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio based on the acquired two or more elements. At this time, the likelihood ratio calculation unit 100 calculates the likelihood ratio by adding the degree of similarity or difference between the series data and the registered data (step S12). That is, the likelihood ratio is calculated as a value considering not only the acquired series data but also the registered data.
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated likelihood ratio (step S13).
  • the determination unit 200 may output the determination result to a display or the like. Further, the determination unit 200 may output the determination result by voice via a speaker or the like.
  • the determination unit 200 cannot determine whether the series data and the registered data are derived from the same object (for example, when the likelihood ratio does not reach the threshold value used for determination), the above-mentioned series of processes May be executed repeatedly. Specifically, the process of acquiring a new element from the series data and calculating the likelihood ratio in consideration of the newly acquired element may be repeated.
  • FIG. 4 is a graph showing an example of the likelihood ratio calculated by the information processing apparatus according to the first embodiment.
  • the likelihood ratio is calculated as a log-likelihood cost (LLR).
  • This likelihood ratio gradually changes from the initial value by repeatedly executing the above-mentioned series of processes (see FIG. 3).
  • the determination unit 200 determines using, for example, a first threshold value corresponding to a state in which the series data and the registered data are derived from the same object, and a second threshold value corresponding to a state in which the series data and the registered data are not derived from the same object. I do. Specifically, when the likelihood ratio reaches the first threshold value, the determination unit 200 determines that the series data and the registered data are derived from the same target. On the other hand, when the likelihood ratio reaches the second threshold value, the determination unit 200 determines that the series data and the registered data are not derived from the same target.
  • the degree of similarity or the degree of difference between the series data and the registered data is taken into consideration when calculating the likelihood ratio. By doing so, it is possible to determine whether the series data and the registered data are derived from the same object by using the likelihood ratio calculated from the series data. More specifically, it is determined whether the input series data belongs to a class in which the series data and the registered data are derived from the same object, or a class in which the series data and the registered data are not derived from the same object. Can be done.
  • the information processing apparatus 10 according to the second embodiment will be described with reference to FIGS. 5 to 7.
  • the second embodiment explains specific examples of the series data and the registered data handled in the first embodiment described above.
  • the apparatus configuration (see FIGS. 1 and 2) is described in the first embodiment. May be similar to. Therefore, in the following, the parts different from the first embodiment will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 5 is a diagram showing an example of image data handled by the information processing apparatus according to the second embodiment.
  • FIG. 6 is a diagram showing an example of voice data handled by the information processing apparatus according to the second embodiment.
  • the series data (hereinafter, may be appropriately referred to as “query”) and the registered data (hereinafter, appropriately referred to as “target”) handled by the information processing apparatus 10 according to the second embodiment may be referred to. ) May be image data, respectively.
  • the series data and the registered data may be image data including a person (for example, face image data obtained by capturing a person's face).
  • the series data and the registered data may be image data including an animal such as a snake or a dog, or an object such as a robot in addition to or instead of a person.
  • the series data may be input as, for example, a plurality of time-series image data (that is, moving image data).
  • the registered data may be registered as at least one image data. Further, the registered data may be moving image data or a 3D image. By using the image data including a person in this way, it is possible to determine whether or not the series data and the registered data are derived from the same person based on the calculated likelihood ratio.
  • the series data and the registered data handled by the information processing apparatus 10 may be voice data, respectively. More specifically, the series data and the registered data may be data including voices emitted by a person. Alternatively, the series data and the registration data may be voice data emitted by an animal such as a snake or a dog, or an object such as a robot.
  • the series data may be input as time-series voice data emitted by, for example, a person, an animal, or the like.
  • the registered data may be registered as, for example, fixed-length voiceprint data.
  • FIG. 7 is a flowchart showing an operation flow of the information processing apparatus according to the second embodiment.
  • the data acquisition unit 50 first acquires the image data or the audio data included in the series data (step S21).
  • the data acquisition unit 50 outputs the acquired image data or audio data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 extracts the feature amount from the acquired image data or audio data (step S22).
  • the specific extraction method of the feature amount the existing technique can be appropriately adopted, and therefore detailed description thereof will be omitted here.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio based on the extracted feature amount.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio by adding the degree of similarity or difference between the series data and the registered data (step S23).
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same person based on the calculated likelihood ratio (step S24).
  • the determination unit 200 may output the determination result to a display, a speaker, or the like. Further, the determination unit 200 may execute a predetermined process (for example, a process executed on condition of personal authentication) according to the determination result.
  • the series data and the registered data include image data or audio data.
  • the information processing device 10 according to the second embodiment can be applied to, for example, a device that performs face recognition.
  • the voice data it can be determined whether or not the person who emitted the voice is the same person as the registered person. Therefore, the information processing device 10 according to the second embodiment can be applied to, for example, a device that performs voice authentication.
  • the information processing apparatus 10 according to the third embodiment will be described with reference to FIGS. 8 to 10. It should be noted that the third embodiment may be the same as the first and second embodiments except for a part of the configuration and operation different from the above-mentioned first and second embodiments. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 8 is a block diagram showing a functional configuration of the information processing apparatus according to the third embodiment.
  • the same components as those shown in FIG. 2 are designated by the same reference numerals.
  • the information processing apparatus 10 includes a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. ing.
  • the likelihood ratio calculation unit 100 according to the third embodiment is particularly configured to include a coupling unit 110.
  • the coupling portion 110 may be realized by, for example, the processor 11 described above (see FIG. 1).
  • the joining unit 110 can combine the feature vector extracted from the series data (hereinafter, appropriately referred to as “query vector”) and the feature vector extracted from the registered data (hereinafter, appropriately referred to as “target vector”). It is configured.
  • the joining unit 110 joins the query vector and the target vector to generate a joining vector.
  • the length of the join vector is the sum of the length of the query vector and the length of the target vector.
  • the coupling vector generated by the coupling unit 110 is used to calculate the likelihood ratio.
  • FIG. 9 is a flowchart showing an operation flow of the information processing apparatus according to the third embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 extracts a feature vector (that is, a query vector) from the acquired elements of the series data (step S31).
  • the joining unit 110 joins the query vector and the target vector to generate a joining vector (step S32).
  • the target vector may be extracted in advance when registering the registration data or the like.
  • the target vector may be stored in the registered data storage unit 300 together with the registered data, and the connecting unit 110 reads the target vector from the registered data storage unit 300 and combines it with the query vector.
  • the target vector may be newly extracted from the registered data when the join vector is generated.
  • the joining unit 110 reads the registered data from the registered data storage unit 300 and executes a process of extracting the target vector from the registered data. Then, the joining unit 110 joins the extracted target vector with the query vector.
  • the likelihood ratio calculation unit 100 performs time series integration using the coupling vector and extracts the feature vector (step S33).
  • the likelihood ratio calculation unit 100 inputs, for example, a coupling vector to an LSTM (Long Short Term Memory), and acquires a feature vector as its output.
  • the LSTM here is an example, and the same processing may be executed using an arbitrary recursive neural network.
  • a feature vector may be extracted using RNN (Recurrent Neural Network).
  • the likelihood ratio calculation unit 100 converts the feature vector into a binary value by a transformation matrix (step S34). Specifically, the likelihood ratio calculation unit 100 converts the feature vector into a binary value indicating that the series data and the registered data are derived from the same object and that the series data and the registered data are not derived from the same target. do. Further, the likelihood ratio calculation unit 100 converts (that is, scales) the range of each of the two values into [0, 1].
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio from the converted value (step S35).
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Specifically, since the query vector extracted from the series data and the target vector extracted from the registered data are combined and the likelihood ratio is calculated based on the combined vector, the calculated likelihood ratio is the result. The degree of similarity or difference between the series data and the registered data is taken into consideration.
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated likelihood ratio (step S13).
  • FIG. 10 is a conceptual diagram showing a specific operation example of the information processing apparatus according to the third embodiment.
  • the operation example shown in FIG. 10 as described in the second embodiment (see FIGS. 5 to 7), it is determined whether or not the series data and the registered data are derived from the same person.
  • the target vector is represented as t 1 .
  • the joining unit 110 sequentially joins the query vector corresponding to each element and the target vector.
  • the joining unit 110 first joins the query vector x 1 1 and the target vector t 1 to generate the joining vector t 1 x 1 1 . Then, the combined vector t 1 x 1 1 is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector. Subsequently, the coupling unit 110 combines the query vector x 1 2 and the target vector t 1 to generate the coupling vector t 1 x 1 2 . Then, the combined vector t 1 x 1 2 is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector.
  • the coupling unit 110 combines the query vector x 1 M and the target vector t 1 to generate the coupling vector t 1 x 1 M. Then, the combined vector t 1 x 1 M is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector.
  • the likelihood ratio calculated by the above processing, the personal threshold value (that is, the threshold value corresponding to the state in which the series data and the registered data are derived from the same person) and the other person's threshold value (that is, the series data and the registration) are shown.
  • the determination is made by comparing the data with the threshold value corresponding to the state in which the data is not derived from the same person.
  • the likelihood ratio gradually changes in the direction of the person's threshold value, and finally reaches the person's threshold value. Therefore, the determination unit 200 determines that the series data and the registered data are derived from the same person.
  • the query vector and the target vector are combined to generate a coupling vector, and the likelihood ratio is calculated using the coupling vector. Processing is performed.
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Therefore, according to the information processing apparatus 10 according to the third embodiment, it is possible to determine whether the series data and the registered data are derived from the same object based on the calculated likelihood ratio.
  • the information processing apparatus 10 according to the fourth embodiment will be described with reference to FIGS. 11 to 13. It should be noted that the fourth embodiment may be the same as the first to third embodiments except for a part of the configuration operation different from the above-mentioned first to third embodiments. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 11 is a block diagram showing a functional configuration of the information processing apparatus according to the fourth embodiment.
  • the same components as those shown in FIG. 2 are designated by the same reference numerals.
  • the information processing apparatus 10 includes a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. ing.
  • the likelihood ratio calculation unit 100 according to the fourth embodiment is particularly configured to include a comparison unit 120.
  • the comparison unit 120 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the comparison unit 120 is configured to be able to compare the feature vector generated by executing a predetermined process on the query vector extracted from the series data and the target vector. More specifically, the comparison unit 120 is configured to be able to calculate the degree of similarity between the feature amount vector generated from the query vector and the target vector. The comparison unit 120 may calculate the cosine similarity between the feature amount vector generated from the query vector and the target vector. However, the comparison unit 120 may calculate a similarity other than the cosine similarity. The similarity calculated by the comparison unit 120 is used to calculate the likelihood ratio.
  • FIG. 12 is a flowchart showing a flow of operation of the information processing apparatus according to the fourth embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 extracts a feature vector (that is, a query vector) from the acquired elements of the series data (step S41).
  • a feature vector that is, a query vector
  • the likelihood ratio calculation unit 100 performs time series integration using the query vector and extracts the feature vector (step S42).
  • the likelihood ratio calculation unit 100 inputs, for example, a query vector to the LSTM, and acquires a feature vector as its output.
  • the LSTM here is an example, and the same processing may be executed using an arbitrary recursive neural network.
  • the feature vector may be extracted using RNN.
  • the comparison unit 120 compares the feature amount vector extracted from the query vector with the target vector, and calculates the similarity of those vectors (step S43).
  • the target vector may be extracted in advance when registering the registration data or the like.
  • the target vector may be stored in the registered data storage unit 300 together with the registered data, and the comparison unit 120 reads the target vector from the registered data storage unit 300 and calculates the similarity.
  • the target vector may be newly extracted from the registered data when calculating the similarity.
  • the comparison unit 120 reads the registered data from the registered data storage unit 300 and executes a process of extracting the target vector from the registered data. Then, the comparison unit 120 compares the extracted target vector with the feature amount vector extracted from the query vector, and calculates the degree of similarity.
  • the likelihood ratio calculation unit 100 converts the calculated range of similarity into the range of probability (step S44). For example, when the cosine similarity is calculated as the similarity, the likelihood ratio calculation unit 100 converts the cosine similarity range [-1,1] into the probability range [0,1].
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio from the converted value (step S45).
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Specifically, the similarity between the feature vector extracted from the query vector and the target vector is calculated, and the likelihood ratio is calculated based on the converted value of the similarity. As a result, the degree ratio takes into account the degree of similarity or difference between the series data and the registered data.
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated likelihood ratio (step S13).
  • FIG. 13 is a conceptual diagram showing a specific operation example of the information processing apparatus according to the fourth embodiment.
  • the operation example shown in FIG. 13 as described in the second embodiment (see FIGS. 5 to 7), it is determined whether or not the series data and the registered data are derived from the same person.
  • the target vector is represented as t 1 .
  • the comparison unit 120 sequentially calculates the similarity between the feature vector extracted from the query vector corresponding to each element and the target vector.
  • the likelihood ratio calculation unit 100 first inputs the query vector x 11 into the LSTM and extracts the feature vector. Then, the comparison unit 120 calculates the degree of similarity between the feature vector extracted from the query vector x 11 and the target vector t 1 . After that, the likelihood ratio calculation unit 100 converts the calculated similarity to calculate the likelihood ratio. Subsequently, the likelihood ratio calculation unit 100 inputs the query vector x 12 into the LSTM and extracts the feature vector. Then, the comparison unit 120 calculates the degree of similarity between the feature vector extracted from the query vector x 12 and the target vector t 1 . After that, the likelihood ratio calculation unit 100 converts the calculated similarity to calculate the likelihood ratio.
  • the likelihood ratio calculation unit 100 inputs the query vector x 1 M to the LSTM and extracts the feature vector. Then, the comparison unit 120 calculates the degree of similarity between the feature vector extracted from the query vector x 1 M and the target vector t 1 . After that, the likelihood ratio calculation unit 100 converts the calculated similarity to calculate the likelihood ratio.
  • the determination is made by comparing the likelihood ratio calculated by the above-mentioned processing with the threshold value of the person and the threshold value of another person.
  • the likelihood ratio gradually changes in the direction of the person's threshold value, and finally reaches the person's threshold value. Therefore, the determination unit 200 determines that the series data and the registered data are derived from the same person.
  • a feature vector is extracted from the query vector, and the similarity is calculated by comparing the extracted feature vector with the target vector. .. Then, a process of calculating the likelihood ratio is performed based on the calculated similarity.
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Therefore, according to the information processing apparatus 10 according to the fourth embodiment, it is possible to determine whether the series data and the registered data are derived from the same object based on the calculated likelihood ratio.
  • the information processing apparatus 10 according to the fifth embodiment will be described with reference to FIGS. 14 to 16. It should be noted that the fifth embodiment may be the same as the first to fourth embodiments except for a part of the configuration operation different from the above-mentioned first to fourth embodiments. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 14 is a block diagram showing a functional configuration of the information processing apparatus according to the fifth embodiment.
  • the same components as those shown in FIG. 2 are designated by the same reference numerals.
  • the information processing apparatus 10 includes a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. ing.
  • the likelihood ratio calculation unit 100 according to the fifth embodiment is particularly configured to include a difference calculation unit 130.
  • the difference calculation unit 130 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the difference calculation unit 130 is configured to be able to calculate the difference between the query vector extracted from the series data and the target vector extracted from the registered data.
  • the difference calculation unit 130 calculates the difference vector as the difference between the query vector and the target vector.
  • the difference vector calculated by the difference calculation unit 130 is used for calculating the likelihood ratio.
  • FIG. 15 is a flowchart showing an operation flow of the information processing apparatus according to the fifth embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 extracts a feature vector (that is, a query vector) from the acquired elements of the series data (step S51).
  • the difference calculation unit 130 calculates the difference vector as the difference between the query vector and the target vector (step S52).
  • the target vector may be extracted in advance when registering the registration data or the like.
  • the target vector may be stored in the registered data storage unit 300 together with the registered data, and the difference calculation unit 130 reads the target vector from the registered data storage unit 300 and calculates the difference from the query vector.
  • the target vector may be newly extracted from the registered data when calculating the difference vector.
  • the difference calculation unit 130 reads the registered data from the registered data storage unit 300 and executes a process of extracting the target vector from the registered data. Then, the difference calculation unit 130 calculates the difference between the extracted target vector and the query vector.
  • the likelihood ratio calculation unit 100 performs time series integration using the difference vector and extracts the feature vector (step S53).
  • the likelihood ratio calculation unit 100 inputs, for example, a difference vector to the LSTM, and acquires a feature vector as its output.
  • the LSTM here is an example, and the same processing may be executed using an arbitrary recursive neural network.
  • the feature vector may be extracted using RNN.
  • the likelihood ratio calculation unit 100 converts the feature vector into a binary value by a transformation matrix (step S54). Specifically, the likelihood ratio calculation unit 100 converts the feature vector into a binary value indicating that the series data and the registered data are derived from the same object and that the series data and the registered data are not derived from the same target. do. Further, the likelihood ratio calculation unit 100 converts (that is, scales) the range of each of the two values into [0, 1].
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio from the converted value (step S55).
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Specifically, since the difference between the query vector extracted from the series data and the target vector extracted from the registered data is calculated and the likelihood ratio is calculated based on the difference vector, the calculated likelihood ratio is As a result, the degree of similarity or difference between the series data and the registered data is added.
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated likelihood ratio (step S13).
  • FIG. 16 is a conceptual diagram showing a specific operation example of the information processing apparatus according to the fifth embodiment.
  • the operation example shown in FIG. 15 as described in the second embodiment (see FIGS. 5 to 7), it is determined whether or not the series data and the registered data are derived from the same person.
  • the target vector is represented as t 1 .
  • the difference calculation unit 130 sequentially calculates the difference between the query vector corresponding to each element and the target vector.
  • the difference calculation unit 130 first calculates the difference between the query vector x 1 1 and the target vector t 1 to generate the difference vector t 1 ⁇ x 1 1 . Then, the difference vector t 1 ⁇ x 1 1 is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector. Subsequently, the difference calculation unit 130 calculates the difference between the query vector x 1 2 and the target vector t 1 to generate the difference vector t 1 ⁇ x 1 2 . Then, the difference vector t 1 ⁇ x 1 2 is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector.
  • the difference calculation unit 130 calculates the difference between the query vector x 1 M and the target vector t 1 to generate the difference vector t 1 ⁇ x 1 M. .. Then, the difference vector t 1 ⁇ x 1 M is input to the LSTM to extract the feature vector, and the likelihood ratio is calculated from the converted value of the feature vector.
  • the determination is made by comparing the likelihood ratio calculated by the above-mentioned processing with the threshold value of the person and the threshold value of another person.
  • the likelihood ratio gradually changes in the direction of the person's threshold value, and finally reaches the person's threshold value. Therefore, the determination unit 200 determines that the series data and the registered data are derived from the same person.
  • a difference vector is calculated as a difference between the query vector and the target vector, and the likelihood ratio is calculated using the difference vector. Processing is done.
  • the likelihood ratio calculated in this way is a value that takes into account the degree of similarity or difference between the series data and the registered data. Therefore, according to the information processing apparatus 10 according to the fifth embodiment, it is possible to determine whether the series data and the registered data are derived from the same object based on the calculated likelihood ratio.
  • the information processing apparatus 10 according to the sixth embodiment will be described with reference to FIGS. 17 and 18.
  • the sixth embodiment selectively uses the above-mentioned third to fifth embodiments in combination, and the configuration and operation thereof may be substantially the same as those of the third to fifth embodiments. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 17 is a block diagram showing a functional configuration of the information processing apparatus according to the sixth embodiment.
  • the same components as those shown in FIGS. 8, 11 and 14 are designated by the same reference numerals.
  • the information processing apparatus 10 includes a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. ing.
  • the likelihood ratio calculation unit 100 according to the sixth embodiment is particularly configured to include a coupling unit 110, a comparison unit 120, a difference calculation unit 130, and a selection unit 140. That is, the likelihood ratio calculation unit 100 according to the sixth embodiment is the coupling unit 110 described in the third embodiment, the comparison unit 120 described in the fourth embodiment, and the difference calculation unit 130 described in the fifth embodiment.
  • a selection unit 140 is further provided.
  • the selection unit 140 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the selection unit 140 is configured to be able to select which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is used when calculating the likelihood ratio. That is, the selection unit 140 uses the method of calculating the likelihood ratio using the coupling vector described in the third embodiment (see FIGS. 8 to 10) and the similarity ratio described in the fourth embodiment. (See FIGS. 11 to 13) and a method of calculating the likelihood ratio using the difference vector described in the fifth embodiment (see FIGS. 14 to 16). It is possible to select whether to calculate the likelihood ratio.
  • the selection unit 140 selects which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is to be used based on the condition information acquired in advance.
  • the condition information is information for determining which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is optimal for calculating the likelihood ratio.
  • the condition information may be, for example, information regarding the type of series data or registered data. For example, information indicating that the series data and the registered data are image data, and information indicating that the series data and the registered data are audio data may be acquired as conditional information. Further, the condition information may be, for example, information regarding the quality of series data or registered data. For example, when the series data and the registered data are image data or audio data, information indicating the sharpness may be acquired as condition information.
  • condition information may be information about the environment in which the series data or the registration data is acquired.
  • the series data and registered data are image data or audio data
  • information about the place where the data was acquired and the surrounding environment information about the camera used to acquire the image data
  • audio data information about the microphone used to acquire the data.
  • Information about the microphone used to acquire the data may be acquired as conditional information.
  • FIG. 18 is a flowchart showing a flow of operation of the information processing apparatus according to the sixth embodiment.
  • the selection unit 140 first acquires the condition information (step S61). Then, the selection unit 140 selects which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is used when calculating the likelihood ratio based on the condition information (step S62).
  • the information processing apparatus 10 uses a method selected by the selection unit 140 to perform a determination process (that is, a process of calculating a likelihood ratio to determine whether the series data and the registered data are derived from the same object). Is executed (step S63). Specifically, when the selection unit 140 selects the coupling unit 110, the determination process (see FIG. 9) described in the third embodiment is executed. When the selection unit 140 selects the comparison unit 120, the determination process (see FIG. 12) described in the fourth embodiment is executed. When the selection unit 140 selects the difference calculation unit 130, the determination process (see FIG. 15) described in the fifth embodiment is executed.
  • a determination process that is, a process of calculating a likelihood ratio to determine whether the series data and the registered data are derived from the same object.
  • the condition information is acquired and the likelihood ratio calculation method is selected before the determination process is executed.
  • the condition information is acquired during the determination process.
  • the method of calculating the likelihood ratio may be selected. For example, after the data acquisition unit acquires an element from the series data (that is, after step S11), the condition information may be acquired and the likelihood ratio calculation method may be selected. Further, the condition information may be acquired immediately before the coupling vector is generated by the coupling unit 110 (that is, immediately before step S32 in FIG. 9), and the likelihood ratio calculation method may be selected. Conditional information may be acquired and the likelihood ratio calculation method may be selected immediately before the similarity is calculated by the comparison unit 120 (that is, immediately before step S43 in FIG. 12). Conditional information may be acquired immediately before the difference vector is calculated by the difference calculation unit 130 (that is, immediately before step S52 in FIG. 15), and the likelihood ratio calculation method may be selected.
  • the likelihood ratio is calculated by the selection unit 140, the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 are used. Which one to use is selected. By doing so, the likelihood ratio can be calculated by selecting the optimum method from the three units of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130. Therefore, it is possible to accurately determine whether the series data and the registered data are derived from the same object.
  • FIG. 19 is a block diagram showing a functional configuration of the information processing apparatus according to the modified example of the sixth embodiment.
  • the same components as those shown in FIGS. 8, 11 and 14 are designated by the same reference numerals.
  • the information processing apparatus 10 has a data acquisition unit 50, a likelihood ratio calculation unit 100, and a determination unit 200 as processing blocks for realizing the function. And have.
  • the likelihood ratio calculation unit 100 according to the modified example of the sixth embodiment is particularly configured to include a coupling unit 110, a comparison unit 120, a difference calculation unit 130, and an operation detection unit 150. That is, the likelihood ratio calculation unit 100 according to the modified example of the sixth embodiment is the coupling unit 110 described in the third embodiment, the comparison unit 120 described in the fourth embodiment, and the difference described in the fifth embodiment.
  • a calculation unit 130 is provided, and an operation detection unit 150 is further provided in addition to the calculation unit 130.
  • the operation detection unit 150 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the operation detection unit 150 is configured to be able to detect an operation by the user. Specifically, the operation detection unit 150 is an operation of selecting which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is used when calculating the likelihood ratio (hereinafter, “selection operation” as appropriate). Is configured to be detectable. In other words, the operation detection unit 150 uses the method of calculating the likelihood ratio using the coupling vector described in the third embodiment (see FIGS. 8 to 10) and the similarity described in the fourth embodiment. Which of the methods for calculating the likelihood ratio (see FIGS. 11 to 13) and the method for calculating the likelihood ratio using the difference vector described in the fifth embodiment (see FIGS. 14 to 16) can be used. It is possible to detect an operation of selecting whether to calculate the likelihood ratio using the product. The operation detection unit 150 may detect, for example, a user's selection operation by the input device 15 (see FIG. 1).
  • FIG. 20 is a flowchart showing the operation flow of the information processing apparatus according to the modified example of the sixth embodiment.
  • the operation detection unit 150 first detects the selection operation by the user (step S65). Then, the operation detection unit 150 selects which of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 is used when calculating the likelihood ratio based on the detected selection operation (step S66). ..
  • a notification or the like urging the user to perform the selection operation may be given.
  • a speaker or the like may be used to notify the user to perform the selection operation by voice.
  • a display or the like may be used to notify the user to perform the selection operation on the screen display.
  • the user may touch the screen to perform a selection operation. For example, even if three areas corresponding to each of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 are displayed on the screen, and an operation in which the user touches any of the areas is detected as a selection operation. good.
  • the information processing apparatus 10 uses a method corresponding to the user's selection operation to perform a determination process (that is, a process of calculating a likelihood ratio to determine whether the series data and the registered data are derived from the same object. ) Is executed (step S67). Specifically, when the user performs an operation of selecting the coupling portion 110, the determination process (see FIG. 9) described in the third embodiment is executed. When the user performs an operation of selecting the comparison unit 120, the determination process (see FIG. 12) described in the fourth embodiment is executed. When the user performs an operation of selecting the difference calculation unit 130, the determination process (see FIG. 15) described in the fifth embodiment is executed.
  • a determination process that is, a process of calculating a likelihood ratio to determine whether the series data and the registered data are derived from the same object.
  • the selection operation may be detected in the middle of the determination process.
  • the selection operation may be detected after the data acquisition unit acquires an element from the series data (that is, after step S11).
  • the selection operation may be detected immediately before the connection vector is generated by the connection unit 110 (that is, immediately before step S32 in FIG. 9).
  • the selection operation may be detected immediately before the similarity is calculated by the comparison unit 120 (that is, immediately before step S43 in FIG. 12).
  • the selection operation may be detected immediately before the difference vector is calculated by the difference calculation unit 130 (that is, immediately before step S52 in FIG. 15).
  • the likelihood ratio is calculated according to the operation of the user, the coupling unit 110, the comparison unit 120, and the like. And which of the difference calculation unit 130 is used is selected. By doing so, the likelihood ratio can be calculated by selecting the optimum method from the three units of the coupling unit 110, the comparison unit 120, and the difference calculation unit 130. Therefore, it is possible to accurately determine whether the series data and the registered data are derived from the same object.
  • the coupling unit 110, the comparison unit 120, and the difference calculation unit 130 are selectively used, but the coupling unit 110, Two of the comparison unit 120 and the difference calculation unit 130 may be selectively used.
  • the coupling unit 110 and the comparison unit 120 may be selectively used.
  • the coupling unit 110 and the difference calculation unit 130 may be selectively used.
  • the comparison unit 120 and the difference calculation unit 130 may be selectively used.
  • the information processing apparatus 10 according to the seventh embodiment will be described with reference to FIGS. 21 and 22. It should be noted that the seventh embodiment differs from the above-mentioned first to sixth embodiments only in a part of the configuration and operation, and other parts may be the same as those of the first to sixth embodiments. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 21 is a diagram conceptually showing a determination targeting a plurality of registered data in the information processing apparatus according to the seventh embodiment.
  • a plurality of registered data are subject to determination with respect to the input series data. That is, it is configured to determine whether or not one query is derived from the same target as a plurality of targets.
  • a plurality of registered data it is assumed that facial images of a plurality of persons are registered as a plurality of registered data. In this case, it is determined which of the person in the image input as the series data and the plurality of registered people is the same person.
  • the likelihood ratio considering the series data and each of the plurality of registered data may be calculated.
  • a plurality of likelihood ratios may be calculated in consideration of the degree of similarity or difference between the series data and each of the plurality of registered data.
  • FIG. 22 is a flowchart showing a flow of operation of the information processing apparatus according to the seventh embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio based on the acquired two or more elements. At this time, the likelihood ratio calculation unit 100 calculates a plurality of likelihood ratios by adding the degree of similarity or difference between the series data and the plurality of registered data (step S71). That is, the likelihood ratio calculates a plurality of likelihood ratios according to the number of determination targets (that is, the number of registered data).
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated plurality of likelihood ratios (step S72). For example, when the first likelihood ratio reaches the person threshold value, the determination unit 200 determines that the series data and the registered data corresponding to the first likelihood ratio are derived from the same person. Similarly, when the second likelihood ratio reaches the person threshold value, the determination unit 200 determines that the series data and the registered data corresponding to the second likelihood ratio are derived from the same person.
  • a plurality of likelihood ratios are taken into consideration in consideration of the degree of similarity or difference between the series data and each of the plurality of registered data. Is calculated. In this way, even when there are a plurality of registered data (that is, when there are a plurality of determination targets), it is possible to determine which of the series data and which registered data are derived from the same target. can.
  • the information processing apparatus 10 according to the eighth embodiment will be described with reference to FIGS. 23 and 24. It should be noted that the eighth embodiment is different from the above-mentioned seventh embodiment only in a part of the configuration and operation, and other parts may be the same as the seventh embodiment. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 23 is a block diagram showing a functional configuration of the information processing apparatus according to the eighth embodiment.
  • the same components as those shown in FIG. 2 are designated by the same reference numerals.
  • the information processing apparatus 10 has a data acquisition unit 50, a likelihood ratio calculation unit 100, a determination unit 200, and an output as a processing block for realizing the function. It is provided with a unit 400. That is, the information processing apparatus 10 according to the eighth embodiment is configured to further include an output unit 400 in addition to the configuration of the first embodiment (see FIG. 2).
  • the output unit 400 may be realized by, for example, the processor 11 (see FIG. 1) described above. Further, the output unit 400 may be configured to include the above-mentioned output device (see FIG. 1).
  • the output unit 400 is configured to be able to output the determination result by the determination unit 200. That is, the output unit 400 is configured to be able to output a determination result as to whether or not the series data and the registered data are derived from the same target. Further, the output unit 400 is configured to be capable of outputting not only one registered data derived from the same target as the series data but also a plurality of registered data likely to be derived from the same target as the series data as a determination result. ing.
  • the output unit 400 may output the determination result to a display or the like. Further, the output unit 400 may output the determination result by voice via a speaker or the like.
  • FIG. 24 is a flowchart showing the operation flow of the information processing apparatus according to the eighth embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG. 22.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio based on the acquired two or more elements. At this time, the likelihood ratio calculation unit 100 calculates a plurality of likelihood ratios by adding the degree of similarity or difference between the series data and the plurality of registered data (step S71). That is, the likelihood ratio calculates a plurality of likelihood ratios according to the number of determination targets (that is, the number of registered data).
  • the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated plurality of likelihood ratios (step S72). Then, the output unit 400 outputs information regarding one or a plurality of registered data as the determination result by the determination unit 200 (step S81).
  • the output unit 400 may output only the information regarding one registered data corresponding to the likelihood ratio as the determination result.
  • the output unit 400 has a plurality of likelihood ratios corresponding to the plurality of likelihood ratios. Information on the registered data may be output as a determination result.
  • the output unit 400 when there is no likelihood ratio that has reached the person's threshold value among the plurality of likelihood ratios corresponding to each of the plurality of registered data, the output unit 400 has a predetermined number in the order in which the final value is closer to the person's threshold value.
  • the likelihood ratio may be selected, and information about a plurality of registered data corresponding to the selected likelihood ratio may be output as a determination result.
  • the output unit 400 selects a plurality of likelihood ratios whose final value exceeds the selection threshold lower than the principal threshold, and selects the likelihood ratio. Information about a plurality of registered data corresponding to the above may be output as a determination result.
  • one registered data derived from the same target as the series data, or a plurality of data having a high possibility of being derived from the same target as the series data is configured to be able to output the registration data of. By doing so, even in the case where the registered data derived from the same target as the series data cannot be accurately narrowed down to one, a plurality of candidates can be output as the determination result.
  • ⁇ 9th embodiment> The information processing apparatus 10 according to the ninth embodiment will be described with reference to FIGS. 25 and 26. It should be noted that the ninth embodiment is different from the above-mentioned seventh embodiment only in a part of the configuration and operation, and other parts may be the same as the seventh embodiment. Therefore, in the following, the parts different from each of the above-described embodiments will be described in detail, and the description of other overlapping parts will be omitted as appropriate.
  • FIG. 25 is a block diagram showing a functional configuration of the information processing apparatus according to the ninth embodiment.
  • the same components as those shown in FIG. 2 are designated by the same reference numerals.
  • the information processing apparatus 10 determines the data acquisition unit 50, the likelihood ratio calculation unit 100, and the determination unit 200 as processing blocks for realizing the function. It is equipped with a target limited unit 500. That is, the information processing apparatus 10 according to the ninth embodiment is configured to further include a determination target limiting unit 500 in addition to the configuration of the first embodiment (see FIG. 2).
  • the determination target limiting unit 500 may be realized by, for example, the processor 11 (see FIG. 1) described above.
  • the determination target limiting unit 500 is configured to be able to limit the determination target by executing a narrowing process on a plurality of registered data stored in the registered data storage unit 300. That is, the determination target limiting unit 500 is configured to be able to execute a process for reducing the number of determination targets.
  • the narrowing down process executed by the determination target limiting unit 500 may be a face authentication process having a low processing load. The face recognition process in this case does not have to be so accurate (for example, it may have a slightly higher tolerance for others).
  • the determination target is only the registration data that may be derived from the same person as the series data. It can be narrowed down to (that is, a smaller number of registered data than all stored registered data).
  • FIG. 26 is a flowchart showing the operation flow of the information processing apparatus according to the ninth embodiment.
  • the same reference numerals are given to the same processes as those shown in FIG. 22.
  • the data acquisition unit 50 first acquires the elements included in the series data (step S11).
  • the data acquisition unit 50 outputs the elements of the acquired series data to the likelihood ratio calculation unit 100.
  • the determination target limiting unit 500 executes the narrowing process using the acquired elements of the series data to limit the number of determination targets (step S91).
  • the subsequent processing will be executed only for the limited determination target. That is, the execution is performed not for all the registered data stored in the registered data storage unit 300, but for the registered data whose number has been reduced by the narrowing process.
  • the likelihood ratio calculation unit 100 calculates the likelihood ratio based on the acquired two or more elements. At this time, the likelihood ratio calculation unit 100 calculates a plurality of likelihood ratios by adding the degree of similarity or difference between the series data and the limited registered data (step S92). Then, the determination unit 200 determines whether or not the series data and the registered data are derived from the same target based on the calculated plurality of likelihood ratios (step S93).
  • the registration data to be determined is limited by the narrowing process (that is, the number of determination targets is reduced). By doing so, even if the original number of determination targets is enormous, it is possible to reduce the number of determination objects for which the likelihood ratio is actually calculated. Therefore, the processing load of the information processing apparatus 10 and the time required for processing can be effectively suppressed.
  • Each embodiment also implements a processing method in which a program for operating the configuration of the embodiment is recorded on a recording medium so as to realize the functions of the above-described embodiments, the program recorded on the recording medium is read out as a code, and the program is executed by a computer. Included in the category of morphology. That is, a computer-readable recording medium is also included in the scope of each embodiment. Further, not only the recording medium on which the above-mentioned program is recorded but also the program itself is included in each embodiment.
  • the recording medium for example, a floppy (registered trademark) disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a magnetic tape, a non-volatile memory card, or a ROM can be used.
  • a floppy (registered trademark) disk for example, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a magnetic tape, a non-volatile memory card, or a ROM
  • the program recorded on the recording medium is executed by itself, but also the program that operates on the OS and executes the process in cooperation with other software and the function of the expansion board is also an embodiment. Is included in the category of.
  • the series data is the same as the predetermined data based on the acquisition means for acquiring the plurality of elements included in the series data and at least two consecutive elements among the plurality of elements.
  • the calculation means is an information processing apparatus characterized in that the likelihood ratio is calculated by adding the degree of similarity or difference between the series data and the predetermined data.
  • the calculation means is the first with respect to the combined feature amount obtained by combining the first feature amount extracted from the series data and the second feature amount extracted from the predetermined data.
  • Addendum 1 characterized in that the degree of similarity or difference between the series data and the predetermined data is added by performing the processing and calculating the likelihood ratio based on the processing result of the first processing.
  • Appendix 3 In the information processing apparatus according to Appendix 3, the calculation means performs a second process on the first feature amount extracted from the series data, and the first feature amount after the second process and the predetermined data.
  • Addendum 1 characterized in that the degree of similarity or difference between the series data and the predetermined data is calculated by calculating the likelihood ratio based on the comparison result with the second feature amount extracted from.
  • the calculation means is the first with respect to the difference feature amount which is the difference between the first feature amount extracted from the series data and the second feature amount extracted from the predetermined data.
  • Addendum 1 characterized in that the degree of similarity or difference between the series data and the predetermined data is calculated by performing the three processes and calculating the likelihood ratio based on the processing result of the third process. It is an information processing apparatus according to.
  • the calculation means calculates a plurality of the likelihood ratios corresponding to each of the plurality of predetermined data, and the determination means is based on the plurality of the likelihood ratios.
  • the information processing apparatus according to any one of Supplementary note 1 to 4, wherein it is determined whether or not the series data is derived from the same target as any of the plurality of predetermined data.
  • Appendix 6 determines that the determination means is likely to be one predetermined data determined to be derived from the same target as the series data, or to be derived from the same target as the series data.
  • Appendix 7 The information processing apparatus according to Appendix 7 is further provided with limiting means for narrowing down a plurality of the predetermined data and limiting the number of the predetermined data to be determined by the determination means to be reduced.
  • the series data includes at least one of the target image data and the voice data, and the calculation means is likely that the series data is derived from the same target as the predetermined data.
  • Appendix 9 In the information processing method described in Appendix 9, a plurality of elements included in the series data are acquired, and the series data is derived from the same object as the predetermined data based on at least two consecutive elements among the plurality of elements.
  • the likelihood ratio indicating the plausibility of a certain thing
  • it is an information processing method characterized by adding the degree of similarity or the degree of difference between the series data and the predetermined data.
  • Appendix 10 The computer program according to Appendix 10 acquires a plurality of elements included in the series data, and the series data is derived from the same object as the predetermined data based on at least two consecutive elements among the plurality of elements.
  • the likelihood ratio indicating the likelihood of the fact
  • a computer program characterized in that a computer is operated so as to take into account the degree of similarity or difference between the series data and the predetermined data.
  • Appendix 11 The recording medium described in Appendix 11 is a recording medium characterized in that the computer program described in Appendix 10 is recorded.
  • Information processing device 11 10 Information processing device 11
  • Processor 14 Storage device 50
  • Data acquisition unit 100
  • Probability ratio calculation unit 110 Coupling unit 120 Comparison unit 130 Difference calculation unit 140
  • Selection unit 150
  • Operation detection unit 200
  • Judgment unit 300
  • Registered data storage unit 400
  • Output unit 500 Judgment target Limited section

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

情報処理装置(10)は、系列データに含まれる複数の要素を取得する取得手段(50)と、複数の要素のうち少なくとも2つの連続する要素に基づいて、系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出する算出手段(100)と、尤度比に基づいて、系列データが所定のデータと同一対象由来であるか否かを判定する判定手段(200)とを備える。算出手段は、系列データと所定のデータとの類似度又は相違度を加味して、尤度比を算出する。このような情報処理装置によれば、系列データが所定のデータと同一対象由来であるか否かを精度よく判定することが可能である。

Description

情報処理装置、情報処理方法、及びコンピュータプログラム
 この開示は、例えばクラス分類に関する情報を処理する情報処理装置、情報処理方法、及びコンピュータプログラムの技術分野に関する。
 この種の装置として、生体の照合処理を実行するものが知られている。例えば特許文献1では、取得した生体情報と複数の登録生体情報との類似度に基づいて尤度比を算出することで、本人か否かの判定を行うことが開示されている。特許文献2では、生体情報に対応する照合スコアを用いて、本人分布及び他人分布の対数尤度比を求めることが開示されている。特許文献3では、入力された顔画像と登録者全員の顔画像とを照合することでスコアの分布を取得し、最も高いスコアが得られた登録者を本人であると推定することが開示されている。
 その他の関連する技術として、例えば特許文献4では、第1の尤度比及び第2の尤度比から統合尤度比を算出すること、及び顔姿勢候補群を構成する顔姿勢候補の確からしさを表す統合尤度を算出することが開示されている。
特開2013-120580号公報 特開2008-299589号公報 特開2008-040874号公報 国際公開2009/091029号
 この開示は、上述した関連する技術を改善することを目的とする。
 この開示の情報処理装置の一の態様は、系列データに含まれる複数の要素を取得する取得手段と、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出する算出手段と、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定する判定手段とを備え、前記算出手段は、前記系列データと前記所定のデータとの類似度又は相違度を加味して、前記尤度比を算出する。
 この開示の情報処理方法の一の態様は、系列データに含まれる複数の要素を取得し、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味する。
 この開示のコンピュータプログラムの一の態様は、系列データに含まれる複数の要素を取得し、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味するようにコンピュータを動作させる。
第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。 第1実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第1実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第1実施形態に係る情報処理装置で算出される尤度比の一例を示すグラフである。 第2実施形態に係る情報処理装置で扱われる画像データの一例を示す図である。 第2実施形態に係る情報処理装置で扱われる音声データの一例を示す図である。 第2実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第3実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第3実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第3実施形態に係る情報処理装置の具体的な動作例を示す概念図である。 第4実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第4実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第4実施形態に係る情報処理装置の具体的な動作例を示す概念図である。 第5実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第5実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第5実施形態に係る情報処理装置の具体的な動作例を示す概念図である。 第6実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第6実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第6実施形態の変形例に係る情報処理装置の機能的構成を示すブロック図である。 第6実施形態の変形例に係る情報処理装置の動作の流れを示すフローチャートである。 第7実施形態に係る情報処理装置における複数の登録データを対象とする判定を概念的に示す図である。 第7実施形態の変形例に係る情報処理装置の動作の流れを示すフローチャートである。 第8実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第8実施形態に係る情報処理装置の動作の流れを示すフローチャートである。 第9実施形態に係る情報処理装置の機能的構成を示すブロック図である。 第9実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
 以下、図面を参照しながら、情報処理装置、情報処理方法、及びコンピュータプログラムの実施形態について説明する。
 <第1実施形態>
 第1実施形態に係る情報処理装置について、図1から図4を参照して説明する。
 (ハードウェア構成)
 まず、図1を参照しながら、第1実施形態に係る情報処理装置のハードウェア構成について説明する。図1は、第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
 図1に示すように、第1実施形態に係る情報処理装置10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。情報処理装置10は更に、入力装置15と、出力装置16とを備えていてもよい。プロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
 プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、情報処理装置10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、尤度比を用いた判定処理を実行ための機能ブロックが実現される。なお、プロセッサ11の一例として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)が挙げられる。プロセッサ11は、上述した一例のうち一つを用いてもよいし、複数を並列で用いてもよい。
 RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
 ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
 記憶装置14は、情報処理装置10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
 入力装置15は、情報処理装置10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。入力装置15は、専用のコントローラ(操作端末)であってもよい。また、入力装置15は、ユーザが保有する端末(例えば、スマートフォンやタブレット端末等)を含んでいてもよい。入力装置15は、例えばマイクを含む音声入力が可能な装置であってもよい。
 出力装置16は、情報処理装置10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、情報処理装置10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。ここでの表示装置は、テレビモニタ、パソコンモニタ、スマートフォンのモニタ、タブレット端末のモニタ、その他の携帯端末のモニタであってよい。また、表示装置は、店舗等の各種施設に設置される大型モニタやデジタルサイネージ等であってよい。また、出力装置16は、画像以外の形式で情報を出力する装置であってもよい。例えば、出力装置16は、情報処理装置10に関する情報を音声で出力するスピーカであってもよい。
 (機能的構成)
 次に、図2を参照しながら、第1実施形態に係る情報処理装置10の機能的構成について説明する。図2は、第1実施形態に係る情報処理装置の機能的構成を示すブロック図である。
 図2に示すように、第1実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。データ取得部50、尤度比算出部100、及び判定部200の各々は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 データ取得部50は、系列データに含まれる複数の要素を取得可能に構成されている。データ取得部50は、任意のデータ取得装置(例えば、カメラやマイク等)から直接データを取得するものであってもよいし、あらかじめデータ取得装置で取得されストレージ等に記憶されているデータを読み出すものであってもよい。カメラからデータを取得する場合、データ取得部50は複数のカメラの各々からデータを取得するように構成されていてもよい。データ取得部50で取得された系列データの要素は、尤度比算出部100に出力される構成となっている。なお、系列データとは、所定の順番で並んだ複数の要素を含むデータであり、例えば時系列データが一例として挙げられる。系列データのより具体的な例としては、動画データや音声データが挙げられるが、これに限られるものではない。
 尤度比算出部100は、データ取得部50で取得された複数の要素のうち少なくとも2つの連続する要素に基づいて、尤度比を算出可能に構成されている。なお、ここでの「尤度比」とは、系列データが所定の登録データと同一対象由来であることの尤もらしさを示す指標である。尤度比は、例えば対数尤度費(LLR:Log Likehood Ratio)として算出されてもよい。また、尤度比は、2つの連続する要素から算出される個別尤度比を統合した統合尤度比として算出されてもよい。
 また、尤度比算出部100は、登録データを記憶する登録データ記憶部300から、適宜登録データに関する情報を読み出し可能とされている。そして本実施形態に係る尤度比算出部100は特に、系列データと登録データとの類似度又は相違度を加味して、尤度比を算出可能に構成されている。このような尤度比の具体的な算出方法については、後述する他の実施形態において詳しく説明する。
 判定部200は、尤度比算出部100で算出された尤度比に基づいて、系列データが登録データと同一対象由来であるか否かを判定する。判定部200は、算出された尤度比が所定の閾値に到達した場合に、系列データと登録データとが同一対象由来であると判定してもよい。また、判定部200は、算出された尤度比が所定の他の閾値に到達した場合に、系列データが登録データとが同一対象由来でないと判定してもよい。
 (動作の流れ)
 次に、図3を参照しながら、第1実施形態に係る情報処理装置10の動作の流れについて説明する。図3は、第1実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
 図3に示すように、第1実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された2つ以上の要素に基づいて尤度比を算出する。この際、尤度比算出部100は、系列データと登録データとの類似度又は相違度を加味して、尤度比を算出する(ステップS12)。即ち、尤度比は、取得される系列データだけでなく、登録データについても考慮した値として算出される。
 続いて、判定部200が、算出された尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS13)。判定部200は、判定結果をディスプレイ等に出力するようにしてもよい。また、判定部200は、判定結果を、スピーカ等を介して音声で出力するようにしてもよい。
 なお、判定部200が系列データと登録データとが同一対象由来であるか否かを判定できない場合(例えば、尤度比が判定に用いる閾値に到達していない場合等)、上述した一連の処理は繰り返し実行されてよい。具体的には、系列データから新たな要素を取得し、新たに取得した要素を考慮した尤度比が算出する処理が繰り返されてもよい。
 (具体的な判定例)
 次に、図4を参照しながら、第1実施形態に係る情報処理装置10による具体的な判定例について説明する。図4は、第1実施形態に係る情報処理装置で算出される尤度比の一例を示すグラフである。なお、図4の例では、尤度比が対数尤度費(LLR)として算出されているものとする。
 図4に示す尤度比は、例えば下記式(1)のように表すことができる。なお、y=1は、系列データと登録データとが同一対象由来であるクラスであり、y=0は、系列データと登録データとが同一対象由来であるクラスである。
  LLR=p(X|y=1)/p(X|y=0) …(1)
 この尤度比は、上述した一連の処理(図3参照)が繰り返し実行されることにより、初期値から徐々に変化していく。判定部200は、例えば系列データと登録データとが同一対象由来である状態に対応する第1閾値と、系列データと登録データとが同一対象由来でない状態に対応する第2閾値とを用いて判定を行う。具体的には、判定部200は、尤度比が第1閾値に到達した場合、系列データと登録データとが同一対象由来であると判定する。一方で、判定部200は、尤度比が第2閾値に到達した場合、系列データと登録データとが同一対象由来でないと判定する。
 (技術的効果)
 次に、第1実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図1から図4で説明したように、第1実施形態に係る情報処理装置10では、尤度比を算出する際に、系列データと登録データとの類似度又は相違度を加味される。このようにすれば、系列データから算出される尤度比を用いて、系列データと登録データとが同一対象由来であるかを判定することが可能となる。より具体的には、入力される系列データが、系列データと登録データとが同一対象由来であるクラスと、系列データと登録データとが同一対象由来でないクラスとのいずれに属するかを判定することができる。
 <第2実施形態>
 第2実施形態に係る情報処理装置10について、図5から図7を参照して説明する。なお、第2実施形態は、上述した第1実施形態で扱われる系列データ及び登録データの具体例を説明するものであり、例えば装置構成(図1及び図2参照)については、第1実施形態と同様であってよい。このため、以下では、第1実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (データの具体例)
 まず、図5及び図6を参照しながら、第2実施形態に係る情報処理装置10で扱われる系列データ及び登録データについて説明する。図5は、第2実施形態に係る情報処理装置で扱われる画像データの一例を示す図である。図6は、第2実施形態に係る情報処理装置で扱われる音声データの一例を示す図である。
 図5に示すように、第2実施形態に係る情報処理装置10で扱われる系列データ(以下、適宜「クエリ」と称することがある)及び登録データ(以下、適宜「ターゲット」と称することがある)は、それぞれ画像データであってよい。より具体的には、系列データ及び登録データは、人物を含む画像データ(例えば、人物の顔を撮像した顔画像データ)であってよい。或いは、系列データ及び登録データは、人物に加えて又は代えて、蛇や犬等の動物、ロボット等の物体を含む画像データであってよい。系列データは、例えば時系列の複数の画像データ(即ち、動画データ)として入力されてよい。登録データは、少なくとも1枚の画像データとして登録されていればよい。また、登録データは、動画データであってもよいし、3D画像であってもよい。このように人物を含む画像データを利用すれば、算出される尤度比に基づいて、系列データと登録データとが同一人物由来であるか否かを判定することが可能である。
 図5に示すように、第2実施形態に係る情報処理装置10で扱われる系列データ及び登録データは、それぞれ音声データであってよい。より具体的には、系列データ及び登録データは、人物が発する音声を含むデータであってよい。或いは、系列データ及び登録データは、蛇や犬等の動物、ロボット等の物体が発する音声データであってよい。系列データは、例えば人物や動物等が発する時系列の音声データとして入力されてよい。登録データは、例えば固定長の声紋データとして登録されていればよい。このように人物等が発する音声データを利用すれば、算出される尤度比に基づいて、系列データと登録データとが同一人物由来(即ち、同一対象由来)であるか否かを判定することが可能である。
 (動作の流れ)
 次に、図7を参照しながら、第2実施形態に係る情報処理装置10の動作の流れについて説明する。図7は、第2実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
 図7に示すように、第2実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる画像データ又は音声データを取得する(ステップS21)。データ取得部50は、取得した画像データ又は音声データを、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得され画像データ又は音声データから、特徴量を抽出する(ステップS22)。なお、特徴量の具体的な抽出手法については、既存の技術を適宜採用することができるため、ここでの詳しい説明は省略するものとする。その後、尤度比算出部100は、抽出した特徴量に基づいて尤度比を算出する。この際、尤度比算出部100は、系列データと登録データとの類似度又は相違度を加味して、尤度比を算出する(ステップS23)。
 続いて、判定部200が、算出された尤度比に基づいて、系列データと登録データとが同一人物由来であるか否かを判定する(ステップS24)。判定部200は、判定結果をディスプレイやスピーカ等に出力するようにしてもよい。また、判定部200は、判定結果に応じて所定の処理(例えば、本人認証を条件として実行される処理等)を実行するようにしてもよい。
 (技術的効果)
 次に、第2実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図5から図7で説明したように、第2実施形態に係る情報処理装置10では、系列データ及び登録データが、画像データ又は音声データを含んでいる。画像データを利用する場合、画像に含まれる人物が、登録されている人物と同一人物であるか否かを判定することができる。よって、第2実施形態に係る情報処理装置10は、例えば顔認証を行う装置に適用することが可能である。また、音声データを利用する場合、音声を発した人物が、登録されている人物と同一人物であるか否かを判定することができる。よって、第2実施形態に係る情報処理装置10は、例えば音声認証を行う装置に適用することが可能である。
 <第3実施形態>
 第3実施形態に係る情報処理装置10について、図8から図10を参照して説明する。なお、第3実施形態は、上述した第1及び第2実施形態と一部の構成及び動作が異なるのみで、その他の部分については第1及び第2実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図8を参照しながら、第3実施形態に係る情報処理装置10の機能的構成について説明する。図8は、第3実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図8では、図2に示した構成要素と同様のものに同一の符号を付している。
 図8に示すように、第3実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。そして、第3実施形態に係る尤度比算出部100は特に、結合部110を備えて構成されている。結合部110は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 結合部110は、系列データから抽出される特徴ベクトル(以下、適宜「クエリベクトル」と称する)と、登録データから抽出される特徴ベクトル(以下、適宜「ターゲットベクトル」と称する)とを結合可能に構成されている。結合部110は、クエリベクトルとターゲットベクトルとを結合して結合ベクトルを生成する。結合ベクトルの長さは、クエリベクトルの長さとターゲットベクトルの長さとを足したものとなる。結合部110で生成された結合ベクトルは、尤度比の算出に用いられる。
 (動作の流れ)
 次に、図9を参照しながら、第3実施形態に係る情報処理装置10の動作の流れについて説明する。図9は、第3実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図9では、図3で示した処理と同様の処理に同一の符号を付している。
 図9に示すように、第3実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された系列データの要素から特徴ベクトル(即ち、クエリベクトル)を抽出する(ステップS31)。クエリベクトルが抽出されると、結合部110が、クエリベクトルとターゲットベクトルとを結合して、結合ベクトルを生成する(ステップS32)。なお、ターゲットベクトルは、登録データを登録する際等に、予め抽出されていてもよい。この場合、ターゲットベクトルは、登録データと共に登録データ記憶部300に記憶されていればよく、結合部110は、登録データ記憶部300からターゲットベクトルを読み出して、クエリベクトルと結合する。あるいは、ターゲットベクトルは、結合ベクトルを生成する際に、登録データから新たに抽出されてもよい。この場合、結合部110は、登録データ記憶部300から登録データを読み出し、登録データからターゲットベクトルを抽出する処理を実行する。そして、結合部110は、抽出したターゲットベクトルをクエリベクトルと結合する。
 続いて、尤度比算出部100は、結合ベクトルを用いて、時系列統合を行い、特徴ベクトルを抽出する(ステップS33)。尤度比算出部100は、例えば結合ベクトルをLSTM(Long Short Term Memory)に入力し、その出力として特徴ベクトルを取得する。なお、ここでのLSTMは一例であり、任意の再帰的ニューラルネットワークを用いて同様の処理を実行するようにしてもよい。例えば、RNN(Recurrent Neural Network)を用いて、特徴ベクトルを抽出してもよい。
 続いて、尤度比算出部100は、特徴ベクトルを変換行列で2値に変換する(ステップS34)。具体的には、尤度比算出部100は、特徴ベクトルを、系列データと登録データとが同一対象由来であること、及び系列データと登録データとが同一対象由来でないことを表す2値に変換する。また、尤度比算出部100は、2値それぞれの値域を[0,1]に変換(即ち、スケーリング)する。
 続いて、尤度比算出部100は、変換した値から尤度比を算出する(ステップS35)。このようにして算出された尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。具体的には、系列データから抽出したクエリベクトルと、登録データから抽出したターゲットベクトルを結合し、その結合ベクトルに基づいて尤度比を算出しているため、算出される尤度比は、結果的に系列データ及び登録データの類似度又は相違度を加味したものとなっている。
 最後に、判定部200は、算出された尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS13)。
 (具体的な動作例)
 次に、図10を参照しながら、第3実施形態に係る情報処理装置10の具体的な動作例を説明する。図10は、第3実施形態に係る情報処理装置の具体的な動作例を示す概念図である。なお、図10に示す動作例では、第2実施形態で説明したように(図5から図7を参照)、系列データと登録データとが同一人物由来であるか否かを判定している。
 図10において、クエリベクトルは、X={x ,x ,…,x }、ターゲットベクトルはtとして表されている。この場合、結合部110は、各要素に対応するクエリベクトルと、ターゲットベクトルとを順次結合していく。
 具体的には、結合部110は、まずクエリベクトルx と、ターゲットベクトルtとを結合して、結合ベクトルt を生成する。そして、その結合ベクトルt をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。続いて、結合部110は、クエリベクトルx と、ターゲットベクトルtとを結合して、結合ベクトルt を生成する。そして、その結合ベクトルt をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。このような処理を同様に繰り返していき、最終的に結合部110は、クエリベクトルx と、ターゲットベクトルtとを結合して、結合ベクトルt を生成する。そして、その結合ベクトルt をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。
 図10に示す例では、上述した処理によって算出される尤度比と、本人閾値(即ち系列データと登録データとが同一人物由来である状態に対応する閾値)及び他人閾値(即ち系列データと登録データとが同一人物由来でない状態に対応する閾値)とを比較することで判定が行われる。図10に示す例では、尤度比が徐々に本人閾値の方向に変化していき、最終的には本人閾値に到達している。このため、判定部200は、系列データと登録データとが同一人物由来であると判定する。
 (技術的効果)
 次に、第3実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図8から図10で説明したように、第3実施形態に係る情報処理装置10では、クエリベクトルとターゲットベクトルとを結合して結合ベクトルを生成し、その結合ベクトルを用いて尤度比を算出する処理が行われる。このようにして算出される尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。よって、第3実施形態に係る情報処理装置10によれば、算出される尤度比に基づいて、系列データと登録データとが同一対象由来であるかを判定することが可能となる。
 <第4実施形態>
 第4実施形態に係る情報処理装置10について、図11から図13を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と一部の構成動作が異なるのみで、その他の部分については第1から第3実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図11を参照しながら、第4実施形態に係る情報処理装置10の機能的構成について説明する。図11は、第4実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図11では、図2に示した構成要素と同様のものに同一の符号を付している。
 図11に示すように、第4実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。そして、第4実施形態に係る尤度比算出部100は特に、比較部120を備えて構成されている。比較部120は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 比較部120は、系列データから抽出されるクエリベクトルに所定の処理を実行して生成される特徴ベクトルと、ターゲットベクトルとを比較可能に構成されている。より具体的には、比較部120は、クエリベクトルから生成される特徴量ベクトルと、ターゲットベクトルとの類似度を算出可能に構成されている。比較部120は、クエリベクトルから生成される特徴量ベクトルと、ターゲットベクトルとのコサイン類似度を算出してもよい。ただし、比較部120は、コサイン類似度以外の類似度を算出するようにしてもよい。比較部120で算出される類似度は、尤度比の算出に用いられる。
 (動作の流れ)
 次に、図12を参照しながら、第4実施形態に係る情報処理装置10の動作の流れについて説明する。図12は、第4実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図12では、図3で示した処理と同様の処理に同一の符号を付している。
 図12に示すように、第4実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された系列データの要素から特徴ベクトル(即ち、クエリベクトル)を抽出する(ステップS41)。クエリベクトルが抽出されると、尤度比算出部100は、クエリベクトルを用いて、時系列統合を行い、特徴ベクトルを抽出する(ステップS42)。尤度比算出部100は、例えばクエリベクトルをLSTMに入力し、その出力として特徴ベクトルを取得する。なお、ここでのLSTMは一例であり、任意の再帰的ニューラルネットワークを用いて同様の処理を実行するようにしてもよい。例えば、RNNを用いて、特徴ベクトルを抽出してもよい。
 続いて、比較部120が、クエリベクトルから抽出された特徴量ベクトルと、ターゲットベクトルとを比較して、それらのベクトルの類似度を算出する(ステップS43)。なお、ターゲットベクトルは、登録データを登録する際等に、予め抽出されていてもよい。この場合、ターゲットベクトルは、登録データと共に登録データ記憶部300に記憶されていればよく、比較部120は、登録データ記憶部300からターゲットベクトルを読み出して、類似度を算出する。あるいは、ターゲットベクトルは、類似度を算出する際に、登録データから新たに抽出されてもよい。この場合、比較部120は、登録データ記憶部300から登録データを読み出し、登録データからターゲットベクトルを抽出する処理を実行する。そして、比較部120は、抽出したターゲットベクトルをクエリベクトルから抽出された特徴量ベクトルと比較して、類似度を算出する。
 続いて、尤度比算出部100は、算出した類似度の値域を確率の値域に変換する(ステップS44)。例えば、類似度としてコサイン類似度が算出されている場合、尤度比算出部100は、コサイン類似度の値域[-1,1]を、確率の値域[0,1]に変換する
 続いて、尤度比算出部100は、変換した値から尤度比を算出する(ステップS45)。このようにして算出された尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。具体的には、クエリベクトルから抽出された特徴量ベクトルと、ターゲットベクトルとの類似度が算出され、その類似度を変換した値に基づいて尤度比を算出しているため、算出される尤度比は、結果的に系列データ及び登録データの類似度又は相違度を加味したものとなっている。
 最後に、判定部200は、算出された尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS13)。
 (具体的な動作例)
 次に、図13を参照しながら、第4実施形態に係る情報処理装置10の具体的な動作例を説明する。図13は、第4実施形態に係る情報処理装置の具体的な動作例を示す概念図である。なお、図13に示す動作例では、第2実施形態で説明したように(図5から図7を参照)、系列データと登録データとが同一人物由来であるか否かを判定している。
 図13において、クエリベクトルは、X={x ,x ,…,x }、ターゲットベクトルはtとして表されている。この場合、比較部120は、各要素に対応するクエリベクトルから抽出される特徴ベクトルと、ターゲットベクトルとの類似度を順次算出していく。
 具体的には、尤度比算出部100が、まずクエリベクトルx をLSTMに入力して特徴ベクトルを抽出する。そして、比較部120は、クエリベクトルx から抽出された特徴ベクトルと、ターゲットベクトルtとの類似度を算出する。その後、尤度比算出部100は、算出された類似度を変換して、尤度比を算出する。続いて、尤度比算出部100は、クエリベクトルx をLSTMに入力して特徴ベクトルを抽出する。そして、比較部120は、クエリベクトルx から抽出された特徴ベクトルと、ターゲットベクトルtとの類似度を算出する。その後、尤度比算出部100は、算出された類似度を変換して、尤度比を算出する。このような処理を同様に繰り返していき、最終的には、尤度比算出部100が、クエリベクトルx をLSTMに入力して特徴ベクトルを抽出する。そして、比較部120は、クエリベクトルx から抽出された特徴ベクトルと、ターゲットベクトルtとの類似度を算出する。その後、尤度比算出部100は、算出された類似度を変換して、尤度比を算出する。
 図13に示す例では、上述した処理によって算出される尤度比と、本人閾値及び他人閾値とを比較することで判定が行われる。図13に示す例では、尤度比が徐々に本人閾値の方向に変化していき、最終的には本人閾値に到達している。このため、判定部200は、系列データと登録データとが同一人物由来であると判定する。
 (技術的効果)
 次に、第4実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図11から図13で説明したように、第4実施形態に係る情報処理装置10では、クエリベクトルから特徴ベクトルを抽出し、抽出した特徴ベクトルとターゲットベクトルとを比較することで類似度を算出する。そして、算出された類似度に基づいて、尤度比を算出する処理が行われる。このようにして算出される尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。よって、第4実施形態に係る情報処理装置10によれば、算出される尤度比に基づいて、系列データと登録データとが同一対象由来であるかを判定することが可能となる。
 <第5実施形態>
 第5実施形態に係る情報処理装置10について、図14から図16を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態と一部の構成動作が異なるのみで、その他の部分については第1から第4実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図14を参照しながら、第5実施形態に係る情報処理装置10の機能的構成について説明する。図14は、第5実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図14では、図2に示した構成要素と同様のものに同一の符号を付している。
 図14に示すように、第5実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。そして、第5実施形態に係る尤度比算出部100は特に、差分演算部130を備えて構成されている。差分演算部130は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 差分演算部130は、系列データから抽出されるクエリベクトルと、登録データから抽出されるターゲットベクトルとの差分を演算可能に構成されている。差分演算部130は、クエリベクトルとターゲットベクトルとの差分として差分ベクトルを算出する。差分演算部130で算出された差分ベクトルは、尤度比の算出に用いられる。
 (動作の流れ)
 次に、図15を参照しながら、第5実施形態に係る情報処理装置10の動作の流れについて説明する。図15は、第5実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図15では、図3で示した処理と同様の処理に同一の符号を付している。
 図15に示すように、第5実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された系列データの要素から特徴ベクトル(即ち、クエリベクトル)を抽出する(ステップS51)。クエリベクトルが抽出されると、差分演算部130が、クエリベクトルとターゲットベクトルとの差分として、差分ベクトルを算出する(ステップS52)。なお、ターゲットベクトルは、登録データを登録する際等に、予め抽出されていてもよい。この場合、ターゲットベクトルは、登録データと共に登録データ記憶部300に記憶されていればよく、差分演算部130は、登録データ記憶部300からターゲットベクトルを読み出して、クエリベクトルとの差分を算出する。あるいは、ターゲットベクトルは、差分ベクトルを算出する際に、登録データから新たに抽出されてもよい。この場合、差分演算部130は、登録データ記憶部300から登録データを読み出し、登録データからターゲットベクトルを抽出する処理を実行する。そして、差分演算部130は、抽出したターゲットベクトルとクエリベクトルとの差分を算出する。
 続いて、尤度比算出部100は、差分ベクトルを用いて、時系列統合を行い、特徴ベクトルを抽出する(ステップS53)。尤度比算出部100は、例えば差分ベクトルをLSTMに入力し、その出力として特徴ベクトルを取得する。なお、ここでのLSTMは一例であり、任意の再帰的ニューラルネットワークを用いて同様の処理を実行するようにしてもよい。例えば、RNNを用いて、特徴ベクトルを抽出してもよい。
 続いて、尤度比算出部100は、特徴ベクトルを変換行列で2値に変換する(ステップS54)。具体的には、尤度比算出部100は、特徴ベクトルを、系列データと登録データとが同一対象由来であること、及び系列データと登録データとが同一対象由来でないことを表す2値に変換する。また、尤度比算出部100は、2値それぞれの値域を[0,1]に変換(即ち、スケーリング)する。
 続いて、尤度比算出部100は、変換した値から尤度比を算出する(ステップS55)。このようにして算出された尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。具体的には、系列データから抽出したクエリベクトルと、登録データから抽出したターゲットベクトルとの差分を算出し、差分ベクトルに基づいて尤度比を算出しているため、算出される尤度比は、結果的に系列データ及び登録データの類似度又は相違度を加味したものとなっている。
 最後に、判定部200は、算出された尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS13)。
 (具体的な動作例)
 次に、図16を参照しながら、第5実施形態に係る情報処理装置10の具体的な動作例を説明する。図16は、第5実施形態に係る情報処理装置の具体的な動作例を示す概念図である。なお、図15に示す動作例では、第2実施形態で説明したように(図5から図7を参照)、系列データと登録データとが同一人物由来であるか否かを判定している。
 図16において、クエリベクトルは、X={x ,x ,…,x }、ターゲットベクトルはtとして表されている。この場合、差分演算部130は、各要素に対応するクエリベクトルと、ターゲットベクトルとの差分を順次算出していく。
 具体的には、差分演算部130は、まずクエリベクトルx と、ターゲットベクトルtとの差分を算出して、差分ベクトルt-x を生成する。そして、その差分ベクトルt-x をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。続いて、差分演算部130は、クエリベクトルx と、ターゲットベクトルtとの差分を算出して、差分ベクトルt-x を生成する。そして、その差分ベクトルt-x をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。このような処理を同様に繰り返していき、最終的に差分演算部130は、クエリベクトルx と、ターゲットベクトルtとの差分を算出して、差分ベクトルt-x を生成する。そして、その差分ベクトルt-x をLSTMに入力して特徴ベクトルを抽出し、特徴ベクトルを変換した値から尤度比を算出する。
 図16に示す例では、上述した処理によって算出される尤度比と、本人閾値及び他人閾値とを比較することで判定が行われる。図16に示す例では、尤度比が徐々に本人閾値の方向に変化していき、最終的には本人閾値に到達している。このため、判定部200は、系列データと登録データとが同一人物由来であると判定する。
 (技術的効果)
 次に、第5実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図14から図16で説明したように、第5実施形態に係る情報処理装置10では、クエリベクトルとターゲットベクトルとの差分として差分ベクトルを算出し、その差分ベクトルを用いて尤度比を算出する処理が行われる。このようにして算出される尤度比は、系列データ及び登録データの類似度又は相違度を加味した値となる。よって、第5実施形態に係る情報処理装置10によれば、算出される尤度比に基づいて、系列データと登録データとが同一対象由来であるかを判定することが可能となる。
 <第6実施形態>
 第6実施形態に係る情報処理装置10について、図17及び図18を参照して説明する。なお、第6実施形態は、上述した第3から第5実施形態を組み合わせて選択的に利用するものであり、その構成や動作は概ね第3から第5実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図17を参照しながら、第6実施形態に係る情報処理装置10の機能的構成について説明する。図17は、第6実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図17では、図8、図11及び図14に示した構成要素と同様のものに同一の符号を付している。
 図17に示すように、第6実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。そして、第6実施形態に係る尤度比算出部100は特に、結合部110、比較部120、差分演算部130、及び選択部140を備えて構成されている。即ち、第6実施形態に係る尤度比算出部100は、第3実施形態で説明した結合部110、第4実施形態で説明した比較部120、及び第5実施形態で説明した差分演算部130をいずれも備えており、それらに加えて選択部140を更に備えて構成されている。なお、選択部140は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 選択部140は、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかを選択可能に構成されている。即ち、選択部140は、第3実施形態で説明した結合ベクトルを用いて尤度比を算出する手法(図8から図10参照)、第4実施形態で説明した類似度を用いて尤度比を算出する手法(図11から図13参照)、及び第5実施形態で説明した差分ベクトルを用いて尤度比を算出する手法(図14から図16参照)のうち、いずれの手法を用いて尤度比を算出するかを選択可能とされている。
 選択部140は、予め取得される条件情報に基づいて、結合部110、比較部120、及び差分演算部130のいずれを用いるかを選択する。条件情報は、結合部110、比較部120、及び差分演算部130のいずれを用いて尤度比を算出するのが最適かを判定するための情報である。条件情報は、例えば系列データや登録データの種別に関する情報であってよい。例えば、系列データ及び登録データが画像データであることを示す情報や、系列データ及び登録データが音声データであることを示す情報が条件情報として取得されてよい。また、条件情報は、例えば系列データや登録データの品質に関する情報であってよい。例えば、系列データ及び登録データが画像データや音声データである場合には、その鮮明度を示す情報が条件情報として取得されてよい。また、条件情報は、系列データや登録データが取得された環境に関する情報であってよい。例えば、系列データ及び登録データが画像データや音声データである場合には、それらのデータが取得された場所及び周辺環境に関する情報や、画像データを取得するのに用いられたカメラに関する情報、音声データを取得するのに用いられたマイクに関する情報等が、条件情報として取得されてよい。
 (動作の流れ)
 次に、図18を参照しながら、第6実施形態に係る情報処理装置10の動作の流れについて説明する。図18は、第6実施形態に係る情報処理装置の動作の流れを示すフローチャートである。
 図18に示すように、第6実施形態に係る情報処理装置10の動作が開始されると、まず選択部140が条件情報を取得する(ステップS61)。そして、選択部140は、条件情報に基づいて、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかを選択する(ステップS62)。
 その後、情報処理装置10は、選択部140が選択した手法を用いて判定処理(即ち、尤度比を算出して系列データと登録データとが同一対象由来であるか否かを判定する処理)を実行する(ステップS63)。具体的には、選択部140が結合部110を選択した場合、第3実施形態で説明した判定処理(図9参照)が実行される。選択部140が比較部120を選択した場合、第4実施形態で説明した判定処理(図12参照)が実行される。選択部140が差分演算部130を選択した場合、第5実施形態で説明した判定処理(図15参照)が実行される。
 なお、上述した例では、判定処理が実行される前に、条件情報が取得され、尤度比の算出手法が選択される例を説明したが、判定処理の途中で、条件情報が取得され、尤度比の算出手法が選択されてもよい。例えば、データ取得部が系列データから要素を取得した後(即ち、ステップS11の後)に、条件情報が取得され、尤度比の算出手法が選択されてもよい。また、結合部110によって結合ベクトルが生成される直前(即ち、図9におけるステップS32の直前)に、条件情報が取得され、尤度比の算出手法が選択されてもよい。比較部120によって類似度が算出される直前(即ち、図12のステップS43の直前)に、条件情報が取得され、尤度比の算出手法が選択されてもよい。差分演算部130で差分ベクトルが算出される直前(即ち、図15におけるステップS52の直前)に、条件情報が取得され、尤度比の算出手法が選択されてもよい。
 (技術的効果)
 次に、第6実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図17及び図18で説明したように、第6実施形態に係る情報処理装置10では、選択部140によって、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかが選択される。このようにすれば、結合部110、比較部120、及び差分演算部130の3つの中から、最適な手法を選択して尤度比を算出することができる。よって、系列データと登録データとが同一対象由来であるかを精度よく判定することが可能となる。
 <第6実施形態の変形例>
 第6実施形態の変形例に係る情報処理装置10について、図19及び図20を参照して説明する。なお、第6実施形態の変形例は、上述した第6実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第6実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図19を参照しながら、第6実施形態の変形例に係る情報処理装置10の機能的構成について説明する。図19は、第6実施形態の変形例に係る情報処理装置の機能的構成を示すブロック図である。なお、図19では、図8、図11及び図14に示した構成要素と同様のものに同一の符号を付している。
 図19に示すように、第6実施形態の変形例に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200とを備えている。そして、第6実施形態の変形例に係る尤度比算出部100は特に、結合部110、比較部120、差分演算部130、及び操作検出部150を備えて構成されている。即ち、第6実施形態の変形例に係る尤度比算出部100は、第3実施形態で説明した結合部110、第4実施形態で説明した比較部120、及び第5実施形態で説明した差分演算部130をいずれも備えており、それらに加えて操作検出部150を更に備えて構成されている。なお、操作検出部150は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 操作検出部150は、ユーザによる操作を検出可能に構成されている。具体的には、操作検出部150は、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかを選択する操作(以下、適宜「選択操作」と称する)を検出可能に構成されている。言い換えれば、操作検出部150は、第3実施形態で説明した結合ベクトルを用いて尤度比を算出する手法(図8から図10参照)、第4実施形態で説明した類似度を用いて尤度比を算出する手法(図11から図13参照)、及び第5実施形態で説明した差分ベクトルを用いて尤度比を算出する手法(図14から図16参照)のうち、いずれの手法を用いて尤度比を算出するかを選択する操作を検出可能とされている。操作検出部150は、例えば入力装置15(図1参照)によるユーザの選択操作を検出してよい。
 (動作の流れ)
 次に、図20を参照しながら、第6実施形態の変形例に係る情報処理装置10の動作の流れについて説明する。図20は、第6実施形態の変形例に係る情報処理装置の動作の流れを示すフローチャートである。
 図20に示すように、第6実施形態の変形例に係る情報処理装置10の動作が開始されると、まず操作検出部150がユーザによる選択操作を検出する(ステップS65)。そして、操作検出部150は、検出した選択操作に基づいて、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかを選択する(ステップS66)。
 なお、ユーザの選択操作を受け付ける際には、ユーザに選択操作を行うことを促す通知等が行われてよい。例えば、スピーカ等を介して、音声で選択操作を行うように通知をしてもよい。また、ディスプレイ等を用いて、画面表示で選択操作を行うように通知してもよい。画面表示を行う場合、ユーザは画面をタッチして選択操作を行ってもよい。例えば、画面上に結合部110、比較部120、及び差分演算部130の各々に対応する3つの領域が表示され、ユーザがそのいずれかの領域をタッチする操作を、選択操作として検出してもよい。
 その後、情報処理装置10は、ユーザの選択操作に対応する手法を用いて判定処理(即ち、尤度比を算出して系列データと登録データとが同一対象由来であるか否かを判定する処理)を実行する(ステップS67)。具体的には、ユーザが結合部110を選択する操作を行った場合、第3実施形態で説明した判定処理(図9参照)が実行される。ユーザが比較部120を選択する操作を行った場合場合、第4実施形態で説明した判定処理(図12参照)が実行される。ユーザが差分演算部130を選択する操作を行った場合、第5実施形態で説明した判定処理(図15参照)が実行される。
 なお、上述した例では、判定処理が実行される前に、ユーザによる選択操作を検出する例を説明したが、判定処理の途中で選択操作が検出されてもよい。例えば、データ取得部が系列データから要素を取得した後(即ち、ステップS11の後)に、選択操作が検出されてもよい。また、結合部110によって結合ベクトルが生成される直前(即ち、図9におけるステップS32の直前)に、選択操作が検出されてもよい。比較部120によって類似度が算出される直前(即ち、図12のステップS43の直前)に、選択操作が検出されてもよい。差分演算部130で差分ベクトルが算出される直前(即ち、図15におけるステップS52の直前)に、選択操作が検出されてもよい。
 (技術的効果)
 次に、第6実施形態の変形例に係る情報処理装置10によって得られる技術的効果について説明する。
 図19及び図20で説明したように、第6実施形態の変形例に係る情報処理装置10では、ユーザの操作に応じて、尤度比を算出する際に、結合部110、比較部120、及び差分演算部130のいずれを用いるかが選択される。このようにすれば、結合部110、比較部120、及び差分演算部130の3つの中から、最適な手法を選択して尤度比を算出することができる。よって、系列データと登録データとが同一対象由来であるかを精度よく判定することが可能となる。
 なお、上述した第6実施形態及び第6実施形態の変形例では、結合部110、比較部120、及び差分演算部130の3つを選択的に利用する例を挙げたが、結合部110、比較部120、及び差分演算部130のうち2つを選択的に利用するようにしてもよい。例えば、結合部110及び比較部120を選択的に利用するようにしてもよい。結合部110及び差分演算部130を選択的に利用するようにしてもよい。比較部120及び差分演算部130を選択的に利用するようにしてもよい。
 <第7実施形態>
 第7実施形態に係る情報処理装置10について、図21及び図22を参照して説明する。なお、第7実施形態は、上述した第1から第6実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第6実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (複数の登録データを対象とする判定)
 まず、図21を参照しながら、第7実施形態に係る情報処理装置10が実行する、複数の登録データを対象とする判定について説明する。図21は、第7実施形態に係る情報処理装置における複数の登録データを対象とする判定を概念的に示す図である。
 図21に示すように、第7実施形態に係る情報処理装置10では、入力される系列データに対して、複数の登録データが判定対象なっている。即ち、1つのクエリが、複数のターゲットと同一対象由来であるか否かを判定される構成となっている。例えば、図21に示すように、複数の登録データとして複数の人物の顔画像が登録されているとする。この場合、系列データとして入力される画像の人物と、登録された複数の人物のいずれが同一人物であるかが判定される。このように、複数の登録データを判定対象とする場合、系列データと、複数の登録データの各々とを考慮した尤度比が算出されればよい。具体的には、系列データと、複数の登録データの各々との類似度又は相違度を加味して、複数の尤度比が算出されればよい。
 (動作の流れ)
 次に、図22を参照しながら、第7実施形態に係る情報処理装置10の動作の流れについて説明する。図22は、第7実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図22では、図3で示した処理と同様の処理に同一の符号を付している。
 図22に示すように、第7実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された2つ以上の要素に基づいて尤度比を算出する。この際、尤度比算出部100は、系列データと複数の登録データとの類似度又は相違度を加味して、複数の尤度比を算出する(ステップS71)。即ち、尤度比は、判定対象の数(即ち、登録データの数)に応じた複数の尤度比を算出する。
 続いて、判定部200が、算出された複数の尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS72)。例えば、第1の尤度比が本人閾値に到達している場合、判定部200は、系列データと、第1の尤度比に対応する登録データとが同一人物由来であると判定する。同様に、第2の尤度比が本人閾値に到達している場合、判定部200は、系列データと、第2の尤度比に対応する登録データとが同一人物由来であると判定する。
 (技術的効果)
 次に、第7実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図21及び図22で説明したように、第7実施形態に係る情報処理装置10では、系列データと、複数の登録データの各々との類似度又は相違度を加味して、複数の尤度比が算出される。このようにすれば、複数の登録データが存在する場合(即ち、判定対象が複数存在する場合)であっても、系列データと、どの登録データとが同一対象由来であるのかを判定することができる。
 <第8実施形態>
 第8実施形態に係る情報処理装置10について、図23及び図24を参照して説明する。なお、第8実施形態は、上述した第7実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第7実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図23を参照しながら、第8実施形態に係る情報処理装置10の機能的構成について説明する。図23は、第8実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図23では、図2に示した構成要素と同様のものに同一の符号を付している。
 図23に示すように、第8実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200と、出力部400とを備えている。即ち、第8実施形態に係る情報処理装置10は、第1実施形態の構成(図2参照)に加えて、出力部400を更に備えて構成されている。出力部400は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。また、出力部400は、上述した出力装置(図1参照)を含んで構成されてもよい。
 出力部400は、判定部200による判定結果を出力可能に構成されている。即ち、出力部400は、系列データと登録データとが同一対象由来であるか否かの判定結果を出力可能に構成されている。また、出力部400は特に、判定結果として、系列データと同一対象由来である1つの登録データだけでなく、系列データと同一対象由来である可能性が高い複数の登録データを出力可能に構成されている。出力部400は、判定結果をディスプレイ等に出力するようにしてもよい。また、出力部400は、判定結果を、スピーカ等を介して音声で出力するようにしてもよい。
 (動作の流れ)
 次に、図24を参照しながら、第8実施形態に係る情報処理装置10の動作の流れについて説明する。図24は、第8実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図24では、図22で示した処理と同様の処理に同一の符号を付している。
 図24に示すように、第8実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、尤度比算出部100は、取得された2つ以上の要素に基づいて尤度比を算出する。この際、尤度比算出部100は、系列データと複数の登録データとの類似度又は相違度を加味して、複数の尤度比を算出する(ステップS71)。即ち、尤度比は、判定対象の数(即ち、登録データの数)に応じた複数の尤度比を算出する。
 続いて、判定部200が、算出された複数の尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS72)。そして、出力部400が、判定部200による判定結果として、1つ又は複数の登録のデータに関する情報を出力する(ステップS81)。
 例えば、複数の登録データの各々に対応する複数の尤度比のうち、本人閾値に到達した尤度比が1つだけであった場合(即ち、1つの登録データのみが同一対象由来であると判定された場合)、出力部400は、その尤度比に対応する1つの登録データに関する情報のみを判定結果として出力すればよい。一方で、複数の登録データの各々に対応する複数の尤度比のうち、本人閾値に到達した尤度比が複数あった場合、出力部400は、それら複数の尤度比に対応する複数の登録データに関する情報を判定結果として出力してもよい。また、複数の登録データの各々に対応する複数の尤度比のうち、本人閾値に到達した尤度比がなかった場合、出力部400は、最終的な値が本人閾値に近い順に所定個数の尤度比を選択し、選択した尤度比に対応する複数の登録データに関する情報を判定結果として出力してもよい。あるいは、本人閾値に到達した尤度比がなかった場合、出力部400は、最終的な値が本人閾値よりも低い選択閾値を超えている複数の尤度比を選択し、選択した尤度比に対応する複数の登録データに関する情報を判定結果として出力してもよい。
 (技術的効果)
 次に、第8実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図23及び図24で説明したように、第7実施形態に係る情報処理装置10では、系列データと同一対象由来である1つの登録データ、又は系列データと同一対象由来である可能性が高い複数の登録データを出力可能に構成されている。このようにすれば、系列データと同一対象由来である登録データを正確に1つに絞り込めないような場合であっても、複数の候補を判定結果として出力することができる。
 <第9実施形態>
 第9実施形態に係る情報処理装置10について、図25及び図26を参照して説明する。なお、第9実施形態は、上述した第7実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第7実施形態と同様であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
 (機能的構成)
 まず、図25を参照しながら、第9実施形態に係る情報処理装置10の機能的構成について説明する。図25は、第9実施形態に係る情報処理装置の機能的構成を示すブロック図である。なお、図25では、図2に示した構成要素と同様のものに同一の符号を付している。
 図25に示すように、第9実施形態に係る情報処理装置10は、その機能を実現するための処理ブロックとして、データ取得部50と、尤度比算出部100と、判定部200と、判定対象限定部500とを備えている。即ち、第9実施形態に係る情報処理装置10は、第1実施形態の構成(図2参照)に加えて、判定対象限定部500を更に備えて構成されている。判定対象限定部500は、例えば上述したプロセッサ11(図1参照)によって実現されてよい。
 判定対象限定部500は、登録データ記憶部300に記憶された複数の登録データに対して絞り込み処理を実行することで、判定対象を限定可能に構成されている。即ち、判定対象限定部500は、判定対象の数を減らすための処理を実行可能に構成されている。例えば、登録画像として顔画像データが記憶されている場合、判定対象限定部500が実行する絞り込み処理は、処理負荷の低い顔認証処理であってよい。この場合の顔認証処理は、そこまで精度の高いものでなくてよい(例えば、他人許容率が多少高いものであってもよい)。このような顔認証処理を実行すれば、仮に系列データと同一人物由来の登録データを1つに絞り込めなかったとしても、判定対象を、系列データと同一人物由来の可能性がある登録データのみ(即ち、記憶されているすべての登録データよりも少ない数の登録データ)に絞り込むことができる。
 (動作の流れ)
 次に、図26を参照しながら、第9実施形態に係る情報処理装置10の動作の流れについて説明する。図26は、第9実施形態に係る情報処理装置の動作の流れを示すフローチャートである。なお、図26では、図22で示した処理と同様の処理に同一の符号を付している。
 図26に示すように、第9実施形態に係る情報処理装置10の動作が開始されると、まずデータ取得部50が、系列データに含まれる要素を取得する(ステップS11)。データ取得部50は、取得した系列データの要素を、尤度比算出部100に出力する。
 続いて、判定対象限定部500が、取得された系列データの要素を用いて絞り込み処理を実行し、判定対象の数を限定する(ステップS91)。これにより、以降の処理は、限定された判定対象に対してのみ実行されることになる。即ち、登録データ記憶部300に記憶されているすべての登録データに対してではなく、絞り込み処理によって数が減らされた登録データに対して実行されることになる。
 尤度比算出部100は、取得された2つ以上の要素に基づいて尤度比を算出する。この際、尤度比算出部100は、系列データと限定された登録データとの類似度又は相違度を加味して、複数の尤度比を算出する(ステップS92)。そして、判定部200は、算出された複数の尤度比に基づいて、系列データと登録データとが同一対象由来であるか否かを判定する(ステップS93)。
 (技術的効果)
 次に、第9実施形態に係る情報処理装置10によって得られる技術的効果について説明する。
 図25及び図26で説明したように、第9実施形態に係る情報処理装置10では、絞り込み処理によって判定対象である登録データが限定される(即ち、判定対象の数が少なくされる)。このようにすれば、もともとの判定対象の数が膨大であったとしても、実際に尤度比を算出する判定対象の数を少なくすることが可能である。よって、情報処理装置10の処理負荷や処理に要する時間を効果的に抑制することができる。
 上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
 記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。
 この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う情報処理装置、情報処理方法、及びコンピュータプログラムもまたこの開示の技術思想に含まれる。
 <付記>
 以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
 (付記1)
 付記1に記載の情報処理装置は、系列データに含まれる複数の要素を取得する取得手段と、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出する算出手段と、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定する判定手段とを備え、前記算出手段は、前記系列データと前記所定のデータとの類似度又は相違度を加味して、前記尤度比を算出することを特徴とする情報処理装置である。
 (付記2)
 付記2に記載の情報処理装置は、前記算出手段は、前記系列データから抽出した第1特徴量と、前記所定のデータから抽出した第2特徴量とを結合した結合特徴量に対して第1処理を行い、前記第1処理の処理結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を加味することを特徴とする付記1に記載の情報処理装置である。
 (付記3)
 付記3に記載の情報処理装置は、前記算出手段は、前記系列データから抽出した第1特徴量に対して第2処理を行い、前記第2処理後の前記第1特徴量と前記所定のデータから抽出した第2特徴量との比較結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を算出することを特徴とする付記1に記載の情報処理装置である。
 (付記4)
 付記4に記載の情報処理装置は、前記算出手段は、前記系列データから抽出した第1特徴量と、前記所定のデータから抽出した第2特徴量との差分である差分特徴量に対して第3処理を行い、前記第3処理の処理結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を算出することを特徴とする付記1に記載の情報処理装置である。
 (付記5)
 付記5に記載の情報処理装置は、前記算出手段は、複数の前記所定データの各々に対応する複数の前記尤度比を算出し、前記判定手段は、複数の前記尤度比に基づいて、前記系列データが複数の前記所定のデータのいずれと同一対象由来であるか否かを判定することを特徴とする付記1から4のいずれか一項に記載の情報処理装置である。
 (付記6)
 付記6に記載の情報処理装置は、前記判定手段は、前記系列データと同一対象由来であると判定した1つの前記所定のデータ、又は前記系列データと同一対象由来である可能性が高いと判定した2つ以上の前記所定のデータを判定結果として出力することを特徴とする付記5に記載の情報処理装置である。
 (付記7)
 付記7に記載の情報処理装置は、複数の前記所定データに対して絞り込み処理を行い、前記判定手段の判定対象となる前記所定のデータが少なくなるように限定する限定手段を更に備えることを特徴とする付記5又は6に記載の情報処理装置である。
 (付記8)
 付記8に記載の情報処理装置は、前記系列データは、対象の画像データ及び音声データの少なくとも一方を含み、前記算出手段は、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出することを特徴とする付記1から7のいずれか一項に記載の情報処理装置である。
 (付記9)
 付記9に記載の情報処理方法は、系列データに含まれる複数の要素を取得し、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味することを特徴とする情報処理方法である。
 (付記10)
 付記10に記載のコンピュータプログラムは、系列データに含まれる複数の要素を取得し、前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味するようにコンピュータを動作させることを特徴とするコンピュータプログラムである。
 (付記11)
 付記11に記載の記録媒体は、付記10に記載のコンピュータプログラムが記録されていることを特徴とする記録媒体である。
 10 情報処理装置
 11 プロセッサ
 14 記憶装置
 50 データ取得部
 100 尤度比算出部
 110 結合部
 120 比較部
 130 差分演算部
 140 選択部
 150 操作検出部
 200 判定部
 300 登録データ記憶部
 400 出力部
 500 判定対象限定部

Claims (10)

  1.  系列データに含まれる複数の要素を取得する取得手段と、
     前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出する算出手段と、
     前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定する判定手段と
     を備え、
     前記算出手段は、前記系列データと前記所定のデータとの類似度又は相違度を加味して、前記尤度比を算出する
     ことを特徴とする情報処理装置。
  2.  前記算出手段は、前記系列データから抽出した第1特徴量と、前記所定のデータから抽出した第2特徴量とを結合した結合特徴量に対して第1処理を行い、前記第1処理の処理結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を加味することを特徴とする請求項1に記載の情報処理装置。
  3.  前記算出手段は、前記系列データから抽出した第1特徴量に対して第2処理を行い、前記第2処理後の前記第1特徴量と前記所定のデータから抽出した第2特徴量との比較結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を算出することを特徴とする請求項1に記載の情報処理装置。
  4.  前記算出手段は、前記系列データから抽出した第1特徴量と、前記所定のデータから抽出した第2特徴量との差分である差分特徴量に対して第3処理を行い、前記第3処理の処理結果に基づいて前記尤度比を算出することで、前記系列データと前記所定のデータとの類似度又は相違度を算出することを特徴とする請求項1に記載の情報処理装置。
  5.  前記算出手段は、複数の前記所定のデータの各々に対応する複数の前記尤度比を算出し、
     前記判定手段は、複数の前記尤度比に基づいて、前記系列データが複数の前記所定のデータのいずれと同一対象由来であるか否かを判定する
     ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。
  6.  前記判定手段は、前記系列データと同一対象由来であると判定した1つの前記所定のデータ、又は前記系列データと同一対象由来である可能性が高いと判定した2つ以上の前記所定のデータを判定結果として出力することを特徴とする請求項5に記載の情報処理装置。
  7.  複数の前記所定データに対して絞り込み処理を行い、前記判定手段の判定対象となる前記所定のデータが少なくなるように限定する限定手段を更に備えることを特徴とする請求項5又は6に記載の情報処理装置。
  8.  前記系列データは、対象の画像データ及び音声データの少なくとも一方を含み、
     前記算出手段は、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出する
     ことを特徴とする請求項1から7のいずれか一項に記載の情報処理装置。
  9.  系列データに含まれる複数の要素を取得し、
     前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、
     前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、
     前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味する
     ことを特徴とする情報処理方法。
  10.  系列データに含まれる複数の要素を取得し、
     前記複数の要素のうち少なくとも2つの連続する要素に基づいて、前記系列データが所定のデータと同一対象由来であることの尤もらしさを示す尤度比を算出し、
     前記尤度比に基づいて、前記系列データが所定のデータと同一対象由来であるか否かを判定し、
     前記尤度比を算出する際に、前記系列データと前記所定のデータとの類似度又は相違度を加味する
     ようにコンピュータを動作させることを特徴とするコンピュータプログラム。
PCT/JP2020/049173 2020-12-28 2020-12-28 情報処理装置、情報処理方法、及びコンピュータプログラム WO2022144992A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022572838A JPWO2022144992A1 (ja) 2020-12-28 2020-12-28
US18/269,681 US20240061859A1 (en) 2020-12-28 2020-12-28 Information processing apparatus, information processing method, and computer program
PCT/JP2020/049173 WO2022144992A1 (ja) 2020-12-28 2020-12-28 情報処理装置、情報処理方法、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/049173 WO2022144992A1 (ja) 2020-12-28 2020-12-28 情報処理装置、情報処理方法、及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
WO2022144992A1 true WO2022144992A1 (ja) 2022-07-07

Family

ID=82259145

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/049173 WO2022144992A1 (ja) 2020-12-28 2020-12-28 情報処理装置、情報処理方法、及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US20240061859A1 (ja)
JP (1) JPWO2022144992A1 (ja)
WO (1) WO2022144992A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245314A (ja) * 2008-03-31 2009-10-22 Kddi Corp 時系列データの識別装置および動画像への人物メタ情報付与装置
WO2018179301A1 (ja) * 2017-03-30 2018-10-04 富士通株式会社 情報処理システム、情報処理装置、および情報処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245314A (ja) * 2008-03-31 2009-10-22 Kddi Corp 時系列データの識別装置および動画像への人物メタ情報付与装置
WO2018179301A1 (ja) * 2017-03-30 2018-10-04 富士通株式会社 情報処理システム、情報処理装置、および情報処理方法

Also Published As

Publication number Publication date
US20240061859A1 (en) 2024-02-22
JPWO2022144992A1 (ja) 2022-07-07

Similar Documents

Publication Publication Date Title
CN109522843B (zh) 一种多目标跟踪方法及装置、设备和存储介质
US11610394B2 (en) Neural network model training method and apparatus, living body detecting method and apparatus, device and storage medium
Tao et al. End-to-end audiovisual speech recognition system with multitask learning
JP5272215B2 (ja) ノイズ及び環境による影響を抑制することが可能な顔認識方法
US9767352B2 (en) Apparatus and method for analyzing body part association
Broun et al. Automatic speechreading with application to speaker verification
CN109886223B (zh) 人脸识别方法、底库录入方法、装置及电子设备
US10836044B2 (en) Robot control device and robot control method
JP6492746B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
US20210012064A1 (en) Recording medium recording complementary program, complementary method, and information processing device
Ponce-López et al. Non-verbal communication analysis in victim–offender mediations
WO2022144992A1 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
Lumini et al. Ensemble of on-line signature matchers based on overcomplete feature generation
WO2020137536A1 (ja) 人物認証装置、制御方法、及びプログラム
KR20160044858A (ko) 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체
US11404064B2 (en) Information processing apparatus and speech analysis method
Nijhawan et al. Real-time Object Detection for Visually Impaired with Optimal Combination of Scores
US20140177950A1 (en) Recognition device, method, and computer program product
US20240046704A1 (en) Determination method and determination apparatus
WO2024111113A1 (ja) 情報処理装置、情報処理方法及び記録媒体
WO2022137439A1 (ja) 情報処理システム、情報処理方法、及びコンピュータプログラム
WO2024079854A1 (ja) 情報処理装置、情報処理方法、及び記録媒体
JP7110293B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2001126074A (ja) パターンマッチングによるデータ検索方法及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20968005

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022572838

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 18269681

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20968005

Country of ref document: EP

Kind code of ref document: A1