WO2012060077A1 - 情報処理装置、情報処理システム、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法およびプログラム Download PDF

Info

Publication number
WO2012060077A1
WO2012060077A1 PCT/JP2011/006027 JP2011006027W WO2012060077A1 WO 2012060077 A1 WO2012060077 A1 WO 2012060077A1 JP 2011006027 W JP2011006027 W JP 2011006027W WO 2012060077 A1 WO2012060077 A1 WO 2012060077A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
test pattern
recognition
unit
information
Prior art date
Application number
PCT/JP2011/006027
Other languages
English (en)
French (fr)
Inventor
小山 和也
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Publication of WO2012060077A1 publication Critical patent/WO2012060077A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Definitions

  • the present invention relates to an information processing apparatus, and more particularly to an information processing apparatus that performs predetermined recognition processing on acquired data.
  • the present invention also relates to an information processing system, an information processing method, and a program.
  • the recognition process of the data recognition system performs some inference on the input data and outputs the inference result as the recognition result, compared with the normal computer calculation process that performs some calculation on the input data. Therefore, there is a characteristic that ambiguity remains in the correctness of the output. This ambiguity of correctness is the recognition accuracy.
  • the recognition accuracy of a data recognition system varies in a complex manner depending on the recognition processing method, various factors in the usage environment, the nature of the recognition target, and the like. For this reason, there is a problem that high recognition accuracy cannot be easily obtained even if the same system is used in different environments and applications.
  • Patent Document 1 discloses a method of inputting sample data prepared in advance and performing adjustment by looking at the recognition processing result in recognition of audio media.
  • the automatic adjustment function is basically dedicated to one recognition process, and the automatic adjustment function must be developed individually for each recognition process.
  • the problem of high development costs arises.
  • the reason for this is that there are multiple factors that contribute to the recognition accuracy of the recognition process, and there are multiple adjustment means for improving accuracy, and their relationships are complex and differ from one recognition process to another. This is because the created automatic adjustment function cannot obtain a sufficient effect by other recognition processing. Therefore, there is a problem that the recognition processing accuracy cannot be improved.
  • an object of the present invention is to solve the above-described problem that the recognition processing accuracy cannot be improved with respect to any recognition processing.
  • an information processing apparatus A data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and Connected to data preprocessing means for processing,
  • a request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle Meta information storage means storing meta information including a possible data format, and Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means Test pattern generation means for generating a plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information; Test pattern execution means for executing recognition processing based on each test pattern generated by the test pattern generation means; Test pattern selection means for selecting the test pattern based on the result
  • An information processing system A data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and A data preprocessing unit that performs processing, and performs a recognition process using the data preprocessing unit and the data analysis unit on the recognition target data acquired using the data acquisition unit
  • a request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle A meta information storage unit storing meta information including a possible data format, and an automatic adjustment unit.
  • the automatic adjustment unit Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means Test pattern generation means for generating a plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information; Test pattern execution means for passing each test pattern generated by the test pattern generation means to the recognition processing section and requesting the recognition processing section to execute recognition processing based on each test pattern; , In response to a request from the test pattern execution means, the recognition processing unit selects the test pattern based on the result of each recognition process executed based on the test pattern, and recognizes the selected test pattern.
  • a test pattern selection means to be set in the processing unit The recognition processing unit executes recognition processing of the recognition target data based on the test patterns in response to a request from the test pattern execution unit of the automatic adjustment unit, and sends the recognition processing result to the automatic adjustment unit. And performing recognition processing of the recognition target data based on the test pattern set by the test pattern selection unit of the automatic adjustment unit,
  • the configuration is as follows.
  • the program which is the other form of this invention is: A data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and Connected to data preprocessing means for processing, A request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle Meta information storage means storing meta information including a possible data format; Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means Test pattern generation means for generating a plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information; Test pattern execution means for executing recognition processing based on each test pattern generated by the test pattern generation means; Test pattern selecting means for selecting the test pattern based on the result of each recognition process executed based
  • an information processing method includes: A data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and Connected to data preprocessing means for processing, A request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle Meta information storage means storing meta information including a possible data format, and an information processing apparatus comprising: Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means A plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information, Recognizing processing is performed based on each of the generated test patterns, Selecting the test pattern based on the result of each recognition process executed based on the test pattern;
  • the configuration is as
  • the present invention which is configured as described above, can automatically adjust in accordance with any recognition process and improve the recognition process accuracy.
  • Embodiment 1 of this invention It is a block diagram which shows the structure in Embodiment 1 of this invention. It is a figure which shows the structure of the recognition request definition table in Embodiment 1 of this invention. It is a figure which shows the structure of the recognition execution definition table in Embodiment 1 of this invention. It is a block diagram which shows the structure of the table which the meta information management part in Embodiment 1 of this invention manages. It is a figure which shows the structure of the test pattern table in Embodiment 1 of this invention. It is explanatory drawing showing the operation
  • Embodiment 1 of this invention It is a flowchart which shows the detailed operation
  • Embodiment 2 of this invention It is a block diagram which shows the structure in Embodiment 2 of this invention. It is a figure which shows the structure of the recognition execution definition table in Embodiment 2 of this invention. It is a figure which shows the structure of the test pattern table in Embodiment 2 of this invention. It is a figure which shows the structure of the table which the meta-information management part in Embodiment 2 of this invention manages. It is a figure which shows the structure of the adjustment parameter definition in Embodiment 2 of this invention.
  • the information processing system according to the present invention is a system that acquires real-world data using a sensor such as a camera or a microphone, performs some recognition processing on the acquired data, and outputs a recognition result.
  • the system according to the present invention includes a configuration for automatically adjusting a system so as to be adapted to a plurality of different usage environments and uses while using various recognition engines. As a result, even if an arbitrary recognition process is added, changed, or deleted, it can be automatically adjusted to suit the environment and application, and high recognition accuracy can be obtained.
  • the detailed configuration and operation of the information processing system according to the first embodiment of the present invention will be described below.
  • a data recognition system 101 that is an information processing system according to the first embodiment of the present invention includes a computer 100 (information processing apparatus) that operates under program control.
  • a data acquisition unit 120 which is an external module, a data preprocessing unit 121, and a data analysis processing unit 122 are connected.
  • external modules such as the data acquisition unit 120, the data preprocessing unit 121, and the data analysis processing unit 122 may be configured to be incorporated in the data recognition system 101.
  • the data acquisition unit 120 (data acquisition means) is a mechanism for acquiring recognition target data as a recognition target from the outside, such as a camera or a microphone.
  • the data acquisition unit 120 is not limited to being a camera or a microphone.
  • the data pre-processing unit 121 (data pre-processing means) is a mechanism that processes the data in the same data format without inferring the data acquired by the data acquisition unit 120 or any runtime data processed by them. It is. That is, the data preprocessing unit 121 performs preprocessing of the contents on the recognition target data before being recognized by the data analysis processing unit 122 described later.
  • the preprocessing performed by the data preprocessing unit 121 includes, for example, noise removal and luminance adjustment for image data processing, volume adjustment and frequency characteristic change for audio data processing, and the like. However, the preprocessing performed by the data preprocessing unit 121 is not limited to the above-described processing.
  • the data analysis processing unit 122 (data analysis means) is a mechanism that performs some reasoning on the recognition target data that is input data and outputs the result. That is, the data analysis processing unit 122 analyzes the recognition target data according to a preset analysis rule, and performs a set recognition process.
  • the recognition processing performed by the data analysis processing unit 122 includes person recognition of image data, tracking of moving objects, natural language recognition of voice data, and the like.
  • the output result is output together with the inference result and the certainty of the inference (recognition accuracy).
  • the recognition process performed by the data analysis processing unit 122 is not limited to the process described above.
  • the data acquisition unit 120, the data preprocessing unit 121, and the data analysis processing unit 122 which are external modules described above, include execution units 131, 132, and 133, respectively, either spontaneously or from the computer 100. Each process is executed according to the command.
  • the computer 100 is a general server computer including a central processing unit (processor) and a storage device, and is configured by one or a plurality of computers.
  • the computer 100 includes a recognition processing unit 103 and an automatic adjustment processing unit 102 as shown in FIG.
  • the recognition processing unit 103 performs a recognition process on the recognition target data acquired using the data acquisition unit 102 using the data preprocessing unit 121 and the data analysis processing unit 122.
  • the automatic adjustment unit 103 sets a procedure by which the recognition processing unit 103 can execute recognition processing with high accuracy.
  • the configurations of the automatic adjustment unit 102 and the recognition processing unit 103 will be described in detail.
  • the automatic adjustment unit 102 includes a test pattern generation unit 104, a meta information management unit 105, a recognition request definition management unit 106, a test execution unit 108, a test pattern management unit 107, and an output monitor. Part 109.
  • the recognition processing unit 103 includes a recognition execution definition management unit 110, a runtime data management unit 112, a recognition execution unit 111, and a result output unit 113.
  • the test pattern generation unit 104, the test execution unit 108, the output monitoring unit 109, the recognition execution unit 111, and the result output unit 113 are incorporated into a central processing unit equipped in the computer 100. Is realized.
  • the meta information management unit 105, the recognition request definition management unit 106, the test pattern management unit 107, the recognition execution definition management unit 110, and the runtime data management unit 112 are storage devices provided in the computer 100. Is formed.
  • the recognition request definition management unit 106 (request definition information storage unit) included in the automatic adjustment unit 102 manages a plurality of recognition request definitions (request definition information).
  • the recognition request definition is a definition for defining the functional behavior of the recognition system, without recognizing accuracy, and a data acquisition process (data acquisition unit 120) and a data analysis process (data analysis processing unit 122) are connected in series.
  • FIG. 2 shows the data structure of the recognition request definition table 201 managed by the recognition request definition management unit 106.
  • the recognition request definition table 201 has a plurality of recognition request definitions, and each recognition request definition includes a “recognition request definition name”, one data acquisition unit name, and one or more data analysis processing unit names. Has "external module name”. It is assumed that the output data format of the data acquisition unit 120, which is the previous module, and the input data format of the data analysis processing unit 122, which is the subsequent module, always match.
  • the recognition execution definition management unit 110 included in the recognition processing unit 103 manages one recognition execution definition.
  • the recognition execution definition defines an external module call procedure for actually performing recognition processing, and is obtained by inserting zero or more pre-processing engine calls between modules into the recognition request definition.
  • FIG. 3 is a data model of the recognition execution definition 301 managed by the recognition execution definition management unit 110.
  • the first is a list of external module names that are the data acquisition unit 120, and subsequently, the module names of the data preprocessing unit 121 and the data analysis processing unit 122 are arranged in the order of calling.
  • the meta information management unit 105 (meta information storage unit) included in the automatic adjustment unit 102 manages meta information related to the use of the external module together with the module name for each external module.
  • the meta information varies depending on the type of external module.
  • FIG. 4 shows the data structure of the meta information tables 401, 402, and 403 managed by the meta information management unit 105.
  • the meta information 401 of the data acquisition unit 120 has an output data format that is a data format for outputting the recognition target data acquired by the data acquisition unit 120.
  • the meta information 402 of the data preprocessing unit 121 has an input / output data format that is a data format for inputting / outputting recognition target data to / from the data preprocessing unit 121.
  • the meta information 402 of the data preprocessing unit 121 has a property name indicating the property of the recognition target data processed by the data preprocessing unit 121, and this property is stored in the data analysis processing unit 122. If the recognition accuracy is affected when the recognition process is performed, it is a property of the recognition target data set in advance.
  • the meta information 403 of the data analysis processing unit 122 includes an input data format that is a data format for inputting recognition target data to the data analysis processing unit 122 and an output that indicates the data format of data output from the data analysis processing unit 122.
  • the meta information 403 of the data analysis processing unit 122 has a property name indicating the property of the recognition target data set in advance when the recognition accuracy is affected when the data analysis processing unit 122 performs the recognition process. ing.
  • the “data format” is a data format name such as voice, image, video, natural language text, person name, and the like.
  • the “property” represents the data property that can affect the inference accuracy of the analysis process, such as volume, luminance, noise amount, etc., but in other words, in the recognition target data. It is a predetermined element.
  • the test pattern management unit 107 included in the automatic adjustment unit 102 manages a recognition process procedure to be executed as a test, that is, a pattern including a calling procedure of each external module, and data of the test result.
  • FIG. 5 shows the data structure of the test pattern table 501 managed by the test pattern management unit 107.
  • the test pattern table 501 has a plurality of test patterns, and each test pattern includes a “test pattern name”, a “recognition execution definition” indicating a calling procedure of each external module, and a result of recognition processing using the pattern. It has a “recognition result”.
  • the runtime data management unit 112 included in the recognition processing unit 103 temporarily holds input / output data of the external module.
  • the runtime data management unit 112 holds data in an arbitrary data format, and the data structure is not particularly defined in the present invention.
  • the runtime data management unit 112 is formed in a primary storage device equipped in the computer 100, for example.
  • the data recognition system 101 has two operation modes: a normal recognition process execution mode and an automatic adjustment mode.
  • a normal recognition processing execution mode only the recognition processing unit 103 operates.
  • the automatic adjustment mode both the automatic adjustment unit 102 and the recognition processing unit 103 operate.
  • the recognition execution unit 111 included in the recognition processing unit 103 is an external module based on the recognition execution unit 111 that interprets the recognition execution definition (see FIG. 3) registered in the recognition execution definition management unit 110.
  • the data acquisition unit 120, the data preprocessing unit 121, and the data analysis processing unit 122 are sequentially called. At this time, when a test pattern selected based on a result of a test performed by the test execution unit 108 of the automatic adjustment unit 102 described later is registered in the recognition execution definition, the pattern is interpreted.
  • the recognition execution unit 111 is connected to a plurality of data acquisition units 120, a plurality of data preprocessing units 121, and a plurality of data analysis processing units 122, which are external modules.
  • the recognition execution unit 111 executes the recognition process in such a manner that the input / output data for each of the external modules 120, 121, and 122 is stored and referenced in the runtime data management unit 112.
  • the recognition execution unit 111 calls an external module
  • the input data in the runtime data management unit 112 is passed to call each execution unit 131, 132, 133, and the output of each execution unit 131, 132, 133
  • the result is stored in the runtime data management unit 112.
  • the recognition execution definition is interpreted by the recognition execution unit 111
  • the result output unit 113 outputs the output data of the last call to the outside of the system.
  • the recognition execution unit 111 in this embodiment is notified of a test pattern including the procedure of the recognition process from the test execution unit 108 of the automatic adjustment unit 102 and receives a request for the recognition process, the recognition execution unit 111 is based on the test pattern.
  • the recognition process is performed in the same manner as described above, and the recognition result is returned to the test execution unit 108.
  • the automatic adjustment unit 102 gives a test recognition execution definition (test pattern), calls the recognition processing unit 103, performs automatic adjustment by checking the result, and finally performs the automatic adjustment. Generate a recognition execution definition suitable for the purpose and environment.
  • meta information management unit 105 and the recognition request definition management unit 106 are registered as advance preparations.
  • meta information necessary for using an available external module is registered in the meta information management unit 105
  • a recognition request definition is registered in the recognition request definition management unit 106.
  • Each of the meta information management unit 105 and the recognition request definition management unit 106 has a function of adding, changing, or deleting management information in response to a request from a user or system outside the recognition system.
  • test pattern generation unit 104 When a recognition request definition to be used is specified and automatic recognition is instructed to the recognition system in a situation where the recognition system 101 is used, the test pattern generation unit 104 (test pattern generation unit) first recognizes the recognition request definition management unit. The designated recognition request definition is extracted from 106. Then, the test pattern generation unit 104 extracts the input / output data format of the external module described in the recognition request definition from the meta information management unit 105 and information on the list of affected properties, and sets the data format of each external module. A list of data preprocessing units 121 that can be handled and can change the affected property of the data analysis processing unit 122 in the subsequent stage is extracted.
  • test pattern generation unit 104 selects an arbitrary number of data preprocessing units 121 from the list of the data preprocessing units 121 extracted between the external modules described in the recognition request definition.
  • a recognition execution definition in which the calling procedures arranged in the above order are inserted is generated as a test pattern.
  • the test pattern generation unit 104 generates a plurality of different tests by generating all combinations when an arbitrary number is selected from the extracted list of the data preprocessing unit 121 and arranged in an arbitrary order.
  • a pattern is generated and registered in the test pattern management unit 107.
  • FIG. 5 is a diagram showing an example of the test pattern table 501 generated by the test pattern generation unit 104 and registered in the test pattern management unit 107 as described above.
  • FIG. 6 is an explanatory diagram showing a relationship between a preset recognition request definition and a recognition execution definition generated by the test pattern generation unit 104. Details will be described later.
  • test execution unit 108 executes the test patterns generated as described above one by one. Specifically, the test execution unit 108 extracts the recognition execution definition from the test pattern, registers it in the recognition execution definition management unit 110 of the recognition processing unit 103, calls the recognition execution unit 111, and requests execution of the recognition process. When the recognition execution unit 111 finishes interpreting the recognition execution definition and outputs the result, the output monitoring unit 109 extracts the recognition accuracy information from the result and stores it as a test pattern recognition result.
  • the test execution unit 108 selects the pattern with the highest accuracy of the recognition result from the patterns stored in the test pattern management unit 107, which is the optimum recognition operation.
  • the recognition execution definition of the pattern is taken out and registered in the recognition execution definition management unit 110 of the recognition processing unit 103, and the automatic adjustment mode is terminated.
  • FIG. 7 is a flowchart showing the overall operation of the data recognition system 101, and will be described with reference to this flowchart.
  • the data recognition system 101 waits for an external event (step S700), and when the event is recognition execution (step S701: Yes), the recognition processing unit 103 executes recognition processing (step S702).
  • step S703 Yes
  • the request information is registered in the meta information management unit 105 (step S705).
  • step S703 No
  • step S704 Yes
  • the request information is registered in the recognition request definition management unit 106 (step S706).
  • step S704 When the external event is not a recognition request definition registration request (step S704: No) but an automatic adjustment start request with a recognition request definition to be used (step S707: Yes), the test pattern generation unit 104. However, a plurality of test patterns are generated and registered in the test pattern management unit 107 (step S708).
  • test execution unit 108 extracts an unexecuted test pattern from the test pattern management unit 107 (step S709), and registers the test pattern recognition execution definition in the recognition execution definition management unit 110 (step S710). Then, the test execution 108 calls the recognition processing unit 103 to execute the recognition process (step S711).
  • the output monitoring unit 109 waits for a recognition result from the recognition processing unit 103 (step S712), and when the recognition result is acquired, the result is registered in the test pattern management unit 107 (step S713).
  • test execution unit 108 repeats the recognition process for all test patterns (steps S709 to S714).
  • step S714: Yes the test execution unit 108 refers to the recognition accuracy that is the recognition result and selects the test pattern with the highest recognition accuracy (step S715).
  • the recognition execution definition of the test pattern is registered in the recognition execution definition management unit 110 (step S716).
  • the recognition execution unit 111 first extracts the data acquisition unit name from the recognition execution definition table of the recognition execution definition management unit 110 (step S800), and calls the data acquisition unit 120 with the extracted name to obtain the data. Acquired (step S801) and stored in the runtime data management unit 112.
  • the recognition execution unit 111 sequentially extracts external module names from the recognition execution definition (step S802), and executes external modules having the extracted external module names (the data preprocessing unit 121 and the data analysis processing unit 122) at the time of execution.
  • the data stored in the data management unit 112 is transferred and called (step S803).
  • the recognition execution unit 111 stores the execution result of the called external module in the runtime data management unit 112.
  • the recognition execution unit 111 repeats the above processing (steps S802 to S804) until the execution of all external modules of the recognition execution definition is completed, and when the execution of all external modules is completed (step S804: Yes), the result
  • the output unit 113 outputs the data stored in the runtime data management unit 112 as a recognition result to the outside of the data recognition system 101 (step S805).
  • the recognition process has been called from the automatic adjustment unit 102 (step S806: Yes)
  • the data is further passed to the output monitoring unit 109 (step S807).
  • test pattern generation unit 104 generates a test pattern in step S708 of FIG. 7 described above will be described with reference to the flowchart of FIG.
  • the test pattern generation unit 104 when receiving a recognition request definition name to be tested (step S900), the test pattern generation unit 104 extracts a list of external module names corresponding to the recognition request definition name from the recognition request definition management unit 106 (step S901). . Then, the test pattern generation unit 104 generates one test pattern having the external module name list of the recognition request definition as it is and adds it to the test pattern management unit 107 (step S902).
  • test pattern generation unit 104 except for the data acquisition unit name at the top of the list of external module names in the recognition request definition, the data analysis processing unit name among all the data analysis processing unit names included in the list Is taken out (step S903). Subsequently, the test pattern generation unit 104 selects “input data associated with the module corresponding to the data analysis processing unit name extracted from the data analysis processing unit meta information table 403 (see FIG. 4) of the meta information management unit 105. The “format” and the “property name list” are extracted (step S904).
  • the “input / output data format” of the data preprocessing unit matches the “data format” of the extracted data analysis processing unit, and
  • the “property name” of the data preprocessing unit extracts a list of external module names of the data preprocessing unit included in the “property name list” of the extracted data analysis processing unit (step S905).
  • the test pattern generation unit 104 includes one or more arbitrary numbers of external module names from the extracted list of data preprocessing units, and includes a plurality of combination lists of data preprocessing units in which the names are arranged in an arbitrary order.
  • a list is generated (step S906). For example, it is assumed that all combinations of external module names that are data pre-processing units and combinations in which all the orders in the combinations are exchanged are generated exhaustively.
  • test pattern generation unit 104 checks the current input data format in the recognition execution definition included in each test pattern for all the test patterns registered in the test pattern management unit 107.
  • a new test pattern is generated by inserting the combination list of data preprocessing unit names generated in step S906 before the analysis processing unit name. Then, new test patterns are generated for all of the combinations included in the list of combinations of the data preprocessing unit 121, and the new test patterns are added to the test pattern management unit 107 (step S907).
  • the test pattern generation unit 104 performs the above-described processing for all data analysis processing unit names in the recognition request definition (steps S903 to S908).
  • the test pattern generation unit 104 completes the test pattern generation processing when the above processing is completed for all the data analysis processing unit names in the recognition request definition (step S908: Yes).
  • step S905 in the above description of the operation it has been described that the list of the data preprocessing unit 121 is extracted using the input data format of the data input to the data analysis processing unit 122.
  • the present invention is not limited to such processing. Since the data format of the input of a certain external module matches the output of the previous external module, the data format of the output of the external module set in the previous stage is used instead of the input data format of the data analysis processing unit 122 described above.
  • the list of the data preprocessing unit 121 having an input / output data format that matches the data format may be used.
  • the recognition processing unit 103 interprets the recognition execution definition and calls an external module, and the meta information of the external module is registered in the meta information management unit 105, so that the data recognition system
  • the test pattern generation unit 104 uses the recognition request definition describing only the function request of the operation 101 to generate a recognition execution definition in which a combination of various data preprocessing units is inserted using the recognition request definition and meta information
  • the test execution unit 108 is configured to test all the generated patterns and select the pattern with the highest accuracy. For this reason, even when using the data recognition system 101 that employs a new combination of the data acquisition unit 120 and the data analysis processing unit 122, the data recognition system 101 having an automatic adjustment function can be obtained simply by adding a recognition request definition. Can be used.
  • a recognition system having an automatic adjustment function can be obtained by simply adding meta information of the data analysis processing unit 122 and a recognition request definition using the data analysis processing unit 122. Can be used. Thus, even when the recognition system performs a new recognition process, the automatic adjustment function can be used without developing the automatic adjustment function individually.
  • Embodiment 2 Next, the data recognition system in Embodiment 2 of this invention is demonstrated with reference to FIG. 10 thru
  • each external module has a function of accepting setting of adjustment parameters for changing the internal operation of the own module, and has adjustment parameter information that can be set for each module as meta information.
  • a test pattern is generated in consideration of various combinations of adjustment parameters.
  • FIG. 10 shows a configuration diagram of the data recognition system 101 in the present embodiment.
  • each external module 120, 121, 122 has adjustment parameter setting units 1010, 1011, 1012 in addition to the execution units 131, 132, 133.
  • FIG. 11 is a configuration diagram of the recognition execution definition table 1101 in the present embodiment.
  • FIG. 12 is a configuration diagram of the test pattern table 1201 in the present embodiment.
  • Each of the tables 1101 and 1201 has a set of adjustment parameters to be set for the external module when the external module is called in addition to the external module name.
  • FIG. 13 is a diagram showing a data structure of meta information managed by the meta information management unit 105 in the present embodiment.
  • Each meta information table 1301, 1302, 1303 has an adjustment parameter definition in addition to the external module name.
  • FIG. 14 is an explanatory diagram illustrating details of the adjustment parameter definition.
  • One adjustment parameter definition includes a parameter name and a set of parameter ranges.
  • adjustment parameters can be set for all external modules such as the data acquisition unit, data preprocessing unit, and data analysis processing unit. However, adjustment parameters can be set only for one of the external modules. There may be.
  • the recognition execution unit 111 in the present embodiment calls an external module described in the recognition execution definition of the recognition execution definition management unit 110
  • the recognition execution unit 111 passes the adjustment parameters to the external module setting units 1010, 1011 and 1012.
  • the execution units 131, 132, 133 are called.
  • FIG. 15 is a flowchart showing the operation of the test pattern generation unit 104 in the present embodiment.
  • the flowchart in FIG. 15 is almost the same as that in FIG. 9, and only different processing parts are denoted by different reference numerals.
  • step S1502 before adding the same recognition execution definition as the recognition request definition to the test pattern, all the data acquisition units 120 and data analysis processing units 122 included in the recognition request definition are adjusted from the meta information management unit 105.
  • the definition is extracted, and different combinations of patterns are generated for the setting values of all the parameters of all the external modules included in the recognition request definition (step S1501). Then, the generated test pattern is registered in the test pattern management unit 107 (step S1502).
  • step 906 after a list of combinations of the data preprocessing unit 121 is created, adjustment parameter definitions for all the data preprocessing units 121 included in the combination list are further extracted from the meta information management unit 105 for each combination list. Then, different combinations of patterns are generated for the set values of all the parameters of all the data preprocessing units 121 included in the combination list (step S1503). Then, the generated test pattern is registered in the test pattern management unit 107 (step S907).
  • the range of the adjustment parameter has been described as a set of discrete values. However, when the range is a numerical value of 1 to 100 or the like, the set value pattern is 1, 10, 20,. .., 90, 100, etc., and appropriate extracted values within the range may be used.
  • each external module when each external module can change the operation using the adjustment parameter, it is possible to automatically adjust the setting value of the adjustment parameter that increases the analysis accuracy. Become.
  • Embodiment 3 Next, the data recognition system in Embodiment 3 of this invention is demonstrated with reference to FIG. 16 thru
  • the test pattern generation unit 104 generates test patterns of possible combinations for all the data preprocessing units 121 and adjustment parameters, and the test execution unit 108 executes them.
  • the test execution unit 108 executes the test pattern, based on the result, a pattern that cannot be expected to improve accuracy from the already executed pattern among the unexecuted test patterns. It may be deleted from the test pattern management unit 107 and only a part of the generated test patterns may be tested.
  • FIG. 16 is a configuration diagram of the data recognition system 101 in the present embodiment.
  • the data recognition system 101 according to the present embodiment further includes a branch picking rule management unit 1601 in addition to the systems according to the first and second embodiments described above.
  • FIG. 17 is a configuration diagram of the branch picking rule table 1701 possessed by the branch picking rule management unit 1601 and has a plurality of rules.
  • This rule describes an arbitrary algorithm for checking the state of the test pattern management unit 107 and deleting an unexecuted test pattern, for example, a script written in a script language.
  • the recognition execution definition that is almost the same as other test patterns is that the difference between the recognition accuracy that is the result of recognition processing using a test pattern and the recognition accuracy that is the result of recognition processing using another test pattern is greater than or equal to the threshold If another test pattern with a specified value is within a setting range that is slightly different from the adjustment parameter of a specific external module that is set for the other test pattern above, Since it is determined that accuracy cannot be improved, the test pattern is deleted without executing another test pattern.
  • the content of the algorithm is not particularly defined in the present invention.
  • FIG. 18 is a flowchart showing the operation of the data recognition system 101 in this embodiment. Note that the flowchart in FIG. 18 is substantially the same as that in FIG. 7, and only different processing parts are denoted by different reference numerals.
  • step S1801 When the event from the outside is a branch picking rule registration request (step SS1801: Yes), the data recognition system 101 registers the branch picking rule (step S1802). Further, when executing the recognition process using the generated test pattern, all registered branch hunting rules are executed (step S1803).
  • a test pattern that is unlikely to improve accuracy may be deleted before execution, but the result with the highest analysis accuracy may not be obtained, but automatic adjustment is performed in a shorter time. The result can be obtained.
  • Embodiment 4 Next, the data recognition system in Embodiment 4 of this invention is demonstrated.
  • the analysis accuracy that is the result of the recognition processing by the data recognition system 101 is output by the data analysis processing unit 122 itself.
  • the correct answer of the recognition processing result for the recognition target data is registered in the output monitoring unit 109 in advance.
  • the output monitoring unit 109 compares the result of the recognition process using each test pattern output from the result output unit 113 with the correct answer registered in advance, and calculates the analysis accuracy from the correct answer rate. .
  • the analysis accuracy is either 0% or 100% depending on whether the answer is correct or incorrect. It is better to prepare the correct answer and calculate the analysis accuracy more finely.
  • FIG. 19 is a configuration diagram of the data recognition system of this embodiment.
  • a camera 1901 and a microphone 1902 are provided as a data acquisition unit which is an external module.
  • a data preprocessing unit that is an external module
  • a video noise filter 1903, a brightness adjustment filter 1904, a sharpness filter 1905, and an audio noise filter 1906 are provided as a data preprocessing unit that is an external module.
  • a face extraction engine 1907, a person recognition engine 1908, and a conversation recognition engine 1909 are provided as data analysis processing units which are external modules.
  • the face extraction engine 1907 extracts only a portion where a human face video is shown from an arbitrary video
  • the person recognition engine 1908 obtains the person's name from the video showing a human face.
  • the conversation recognition engine 1909 converts the conversation content in the voice into a character string.
  • FIG. 20 shows the registration contents of the recognition request definition management unit 106 in this embodiment.
  • Each recognition request definition includes a data acquisition unit composed of a camera and the like, and a data analysis processing unit composed of each engine.
  • FIG. 21 shows registration contents of the meta information management unit 105 of this embodiment.
  • meta information tables 2101, 2102, 2103 of each external module are registered in advance.
  • the adjustment parameter definition indicates that no adjustment parameter is provided when it is blank, and the notation “ ⁇ ” indicates a value candidate as a range.
  • FIG. 22 shows the registration contents of the pruning rule table 2201 in the present embodiment, and it is assumed that no rule is registered here.
  • the data recognition system 101 When the user of the data recognition system 101 designates the recognition request name “person recognition” and sends an automatic adjustment start request, the data recognition system 101 first obtains a test pattern from the registered recognition request definition and meta information. Generate.
  • the test pattern generation unit 104 takes out the corresponding recognition request definition from the recognition request definition management unit 106.
  • a list of cameras, face extraction engines, and person recognition engines is extracted from the recognition request definition table 2001 shown in FIG.
  • the test pattern generation unit 104 extracts meta information of each external module of the camera, the face extraction engine, and the person recognition engine from the meta information management unit 105.
  • each meta information is taken out from each meta information table 2101, 2102 and 2103 shown in FIG.
  • the test pattern generation unit 104 generates an adjustment parameter combination list.
  • a set value combination list is created for “focus” and “automatic zoom” that are the adjustment parameters of the camera 1901.
  • the following four combinations (1-1) to (1-4) can be generated.
  • test pattern generation unit 104 generates the four patterns shown in FIG. A unique name is automatically generated as the test pattern name.
  • the test pattern generation unit 104 extracts meta information with the input data format “image” and the influence properties “contour” and “color”, and sets the corresponding data pre-processing unit as the meta information. Obtained from the information management unit 105.
  • three items of “image noise filter”, “brightness adjustment filter”, and “sharpness filter” are obtained.
  • Video noise filter (2-2) Brightness adjustment filter (2-3) Sharpness filter (2-4) Video noise filter and brightness adjustment filter (2-5) Brightness adjustment filter and video noise filter (2- 6) Brightness adjustment filter, sharpness filter (2-7) Sharpness filter, brightness adjustment filter (2-8) Video noise filter, sharpness filter (2-9) Sharpness filter, video noise filter (2-10) Video noise filter, Brightness adjustment filter, sharpness filter (2-11) Video noise filter, sharpness filter, brightness adjustment filter (2-12) Brightness adjustment filter, video noise filter, sharpness filter (2-13) Brightness adjustment filter, sharpness filter, video noise Filter (2- 14) Sharpness filter, video noise filter, brightness adjustment filter (2-15) Sharpness filter, brightness adjustment filter, video noise filter
  • the adjustment parameter combination list is generated.
  • the “brightness adjustment filter” can set the adjustment parameter, and the variation is only one of the adjustment types “bright, dark”. Therefore, the variation including the “brightness adjustment filter” is subdivided so as to consider the variation of the adjustment parameter.
  • a list including 26 combinations (variations) such as the following (3-1) to (3-26) can be generated.
  • any one of the 26 patterns (3-1) to (3-26) is inserted before the “face extraction engine”. Generated test pattern.
  • 104 test patterns are newly generated at 4 ⁇ 26, and 108 test patterns are registered by adding the original four patterns.
  • FIG. 24 shows an example of a test pattern to be added. The pattern corresponding to the above 26 variations is inserted into “pattern-1” shown in FIG.
  • test pattern generation unit 104 performs an insertion process of the data preprocessing unit similar to the above-described “face extraction engine” for the “person recognition engine”.
  • the “person recognition engine” has a data format of “image” and an influence property of “contour”, two types of “video noise filter” and “sharpness filter” are obtained, and combinations thereof are as follows ( 4-1) to (4-4).
  • Video noise filter (4-1) Video noise filter (4-2) Sharpness filter (4-3) Video noise filter, sharpness filter (4-4) Sharpness filter, video noise filter
  • FIG. 25 shows an example of a test pattern to be added, in which patterns for the above four variations are inserted into pattern-5 in FIG.
  • test pattern generation is now complete, and then the test execution by the test execution unit 108 is started.
  • the test execution unit 108 extracts 540 test patterns registered in the test pattern management unit 107 one by one, registers the recognition execution definition of each pattern in the recognition execution definition management unit 110, and calls the recognition execution unit 111.
  • the recognition execution unit 111 extracts the recognition execution definition from the recognition execution definition management unit 110 and executes it.
  • “Pattern-5” in FIG. 24 will be described as an example.
  • the contents of FIG. 26 are registered in the recognition execution definition management unit 110.
  • the video noise filter 1903 is taken out as the external module name, the video data stored in the runtime data management unit 112 is passed, noise removal processing is performed, and the video data from which noise has been removed is executed. 112 to save.
  • the face extraction engine 1907 is taken out as the external module name, the video data stored in the runtime data management unit 112 is passed, and the face extraction process is executed. Then, video data obtained by clipping only a portion of the video where an object estimated to be a face is clipped and the analysis accuracy thereof are stored in the runtime data management unit 112.
  • the person recognition engine 1908 is taken out as the external module name, the video data stored in the runtime data management unit 112 is passed, and the person recognition process is executed. Then, the name of the person estimated from the face image and the analysis accuracy thereof are stored in the runtime data management unit 112.
  • the result output unit 113 outputs the person name stored in the runtime data management unit 112 as a recognition result to the outside of the system.
  • the recognition process described above is called from the automatic adjustment unit 102, the person name and the analysis accuracy are passed to the output monitoring unit 109.
  • the output monitoring unit 109 When the output monitoring unit 109 receives the person name and the analysis accuracy, the output monitoring unit 109 passes the result to the test execution unit 108, assuming that one test pattern has been executed.
  • the test execution unit 108 stores the analysis accuracy in the test pattern management unit 107 as the pattern execution result.
  • test execution unit 108 executes the rule registered in the pruning rule management unit 1601, but nothing is performed because it is not registered here.
  • FIG. 27 is a diagram illustrating a state of the test pattern management unit 107 when execution of the test pattern is completed.
  • the accuracy of analysis represents the degree of certainty in percent, and the higher the numerical value, the higher the degree of guessing.
  • the test execution unit 108 compares the recognition results of all the patterns and selects the pattern with the best numerical value.
  • the test execution unit 108 sends the recognition execution definition of “Pattern-5” and its adjustment parameters to the recognition execution definition management unit 110. Register and end automatic adjustment.
  • a facial expression recognition system having an automatic adjustment function can be used only by adding a recognition request definition for facial expression recognition as shown in FIG. 28 and meta information of the facial expression recognition engine as shown in FIG. .
  • the present invention can be applied to applications such as developing a recognition system that can obtain high accuracy in various environments and applications at low cost.
  • various data acquisition units and data analysis processes are prepared as components and can be easily combined according to the application to constitute a recognition system.
  • data preprocessing means 3021 for performing preprocessing of A request definition information storage unit 3011 that stores request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit, respectively.
  • Meta information storage means 3012 in which meta information including a handleable data format is stored, and Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means
  • a test pattern generation unit 3013 for generating a plurality of test patterns added to the calling procedure including the data acquisition unit and the data analysis unit defined in the request definition information;
  • Test pattern execution means 3014 for executing recognition processing based on each test pattern generated by the test pattern generation means;
  • Test pattern selection means 3015 for selecting the test pattern based on the result of each recognition process executed based on each test pattern by the test pattern execution means, Information processing apparatus 3001.
  • (Appendix 2) An information processing apparatus according to attachment 1, wherein The meta information is input to the data format of the recognition target data output from the data acquisition unit, the data format of the recognition target data input to and output from the data preprocessing unit, and the data analysis unit.
  • the test pattern generation unit is configured to generate the recognition target data in a data format that is output from the data acquisition unit included in the calling procedure defined in the request definition information and can be input to the data analysis unit based on the meta information.
  • the meta information has information that specifies elements in the recognition target data to be processed by the data preprocessing unit and influences the recognition process when the data analysis unit performs the recognition process in advance.
  • Information for identifying an element in the set recognition target data, and The test pattern generation means is the same as the information for identifying an element in the recognition target data associated with the data analysis means included in the calling procedure defined in the request definition information based on the meta information.
  • the data preprocessing means associated with the information is extracted, and the extracted data preprocessing means represents a new calling procedure added between the data acquisition means and the data analysis means included in the calling procedure. Generating each of the test patterns; Information processing device.
  • the meta information includes parameter information indicating a value of a parameter capable of setting its own operation state for at least one of the data acquisition unit, the data preprocessing unit, and the data analysis unit
  • the test pattern generation means can be set based on the meta information for at least one of the data acquisition means, the data preprocessing means, and the data analysis means included in the generated test pattern. Generating a plurality of test patterns each having a parameter value set; Information processing device.
  • test pattern deletion means for deleting a test pattern is provided.
  • Information processing device An information processing apparatus according to any one of appendices 1 to 4, Based on the result of recognition processing based on each test pattern by the test pattern execution means, among the test patterns generated by the test pattern generation means, the test pattern execution means not executed by the test pattern execution means A test pattern deletion means for deleting a test pattern is provided.
  • Information processing device Based on the result of recognition processing based on each test pattern by the test pattern execution means, among the test patterns generated by the test pattern generation means, the test pattern execution means not executed by the test pattern execution means.
  • test pattern selection unit calculates an analysis accuracy with respect to a preset reference for each result obtained by recognizing the recognition target data based on each test pattern by the test pattern execution unit, and the analysis accuracy is the highest. Select the test pattern that resulted in a high recognition process, Information processing device.
  • test pattern selection means includes information on results obtained by recognizing the recognition target data based on the test patterns by the test pattern execution means, and correct recognition processing for the recognition target data set in advance. Selecting the test pattern that resulted from the recognition process with the highest analysis accuracy calculated by comparing the correct answer data, Information processing device.
  • a data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and A data preprocessing unit that performs processing, and performs a recognition process using the data preprocessing unit and the data analysis unit on the recognition target data acquired using the data acquisition unit
  • a request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle
  • a meta information storage unit storing meta information including a possible data format, and an automatic adjustment unit.
  • the automatic adjustment unit Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means Test pattern generation means for generating a plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information; Test pattern execution means for passing each test pattern generated by the test pattern generation means to the recognition processing section and requesting the recognition processing section to execute recognition processing based on each test pattern; , In response to a request from the test pattern execution means, the recognition processing unit selects the test pattern based on the result of each recognition process executed based on the test pattern, and recognizes the selected test pattern.
  • a test pattern selection means to be set in the processing unit The recognition processing unit executes recognition processing of the recognition target data based on the test patterns in response to a request from the test pattern execution unit of the automatic adjustment unit, and sends the recognition processing result to the automatic adjustment unit. And performing recognition processing of the recognition target data based on the test pattern set by the test pattern selection unit of the automatic adjustment unit, Information processing system.
  • the information processing system includes a data format of the recognition target data output from the data acquisition unit, and a data format of the recognition target data input to and output from the data preprocessing unit.
  • the test pattern generation means included in the automatic adjustment unit is based on the meta information, and is output from the data acquisition means included in the calling procedure defined in the request definition information and can be input to the data analysis means
  • the data preprocessing means for inputting / outputting the recognition target data in the format is extracted, and the extracted data preprocessing means is added between the data acquisition means and the data analysis means included in the calling procedure. Generating each test pattern representing a new calling procedure; Information processing system.
  • a data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and Connected to data preprocessing means for processing,
  • a request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle Meta information storage means storing meta information including a possible data format;
  • the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means Test pattern generation means for generating a plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information;
  • Test pattern execution means for executing recognition processing based on each test pattern generated by the test pattern generation means;
  • Test pattern selecting means for selecting the test pattern based on the result of each recognition process executed based on the test pattern by the test pattern
  • the program according to attachment 10 wherein The meta information is input to the data format of the recognition target data output from the data acquisition unit, the data format of the recognition target data input to and output from the data preprocessing unit, and the data analysis unit.
  • the test pattern generation unit is configured to generate the recognition target data in a data format that is output from the data acquisition unit included in the calling procedure defined in the request definition information and can be input to the data analysis unit based on the meta information.
  • a data acquisition unit that acquires recognition target data; a data analysis unit that analyzes the recognition target data and performs a recognition process; and Connected to data preprocessing means for processing,
  • a request definition information storage unit storing request definition information in which a calling procedure between the data acquisition unit and the data analysis unit to be called at the time of recognition processing is defined, and at least the data analysis unit and the data preprocessing unit respectively handle Meta information storage means storing meta information including a possible data format
  • an information processing apparatus comprising: Based on the request definition information and the meta information, the data preprocessing means capable of performing preprocessing on the recognition target data to be recognized by the data analysis means is extracted, and the data preprocessing means A plurality of test patterns added to the calling procedure including the data acquisition means and the data analysis means defined in the request definition information, Recognizing processing is performed based on each of the generated test patterns, Selecting the test pattern based on the result of each recognition process executed based on the test pattern; Information processing method.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 データ獲得手段とデータ解析手段との呼び出し手順が定義された要求定義情報と、上記各手段がそれぞれ取り扱い可能なデータ形式を含むメタ情報とに基づいて、データ解析手段にて認識処理される認識対象データに対する前処理を行うことが可能なデータ前処理手段を抽出し、当該データ前処理手段を要求定義情報にて定義されたデータ獲得手段とデータ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、テストパターン生成手段にて生成された各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、テストパターン実行手段にて各テストパターンに基づいて実行された各認識処理の結果に基づいてテストパターンを選定するテストパターン選定手段と、を備えた。

Description

情報処理装置、情報処理システム、情報処理方法およびプログラム
 本発明は、情報処理装置にかかり、特に、取得したデータに対する所定の認識処理を行う情報処理装置に関する。また、情報処理システム、情報処理方法、プログラムに関する。
 カメラやマイクなどのセンサーを用いて実世界のデータを取得し、何らかの認識処理を行い、認識結果を出力する様々なデータ認識システムがある。例えば、カメラ画像データから人間の顔を識別し、人間が誰であるかを認識するシステムや、マイクが出力する音声データから人間の話し言葉を識別し、言葉の内容を認識するシステムなどがある。
 一方で、データ認識システムの認識処理は、入力データを何らか計算処理するという通常のコンピュータでの計算処理と比較して、入力データに対して何らかの推論を行い、その推論結果を認識結果として出力するため、出力の正しさに曖昧性が残るという特徴がある。この正しさの曖昧性が認識精度である。
 ここで、一般的に、データ認識システムの認識精度は、認識処理の方式や、利用環境の様々な要因、認識対象の性質などに応じて複雑に変化する。このため、同じシステムを異なる環境・用途で使用しても、容易には高い認識精度が得られないという問題がある。
 上述した課題に対して、データ認識システムが、利用される環境や用途において高い精度が得られるよう、自動的に自身の設定や動作を調整する、自動調整機能を持ったデータ認識システムが多数提案されている。例えば、特許文献1では、音声メディアの認識において、事前に用意されたサンプルデータを入力し、その認識処理結果を見て調整を行う手法が開示されている。
特開2008-164747号公報
 しかしながら、上述した特許文献1に開示の技術では、基本的に自動調整機能はある一つの認識処理専用であり、認識処理毎に自動調整機能を個別に開発しなければならず、自動調整機能の開発コストが大きい、という問題が生じる。その理由は、認識処理の認識精度に与える要因は複数あり、また精度向上のための調整手段も複数あり、それらの関係性が複雑であり、かつ認識処理毎に異なるため、ある認識処理用に作られた自動調整機能は、他の認識処理では十分な効果を得る事ができないためである。従って、認識処理精度の向上を図ることができない、という問題があった。
 このため、本発明の目的は、上述した課題である、あらゆる認識処理に対して認識処理精度の向上を図ることができないこと、を解決することにある。
 上記目的を達成すべく本発明の一形態である情報処理装置は、
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えると共に、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
 前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、
 前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段と、を備えた、
という構成をとる。
 また、本発明の他の形態である情報処理システムは、
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続され、前記データ獲得手段を用いて獲得した前記認識対象データに対して前記データ前処理手段と前記データ解析手段とを用いて認識処理を実行する認識処理部と、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた自動調整部と、を備え、
 前記自動調整部は、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
 前記テストパターン生成手段にて生成された前記各テストパターンを前記認識処理部に渡して当該認識処理部に対して前記各テストパターンに基づいてそれぞれ認識処理を実行するよう要求するテストパターン実行手段と、
 前記テストパターン実行手段からの要求に応じて前記認識処理部にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定し、当該選定したテストパターンを前記認識処理部に設定するテストパターン選定手段と、を備え、
 前記認識処理部は、前記自動調整部のテストパターン実行手段からの要求に応じて前記各テストパターンに基づいて前記認識対象データの認識処理を実行して当該認識処理の結果を前記自動調整部に返すと共に、前記自動調整部の前記テストパターン選定手段にて設定された前記テストパターンに基づいて前記認識対象データの認識処理を実行する、
という構成をとる。
 また、本発明の他の形態であるプログラムは、
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置に、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
 前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、
 前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段と、
を実現させるためのプログラムである。
 また、本発明の他の形態である情報処理方法は、
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置にて、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成し、
 生成された前記各テストパターンに基づいてそれぞれ認識処理を実行し、
 前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定する、
という構成をとる。
 本発明は、以上のように構成されることにより、あらゆる認識処理に対応して自動調整し、認識処理精度の向上を図ることができる。
本発明の実施形態1における構成を示すブロック図である。 本発明の実施形態1における認識要求定義テーブルの構成を示す図である。 本発明の実施形態1における認識実行定義テーブルの構成を示す図である。 本発明の実施形態1におけるメタ情報管理部の管理するテーブルの構成を示す構成図である。 本発明の実施形態1におけるテストパターンテーブルの構成を示す図である。 本発明の実施形態1における動作を表す説明図である。 本発明の実施形態1における動作を示すフローチャートである。 本発明の実施形態1における詳細の動作を示すフローチャートである。 本発明の実施形態1における詳細の動作を示すフローチャートである。 本発明の実施形態2における構成を示すブロック図である。 本発明の実施形態2における認識実行定義テーブルの構成を示す図である。 本発明の実施形態2におけるテストパターンテーブルの構成を示す図である。 本発明の実施形態2におけるメタ情報管理部の管理するテーブルの構成を示す図である。 本発明の実施形態2における調整パラメータ定義の構成を示す図である。 本発明の実施形態2における詳細の動作を示すフローチャートである。 本発明の実施形態3における構成を示すブロック図である。 本発明の実施形態3における枝刈りルールテーブルの構成を示す図である。 本発明の実施形態3における詳細の動作を示すフローチャートである。 本発明の実施例における構成を示すブロック図である。 本発明の実施例における認識要求定義テーブルの説明図である。 本発明の実施例におけるメタ情報管理部の管理するテーブルの説明図である。 本発明の実施例における枝刈りルールテーブルの説明図である。 本発明の実施例におけるテストパターンテーブルの説明図である。 本発明の実施例におけるテストパターンテーブルの説明図である。 本発明の実施例におけるテストパターンテーブルの説明図である。 本発明の実施例における認識実行定義テーブルの説明図である。 本発明の実施例におけるテストパターンテーブルの説明図である。 本発明の実施例における認識要求定義テーブルの説明図である。 本発明の実施例におけるメタ情報管理部の管理するテーブルの説明図である。 本発明の付記1における情報処理装置の構成を示すブロック図である。
 <実施形態1>
 本発明における情報処理システムは、カメラやマイクなどのセンサーを用いて実世界のデータを取得し、取得したデータに対して何らかの認識処理を行い、認識結果を出力するシステムである。そして、本発明におけるシステムは、特に、様々な認識エンジンを用いつつ、一つのシステムが複数の異なる利用環境や用途に適合するよう、自動調整するための構成を備えている。これにより、任意の認識処理を追加・変更・削除などしても、環境・用途に適合して自動調整し、高い認識精度を出すことができるというものである。以下、本発明の第1の実施形態における情報処理システムの詳細な構成及び動作を説明する。
 [構成]
 本発明の実施形態1における情報処理システムであるデータ認識システム101は、図1に示すように、プログラム制御により動作するコンピュータ100(情報処理装置)を備えて構成されており、このコンピュータ100に、外部モジュールであるデータ獲得部120と、データ前処理部121と、データ解析処理部122と、が接続されている。
 なお、データ獲得部120とデータ前処理部121とデータ解析処理部122といった外部モジュールは、データ認識システム101に組み込まれていて構成されていてもよい。
 そして、上記データ獲得部120(データ獲得手段)は、認識対象となる認識対象データを外部から獲得する機構であり、例えば、カメラやマイクである。但し、データ獲得部120は、カメラやマイクであることに限定されない。
 上記データ前処理部121(データ前処理手段)は、データ獲得部120が獲得したデータやそれらが処理された何らかの実行時データを、推論などは行わず、同じデータ形式のまま内容を加工する機構である。つまり、データ前処理部121は、後述するデータ解析処理部122にて認識処理される前の認識対象データに対して内容の前処理を行う。このデータ前処理部121が行う前処理としては、例えば、画像データ処理用のノイズ除去や輝度調整、音声データ処理用のボリューム調整や周波数特性変更などである。但し、データ前処理部121が行う前処理は、上述した処理に限定されない。
 上記データ解析処理部122(データ解析手段)は、入力データである認識対象データに対して何らかの推論を行い、その結果を出力する機構である。つまり、データ解析処理部122は、予め設定された解析ルールに従って認識対象データを解析し、設定された認識処理を行う。このデータ解析処理部122が行う認識処理としては、画像データの人物認識や動体追跡、音声データの自然言語認識などである。なお、出力結果は、推論結果と、その推論の確からしさ(認識精度)をあわせて出力するものとする。但し、データ解析処理部122が行う認識処理は、上述した処理に限定されない。
 そして、上述した外部モジュールであるデータ獲得部120とデータ前処理部121とデータ解析処理部122とは、それぞれ実行部131,132,133を備えており、自発的に、あるいは、コンピュータ100からの指令に応じて各処理を実行する。
 次に、コンピュータ100の構成の詳細を説明する。コンピュータ100は、中央処理装置(プロセッサ)や記憶装置を備えた一般的なサーバコンピュータであり、1台又は複数台のコンピュータにて構成されている。そして、コンピュータ100は、図1に示すように、認識処理部103と自動調整処理部102とを備えている。認識処理部103は、例えば、上記データ獲得部102を用いて獲得した認識対象データに対してデータ前処理部121とデータ解析処理部122とを用いて認識処理を実行する。また、自動調整部103は、認識処理部103にて高精度に認識処理を実行できる手順を設定する。以下、自動調整部102及び認識処理部103の構成について詳述する。
 図1に示すように、自動調整部102は、テストパターン生成部104と、メタ情報管理部105と、認識要求定義管理部106と、テスト実行部108と、テストパターン管理部107と、出力監視部109と、を備えている。また、認識処理部103は、認識実行定義管理部110と、実行時データ管理部112と、認識実行部111と、結果出力部113と、を備えている。
 そして、上記テストパターン生成部104と、テスト実行部108と、出力監視部109と、認識実行部111と、結果出力部113とは、コンピュータ100に装備された中央処理装置にプログラムが組み込まれることによって実現されるものである。また、上記メタ情報管理部105と、認識要求定義管理部106と、テストパターン管理部107と、認識実行定義管理部110と、実行時データ管理部112とは、コンピュータ100に装備された記憶装置に形成されるものである。
 上記自動調整部102が備える上記認識要求定義管理部106(要求定義情報記憶手段)は、複数の認識要求定義(要求定義情報)を管理する。認識要求定義は、認識精度は抜きに、認識システムの機能的な振舞いを規定するための定義であり、データ獲得処理(データ獲得部120)とデータ解析処理(データ解析処理部122)とを直列で呼び出す呼出し手順定義である。つまり、認識要求定義は、認識処理時に呼び出されるデータ獲得部120とデータ解析処理部122との呼び出し手順が定義された情報である。
 図2は、認識要求定義管理部106が管理する認識要求定義テーブル201のデータ構造である。認識要求定義テーブル201は、複数の認識要求定義を持ち、各々の認識要求定義は、「認識要求定義名」と、一つのデータ獲得部名と、一つ以上のデータ解析処理部名とからなる「外部モジュール名」を持つ。なお、前段のモジュールであるデータ獲得部120の出力データ形式と、後段のモジュールであるデータ解析処理部122の入力データ形式は、必ず一致するものとする。
 上記認識処理部103が備える上記認識実行定義管理部110は、一つの認識実行定義を管理する。認識実行定義は、実際に認識処理を行うための外部モジュール呼び出し手順を定義したものであり、認識要求定義に、各モジュール間にゼロ個以上の前処理エンジン呼び出しを挿入したものになる。図3は、認識実行定義管理部110が管理する認識実行定義301のデータモデルである。先頭がデータ獲得部120である外部モジュール名のリストとなり、それに続いて、データ前処理部121やデータ解析処理部122のモジュール名が、呼び出し順に並べられる。
 上記自動調整部102が備える上記メタ情報管理部105(メタ情報記憶手段)は、外部モジュールの利用に関わるメタ情報を、外部モジュール毎にモジュール名と共に管理する。メタ情報は、外部モジュールの種類によって異なる。
 図4は、メタ情報管理部105が管理するメタ情報テーブル401,402,403のデータ構造である。データ獲得部120のメタ情報401は、当該データ獲得部120が取得した認識対象データを出力するデータ形式である出力データ形式を有する。データ前処理部121のメタ情報402は、当該データ前処理部121に対して認識対象データを入出力するデータ形式である入出力データ形式を有する。また、データ前処理部121のメタ情報402は、当該データ前処理部121にて処理される認識対象データの性質を表す性質名を有しており、この性質とは、データ解析処理部122にて認識処理を行う際に認識精度に影響を及ぼすと予め設定された認識対象データの性質である。
 また、データ解析処理部122のメタ情報403は、当該データ解析処理部122に認識対象データを入力するデータ形式である入力データ形式と、データ解析処理部122から出力するデータのデータ形式を表す出力データ形式と、を有する。さらに、データ解析処理部122のメタ情報403は、当該データ解析処理部122にて認識処理を行う際に認識精度に影響を及ぼすと予め設定された認識対象データの性質を表す性質名を有している。
 なお、上記「データ形式」は、例えば、音声、画像、映像、自然言語テキスト、人物名、などといったデータの形式名である。また、上記「性質」とは、音量、輝度、ノイズ量などといった、データ形式としては同一ながら、解析処理の推論の精度に影響を与えうるデータの性質を表し、換言すると、認識対象データ内の所定の要素である。
 上記自動調整部102が有するテストパターン管理部107は、テストとして実行すべき認識処理の手順つまり各外部モジュールの呼び出し手順からなるパターンと、そのテスト結果のデータと、を管理する。図5は、テストパターン管理部107が管理するテストパターンテーブル501のデータ構造である。テストパターンテーブル501は、複数のテストパターンを持ち、各テストパターンは、「テストパターン名」と、各外部モジュールの呼び出し手順を表す「認識実行定義」と、当該パターンで認識処理を行った結果を表す「認識結果」を持つ。
 上記認識処理部103が有する実行時データ管理部112は、外部モジュールの入出力データを一時的に保持する。実行時データ管理部112は、任意のデータ形式のデータを保持し、本発明としては特にデータ構造は規定しない。なお、実行時データ管理部112は、例えば、コンピュータ100に装備された一次記憶装置に形成される。
 ここで、本発明であるデータ認識システム101は、通常の認識処理実行モードと、自動調整モードとの2つの動作モードを持つ。通常の認識処理実行モードでは、上記認識処理部103のみが動作する。一方、自動調整モードの時には、自動調整部102と認識処理部103の双方が動作する。
 上記認識処理部103が有する認識実行部111は、認識実行定義管理部110に登録された認識実行定義(図3を参照)を認識実行部111が解釈して、これに基づいて外部モジュールであるデータ獲得部120やデータ前処理部121、データ解析処理部122を順次呼び出す。このとき、認識実行定義に、後述する自動調整部102のテスト実行部108にてテストが行われた結果により選定されたテストパターンが登録されている場合には、そのパターンを解釈する。なお、認識実行部111は、外部モジュールである複数のデータ獲得部120、複数のデータ前処理部121、複数のデータ解析処理部122に接続されている。
 そして、認識実行部111は、各外部モジュール120,121,122に対する入出力データを、実行時データ管理部112に保存・参照する形で認識処理を実行する。ここで、認識実行部111が外部モジュールを呼び出すときは、実行時データ管理部112にある入力データを渡して各実行部131,132,133を呼び出し、当該各実行部131,132,133の出力結果を実行時データ管理部112に保存する。但し、データ獲得部120のみは呼び出しに入力データはない。また、認識実行部111による認識実行定義の解釈が終わると、結果出力部113は、最後の呼び出しの出力データをシステム外部に出力する。
 また、本実施形態における認識実行部111は、自動調整部102のテスト実行部108から認識処理の手順が含まれたテストパターンが通知されて認識処理の要求を受けると、かかるテストパターンに基づいて上述同様に認識処理を行い、その認識結果をテスト実行部108に返す。
 また、上記自動調整部102は、自動調整モードの時に、テスト用の認識実行定義(テストパターン)を与えて認識処理部103を呼び出し、その結果をチェックする形で自動調整を行い、最終的に用途や環境に適した認識実行定義を生成する。
 上記メタ情報管理部105と認識要求定義管理部106とには、まず事前準備として、必要情報が登録される。メタ情報管理部105には、上述したように利用可能な外部モジュールの利用に必要なメタ情報が登録され、認識要求定義管理部106には認識要求定義が登録される。そして、メタ情報管理部105と認識要求定義管理部106とは、それぞれ認識システムの外部の利用者やシステムからの要求に応じて、管理情報を追加、変更、削除などする機能を持つ。
 上記テストパターン生成部104(テストパターン生成手段)は、認識システム101を利用する状況において、利用する認識要求定義を指定して認識システムに自動調整が指示されると、まず、認識要求定義管理部106から指定された認識要求定義を取り出す。そして、テストパターン生成部104は、メタ情報管理部105から認識要求定義に記載された外部モジュールの入出力データ形式と、影響される性質のリストの情報を取り出し、当該各外部モジュールのデータ形式を扱い、かつ、後段のデータ解析処理部122の影響される性質を変更しうるデータ前処理部121のリストを取り出す。
 さらに、テストパターン生成部104は、認識要求定義に記載された各外部モジュールの間に、取り出したデータ前処理部121のリストの中から、任意の数のデータ前処理部121を選択して任意の順番に並べた呼出し手順を挿入した認識実行定義を、テストパターンとして生成する。このとき、テストパターン生成部104は、取り出したデータ前処理部121のリストの中から、任意の数を選択して任意の順序に並べた場合の全ての組み合わせを生成することによって複数の異なるテストパターンを生成して、テストパターン管理部107に登録する。
 なお、図5は、上述したようにテストパターン生成部104にて生成されテストパターン管理部107に登録されたテストパターンテーブル501の一例を示す図である。また、図6は、予め設定された認識要求定義と、テストパターン生成部104にて生成される認識実行定義と、の関係を示す説明図である。詳しくは、後述する。
 また、テスト実行部108(テストパターン実行手段、テストパターン選定手段)は、上述したように生成されたテストパターンを一つずつ実行する。具体的に、テスト実行部108は、テストパターンから認識実行定義を取り出して、認識処理部103の認識実行定義管理部110に登録し、認識実行部111を呼び出して認識処理の実行を要求する。認識実行部111が認識実行定義の解釈実行を終了して結果を出力したら、出力監視部109がその結果から認識精度情報を取り出し、それをテストパターンの認識結果として保存する。
 そして、全てのテストパターンの実行が終わったら、テスト実行部108はテストパターン管理部107に保存されているパターンの中から、最も認識結果の精度が良かったものを選び、それが最適な認識動作であるとして、そのパターンの認識実行定義を取り出して、認識処理部103の認識実行定義管理部110に登録し、自動調整モードを終了する。
 [動作]
 次に、上述したデータ認識システム101の動作を、図7乃至図9を参照して説明する。まず、図7は、データ認識システム101全体の動作を表すフローチャートであり、これを参照して説明する。
 データ認識システム101は、外部からのイベントを待ち(ステップS700)、イベントが認識実行である場合には(ステップS701:Yes)、認識処理部103が認識処理を実行する(ステップS702)。
 また、外部からのイベントが認識実行ではなく(ステップS701:No)、メタ情報登録要求である場合には(ステップS703:Yes)、要求情報をメタ情報管理部105に登録する(ステップS705)。
 また、外部からのイベントがメタ情報登録要求ではなく(ステップS703:No)、
認識要求定義登録要求である場合には(ステップS704:Yes)、要求情報を認識要求定義管理部106に登録する(ステップS706)。
 また、外部からのイベントが認識要求定義登録要求ではなく(ステップS704:No)、利用する認識要求定義を伴った自動調整開始要求である場合には(ステップS707:Yes)、テストパターン生成部104が、複数のテストパターンを生成してテストパターン管理部107に登録する(ステップS708)。
 続いて、テスト実行部108が、テストパターン管理部107から未実行のテストパターンを取り出し(ステップS709)、テストパターンの認識実行定義を認識実行定義管理部110に登録する(ステップS710)。そして、テスト実行108は、認識処理部103を呼び出して認識処理を実行する(ステップS711)。
 その後、出力監視部109が認識処理部103から認識結果を待ち(ステップS712)、かかる認識結果を取得すると、テストパターン管理部107に結果を登録する(ステップS713)。
 そして、テスト実行部108は、全てのテストパターンについて認識処理の実行を繰り返す(ステップS709~S714)。テスト実行部108は、全てのテストパターンの実行が終わると(ステップS714:Yes)、認識結果である認識精度を参照して、最も認識精度が高かったテストパターンを選択し(ステップS715)、そのテストパターンの認識実行定義を認識実行定義管理部110に登録する(ステップS716)。
 ここで、図8のフローチャートを参照して、上述した図7のステップS702やステップS711における認識処理の実行時の詳細動作を説明する。
 認識処理部103では、認識実行部111が、まず認識実行定義管理部110の認識実行定義テーブルからデータ獲得部名を取り出し(ステップS800)、当該取り出した名称のデータ獲得部120を呼び出してデータを取得して(ステップS801)、実行時データ管理部112に保存する。
 続いて、認識実行部111は、認識実行定義から外部モジュール名を順次取り出し(ステップS802)、当該取り出した外部モジュール名の外部モジュール(データ前処理部121やデータ解析処理部122)を、実行時データ管理部112に保存されているデータを渡して呼び出す(ステップS803)。そして、認識実行部111は、呼び出した外部モジュールによる実行結果を実行時データ管理部112に保存する。
 そして、認識実行部111は、認識実行定義の全ての外部モジュールの実行が終了するまで上記処理(ステップS802~S804)を繰り返し、全ての外部モジュールの実行が終了すると(ステップS804:Yes)、結果出力部113が実行時データ管理部112に保存されているデータを、データ認識システム101の外部に、認識結果として出力する(ステップS805)。このとき、認識処理が自動調整部102から呼び出されていた場合には(ステップS806:Yes)、データをさらに出力監視部109にも渡す(ステップS807)。
 次に、図9のフローチャートを参照して、上述した図7のステップS708におけるテストパターン生成部104によるテストパターン生成時の詳細動作を説明する。
 テストパターン生成部104は、まず、テストすべき認識要求定義名を受け取ると(ステップS900)、認識要求定義管理部106からその認識要求定義名に該当する外部モジュール名のリストを取り出す(ステップS901)。そして、テストパターン生成部104は、認識要求定義の外部モジュール名のリストをそのまま持つテストパターンを一つ生成し、テストパターン管理部107に追加する(ステップS902)。
 続いて、テストパターン生成部104は、認識要求定義の外部モジュール名のリストの先頭にあるデータ獲得部名を除き、当該リストに含まれる全てのデータ解析処理部名のうち当該データ解析処理部名の一つ取り出す(ステップS903)。続いて、テストパターン生成部104は、メタ情報管理部105のデータ解析処理部用メタ情報テーブル403(図4参照)から、取り出したデータ解析処理部名に該当するモジュールに関連付けられた「入力データ形式」と「性質名リスト」を取り出す(ステップS904)。
 次に、データ前処理部用メタ情報テーブル402(図4参照)から、データ前処理部の「入出力データ形式」が、上記取り出したデータ解析処理部の「データ形式」と一致し、かつ、データ前処理部の「性質名」が、上記取り出したデータ解析処理部の「性質名リスト」に含まれるデータ前処理部の外部モジュール名のリストを取り出す(ステップS905)。
 続いて、テストパターン生成部104は、取り出したデータ前処理部のリストから一つ以上任意数の外部モジュール名を取り出し、それを任意の順序で並べたデータ前処理部の組み合わせリストを複数含んだリストを生成する(ステップS906)。例えば、データ前処理部である全ての外部モジュール名の組合わせ方と、その組み合わせの中での全ての順序を入れ替えた組み合わせを、網羅的に生成するとする。
 続いて、テストパターン生成部104は、テストパターン管理部107に登録されている全てのテストパターンに対して、当該各テストパターンに含まれる認識実行定義内において現在入力データ形式をチェックしているデータ解析処理部名の前に、ステップS906で生成したデータ前処理部名の組合せリストを挿入して、新たなテストパターンを生成する。そして、データ前処理部121の組み合わせのリストに含まれる全てについて、新たなテストパターンを生成し、当該新たなテストパターンをテストパターン管理部107に追加する(ステップS907)。
 テストパターン生成部104は、認識要求定義の全てのデータ解析処理部名について、上述した処理を行う(ステップS903~S908)。そして、テストパターン生成部104は、認識要求定義のデータ解析処理部名の全てについて上記処理が終了すると(ステップS908:Yes)、テストパターンの生成処理を完了する。
 なお、上記動作説明におけるステップS905では、データ解析処理部122に入力されるデータの入力データ形式を用いてデータ前処理部121のリストを取り出すこととして説明したが、かかる処理に限定されない。ある外部モジュールの入力は、その前の外部モジュールの出力とデータ形式は一致するため、上述したデータ解析処理部122の入力データ形式の代わりに、前段に設定された外部モジュールの出力のデータ形式を利用して、かかるデータ形式と一致する入出力データ形式のデータ前処理部121のリストを取り出してもよい。
 以上のように、本実施形態によると、認識処理部103が認識実行定義を解釈して外部モジュールを呼び出す形で構成され、外部モジュールのメタ情報がメタ情報管理部105に登録され、データ認識システム101の動作の機能要求のみを記述した認識要求定義を用いて、テストパターン生成部104が認識要求定義とメタ情報を用いて様々なデータ前処理部の組み合わせを挿入した認識実行定義を生成し、テスト実行部108が生成されたパターンを全てテストして最も精度が良いパターンを選択する、というように構成されている。このため、新しいデータ獲得部120とデータ解析処理部122の組合わせ方を採用したデータ認識システム101を利用する場合でも、認識要求定義を追加するだけで、自動調整機能を持ったデータ認識システム101を利用できる。
 また、新しいデータ解析処理部122を利用する場合でも、そのデータ解析処理部122のメタ情報と、そのデータ解析処理部122を用いる認識要求定義を追加するだけで、自動調整機能を持った認識システムを利用できる。これにより、認識システムに新しい認識処理を行なわせる場合でも、個別に自動調整機能を開発せずに、自動調整機能を利用できるようになる。
 <実施形態2>
 次に、本発明の実施形態2におけるデータ認識システムについて、図10乃至図15を参照して説明する。
 上述した実施形態1では、外部モジュールの利用は単にデータを渡して処理を呼び出すだけであり、メタ情報も入力や出力のデータ型や影響されるデータの性質のみを管理し、テストパターン生成は入力データと性質から決まるデータ前処理部121の組合わせ方のみ考慮していた。これに対して、本実施形態では、各外部モジュールが自モジュールの内部動作を変更するための調整パラメータの設定を受け付ける機能を持ち、メタ情報として各モジュール毎に設定可能な調整パラメータの情報を持ち、テストパターン生成は、調整パラメータの様々な組合わせ方を考慮してテストパターンを生成する。
 [構成]
 図10は、本実施形態におけるデータ認識システム101の構成図を示す。本実施形態では、上述した実施形態1の構成に加えて、各外部モジュール120,121,122が実行部131,132,133に加えて、調整パラメータの設定部1010,1011,1012を持つ。
 図11は、本実施形態における認識実行定義テーブル1101の構成図である。図12は、本実施形態におけるテストパターンテーブル1201の構成図である。いずれのテーブル1101,1201も、外部モジュール名に加えて、外部モジュールを呼び出す時に当該外部モジュールに設定する調整パラメータのセットを持つ。
 図13は、本実施形態におけるメタ情報管理部105にて管理されるメタ情報のデータ構造を示す図である。各メタ情報テーブル1301,1302,1303は、外部モジュール名に加えて、調整パラメータ定義を持つ。図14は、調整パラメータ定義の詳細の説明図である。一つの調整パラメータ定義は、パラメータ名と、そのパラメータの値域のセットからなる。
 なお、上記では、データ獲得部、データ前処理部、データ解析処理部といった全ての外部モジュールについて調整パラメータの設定が可能であることして説明するが、いずれかの外部モジュールのみに調整パラメータが設定可能であってもよい。
 そして、本実施形態における認識実行部111は、認識実行定義管理部110の認識実行定義に記載された外部モジュールを呼び出す時に、調整パラメータを外部モジュールの設定部1010,1011,1012に渡してから、実行部131,132,133を呼び出す。
 [動作]
 次に、上述したデータ認識システム101の動作を、図15を参照して説明する。図15は、本実施形態におけるテストパターン生成部104の動作を示すフローチャートである。なお、図15のフローチャートは、図9とほぼ同様であり、異なる処理部分だけ異なる符号を付して記載している。
 本実施形態では、認識要求定義と同じ認識実行定義をテストパターンに追加する前に、認識要求定義に含まれる全てのデータ獲得部120やデータ解析処理部122について、メタ情報管理部105から調整パラメータ定義を取り出し、認識要求定義に含まれる全ての外部モジュールの全てのパラメータの設定値に関して、異なる組合せのパターンを生成する(ステップS1501)。そして、生成したテストパターンを、テストパターン管理部107に登録する(ステップS1502)。
 また、ステップ906で、データ前処理部121の組合せのリストを作った後、さらに各組み合わせリストについて、組合せリストに含まれる全てのデータ前処理部121に関する調整パラメータ定義をメタ情報管理部105から取り出し、組合せリストに含まれる全てのデータ前処理部121の全てのパラメータの設定値に関して、異なる組合せのパターンを生成する(ステップS1503)。そして、生成したテストパターンを、テストパターン管理部107に登録する(ステップS907)。
 なお、上記説明では、調整パラメータの値域は、離散値のセットとして説明したが、これを値域は数値で1~100などの連続値の場合に、設定値のパターンを1,10,20,・・・,90,100などと、その値域内の適当な抽出値を用いてもよい。
 以上のようにすることにより、本実施形態では、各外部モジュールが調整パラメータを用いて動作を変更可能な場合に、解析精度が高くなる調整パラメータの設定値をあわせて自動調整することが可能となる。
 <実施形態3>
 次に、本発明の実施形態3におけるデータ認識システムについて、図16乃至図18を参照して説明する。
 上述した実施形態1,2では、テストパターン生成部104にて、全てのデータ前処理部121や調整パラメータについて可能な組合せのテストパターンを生成し、テスト実行部108は実行する場合を説明した。これに対して、本実施形態では、テスト実行部108がテストパターンを実行した後で、その結果に基づいて、未実行のテストパターンの中で、実行済みのパターンより精度向上が期待できないパターンをテストパターン管理部107から削除し、生成されたテストパターンの中で一部のテストパターンだけをテスト実行するようにしてもよい。
 [構成]
 図16は、本実施形態におけるデータ認識システム101の構成図である。本実施形態におけるデータ認識システム101は、上述した実施形態1,2のシステムに加えて、枝狩りルール管理部1601をさらに有する。
 図17は、枝狩りルール管理部1601が持つ枝狩りルールテーブル1701の構成図であり、複数のルールを持つ。このルールは、テストパターン管理部107の状態をチェックし、未実行テストパターンを削除するための任意のアルゴリズムを記載したものであり、例えば、スクリプト言語で記述されたスクリプトである。
 そして、上記枝狩りのルールの一例を挙げる。例えば、あるテストパターンを用いた認識処理結果である認識精度と他のテストパターンを用いた認識処理結果である認識精度との差が閾値以上であり、他のテストパターンとほぼ同様の認識実行定義が規定されたさらに別のテストパターンが、上記他のテストパターンに設定されている特定の外部モジュールの調整パラメータと値がわずかに異なるだけの設定範囲内である場合には、実行済みのパターンより精度向上が期待できないと判断して、上記別のテストパターンを実行することなく削除する。但し、上記ルールのアルゴリズムは様々なものが考えられるため、当該アルゴリズムの内容は本発明では特に規定しない。
 [動作]
 次に、上述したデータ認識システム101の動作を、図18を参照して説明する。図18は、本実施形態におけるデータ認識システム101の動作を示すフローチャートである。なお、図18のフローチャートは、図7のものとほぼ同様であり、異なる処理部分だけ異なる符号を付して記載している。
 データ認識システム101は、外部からのイベントが枝狩りルール登録要求である場合には(ステップSS1801:Yes)、枝狩りルールを登録する(ステップS1802)。また、生成したテストパターンを用いた認識処理を実行する際に、登録されている全ての枝狩りルールを実行する(ステップS1803)。
 以上のように、本実施形態では、精度が向上する見込みが薄いテストパターンを実行前に削除することで、最も解析精度が高い結果は得られなくなる可能性があるものの、より短い時間で自動調整結果を得ることが可能となる。
 <実施形態4>
 次に、本発明の実施形態4におけるデータ認識システムについて説明する。上述した実施形態1では、データ認識システム101による認識処理の結果である解析精度は、データ解析処理部122自身が出力するとしていた。これに対して、本実施形態では、事前に、認識対象データに対する認識処理の結果の正解を、出力監視部109に登録しておく。
 そして、出力監視109部が、結果出力部113が出力する各テストパターンを用いて認識処理を行った結果と、予め登録された正解と、を比較して、その正解率から解析精度を算出する。
 この場合、認識対象データが一つである場合には、解析精度は正解か不正解かで0%あるいは100%のいずれかになってしまうが、一つのテストパターンの実行に複数の認識対象データとその正解を用意して、より細かく解析精度を計算するようにするとよい。
 <実施例>
 次に、上記各実施形態にて説明したデータ認識システムの具体例を、図19乃至図29を参照して説明する。
 [構成]
 図19は、本実施例のデータ認識システムの構成図である。本実施例では、外部モジュールであるデータ獲得部として、カメラ1901とマイク1902を備えている。また、外部モジュールであるデータ前処理部として、映像ノイズフィルタ1903、輝度調整フィルタ1904、シャープネスフィルタ1905、音声ノイズフィルタ1906を備えている。また、外部モジュールであるデータ解析処理部として、顔抽出エンジン1907、人物認識エンジン1908、会話認識エンジン1909を備えている。
 ここで、顔抽出エンジン1907は、任意の映像から人間の顔の映像が映った箇所のみを抜粋するもの、人物認識エンジン1908は、人間の顔が映った映像からその人物の人物名を得るもの、会話認識エンジン1909は、音声中の会話内容を文字列化するものである。
 図20は、本実施例における認識要求定義管理部106の登録内容である。本実施例では、予め「人物認識」、「顔認識」、「会話認識」の3つの認識要求定義2001が登録されているとする。そして、各認識要求定義には、カメラ等からなるデータ獲得部と、各エンジンからなるデータ解析処理部と、が設定されている。
 図21は、本実施例のメタ情報管理部105の登録内容である。本実施例では、予め各外部モジュールのメタ情報テーブル2101,2102,2103が登録されている。このうち、調整パラメータ定義は、空欄の場合は調整パラメータを持たないことを表しており、”{  }”の表記は、値域としての値候補を表している。
 図22は、本実施例における枝刈りルールテーブル2201の登録内容であり、ここではルールが登録されていないとする。
 [動作]
 次に、本実施例におけるデータ認識システム101の具体的な動作を説明する。なお、ここでは、データ認識システム101をある利用環境に設置して、人物認識に用いる場合を説明する。
 データ認識システム101の利用者が、認識要求名「人物認識」を指定して自動調整開始要求を送ると、まず、データ認識システム101は、登録されている認識要求定義とメタ情報からテストパターンを生成する。
 すると、テストパターン生成部104は、認識要求定義管理部106から該当する認識要求定義を取り出す。ここでは、図20に示す認識要求定義テーブル2001から、カメラ、顔抽出エンジン、人物認識エンジンのリストを取り出す。
 次に、テストパターン生成部104は、カメラ、顔抽出エンジン、人物認識エンジンの各外部モジュールのメタ情報を、メタ情報管理部105から取出す。ここでは、図21に示す各メタ情報テーブル2101,2102,2103から各メタ情報を取り出す。そして、テストパターン生成部104は、調整パラメータの組み合わせリストを生成する。図21の例では、調整パラメータが設定可能な外部モジュールはカメラ1901のみであるため、当該カメラ1901の調整パラメータである「フォーカス」と「自動ズーム」について、設定値の組合せリストを作成する。ここでは、下記の4つの組み合わせ(1-1)~(1-4)が生成できる。
 (1-1)カメラ:フォーカス=自動,自動ズーム=入
 (1-2)カメラ:フォーカス=自動,自動ズーム=切
 (1-3)カメラ:フォーカス=接写,自動ズーム=入
 (1-4)カメラ:フォーカス=接写,自動ズーム=切
 このようにして、テストパターン生成部104は、図23に示す4つのパターンを生成する。なお、テストパターン名は、一意な名前が自動生成される。
 次に、テストパターン生成部104は、顔抽出エンジン1907について、入力データ形式が「画像」、影響性質が「輪郭」と「色」というメタ情報を取り出し、これに該当するデータ前処理部をメタ情報管理部105から取得する。ここでは、「映像ノイズフィルタ」、「輝度調整フィルタ」、「シャープネスフィルタ」の3つが得られる。
 次に、この3つのデータ前処理部の組合せのリストを生成する。ここでは、データ前処理部の選択とその順序から、下記の(2-1)~(2-15)に示す15の組合せ(バリエーション)のリストが生成できる。
 (2-1)映像ノイズフィルタ
 (2-2)輝度調整フィルタ
 (2-3)シャープネスフィルタ
 (2-4)映像ノイズフィルタ、輝度調整フィルタ
 (2-5)輝度調整フィルタ、映像ノイズフィルタ
 (2-6)輝度調整フィルタ、シャープネスフィルタ
 (2-7)シャープネスフィルタ、輝度調整フィルタ
 (2-8)映像ノイズフィルタ、シャープネスフィルタ
 (2-9)シャープネスフィルタ、映像ノイズフィルタ
 (2-10)映像ノイズフィルタ、輝度調整フィルタ、シャープネスフィルタ
 (2-11)映像ノイズフィルタ、シャープネスフィルタ、輝度調整フィルタ
 (2-12)輝度調整フィルタ、映像ノイズフィルタ、シャープネスフィルタ
 (2-13)輝度調整フィルタ、シャープネスフィルタ、映像ノイズフィルタ
 (2-14)シャープネスフィルタ、映像ノイズフィルタ、輝度調整フィルタ
 (2-15)シャープネスフィルタ、輝度調整フィルタ、映像ノイズフィルタ
 次に、調整パラメータの組み合わせリストを生成する。ここでは、調整パラメータを設定できるのは「輝度調整フィルタ」のみで、そのバリエーションも調整種類の「明,暗」いずれかのみである。従って、「輝度調整フィルタ」を含むバリエーションについて、調整パラメータのバリエーションを考慮するよう細分化する形となる。その結果、下記の(3-1)~(3-26)といった26通りの組合せ(バリエーション)を含むリストが生成できる。
 (3-1)映像ノイズフィルタ
 (3-2)輝度調整フィルタ{調整種類=明}
 (3-3)輝度調整フィルタ{調整種類=暗}
 (3-4)シャープネスフィルタ
 (3-5)映像ノイズフィルタ、輝度調整フィルタ{調整種類=明}
 (3-6)映像ノイズフィルタ、輝度調整フィルタ{調整種類=暗}
 (3-7)輝度調整フィルタ{調整種類=明}、映像ノイズフィルタ
 (3-8)輝度調整フィルタ{調整種類=暗}、映像ノイズフィルタ
 (3-9)輝度調整フィルタ{調整種類=明}、シャープネスフィルタ
 (3-10)輝度調整フィルタ{調整種類=暗}、シャープネスフィルタ
 (3-11)シャープネスフィルタ、輝度調整フィルタ{調整種類=明}
 (3-12)シャープネスフィルタ、輝度調整フィルタ{調整種類=暗}
 (3-13)映像ノイズフィルタ、シャープネスフィルタ
 (3-14)シャープネスフィルタ、映像ノイズフィルタ
 (3-15)映像ノイズフィルタ、輝度調整フィルタ{調整種類=明}、シャープネスフィルタ
 (3-16)映像ノイズフィルタ、輝度調整フィルタ{調整種類=暗}、シャープネスフィルタ
 (3-17)映像ノイズフィルタ、シャープネスフィルタ、輝度調整フィルタ{調整種類=明}
 (3-18)映像ノイズフィルタ、シャープネスフィルタ、輝度調整フィルタ{調整種類=暗}
 (3-19)輝度調整フィルタ{調整種類=明}、映像ノイズフィルタ、シャープネスフィルタ
 (3-20)輝度調整フィルタ{調整種類=暗}、映像ノイズフィルタ、シャープネスフィルタ
 (3-21)輝度調整フィルタ{調整種類=明}、シャープネスフィルタ、映像ノイズフィルタ
 (3-22)輝度調整フィルタ{調整種類=暗}、シャープネスフィルタ、映像ノイズフィルタ
 (3-23)シャープネスフィルタ、映像ノイズフィルタ、輝度調整フィルタ{調整種類=明}
 (3-24)シャープネスフィルタ、映像ノイズフィルタ、輝度調整フィルタ{調整種類=暗}
 (3-25)シャープネスフィルタ、輝度調整フィルタ{調整種類=明}、映像ノイズフィルタ
 (3-26)シャープネスフィルタ、輝度調整フィルタ{調整種類=暗}、映像ノイズフィルタ
 次に、既にテストパターン生成部104に登録されている4つのテストパターンの各々について、「顔抽出エンジン」の前段に上記(3-1)~(3-26)の26通りのいずれかを挿入したテストパターンを生成する。この結果、4×26で新たに104のテストパターンが生成され、元々あった4つを加えて108のテストパターンが登録された状態になる。図24は、追加されるテストパターンの一例であり、図23に示す「パターン-1」に対して、上記26のバリエーション分のパターンを挿入したものになる。
 次に、テストパターン生成部104は、「人物認識エンジン」について、上述した「顔抽出エンジン」と同様のデータ前処理部の挿入処理を行う。ここで、「人物認識エンジン」は、データ形式が「画像」、影響性質が「輪郭」である事から、「映像ノイズフィルタ」、「シャープネスフィルタ」の2つが得られ、その組み合わせは、下記(4-1)~(4-4)の4通りとなる。
 (4-1)映像ノイズフィルタ
 (4-2)シャープネスフィルタ
 (4-3)映像ノイズフィルタ、シャープネスフィルタ
 (4-4)シャープネスフィルタ、映像ノイズフィルタ
 次に、調整パラメータの組み合わせリストを生成するが、「映像ノイズフィルタ」、「シャープネスフィルタ」は共に、調整パラメータをとらないため、ここではバリエーションの細分化は行われない。結果、上記4通りのバリエーションを含むリストが生成できる。
 次に、既にテストパターン生成部104に登録されている108通りのテストパターンの各々について、「人物認識エンジン」の前段に、上記4つリストのうちのいずれかを挿入したテストパターンを生成する。この結果、108×4で新たに416通りのテストパターンが生成され、元々あった108つを加えて540通りのテストパターンが登録された状態になる。図25は、追加されるテストパターンの一例であり、図24のパターン-5に対して上記4つのバリエーション分のパターンを挿入したものになる。
 以上でテストパターン生成は終了であり、続いて、テスト実行部108によるテスト実行を開始する。テスト実行部108は、テストパターン管理部107に登録された540通りのテストパターンを一つずつ取出し、各パターンの認識実行定義を認識実行定義管理部110に登録し、認識実行部111を呼び出す。
 次に、認識実行部111は、認識実行定義管理部110から認識実行定義を取出して実行する。ここでは、図24の「パターン-5」を例に説明する。認識実行定義管理部110には、図26の内容が登録されている。まず先頭のデータ獲得部名としてカメラ1901を取り出し、該当する外部のカメラ1901を、調整パラメータとして「フォーカス=自動」、「自動ズーム=入」で呼び出し、映像データを取得し、その映像データを実行時データ管理部112に保存する。
 次に、外部モジュール名として映像ノイズフィルタ1903を取り出し、実行時データ管理部112に保存されている映像データを渡して、ノイズ除去処理を実行し、ノイズ除去された映像データを実行時データ管理部112に保存する。
 次に、外部モジュール名として顔抽出エンジン1907を取り出し、実行時データ管理部112に保存されている映像データを渡して、顔抽出処理を実行する。そして、映像の中で顔と推定される物が映っている部分だけクリッピングした映像データと、その解析精度を、実行時データ管理部112に保存する。
 次に、外部モジュール名として人物認識エンジン1908を取り出し、実行時データ管理部112に保存されている映像データを渡して、人物認識処理を実行する。そして、顔画像から推定される人物の名前と、その解析精度を実行時データ管理部112に保存する。
 上述したように外部モジュールの実行が終了すると、結果出力部113は、実行時データ管理部112に保存されている人物名を認識結果として、システム外部に出力する。このとき、上述した認識処理の実行は、自動調整部102からの呼び出しのため、人物名と解析精度を出力監視部109に渡す。
 出力監視部109は、人物名と解析精度を受け取ると、一つのテストパターンの実行が終了したとして、その結果をテスト実行部108に渡す。テスト実行部108は、解析精度をそのパターンの実行結果としてテストパターン管理部107に保存する。
 次に、テスト実行部108は、枝刈りルール管理部1601に登録されているルールを実行するが、ここでは登録されていないので何も行われない。
 以上で一つのテストパターンの実行が終了し、これを全てのテストパターンについて繰り返す。
 そして、図27は、テストパターンの実行が終了した時のテストパターン管理部107の状態を示す図である。解析精度は、確からしさ度合いをパーセントで表し、数値が高いほど推測の正しさ度合いが高いとする。
 全てのテストパターンの実行が終了すると、テスト実行部108は、全てのパターンの認識結果を比較し、最も数値の良いパターンを選択する。ここで、図27に示す「パターン-5」が最も数値が良かった場合を考えると、テスト実行部108は、「パターン-5」の認識実行定義とその調整パラメータを認識実行定義管理部110に登録し、自動調整を終了する。
 すると、この後は、このデータ認識システム101をこの環境・用途で用いる場合に、通常の認識処理は「パターン-5」の定義を用いて行われることとなる。なお、このデータ認識システム101を異なる環境で使用する場合には、その環境で再度自動調整を行えばよい。
 また、人物認識までは行わず顔認識のみを行ったり、会話認識など異なる用途に用いる場合には、その認識要求定義を指定して自動調整を行えばよい。
 また、例えば、このデータ認識システム101に、新たに人間が笑っているのか泣いているのかなど顔の表情を認識するエンジンを追加し、表情認識システムとしても利用できるようにする場合を考える。この場合には、図28のような表情認識用の認識要求定義と、図29のような表情認識エンジンのメタ情報を追加するだけで、自動調整機能を持った表情認識システムが利用可能となる。
 以上のように、本発明によると、様々な環境や用途で高い精度を得る事ができる認識システムを低コストに開発するといった用途に適用できる。また、様々なデータ獲得部やデータ解析処理を部品として用意して置き、用途に応じて簡単に組み合わせて認識システムを構成するといった用途にも適用可能である。
<付記>
 上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理装置の構成の概略を、図30を参照して説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
 認識対象データを取得するデータ獲得手段3020と、前記認識対象データを解析して認識処理を行うデータ解析手段3022と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段3021と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段3011と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段3012と、を備えると共に、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段3013と、
 前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段3014と、
 前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段3015と、を備えた、
情報処理装置3001。
(付記2)
 付記1に記載の情報処理装置であって、
 前記メタ情報は、前記データ獲得手段から出力される前記認識対象データのデータ形式と、前記データ前処理手段に対して入出力される前記認識対象データのデータ形式と、前記データ解析手段に入力される前記認識対象データのデータ形式と、を含み、
 前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ獲得手段から出力され前記データ解析手段に入力可能なデータ形式の前記認識対象データが入出力される前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
情報処理装置。
(付記3)
 付記1又は2に記載の情報処理装置であって、
 前記メタ情報は、前記データ前処理手段にて処理される前記認識対象データ内の要素を特定する情報と、前記データ解析手段にて認識処理される際に当該認識処理に影響を及ぼすことが予め設定された前記認識対象データ内の要素を特定する情報と、を含み、
 前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ解析手段に関連付けられた前記認識対象データ内の要素を特定する情報と同一の情報が関連付けられた前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
情報処理装置。
(付記4)
 付記1乃至3のいずれかに記載の情報処理装置であって、
 前記メタ情報は、前記データ獲得手段と前記データ前処理手段と前記データ解析手段とのうち少なくとも1つに対して、自己の動作状態を設定可能なパラメータの値を表すパラメータ情報を含み、
 前記テストパターン生成手段は、前記生成したテストパターンに含まれる前記データ獲得手段と前記データ前処理手段と前記データ解析手段とのうち少なくとも1つに対して、前記メタ情報に基づいて設定可能な前記パラメータの値をそれぞれ設定した前記テストパターンを複数生成する、
情報処理装置。
(付記5)
 付記1乃至4のいずれかに記載の情報処理装置であって、
 前記テストパターン実行手段にて前記各テストパターンに基づいて認識処理された結果に基づいて、前記テストパターン生成手段にて生成された前記各テストパターンのうち前記テストパターン実行手段にて未実行の前記テストパターンを削除するテストパターン削除手段を備えた、
情報処理装置。
(付記6)
 付記1乃至5のいずれかに記載の情報処理装置であって、
 前記テストパターン選定手段は、前記テストパターン実行手段にて前記各テストパターンに基づいて前記認識対象データをそれぞれ認識処理した各結果の予め設定された基準に対する解析精度を算出し、当該解析精度が最も高い認識処理の結果となった前記テストパターンを選定する、
情報処理装置。
(付記7)
 付記6に記載の情報処理装置であって、
 前記テストパターン選定手段は、前記テストパターン実行手段にて前記各テストパターンに基づいて前記認識対象データをそれぞれ認識処理した各結果の情報と、予め設定された前記認識対象データに対する認識処理の正解とされる正解データと、を比較することにより算出した解析精度が最も高い前記認識処理した結果となった前記テストパターンを選定する、
情報処理装置。
(付記8)
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続され、前記データ獲得手段を用いて獲得した前記認識対象データに対して前記データ前処理手段と前記データ解析手段とを用いて認識処理を実行する認識処理部と、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた自動調整部と、を備え、
 前記自動調整部は、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
 前記テストパターン生成手段にて生成された前記各テストパターンを前記認識処理部に渡して当該認識処理部に対して前記各テストパターンに基づいてそれぞれ認識処理を実行するよう要求するテストパターン実行手段と、
 前記テストパターン実行手段からの要求に応じて前記認識処理部にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定し、当該選定したテストパターンを前記認識処理部に設定するテストパターン選定手段と、を備え、
 前記認識処理部は、前記自動調整部のテストパターン実行手段からの要求に応じて前記各テストパターンに基づいて前記認識対象データの認識処理を実行して当該認識処理の結果を前記自動調整部に返すと共に、前記自動調整部の前記テストパターン選定手段にて設定された前記テストパターンに基づいて前記認識対象データの認識処理を実行する、
情報処理システム。
(付記9)
 付記8に記載の情報処理システムであって、
 前記自動調整部に記憶された前記メタ情報は、前記データ獲得手段から出力される前記認識対象データのデータ形式と、前記データ前処理手段に対して入出力される前記認識対象データのデータ形式と、前記データ解析手段に入力される前記認識対象データのデータ形式と、を含み、
 前記自動調整部が有する前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ獲得手段から出力され前記データ解析手段に入力可能なデータ形式の前記認識対象データが入出力される前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
情報処理システム。
(付記10)
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置に、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
 前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、
 前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段と、
を実現させるためのプログラム。
(付記11)
 付記10に記載のプログラムであって、
 前記メタ情報は、前記データ獲得手段から出力される前記認識対象データのデータ形式と、前記データ前処理手段に対して入出力される前記認識対象データのデータ形式と、前記データ解析手段に入力される前記認識対象データのデータ形式と、を含んでおり、
 前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ獲得手段から出力され前記データ解析手段に入力可能なデータ形式の前記認識対象データが入出力される前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
プログラム。
(付記12)
 認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
 認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置にて、
 前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成し、
 生成された前記各テストパターンに基づいてそれぞれ認識処理を実行し、
 前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定する、
情報処理方法。
(付記13)
 付記12に記載の情報処理方法であって、
 前記メタ情報は、前記データ獲得手段から出力される前記認識対象データのデータ形式と、前記データ前処理手段に対して入出力される前記認識対象データのデータ形式と、前記データ解析手段に入力される前記認識対象データのデータ形式と、を含んでおり、
 前記テストパターンを生成する際に、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ獲得手段から出力され前記データ解析手段に入力可能なデータ形式の前記認識対象データが入出力される前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
情報処理方法。
 なお、本発明は、日本国にて2010年11月5日に特許出願された特願2010-248205の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。
100 コンピュータ
101 データ認識システム
102 自動調整部
103 認識処理部
104 テストパターン生成部
105 メタ情報管理部
106 認識要求定義管理部
107 テストパターン管理部
108 テスト実行部
109 出力監視部
110 認識実行定義管理部
111 認識実行部
112 実行時データ管理部
113 結果出力部
120 データ獲得部
121 データ前処理部
122 データ解析処理部
131,132,133 実行部
1010,1011,1012 設定部
1601 枝狩りルール管理部
1901 カメラ
1902 マイク
1903 映像ノイズフィルタ
1904 輝度調整フィルタ
1905 シャープネスフィルタ
1906 音声ノイズフィルタ
1907 顔抽出エンジン
1908 人物認識エンジン
1909 会話認識エンジン
3001 情報処理装置
3011 要求定義情報記憶手段
3012 メタ情報記憶手段
3013 テストパターン生成手段
3014 テストパターン実行手段
3015 テストパターン選定手段
3020 データ獲得手段
3021 データ前処理手段
3022 データ解析手段
 

Claims (10)

  1.  認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
     認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えると共に、
     前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
     前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、
     前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段と、を備えた、
    情報処理装置。
  2.  請求項1に記載の情報処理装置であって、
     前記メタ情報は、前記データ獲得手段から出力される前記認識対象データのデータ形式と、前記データ前処理手段に対して入出力される前記認識対象データのデータ形式と、前記データ解析手段に入力される前記認識対象データのデータ形式と、を含み、
     前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ獲得手段から出力され前記データ解析手段に入力可能なデータ形式の前記認識対象データが入出力される前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
    情報処理装置。
  3.  請求項1又は2に記載の情報処理装置であって、
     前記メタ情報は、前記データ前処理手段にて処理される前記認識対象データ内の要素を特定する情報と、前記データ解析手段にて認識処理される際に当該認識処理に影響を及ぼすことが予め設定された前記認識対象データ内の要素を特定する情報と、を含み、
     前記テストパターン生成手段は、前記メタ情報に基づいて、前記要求定義情報にて定義された呼び出し手順に含まれる前記データ解析手段に関連付けられた前記認識対象データ内の要素を特定する情報と同一の情報が関連付けられた前記データ前処理手段を抽出し、当該抽出したデータ前処理手段を、前記呼び出し手順に含まれる前記データ獲得手段と前記データ解析手段との間に追加した新たな呼び出し手順を表す前記各テストパターンを生成する、
    情報処理装置。
  4.  請求項1乃至3のいずれかに記載の情報処理装置であって、
     前記メタ情報は、前記データ獲得手段と前記データ前処理手段と前記データ解析手段とのうち少なくとも1つに対して、自己の動作状態を設定可能なパラメータの値を表すパラメータ情報を含み、
     前記テストパターン生成手段は、前記生成したテストパターンに含まれる前記データ獲得手段と前記データ前処理手段と前記データ解析手段とのうち少なくとも1つに対して、前記メタ情報に基づいて設定可能な前記パラメータの値をそれぞれ設定した前記テストパターンを複数生成する、
    情報処理装置。
  5.  請求項1乃至4のいずれかに記載の情報処理装置であって、
     前記テストパターン実行手段にて前記各テストパターンに基づいて認識処理された結果に基づいて、前記テストパターン生成手段にて生成された前記各テストパターンのうち前記テストパターン実行手段にて未実行の前記テストパターンを削除するテストパターン削除手段を備えた、
    情報処理装置。
  6.  請求項1乃至5のいずれかに記載の情報処理装置であって、
     前記テストパターン選定手段は、前記テストパターン実行手段にて前記各テストパターンに基づいて前記認識対象データをそれぞれ認識処理した各結果の予め設定された基準に対する解析精度を算出し、当該解析精度が最も高い認識処理の結果となった前記テストパターンを選定する、
    情報処理装置。
  7.  請求項6に記載の情報処理装置であって、
     前記テストパターン選定手段は、前記テストパターン実行手段にて前記各テストパターンに基づいて前記認識対象データをそれぞれ認識処理した各結果の情報と、予め設定された前記認識対象データに対する認識処理の正解とされる正解データと、を比較することにより算出した解析精度が最も高い前記認識処理した結果となった前記テストパターンを選定する、
    情報処理装置。
  8.  認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続され、前記データ獲得手段を用いて獲得した前記認識対象データに対して前記データ前処理手段と前記データ解析手段とを用いて認識処理を実行する認識処理部と、
     認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた自動調整部と、を備え、
     前記自動調整部は、
     前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
     前記テストパターン生成手段にて生成された前記各テストパターンを前記認識処理部に渡して当該認識処理部に対して前記各テストパターンに基づいてそれぞれ認識処理を実行するよう要求するテストパターン実行手段と、
     前記テストパターン実行手段からの要求に応じて前記認識処理部にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定し、当該選定したテストパターンを前記認識処理部に設定するテストパターン選定手段と、を備え、
     前記認識処理部は、前記自動調整部のテストパターン実行手段からの要求に応じて前記各テストパターンに基づいて前記認識対象データの認識処理を実行して当該認識処理の結果を前記自動調整部に返すと共に、前記自動調整部の前記テストパターン選定手段にて設定された前記テストパターンに基づいて前記認識対象データの認識処理を実行する、
    情報処理システム。
  9.  認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
     認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置に、
     前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成するテストパターン生成手段と、
     前記テストパターン生成手段にて生成された前記各テストパターンに基づいてそれぞれ認識処理を実行するテストパターン実行手段と、
     前記テストパターン実行手段にて前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定するテストパターン選定手段と、
    を実現させるためのプログラム。
  10.  認識対象データを取得するデータ獲得手段と、前記認識対象データを解析して認識処理を行うデータ解析手段と、前記データ解析手段にて認識処理される前の前記認識対象データに対して所定の前処理を行うデータ前処理手段と、に接続されており、
     認識処理時に呼び出される前記データ獲得手段と前記データ解析手段との呼び出し手順が定義された要求定義情報を記憶した要求定義情報記憶手段と、少なくとも前記データ解析手段と前記データ前処理手段とがそれぞれ取り扱い可能なデータ形式を含むメタ情報が記憶されたメタ情報記憶手段と、を備えた情報処理装置にて、
     前記要求定義情報と前記メタ情報とに基づいて、前記データ解析手段にて認識処理される前記認識対象データに対する前処理を行うことが可能な前記データ前処理手段を抽出し、当該データ前処理手段を前記要求定義情報にて定義された前記データ獲得手段と前記データ解析手段とを含む呼び出し手順に追加したテストパターンを複数生成し、
     生成された前記各テストパターンに基づいてそれぞれ認識処理を実行し、
     前記各テストパターンに基づいて実行された各認識処理の結果に基づいて前記テストパターンを選定する、
    情報処理方法。
     
PCT/JP2011/006027 2010-11-05 2011-10-28 情報処理装置、情報処理システム、情報処理方法およびプログラム WO2012060077A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010248205 2010-11-05
JP2010-248205 2010-11-05

Publications (1)

Publication Number Publication Date
WO2012060077A1 true WO2012060077A1 (ja) 2012-05-10

Family

ID=46024205

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/006027 WO2012060077A1 (ja) 2010-11-05 2011-10-28 情報処理装置、情報処理システム、情報処理方法およびプログラム

Country Status (1)

Country Link
WO (1) WO2012060077A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019008274A (ja) * 2017-06-26 2019-01-17 フェアリーデバイセズ株式会社 音声情報処理システム、音声情報処理システムの制御方法、音声情報処理システムのプログラム及び記録媒体
CN111183436A (zh) * 2017-10-04 2020-05-19 日本电气方案创新株式会社 信息处理装置、控制方法和程序
JP7467008B2 (ja) 2020-09-28 2024-04-15 新明和工業株式会社 画像認識検査装置およびその画像認識検査装置を備えた画像認識検査システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293204A (ja) * 1999-02-05 2000-10-20 Denso Corp 制御量算出装置、空調制御装置及び記録媒体
JP2001216142A (ja) * 2000-02-04 2001-08-10 Hitachi Ltd プログラム作成支援装置
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
JP2005292982A (ja) * 2004-03-31 2005-10-20 Advanced Telecommunication Research Institute International データ処理システム設計装置及びそのためのコンピュータプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293204A (ja) * 1999-02-05 2000-10-20 Denso Corp 制御量算出装置、空調制御装置及び記録媒体
JP2001216142A (ja) * 2000-02-04 2001-08-10 Hitachi Ltd プログラム作成支援装置
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
JP2005292982A (ja) * 2004-03-31 2005-10-20 Advanced Telecommunication Research Institute International データ処理システム設計装置及びそのためのコンピュータプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019008274A (ja) * 2017-06-26 2019-01-17 フェアリーデバイセズ株式会社 音声情報処理システム、音声情報処理システムの制御方法、音声情報処理システムのプログラム及び記録媒体
CN111183436A (zh) * 2017-10-04 2020-05-19 日本电气方案创新株式会社 信息处理装置、控制方法和程序
CN111183436B (zh) * 2017-10-04 2024-01-09 日本电气方案创新株式会社 信息处理装置、控制方法和程序
JP7467008B2 (ja) 2020-09-28 2024-04-15 新明和工業株式会社 画像認識検査装置およびその画像認識検査装置を備えた画像認識検査システム

Similar Documents

Publication Publication Date Title
US11615791B2 (en) Voice application platform
EP3665676B1 (en) Speaking classification using audio-visual data
US11769018B2 (en) System and method for temporal attention behavioral analysis of multi-modal conversations in a question and answer system
CN109871807B (zh) 人脸图像处理方法和装置
CN111444346B (zh) 一种用于文本分类的词向量对抗样本生成方法及装置
CN110728319B (zh) 一种图像生成方法、装置以及计算机存储介质
CN113939870A (zh) 为基于生成和检索的应用学习有效音乐特征的技术
CN116070169A (zh) 模型训练方法、装置、电子设备及存储介质
CN114140885A (zh) 一种情感分析模型的生成方法、装置、电子设备以及存储介质
WO2012060077A1 (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
CN110533184B (zh) 一种网络模型的训练方法及装置
Kankanhalli et al. Experiential sampling in multimedia systems
CN114139630A (zh) 姿态识别方法、装置、存储介质和电子设备
Ferreira et al. Users’ belief awareness in reinforcement learning-based situated human–robot dialogue management
US20220415085A1 (en) Method of machine learning and facial expression recognition apparatus
CA3102093A1 (en) Voice application platform
CN110209880A (zh) 视频内容检索方法、视频内容检索装置及存储介质
US11574246B2 (en) Updating training examples for artificial intelligence
KR20230071673A (ko) 언어 모델을 이용한 개방형 도메인 대화 모델 구축을 위한 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
CN114528762A (zh) 一种模型训练方法、装置、设备和存储介质
CN117668763B (zh) 基于多模态的数字人一体机及其多模态感知识别方法
KR20200094821A (ko) 인공지능 기반의 직물 패턴 검색 장치 및 방법
CN117851835B (zh) 一种深度学习的物联网识别系统及方法
EP4345613A1 (en) Framework for machine guidance
US20230169276A1 (en) Switchboard

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11837731

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11837731

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP