WO2019065647A1 - 対話処理装置および対話処理システム - Google Patents

対話処理装置および対話処理システム Download PDF

Info

Publication number
WO2019065647A1
WO2019065647A1 PCT/JP2018/035497 JP2018035497W WO2019065647A1 WO 2019065647 A1 WO2019065647 A1 WO 2019065647A1 JP 2018035497 W JP2018035497 W JP 2018035497W WO 2019065647 A1 WO2019065647 A1 WO 2019065647A1
Authority
WO
WIPO (PCT)
Prior art keywords
item
information
dialogue
user
candidate
Prior art date
Application number
PCT/JP2018/035497
Other languages
English (en)
French (fr)
Inventor
千加志 杉浦
佐々木 淳哉
後藤 哲也
長 健太
浩之 田中
鈴木 優
Original Assignee
株式会社東芝
東芝デジタルソリューションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社東芝, 東芝デジタルソリューションズ株式会社 filed Critical 株式会社東芝
Priority to CN201880058572.1A priority Critical patent/CN111095237B/zh
Publication of WO2019065647A1 publication Critical patent/WO2019065647A1/ja
Priority to US16/811,197 priority patent/US10896074B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/543User-generated data transfer, e.g. clipboards, dynamic data exchange [DDE], object linking and embedding [OLE]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics

Definitions

  • Embodiments of the present invention relate to an interactive processing apparatus and an interactive processing system.
  • an interaction processing apparatus that performs interaction with a user based on an interaction scenario.
  • This kind of dialogue processing device can realize dialogue processing according to the purpose by creating dialogue scenarios, but in order to flexibly cope with various dialogue variations, the amount of dialogue scenarios required is enormous. Become.
  • the dialogue scenario is generally created individually along a series of dialogue flows for achieving a predetermined purpose, it is difficult to make the created dialogue scenario versatile. For this reason, there is a problem that it takes a lot of effort to create a dialogue scenario for realizing dialogue processing, and a mechanism capable of realizing dialogue processing for achieving a predetermined purpose with a simpler configuration is desired. .
  • the problem to be solved by the present invention is to provide an interaction processing apparatus and an interaction processing system capable of realizing interaction processing for achieving a predetermined purpose with a simple configuration.
  • the interaction processing apparatus is an interaction processing apparatus that acquires information of one or more items for performing a predetermined operation through interaction with a user, the one or the one corresponding to the one or more items.
  • the dialogue control unit sends input information according to the user's input to each of the one or more item-specific processing units.
  • Each of the one or more item-specific processing units extracts a candidate of information to be acquired from the input information received from the dialogue control unit, and the information is to be acquired by the candidate. It is sent to the dialogue control unit together with information indicating the degree of certainty of things.
  • the dialogue control unit corresponds to the item-by-item processing unit that has sent the candidate, among the candidates received from each of the one or more item-by-item processing units, the candidate whose degree of certainty satisfies the first standard. If there is an item whose information is unconfirmed, a response for inquiring the information of the item is output to the user.
  • Each of the one or more item-specific processing units is for a general-purpose processing unit having a basic rule that performs extraction of the candidate and calculation of the degree of certainty based on dialogue knowledge corresponding to the type of information to be acquired It is constructed by giving the item name of the corresponding item and the operation parameter that determines its own operation.
  • FIG. 1 is a block diagram showing a functional configuration example of the dialog processing device according to the first embodiment.
  • FIG. 2 shows an example of the slot table.
  • FIG. 3 is a diagram showing an example of table information.
  • FIG. 4 is a diagram for explaining the details of the item-by-item processing unit.
  • FIG. 5 is a diagram for explaining the details of the item-by-item processing unit.
  • FIG. 6 is a diagram for explaining the details of the item-by-item processing unit.
  • FIG. 7 is a diagram for explaining the details of the item-by-item processing unit.
  • FIG. 8 is a diagram for explaining the details of the dialogue control unit.
  • FIG. 9 is a diagram for explaining an operation example of the dialog processing device.
  • FIG. 9 is a diagram for explaining an operation example of the dialog processing device.
  • FIG. 10 is a flowchart illustrating an example of a processing procedure by the dialogue control unit.
  • FIG. 11 is a flowchart illustrating an example of the processing procedure of the item-by-item processing unit.
  • FIG. 12 is a block diagram showing an overview of the dialog processing system according to the second embodiment.
  • FIG. 13 is a diagram for explaining a configuration example in which a plurality of item-specific processing units have a hierarchical structure.
  • FIG. 14 is a block diagram showing an example of the hardware configuration of the dialog processing apparatus according to the first embodiment and the dialog processing system according to the second embodiment.
  • the dialogue processing apparatus is a goal achievement type dialogue processing apparatus used by the user with a clear purpose, and one or more for performing predetermined operations according to the purpose through dialogue with the user.
  • Acquire item information For example, if the purpose is “business negotiation record”, information of each item such as “visit date and time”, “visit destination”, “next scheduled date”, and “special notes” is acquired through dialogue with the user.
  • the purpose is "accommodation reservation”
  • information of each item such as “check in scheduled date and time”, “check out scheduled date and time”, “number of guests”, “accommodation plan”
  • purpose is "route of car navigation system”
  • search information of each item such as “destination” and “presence of toll road use” is information to be acquired.
  • information to be acquired is described below as information on a plurality of items, the information to be acquired may be information on one item.
  • the interactive processing apparatus of the present embodiment uses a slot table to execute predetermined operations according to the purpose.
  • the slot table has a plurality of slots corresponding to each of a plurality of items. In each slot, information (item value) acquired through interaction is input.
  • a predetermined operation according to the purpose is executed based on the slot table.
  • the predetermined operation according to the purpose is, for example, an operation of registering the negotiation record in the database if the purpose is “negotiation record”. Also, if the purpose is "accommodation reservation", the operation such as execution of the accommodation reservation query and the process of searching for a route from the current location to the destination if the purpose is "route search” are predetermined operations according to the purpose. . Note that even if all the slots in the slot table are not filled, the predetermined operation may be performed when the slot corresponding to the item necessary for performing the predetermined operation is filled.
  • the dialogue processing apparatus is configured to include the plurality of item-specific processing units, and the dialogue control unit that controls interaction with the user in cooperation with the plurality of item-specific processing units.
  • the interaction control unit controls interaction with the user in cooperation with a plurality of item-specific processing units such that information is input to each slot of the above-described slot table.
  • Information of each item to be acquired by the dialog processing device of this embodiment can be classified into types according to the attribute of the item.
  • the information to be acquired is a date and time since it is date and time type, and the item is "visit destination"
  • the information to be acquired is an option type because it is a company name etc. selected from among several options.
  • the item is a "special item”
  • the information to be acquired is a free description type because it is arbitrary information without particular limitations.
  • the process for obtaining these pieces of information can be generalized to some extent depending on the type of the information. Therefore, in the present embodiment, a general-purpose processing unit which defines general-purpose processing corresponding to the type of information to be acquired is prepared in advance for each type, and the general-purpose processing unit is customized Build
  • the general-purpose processing unit prepared in advance for each type of information to be acquired is customized to construct a plurality of item-based processing units, and the plurality of item-based processing units are combined.
  • Build an interactive processor Therefore, it becomes possible to perform appropriate dialogue processing without performing complicated work such as creating a large number of dialogue scenarios according to the purpose to be achieved, such as a dialogue processing device that carries out dialogue processing based on the conventional dialogue scenario.
  • Interactive processing for achieving a predetermined purpose can be realized with a simple configuration.
  • a specific configuration example and operation of the dialog processing device of the present embodiment will be described by taking the case where the objective to be achieved is “negotiation record” as an example.
  • FIG. 1 is a block diagram showing a functional configuration example of the dialog processing device 10 according to the first embodiment.
  • the dialogue processing apparatus 10 according to the present embodiment, the dialogue control unit 11 and the plurality of item-by-item processing units 12A, 12B, 12C, and 12D (hereinafter referred to as “item-by-item processing units 12) is provided as a basic unit for realizing interaction processing with the user 50.
  • the interactive processing device 10 performs interactive processing with the user 50 in order to obtain information to be input to each slot of the slot table 16.
  • the slot table 16 is, as shown in FIG. 2, a plurality of slots 17A, 17B, 17C, 17D (hereinafter referred to as "when they are not particularly distinguished") identified by item numbers (01, 02, 03, 04 in the figure). (Denoted as “slot 17”).
  • the plurality of slots 17 correspond to a plurality of items according to the purpose to be achieved.
  • the purpose to be achieved is “negotiation record”, and the information required to register the negotiation record in the database is “visit date and time”, “visit destination”, “next scheduled date” and “special mention” It is assumed that it is the information of each item of "item”. Therefore, slot 17A of item No.
  • slot 17B of item No. 02 where information of "visit destination” is input, and information of "next scheduled date” is input.
  • a slot table 16 having a slot 17C of the item number 03 and a slot 17D of the item number 04 to which the information of "special notes" is input is created.
  • the slot table 16 is created when the interaction process with the user 50 is started, and information acquired through the interaction with the user is input as needed. Then, when all the slots 17 are filled, a predetermined operation according to the purpose is executed, and the slot table 16 is deleted.
  • the slot table 16 is a temporary table that is created each time a series of interaction processes are performed with the user 50 in order to achieve the purpose.
  • the slot table 16 is created on the basis of table information permanently held in the interactive processing device 10.
  • the slot table 16 has been described as being created each time based on the table information held permanently inside the interactive processing apparatus 10.
  • the present invention is not limited to this, and the created slot table 16 is not deleted but a table format You may hold it by
  • the table information 18 defines an item number, an information type, and an item name for each of a plurality of items for which information is to be acquired in order to execute a predetermined operation according to the purpose. It is information.
  • the table information 18 shown in FIG. 3 determines the information input to each slot 17 of the slot table 16 shown in FIG. That is, in the slot 17A identified by the item number 01 of the slot table 16, date-and-time type information is input as information of the item having the item name “visit date and time”, and in the slot 17B identified by the item number 02.
  • Option type information is input as the information of the item whose item name is “visited”, and the slot 17C identified by the item number 03 has the date and time type information as the information of the item whose item name is “next scheduled date”. It is determined based on the table information 18 shown in FIG. 3 that information of free description type is input as the information of the item of the item "special note" in the slot 17D which is input and identified by the item number 04. Be done.
  • the table information 18 described above is input by, for example, a device builder when constructing the interactive processing device 10 according to the purpose, and is persistently held inside the interactive processing device 10. Then, when the interaction process with the user 50 is started, the slot table 16 is created with reference to the table information 18.
  • the table information 18 is also used as information for constructing a plurality of item-specific processing units 12 corresponding to a plurality of items. Furthermore, the table information 18 is also referred to when the dialogue control unit 11 outputs a response to the user 50 as described later.
  • the interaction control unit 11 controls interaction with the user 50 in cooperation with the plurality of item-specific processing units 12.
  • the dialogue control unit 11 has a function of collecting a plurality of item-specific processing units 12 which operate independently, and acquiring information to be input to each slot 17 of the slot table 16 from the input text corresponding to the input of the user 50. .
  • the interaction control unit 11 receives an input of the user 50 and sends input information corresponding to the input of the user 50 to each of the plurality of item-specific processing units 12.
  • the input information is described below as text (input text), the present invention is not limited to this.
  • the input information corresponding to the input of the user 50 is text
  • the input of the user 50 may be voice acquired by a microphone or text input by a keyboard or the like.
  • the dialog control unit 11 sends the text input by the user 50 as it is to each of the plurality of item-specific processing units 12 as an input text.
  • the dialogue control unit 11 converts the voice into text by voice recognition processing, and sends the obtained text to each of the plurality of item-specific processing units 12 as input text.
  • the voice recognition process may be performed on the voice input by the user 50 outside the dialogue control unit 11, and the dialogue control unit 11 may receive the text converted from the voice.
  • the speech recognition process may use a well-known technique, and thus the detailed description is omitted.
  • the dialogue control unit 11 receives the below-described candidates and scores sent from each of the plurality of item-specific processing units 12. Then, if there is a candidate having a score equal to or higher than the first threshold (a candidate satisfying the first standard), the candidate is decided as information of an item corresponding to the item-by-item processing unit 12 that sent the candidate. Input to the slot 17 of the corresponding item. For example, if the score of the candidate sent from the item-by-item processing unit 12A whose item name corresponds to the item “visit date and time” is equal to or greater than the first threshold, the dialogue control unit 11 receives the item-by-item processing unit 12A.
  • the candidate is confirmed as information of an item whose item name is “visit date and time”, and is input to the slot 17 A of the slot table 16.
  • the score is an example of information indicating the degree of certainty that the candidate is information to be acquired, and information other than the score may be used.
  • a label for example, “certain”, “fuzzy”, “not applicable”, etc.
  • the candidate with the label “certain” is a candidate that satisfies the first criterion
  • the candidate with the label “fuzzy” does not satisfy the first criterion and is a candidate that satisfies the second criterion.
  • the dialogue control unit 11 sends a response inquiring the information of the item. It outputs to the user 50. For example, if the input of the user 50 is text, the dialogue control unit 11 generates a response text for inquiring information on an unconfirmed item, and causes the display device used by the user 50 to display the response text. If the input of the user 50 is a voice, the dialogue control unit 11 converts the generated response text into a voice by voice synthesis processing, and outputs the obtained voice from a speaker used by the user 50.
  • the voice synthesis process for the response text may be performed outside the dialogue control unit 11, and may be output from a speaker used by the user 50.
  • the speech synthesis process may use a well-known technique, and thus the detailed description is omitted.
  • the response text inquiring the information of the undecided item prepare the general-purpose response text as a base, such as "What is xxx?", And the item name of the undecided information in the "xxx" part. It can be generated by inserting. For example, if the information of the item whose item name is "next scheduled date" is undecided, the response such as "what is the next scheduled date?" By inserting "next scheduled date” in the base response text. Text can be generated.
  • the dialogue control unit 11 may output, to the user 50, a response for inquiring information on the items, for example, in order from the item with the smallest item number.
  • the dialogue control unit 11 is a candidate whose score is less than the first threshold and is equal to or more than the second threshold from any of the plurality of item-specific processing units 12 (the first criterion is not satisfied and the second criterion is When a candidate that satisfies the requirement is received (where first threshold> second threshold), a response is output to the user 50 asking whether the candidate is correct.
  • first threshold> second threshold When a candidate that satisfies the requirement is received (where first threshold> second threshold, a response is output to the user 50 asking whether the candidate is correct.
  • For the response text in this case for example, prepare a general-purpose response text as a base such as “xxx is yyy?”, Insert the item name to be the subject of inquiry in the “xxx” part, and It can be generated by inserting a candidate to be a query target in the part of.
  • the candidate received from the item-by-item processing unit 12B whose item name is “visited” is “Yamashita Kogyo”, and the score of the candidate is less than the first threshold and not less than the second threshold
  • a response text such as "Is the destination visited Yamashita Kogyo?"
  • the dialog control unit 11 determines that the input text corresponding to the next input from the user 50 is, for example, “Yes”. If it contains an affirmative expression such as “Yes”, the candidate targeted for the inquiry is decided as information corresponding to the item targeted for the inquiry, and is input to the slot 17 of the corresponding item of the slot table 16.
  • the dialogue control unit 11 The input text is sent to the item-by-item processing unit 12 corresponding to the item to be inquired, and the process waits for the item-by-item processing unit 12 to send the candidate and its score again.
  • the input text may be sent not only to the item-based processing unit 12 corresponding to the item whose input text is the subject of the inquiry but also to all the item-based processing units 12.
  • the dialogue control unit 11 selects, for example, items in ascending order of item numbers, A response may be output to the user 50 asking whether the candidate is correct.
  • the interaction control unit 11 repeats the above process until all the slots 17 of the slot table 16 are filled, and when all the slots 17 of the slot table 16 are filled, the information input to each slot 17 of the slot table 16 is used. , Perform a predetermined operation according to the purpose.
  • the purpose to be achieved is “negotiation record”
  • the “visit date and time” information input to the slot 17A of the slot table 16 and the “visit destination” information input to the slot 17B the information on the "next scheduled date” input to the slot 17C and the information on the "special note” input to the slot 17D are registered in the database as one negotiation record.
  • the dialogue control unit 11 performs processing up to inputting information in each slot 17 of the slot table 16, and in a predetermined operation according to the purpose, a unit different from the dialogue control unit 11 corresponds to each slot of the slot table 16 It may be configured to execute based on the information input to 17.
  • Each of the plurality of item-specific processing units 12 receives the input text sent from the dialogue control unit 11, extracts a candidate of information to be acquired from the input text, and acquires the extracted candidate. It sends to the dialogue control part 11 with the score which shows the certainty of being the information which should be.
  • the item-specific processing units 12 are constructed by customizing the general-purpose processing unit corresponding to the type of information to be acquired among the general-purpose processing units prepared in advance for each information type. Ru.
  • the general-purpose processing unit has basic rules for extracting candidates and calculating a score based on dialog knowledge corresponding to the type of information to be acquired, and has item names and operation parameters that determine the operation of the item-by-item processing unit 12 By being given, it functions as the item-by-item processing unit 12.
  • FIG. 4 is a diagram for explaining the details of the item-by-item processing unit 12A corresponding to the item whose item name is “visit date and time”.
  • the item-specific processing unit 12A is constructed by giving an item name 22A and an operation parameter 23A to the date-and-time type general-purpose processing unit 20A.
  • the date-and-time general-purpose processor 20A is a general-purpose processor corresponding to date-and-time information.
  • the item name 22A is “visit date and time”
  • the operation parameter 23A is a condition for acquiring information “past date and time” because the information to be acquired by the item-by-item processing unit 12A is a visit date and time .
  • the date-and-time type general-purpose processing unit 20A extracts a portion estimated to represent the date and time from the input text as a candidate based on the dialogue knowledge 21A, and outputs a score indicating the likelihood that each extracted candidate represents the date and time. Calculate for each candidate, and output the candidate with the highest score together with the score.
  • the interaction knowledge 21A includes the operation flow of the date-and-time type general-purpose processing unit 20A, the rules of score calculation, the list of character strings representing date and time, the rules for converting the character string representing date and time to a string of numerical values in predetermined format, For example, if the input text includes the character string "Today's 15 o'clock", the date-and-time general processing unit 20A selects the character string "Today's 15 o'clock” based on the interaction knowledge 21A as "2017/06/26 Convert to a string of numbers in a predetermined format, such as 15:00. Further, when the character string representing the date and time is included together with the item name 22A in the input text, the interaction knowledge 21A may include a rule to maximize the score of the character string (candidate).
  • calculation of a score can be performed according to the predetermined score calculation rule. For example, when the input text includes a part of the item name 22A, 0.7 is given as a base score, and when it corresponds to the operation parameter 23A, the base score is obtained when all the item names 22A are included. The score is calculated according to the calculation rule of adding 0.1 to. For example, when "To introduce yy to 15 o'clock at today's 15 o'clock" is input, since "15 o'clock of today" corresponds to a part of date and time of the item name 22A, a base score of 0.7 is given.
  • “Today's 15 o'clock” indicates the past date and time, which corresponds to the operation parameter 23A, 0.1 is added, and the score is 0.8.
  • the input text includes all of the item names 22A, such as “visit time is 15 o'clock of today ...” or “visited xx at 15 o'clock of today”, 0.1 is further added. The score is 0.9 because it is added.
  • the score is not set to zero but the character string of the input text is set to the item name 22A and the operation parameter 23A.
  • the score is calculated from the degree of similarity with the received information. In that case, it is desirable to set a score lower than the base score.
  • the date-and-time type general-purpose processing unit 20A is customized as an item-by-item processing unit 12A for acquiring information on "visit date and time” by receiving the item name 22A and the operation parameter 23A.
  • the item-by-item processing unit 12A extracts a candidate for “visit date and time” from the input text, using “past date and time” given as the operation parameter 23A as a condition for acquiring information, and the likelihood is that the candidate is “visit date and time” Is calculated, and the candidate with the highest score is sent to the dialogue control unit 11 together with the score.
  • FIG. 5 is a diagram for explaining the details of the item-by-item processing unit 12B corresponding to the item whose item name is “visited destination”.
  • the item-specific processing unit 12B is constructed by giving the item name 22B and the operation parameter 23B to the option type general-purpose processing unit 20B.
  • the choice-type general-purpose processing unit 20B is a general-purpose processing unit that corresponds to choice-type information. Since the item name 22B is “visited” and the operation parameter 23B is a company name etc. where the information to be acquired by the item-by-item processing unit 12B is selected from among several options, “Tokyo Shoji, seamount construction, It is an option such as "Yamada Industry ".
  • the choice-type general-purpose processing unit 20B extracts, as a candidate, a portion estimated to match any of the options given as the operation parameter 23B from the input text based on the dialogue knowledge 21B, and each extracted candidate represents the option
  • the score indicating the certainty is calculated for each candidate, and the candidate with the highest score is output together with the score.
  • the dialogue knowledge 21B includes an operation flow of the option type general-purpose processing unit 20B, a rule of score calculation, and the like.
  • the dialogue knowledge 21B determines the score of the character string (candidate) It may include rules to maximize it.
  • the option type general-purpose processing unit 20B operates when the input text includes reading information (for example, when reading information obtained by voice recognition processing for voice input from the user 50 is added to the input text) Reading information may be added to the option given as the parameter 23B, and a candidate may be extracted from the input text by matching the reading information included in the input text with the reading information of the option.
  • calculation of a score can be performed according to the predetermined score calculation rule. For example, as in the case of the date and time type, it can be calculated depending on whether the input text includes the item name 22B or the operation parameter 23B. For example, a base score (0.7) is given when the motion parameter 23B is included, and a score is added when the item name 22B is included. Moreover, it is also possible to reflect the result of the matching which used the information of the above-mentioned reading on a score, and in that case, it is good to try to add a score according to the similarity of information on reading.
  • “visit destination” of the item name or “visit” which is a part of the item name The score is added (+0.1) because it is included. Further, the score is further added (+0.2) in order to include “seamount company” which is the option set in the operation parameter 23B.
  • the score evaluation in the relationship with the operation parameter 23B can be evaluated based on, for example, the match of the target character string with the option, the similarity of the reading information, the distance to the item name, and the like. Evaluation (plus value of score) can be set as appropriate.
  • the score is not zero, for example, only part of the information of the input text reading Is similar to the information set in the item name 22B and the operation parameter 23B, the score can be calculated from the relationship with the information set in the item name 22B and the operation parameter 23B based on a part of the information. In that case, it is desirable to set a score lower than the base score. Also in the free description type general-purpose processing unit 20D described later, it is possible to calculate the score in the case where the input text does not correspond to the item name and the operation parameter by the same way of thinking.
  • the option type general-purpose processing unit 20B is customized as an item-by-item processing unit 12B for acquiring information of “visit destination” by receiving the item name 22B and the operation parameter 23B.
  • the item-specific processing unit 12B extracts, from the input text, a character string estimated to match any of the options given as the operation parameter 23B as a candidate for “visit destination”, and the candidate is “visit destination”.
  • a score representing the likelihood is calculated, and the candidate with the highest score is sent to the dialogue control unit 11 together with the score.
  • FIG. 6 is a diagram for explaining the details of the item-by-item processing unit 12C corresponding to the item whose item name is “next scheduled date”.
  • the item-specific processing unit 12C is constructed by giving an item name 22C and an operation parameter 23C to the date-and-time type general-purpose processing unit 20A.
  • the item name 22C is the “next scheduled date”
  • the operation parameter 23C is the next scheduled date that the information processing unit 12C should acquire is the future scheduled date and time, so the condition for acquiring the information “future date and time” It is.
  • the date-and-time general-purpose processing unit 20A used for the item-specific processing unit 12C is common to the date-and-time general-purpose processing unit 20A used for the above-described item-specific processing unit 12A, and a portion presumed to represent date and time from input text A candidate is extracted, and a score indicating the likelihood that each extracted candidate represents a date and time is calculated for each candidate, and the candidate with the highest score is output together with the score.
  • the date-and-time general-purpose processing unit 20A is customized as an item-by-item processing unit 12C for acquiring information of “next visit date” by receiving the item name 22C and the operation parameter 23C.
  • the item-by-item processing unit 12C extracts the candidate for the “next scheduled date” from the input text using the “future date and time” given as the operation parameter 23C as a condition for acquiring information, and the candidate is the “next scheduled date”. A score representing the likelihood is calculated, and the candidate with the highest score is sent to the dialogue control unit 11 together with the score.
  • FIG. 7 is a diagram for explaining the details of the item-by-item processing unit 12D in which the item name corresponds to the item “special item”.
  • the item-specific processing unit 12D is constructed by providing the free description type general-purpose processing unit 20D with an item name 22D and an operation parameter 23D.
  • the free description type general purpose processing unit 20D is a general purpose processing unit corresponding to free description type information.
  • the item name 22D is "special notes”
  • the operation parameter 23D is a user dictionary defining technical terms and the like related to "business negotiation record", the number of characters of information input to the slot 17D corresponding to "special notes", etc. .
  • the free-description-type general-purpose processing unit 20D extracts a candidate of information to be input to the slot 17 corresponding to the item name from the input text based on the dialog knowledge 21D, and inputs the extracted candidate to the slot 17 corresponding to the item name. A score indicating the likelihood of being information is calculated, and the candidate is output together with the score.
  • the dialogue knowledge 21D maximizes the score by extracting the character string following the item name as the operation flow of the free description type general-purpose processing unit 20D, the rule of score calculation, and the item name is included in the input text Including such rules as
  • calculation of a score can be performed according to the predetermined score calculation rule.
  • the score can be calculated according to whether or not the item name 22D is included.
  • calculation can be performed according to a calculation rule in which a base score is given and a score is added by the appearance position of the item name in the input text. For example, when the input text is “xxxxxx, special item is yyy”, “special item” is in the middle, so “yyy” under “special item” is extracted as free description content, and the base score (0.6 )give. Also, if the input text is "special item is yyy" and there is an item name at the beginning, the score is added (+0.2).
  • the base score may be given as one including the
  • the free description type general-purpose processing unit 20D is customized as an item-by-item processing unit 12D for acquiring information of "special item” by receiving the item name 22D and the operation parameter 23D.
  • the item-by-item processing unit 12D extracts a character string not exceeding the character limit as a candidate from the input text using the user dictionary given as the operation parameter 23D, and the score representing the likelihood that the candidate is "special item" Are calculated, and candidates are sent to the dialogue control unit 11 together with the score.
  • each of the plurality of item-specific processing units 12 included in the dialog processing device 10 according to the present embodiment has item names and operation parameters for the general-purpose processing unit corresponding to the type of information to be acquired by itself. It is built by being given.
  • the general-purpose processing unit uses one prepared in advance according to the type of information. Therefore, when constructing the dialog processing apparatus 10 of the present embodiment, for each item necessary to execute a predetermined operation according to the purpose, the general-purpose processing unit according to the type of the information is selected and the item It is possible to construct the dialogue processing apparatus 10 capable of appropriate dialogue processing only by providing the name and operation parameters, constructing the item-specific processing section 12, and providing the dialogue control section 11 which organizes the plurality of item-specific processing sections 12.
  • the general-purpose processing unit is a date-and-time general-purpose processing unit 20A corresponding to date-and-time information, and an option corresponding to option-type information
  • the example of the general-purpose processing unit 20B and the free-description-type general-purpose processing unit 20D corresponding to the free-description-type information is illustrated.
  • a general-purpose processing unit corresponding to information of a numerical type is prepared in advance, and "general purpose reservation" as an item name and "unit (person), significant digit, upper limit / lower limit” etc.
  • general purpose reservation as an item name and "unit (person), significant digit, upper limit / lower limit” etc.
  • an item-by-item processing unit that acquires information on the "number of guests” necessary to achieve the purpose of the "hotel reservation”.
  • a general-purpose processing unit corresponding to address type information is prepared in advance and "destination" as an item name and “address data, map data” etc. as operation parameters are given to this general-purpose processing unit, "path” It is possible to construct an item-specific processing unit that acquires information on "destination” necessary to achieve the purpose of "search”.
  • FIG. 8 is a diagram for explaining the details of the dialogue control unit 11 constructed in this way.
  • the dialogue control unit 11 is constructed by giving the operation parameter 32 to the general-purpose dialogue control unit 30 as shown in FIG.
  • the general-purpose dialogue control unit 30 controls the dialogue with the user 50 based on the dialogue knowledge 31.
  • the dialogue knowledge 31 sends the input text to the item-by-item processing unit 12 and receives the candidates together with the score, and inputs a candidate whose score is the first threshold or more into the corresponding slot 17 of the slot table 16. It includes the rules of interaction, the above-described general-purpose response text used to respond to the user 50, and the like.
  • the general-purpose dialogue control unit 30 is customized to the dialogue control unit 11 according to the purpose to be achieved by the dialogue processing device 10 by receiving the operation parameter 32.
  • the operation parameter 32 is, for example, an item name corresponding to each slot 17 of the slot table 16 or an operation to be executed when all the slots 17 are filled.
  • the history of dialogue with the user 50 is accumulated in the dialogue history accumulation unit 13.
  • the dialog history stored in the dialog history storage unit 13 updates, for example, the dialog knowledge 21A, 21B, 21D of the item-by-item processing unit 12 (hereinafter referred to as “dialogue knowledge 21” unless otherwise specified). It can be used to
  • the dialogue processing apparatus 10 of the present embodiment includes an update unit 14 that updates the dialogue knowledge 21 using the dialogue history.
  • the updating unit 14 detects, based on the dialog history stored in the dialog history storage unit 13, an event for which information to be determined as information of an item corresponding to any one of the plurality of item-by-item processing units 12 can not be determined.
  • the dialogue knowledge 21 of the item-by-item processing unit 12 corresponding to the item is updated so that the information can be determined as the information of the item.
  • the dialog history stored in the dialog history storage unit 13 is presented to the manager who manages the operation of the dialog processing apparatus 10 so as to be viewable.
  • the administrator confirms the dialogue history, and inputs the information and the item name to the dialogue processing device 10 when the user 50 is inquired without determining the information of the certain item included in the input text. .
  • the updating unit 14 detects the above-mentioned event based on the input from the administrator, and the information input from the administrator is appropriately acquired in the item-by-item processing unit 12 of the item name input from the administrator. Thus, the dialog knowledge 21 of the item-by-item processing unit 12 is updated.
  • the updating unit 14 outputs, from the dialog history stored in the dialog history storage unit 13, a candidate that the dialog control unit 11 has output to the user 50 and whose score is less than the first threshold and which is equal to or higher than the second threshold.
  • the dialog pattern of the combination of input text including a response asking whether it is correct and the subsequent positive expression is detected as the above-mentioned event, and the score of the candidate included in the dialog pattern is equal to or higher than the first threshold.
  • the dialogue knowledge 21 of the item-by-item processing unit 12 that has sent the candidates to the dialogue control unit 11 may be updated.
  • the dialogue control unit 11 can control the dialogue with the user 50 in accordance with the adjustable control parameter.
  • the control parameters for controlling the interaction with the user 50 are, for example, verbalization (intimacy, politeness, etc.) of the response text, voice quality and speed of synthesized speech in the case of synthesizing the response text, and outputting. .
  • verbalization intimacy, politeness, etc.
  • voice quality and speed of synthesized speech in the case of synthesizing the response text, and outputting.
  • the dialogue processing apparatus 10 includes a parameter adjustment unit 15 that adjusts control parameters for controlling the dialogue with the user 50 by the dialogue control unit 11.
  • the parameter adjustment unit 15 acquires the attribute of the user 50, and adjusts the above-described control parameter in accordance with the acquired attribute.
  • the attribute of the user 50 can be acquired, for example, by receiving an explicit designation (for example, an input of age or gender) by the user 50.
  • the face image of the user 50 may be captured by a camera, and the face image may be analyzed to estimate the attribute of the user 50.
  • the history of interaction with the user 50 may be analyzed to estimate the rough character (strict, friendly, etc.) of the user 50, and this may be included in the attributes of the user 50.
  • the value of the control parameter according to the attribute of the user 50 is, for example, a statistic process of collecting satisfaction of the user 50 when performing interactive processing while changing the value of the control parameter for the user 50 of various attributes. By doing this, the optimal value can be determined.
  • FIG. 9 is a diagram for explaining an operation example of the dialog processing apparatus 10 according to the present embodiment, and the operation of the dialog processing apparatus 10 when the user 50 inputs “I went to Tokyo at 15 o'clock of today”. An example is shown.
  • the dialogue control unit 11 receives the input of the user 50, and sends an input text “I visited Tokyo Corporation at 15 o'clock of today” to each of the plurality of item-specific processing units 12 (1).
  • the item-by-item processing unit 12A corresponding to the item with the item name “visit date and time” among the plurality of item-by-item processing units 12 is an input “I visited Tokyo Corporation at 15 o'clock of today” received from the dialogue control unit 11 "Today's 15 o'clock" is extracted from the text and converted to "2017/06/26 15:00".
  • the input text includes the “visit” of the item name 22A and indicates the past date and time such as “visited”, and it is calculated because it matches the condition of the past date and time given as the operation parameter 23A.
  • a high value of 0.9 is calculated by adding 0.2 to 0.2 to a base score of 0.7.
  • the score for "Today's 15 o'clock” extracted from “Today's 15 o'clock at Tokyo Trading Company” is 0.9
  • the score 0.9 is sent to the dialogue control unit 11 (2A).
  • the score range is 0 to 1.0
  • the first threshold is 0.9
  • the second threshold is 0.7.
  • the item-by-item processing unit 12B whose item name corresponds to the item of “visit destination” received from the dialogue control unit 11 “I went to Tokyo trading company at 15 o'clock of today” Extract “visit” and “Tokyo Shoji” from the input text and calculate the score. Since “visit” matches the item name 22B, the score is 0.8, and "Tokyo Corporation” is included in the option given as the operation parameter 23B, so a high value of 0.9 is calculated as the score. In this case, the item-specific processing unit 12 sends "Tokyo Shoji Co., Ltd.” as a candidate to the dialogue control unit 11 with a score of 0.9 (2B).
  • the item-by-item processing unit 12C whose item name corresponds to the item of “next scheduled date” visited “Tomorrow at 15 o'clock at 15 o'clock of today received from the dialogue control unit 11 “Today's 15 o'clock” is extracted from the input text “” and converted to “2017/06/26 15:00”, and this is sent as a candidate to the dialogue control unit 11 with a score of 0.45 (2C).
  • the score is a relatively low value of 0.45 because "today's 15 o'clock" does not meet the condition of the future date and time given as the operation parameter 23C.
  • the item-by-item processing unit 12 D whose item name corresponds to the item of “special notes” received “from today's 15 o'clock Tokyo corporation” received from the dialogue control unit 11
  • the input text is extracted as a candidate as it is, and is sent to the dialogue control unit 11 with a score of 0.12 (2D). Since this candidate is not a character string following the item name “special notes”, the score is as low as 0.12.
  • the dialogue control unit 11 having received the candidate and the score from each of the plurality of item-specific processing units 12 determines the candidate having the score equal to or more than the first threshold as the information of the item corresponding to the item-specific processing unit 12 which sent the candidate. Then, the information is input to the slot 17 of the corresponding item of the slot table 16 (3).
  • the score of “2017/06/26 15:00” sent from the item-by-item processing unit 12A is 0.95
  • the score for “Tokyo Corporation” sent from the item-by-item processing unit 12B is 0. 92.
  • the dialog control unit 11 determines "2017/06/26 15:00” as information on “visit date and time” and "Tokyo Corporation” as information on “visit destination”, and sets “visit date and time” in the slot table 16 “2017/06/26 15:00” is input to the corresponding slot 17A, and “Tokyo Shoji” is input to the slot 17B corresponding to the “visit destination”.
  • the dialogue control unit 11 when the score is less than the first threshold and the candidate having the second threshold or more is received, the dialogue control unit 11 outputs a response to the user 50 inquiring whether the candidate is correct or not. In the example, since such a candidate has not been received, no response is made to inquire whether the candidate is correct.
  • the dialog control unit 11 checks whether all the slots 17 in the slot table 16 are filled, and if there is a slot 17 for which information has not been input, the user 50 responds to inquire about the information to be input to the slot 17. Output to (4).
  • the information on “next scheduled date” to be input to the slot 17C having a small item number is inquired A response such as “What is the next scheduled date?” Is output to the user 50.
  • the interaction processing apparatus 10 of the present embodiment repeats the above operation until all the slots 17 of the slot table 16 are filled, acquires information of each item through interaction with the user 50, and inputs the information to each slot 17 of the slot table 16. I will. Then, when all the slots 17 are filled, the dialogue control unit 11 executes an operation according to the purpose such as “negotiation record” based on the slot table 16.
  • FIG. 10 is a flowchart showing an example of a processing procedure by the dialogue control unit 11, and shows a flow of processing executed by the dialogue control unit 11 each time an input from the user 50 is received.
  • the dialogue control unit 11 When the dialogue control unit 11 receives an input from the user 50, first, it sends an input text according to the input to each of the plurality of item-specific processing units 12 (step S101). Then, the dialogue control unit 11 receives the candidate and the score from the item-by-item processing unit 12 (step S102).
  • the dialogue control unit 11 determines whether or not there is a candidate having a score equal to or higher than the first threshold among the candidates received from the item-by-item processing unit 12 (step S103). Then, if there is a candidate whose score is equal to or higher than the first threshold (step S103: Yes), the candidate is input to the corresponding slot 17 of the slot table 16 (step S104). On the other hand, if there is no candidate whose score is equal to or higher than the first threshold (step S103: No), the process proceeds to the next step S105 without performing the process of step S104.
  • the dialogue control unit 11 determines whether or not there is a candidate having a score less than the first threshold and greater than or equal to the second threshold among the candidates received from the item-by-item processing units 12 (step S105). ). Then, if there is a candidate whose score is less than the first threshold and greater than or equal to the second threshold (step S105: Yes), the dialog control unit 11 sends a response to the user 50 asking whether the candidate is correct. It outputs (step S106), and ends a series of processings.
  • step S105 determines whether the score is less than the first threshold and there is no candidate having the second threshold or more.
  • step S105: No the dialog control unit 11 determines whether all the slots 17 in the slot table 16 are filled.
  • step S107 the dialogue control unit 11 outputs a response for inquiring information to be input to the unconfirmed slot 17 to the user 50 (step S108). , End a series of processing.
  • step S107 when all the slots 17 of the slot table 16 are filled (step S107: Yes), the dialog control unit 11 executes a predetermined operation according to the purpose using the information input to each slot 17 of the slot table 16 Then (step S109), the series of processing is ended.
  • FIG. 11 is a flowchart showing an example of a processing procedure by the item-by-item processing unit 12, and shows a flow of processing executed by the item-by-item processing unit 12 each time an input text is sent from the dialogue control unit 11.
  • the item-by-item processing unit 12 When receiving the input text sent from the dialogue control unit 11 (step S201), the item-by-item processing unit 12 extracts candidates from the input text and calculates a score (step S202). Next, the item-by-item processing unit 12 sends the candidate extracted in step S202 and the score calculated for the candidate to the dialogue control unit 11 (step S203), and ends the series of processing.
  • the item-specific processing unit 12 may divide the input text into partial texts such as character strings in predetermined units and process them. In that case, as a method of division, for example, a method of semantically analyzing the input text and dividing the input text in units of groups of meaning can be used.
  • the method of division may be different depending on the type of information to be acquired, and the above-mentioned dialogue knowledge 21 may be configured to include the rule of division.
  • the score may be calculated for each divided partial text, the partial text with the highest calculated score may be a candidate, and the candidate may be sent to the dialogue control unit 11 together with the score.
  • the dialog processing apparatus 10 includes a plurality of items constructed by customizing a general-purpose processing unit prepared in advance for each type of information.
  • a combination of the separate processing unit 12 and the dialogue control unit 11 which brings together the plurality of item-by-item processing units 12 realizes dialogue processing according to the purpose to be achieved. Therefore, it becomes possible to perform appropriate dialogue processing without performing complicated work such as creating a large number of dialogue scenarios according to the purpose to be achieved, such as a dialogue processing device that carries out dialogue processing based on the conventional dialogue scenario.
  • Interactive processing for achieving a predetermined purpose can be realized with a simple configuration.
  • the dialogue control unit 11 sends the input text to all of the plurality of item-by-item processing units 12, and the process for acquiring the information of each item Since each of the configurations is performed independently, information of a plurality of items can be obtained simultaneously from one input of the user 50. That is, in the related art, only one item of information can be obtained from one input of the user 50, but in the present embodiment, information of a plurality of items can be obtained from one input of the user 50. Good dialogue can be realized.
  • only candidates whose score is less than the first threshold and greater than or equal to the second threshold are inquired to the user 50 whether the candidates are correct or not. 50 may be specified. For example, when the “standard mode” and the “certain mode” are provided as the operation mode of the dialog processing device 10 and the “standard mode” is selected by the user 50, the score is less than the first threshold as in the above example. And, the user 50 is inquired whether the candidate is correct only for the candidate having the second threshold or more, and when the “certain mode” is selected by the user 50, the score is the second threshold or more For all candidates, the user 50 may be inquired whether the candidates are correct.
  • the score is less than the first threshold without making an inquiry to the user 50
  • a candidate having a second threshold or more may be determined as the information of the corresponding item.
  • the user 50 lowers the value of the first threshold when the "certain mode” is selected by the user 50, and raises the value of the second threshold when the "simple mode” is selected by the user 50.
  • the threshold for the score may be changed according to the selected operation mode. Further, a mechanism may be provided to confirm the content finally confirmed regardless of the mode for confirming whether the content input at the end is good or the selected mode.
  • the dialogue processing apparatus 10 can facilitate the dialogue with the user 50 as well as the plurality of item-specific processing units 12 for acquiring information to be input to each slot 17 of the slot table 16. It may be configured to include a dialogue processing unit.
  • an interaction processing unit may be provided that responds to the greeting at the start of interaction processing with the user 50.
  • Such a dialogue processing unit can also be constructed by the same mechanism as the item-by-item processing unit 12. That is, for example, by providing operation parameters indicating various greeting patterns to a general-purpose processing unit of a one-to-one type, a dialog processing unit that responds to the greeting at the start of the dialog processing with the user 50 is constructed. be able to.
  • the present embodiment is an example in which a multipurpose dialogue processing system is constructed by combining a plurality of dialogue processing devices 10 having different goals to be achieved.
  • FIG. 12 is a block diagram showing an overview of the dialog processing system 100 according to the second embodiment.
  • the dialogue processing system 100 includes a plurality of dialogue processing devices 10A, 10B and 10C (hereinafter referred to as "dialogue processing device 10" unless otherwise specified) and a selection unit 40.
  • the plurality of interactive processing devices 10 have the same configuration as the interactive processing device 10 according to the first embodiment described above, but have different goals to be achieved (predetermined operations to be performed depending on the purposes).
  • the dialogue processing device 10A is constructed for the purpose of “negotiation record”
  • the dialogue processing device 10B is constructed for the purpose of “new customer registration”
  • the dialogue processing device 10C is constructed for the purpose of “order receipt record” Shall be
  • the selection unit 40 determines a predetermined operation intended by the user 50 based on the input text according to the input of the user 50, and performs an interaction with the user 50 among the plurality of interaction processing devices 10 Choose 10 For example, when the input text corresponding to the input of the user 50 includes a character string specific to “negotiation record”, the selection unit 40 determines that the purpose of the user 50 is “negotiation record”, and the user 50 The dialogue processing apparatus 10A corresponding to the "negotiation record" is selected as the dialogue processing apparatus 10 that performs dialogue with the user.
  • the selection unit 40 determines that the purpose of the user 50 is “new customer registration”, As the interaction processing device 10 that interacts with the user 50, the interaction processing device 10B corresponding to "new customer registration” is selected. Further, when the input text corresponding to the input of the user 50 includes a character string specific to “order receipt record”, the selection unit 40 determines that the purpose of the user 50 is “order receipt record”, and the user 50 The dialogue processing apparatus 10C corresponding to the “order receipt record” is selected as the dialogue processing apparatus 10 that performs dialogue with the user.
  • the selection unit 40 can not determine the predetermined operation intended by the user 50 based on the input text (for example, when the input text does not include a character string indicating the purpose of the dialog processing device 10), Input texts are sent to the item-by-item processing units 12 via the dialogue control units 11 of all the dialogue processing devices 10 so that each item-by-item processing unit 12 calculates a score.
  • the dialogue control unit 11 of each dialogue processing device 10 selects the highest score from the scores sent from the item-by-item processing unit 12 and sends it to the selection unit 40. Then, based on the score sent from the dialogue control unit 11 of each dialogue processing device 10, the selection unit 40 may select the dialogue processing device 10 that processes the input text.
  • the input text is “visited xx at 15 o'clock”
  • the input text is processed because this input text does not contain strings such as “business opportunities”, “new customers”, “orders”, etc. It can not judge which dialogue processing apparatus 10 should be. Therefore, based on the calculation result of the score in each item processing unit 12 by sending the input text to each dialogue processing device 10, for example, from the dialogue processing device 10 for the purpose of "negotiation record", "visit destination: xx" If the score of 0.85 is sent and no more score is sent from the other dialogue processing device 10, it is presumed that the predetermined operation intended by the user 50 is "business record", and the input text is As the dialog processing device 10 to be processed, the dialog processing device 10 for the purpose of "negotiation record” is selected. Also, in this case, the selection unit 40 performs processing such as “Are you OK with the input of the business record?” “A visitation date is xxx and a visit destination is xx?” May be
  • the dialogue processing system 100 is constructed by combining a plurality of dialogue processing devices 10 having different goals to be achieved, and each dialogue processing device 10 has the same configuration as that of the first embodiment described above. Therefore, as in the dialog processing apparatus 10 according to the first embodiment, multipurpose dialog processing can be appropriately realized with a simple configuration without performing complicated work of creating a large number of dialog scenarios.
  • the dialog processing device 10 is configured by a combination of the plurality of item-specific processing units 12 and the dialog control unit 11, and the combination of the plurality of dialog processing devices 10 and the selection unit 40.
  • the dialog processing system 100 has been described as being configured, various variations can be considered as the configurations of the dialog processing device 10 and the dialog processing system 100.
  • the item processing unit 12 described above, the dialog processing device 10, and the dialog processing system 100 are components (hereinafter, the item processing unit 12 is "small agent”, the dialog processing device 10 is "middle agent”, the dialog processing system By regarding 100 as a "large agent”, various combinations of these small agents, medium agents, and large agents can be made into various configurations including the number of layers.
  • a simple dialogue scenario has been described as an example, but by combining small agents, medium agents, and large agents, it is possible to cope with a large amount of scenario creation and various dialogue variations. It is possible.
  • the medium agent is described as being composed of a plurality of small agents in the above-described embodiments and modifications, the medium agent may be divided into a plurality of small agents depending on the unit of interaction for achieving the purpose. Not only the configuration from agents but also a combination of a large agent, a medium agent, and a small agent may be realized as a single agent, or an input from the user 50 may be processed only by the small agent.
  • the configuration is made such that a plurality of small agents are configured in a hierarchy such as a small agent group ⁇ and a small agent group ⁇ connected to one of the small agent groups ⁇ , etc. It can be done.
  • the combination of each agent and the existing dialogue scenario is provided by providing an interface between each agent and the existing dialogue scenario generated by another mechanism as well as the combination of the above-mentioned large agent, medium agent and small agent. It is also possible.
  • One of the small agents group ⁇ is a small agent for selecting a plan, and the small agent responds again such as "What is your request for price and conditions (no smoking and bathing)?"
  • the answer to the selection plan is obtained from the user 50 through the above, which can be realized by processing the plan selected by the small agent in the small agent group ⁇ as definite information.
  • the interaction processing apparatus 10 according to the first embodiment described above and the interaction processing system 100 according to the second embodiment are, for example, a combination of hardware constituting a general computer and a program (software) executed by the computer. It can be realized by work.
  • functional components constituting the dialogue processing apparatus 10 such as the dialogue control unit 11, the item-by-item processing units 12A to 12D, the update unit 14, and the parameter adjustment unit 15 when the computer executes a predetermined program.
  • functional components constituting the dialogue processing system 100 such as the dialogue processing devices 10A to 10C and the selection unit 40 can be realized.
  • FIG. 14 is a block diagram showing an example of the hardware configuration of the dialog processing apparatus 10 according to the first embodiment described above and the dialog processing system 100 according to the second embodiment.
  • the dialog processing apparatus 10 and the dialog processing system 100 include a hardware processor (processor circuit) such as the CPU 101, a storage device such as the RAM 102 or the ROM 103, a mass storage device such as the SSD 104, and a network.
  • a hardware configuration as a general computer provided with a communication I / F 105 for communicating with the outside via the device and an apparatus I / F 106 for connecting peripheral devices.
  • the above program is provided by being recorded on, for example, a magnetic disk, an optical disk, a semiconductor memory, or a similar recording medium.
  • the storage format for recording the program may be any format as long as it is a storage medium readable by the computer system.
  • the program may be configured to be installed in advance in a computer, or may be configured to be installed in a computer as appropriate, the program distributed via a network.
  • the program executed by the above computer may be the dialog control unit 11, the item processing units 12A to 12D, the update unit 14, the units such as the parameter adjustment unit 15, the dialog processing devices 10A to 10C, the selection unit 40, etc.
  • the above-described units are generated on the main storage such as the RAM 102 by the processor reading and executing this program as appropriate.
  • the dialog processing apparatus 10 according to the first embodiment described above and the dialog processing system 100 according to the second embodiment can implement part or all of the functional units described above by using an application specific integrated circuit (ASIC) or an FPGA (FPGA).
  • ASIC application specific integrated circuit
  • FPGA FPGA
  • the configuration may be realized by dedicated hardware such as a field-programmable gate array).
  • the dialogue processing apparatus 10 according to the first embodiment and the dialogue processing system 100 according to the second embodiment are configured as a network system in which a plurality of computers are communicably connected, and each unit described above is constituted of a plurality of units. It may be configured to be distributed to a computer. Further, the dialog processing apparatus 10 according to the first embodiment described above and the dialog processing system 100 according to the second embodiment may be virtual machines operating on a cloud system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

実施形態の対話処理装置(10)は、1又は複数の項目別処理部(12)と対話制御部(11)とを備える。対話制御部(11)は、各項目別処理部(12)に入力情報を送る。各項目別処理部(12)は、入力情報から自身が獲得すべき情報の候補を抽出してその候補の確からしさの度合いを示す情報とともに対話制御部(11)に送る。対話制御部(11)は、確からしさの度合いが第1基準を満たす候補を対応する項目の情報として確定し、情報が未確定の項目があれば、該項目の情報を問い合わせる応答をユーザに対して出力する。複数の項目別処理部(12A,12B,12C,12D)の各々は、獲得すべき情報の型に応じた対話知識(21A,21B,21D)に基づいて候補の抽出および確からしさの度合いを算出する基本ルールを有する汎用処理部(20A,20B,20D)に対して、項目名(22A,22B,22C,22D)と動作パラメータ(23A,23B,23C,23D)とが与えられることにより構築される。

Description

対話処理装置および対話処理システム
 本発明の実施形態は、対話処理装置および対話処理システムに関する。
 従来、対話シナリオに基づいてユーザとの対話を行う対話処理装置が知られている。この種の対話処理装置は、対話シナリオの作り込みによって目的に応じた対話処理を実現できるが、様々な対話のバリエーションに柔軟に対応するためには、必要とされる対話シナリオの量が膨大になる。また、対話シナリオは、一般的に、所定の目的を達成するための一連の対話の流れに沿って個別に作成されるため、作成された対話シナリオに汎用性を持たせることが難しい。このため、対話処理を実現するための対話シナリオの作り込みに多大な労力を要するという問題があり、より簡便な構成で所定の目的を達成するための対話処理を実現できる仕組みが望まれている。
特開2007-264198号公報
 本発明が解決しようとする課題は、簡便な構成で所定の目的を達成するための対話処理を実現できる対話処理装置および対話処理システムを提供することである。
 実施形態の対話処理装置は、ユーザとの対話を通じて、所定の動作を実行するための1又は複数の項目の情報を獲得する対話処理装置であって、前記1又は複数の項目に対応する1又は複数の項目別処理部と、前記1又は複数の項目別処理部と連携してユーザとの対話を制御する対話制御部と、を備える。前記対話制御部は、ユーザの入力に応じた入力情報を前記1又は複数の項目別処理部の各々に送る。前記1又は複数の項目別処理部の各々は、前記対話制御部から受け取った前記入力情報から自身が獲得すべき情報の候補を抽出して、抽出した候補を該候補が獲得すべき情報であることの確からしさの度合いを示す情報とともに前記対話制御部に送る。前記対話制御部は、前記1又は複数の項目別処理部の各々から受け取った候補のうち、前記確からしさの度合いが第1基準を満たす候補を、該候補を送った項目別処理部に対応する項目の情報として確定し、情報が未確定の項目があれば、該項目の情報を問い合わせる応答をユーザに対して出力する。前記1又は複数の項目別処理部の各々は、獲得すべき情報の型に応じた対話知識に基づいて前記候補の抽出および前記確からしさの度合いの算出を行う基本ルールを有する汎用処理部に対して、対応する項目の項目名と自身の動作を決定付ける動作パラメータとが与えられることにより構築される。
図1は、第1実施形態に係る対話処理装置の機能的な構成例を示すブロック図である。 図2は、スロットテーブルの一例を示す図である。 図3は、テーブル情報の一例を示す図である。 図4は、項目別処理部の詳細を説明する図である。 図5は、項目別処理部の詳細を説明する図である。 図6は、項目別処理部の詳細を説明する図である。 図7は、項目別処理部の詳細を説明する図である。 図8は、対話制御部の詳細を説明する図である。 図9は、対話処理装置の動作例を説明する図である。 図10は、対話制御部による処理手順の一例を示すフローチャートである。 図11は、項目別処理部による処理手順の一例を示すフローチャートである。 図12は、第2実施形態に係る対話処理システムの概要を示すブロック図である。 図13は、複数の項目別処理部を階層構造とした構成例を説明する図である。 図14は、第1実施形態に係る対話処理装置や第2実施形態に係る対話処理システムのハードウェア構成例を示すブロック図である。
 以下、実施形態の対話処理装置および対話処理システムについて、図面を参照して詳細に説明する。
<実施形態の概要>
 本実施形態の対話処理装置は、ユーザが明確な目的をもって利用する目的達成型の対話処理装置であり、ユーザとの対話を通じて、その目的に応じた所定の動作を実行するための1又は複数の項目の情報を獲得する。例えば、目的が「商談記録」であれば、「訪問日時」、「訪問先」、「次回予定日」、「特記事項」などの各項目の情報を、ユーザとの対話を通じて獲得する。また、目的が「宿泊予約」であれば、「チェックイン予定日時」、「チェックアウト予定日時」、「宿泊人数」、「宿泊プラン」などの各項目の情報、目的がカーナビゲーションシステムの「経路探索」であれば、「目的地」、「有料道路利用の有無」などの各項目の情報が、それぞれ獲得すべき情報となる。なお、以下では獲得すべき情報が複数の項目の情報であるものとして説明するが、獲得すべき情報が1つの項目の情報であってもよい。
 本実施形態の対話処理装置は、目的に応じた所定の動作を実行するために、スロットテーブルを用いる。スロットテーブルは、複数の項目の各々に対応する複数のスロットを有する。各スロットには、対話を通じて獲得される情報(項目値)が入力される。スロットテーブルのすべてのスロットが埋まると、そのスロットテーブルに基づいて、目的に応じた所定の動作が実行される。目的に応じた所定の動作は、例えば、目的が「商談記録」であれば商談記録をデータベースに登録するという動作である。また、目的が「宿泊予約」であれば宿泊予約クエリの実行、目的が「経路探索」であれば現在地から目的地までの経路の探索処理といった動作が、それぞれ目的に応じた所定の動作である。なお、スロットテーブルのすべてのスロットが埋まっていなくとも、所定の動作を実行するために必要な項目に対応するスロットが埋まった段階で所定の動作を実行してもよい。
 本実施形態では、上述のスロットテーブルの各スロットに対応する複数の項目ごとに、その項目の情報を獲得するための処理を個別に行う小パーツ(本実施形態ではこれを「項目別処理部」と呼ぶ)を設け、複数の項目に対応する複数の項目別処理部を組み合わせて対話処理を実現することを基本とする。本実施形態の対話処理装置は、これら複数の項目別処理部と、これら複数の項目別処理部と連携してユーザとの対話を制御する対話制御部とを備えて構成される。対話制御部は、上述のスロットテーブルの各スロットに情報が入力されるように、複数の項目別処理部と連携しながらユーザとの対話を制御する。
 本実施形態の対話処理装置が獲得すべき各項目の情報は、その項目の属性に応じた型に分類できる。例えば上述の「商談記録」を目的とする例において、項目が「訪問日時」や「次回予定日」であれば、獲得すべき情報は日時であるため日時型であり、項目が「訪問先」であれば、獲得すべき情報はいくつかの選択肢の中から選ばれる社名等であるため選択肢型である。また、項目が「特記事項」であれば、獲得すべき情報は特に制限のない任意の情報となるため自由記述型である。これらの情報を獲得するための処理は、その情報の型に応じてある程度一般化できる。そこで本実施形態では、獲得すべき情報の型に応じた汎用的な処理を定義した汎用処理部を型ごとに事前に用意しておき、これら汎用処理部をカスタマイズして上述の項目別処理部を構築する。
 本実施形態では、以上のように、獲得すべき情報の型ごとに事前に用意された汎用処理部をカスタマイズして複数の項目別処理部を構築し、これら複数の項目別処理部を組み合わせて対話処理装置を構築する。したがって、従来の対話シナリオに基づいて対話処理を行う対話処理装置のように、達成すべき目的に応じた大量の対話シナリオを作り込むといった煩雑な作業を行うことなく適切な対話処理が可能となり、簡便な構成で所定の目的を達成するための対話処理を実現できる。以下では、達成すべき目的が「商談記録」である場合を例に挙げて、本実施形態の対話処理装置の具体的な構成例および動作を説明する。
<第1実施形態>
 図1は、第1実施形態に係る対話処理装置10の機能的な構成例を示すブロック図である。本実施形態の対話処理装置10は、図1に示すように、対話制御部11と複数の項目別処理部12A,12B,12C,12D(以下、これらを特に区別しない場合は「項目別処理部12」と表記する)との組み合わせを、ユーザ50との間の対話処理を実現するための基本ユニットとして備える。この対話処理装置10は、スロットテーブル16の各スロットに入力する情報を獲得するために、ユーザ50との間の対話処理を行う。
 スロットテーブル16の一例を図2に示す。スロットテーブル16は、図2に示すように、項目番号(図中の01,02,03,04)により識別される複数のスロット17A,17B,17C,17D(以下、これらを特に区別しない場合は「スロット17」と表記する)を有する。これら複数のスロット17は、達成すべき目的に応じた複数の項目に対応する。本実施形態では、達成すべき目的が「商談記録」であり、商談記録をデータベースに登録するために必要とされる情報は「訪問日時」、「訪問先」、「次回予定日」および「特記事項」の各項目の情報であるとする。このため、「訪問日時」の情報が入力される項目番号01のスロット17Aと、「訪問先」の情報が入力される項目番号02のスロット17Bと、「次回予定日」の情報が入力される項目番号03のスロット17Cと、「特記事項」の情報が入力される項目番号04のスロット17Dとを有するスロットテーブル16が作成される。
 スロットテーブル16は、ユーザ50との間の対話処理を開始する際に作成され、ユーザとの対話を通じて獲得された情報が随時入力される。そして、すべてのスロット17が埋まると目的に応じた所定の動作が実行され、そのスロットテーブル16は削除される。つまり、スロットテーブル16は、ユーザ50との間で目的を達成するための一連の対話処理を行うたびに作成される一時的なテーブルである。このスロットテーブル16は、対話処理装置10の内部に永続的に保持されたテーブル情報に基づいて作成される。ここではスロットテーブル16について、対話処理装置10の内部に永続的に保持されたテーブル情報に基づいて都度作成する仕組みで説明したが、これに限らず、作成したスロットテーブル16を削除せずテーブル形式で保持するようにしてもよい。
 テーブル情報18の一例を図3に示す。テーブル情報18は、図3に示すように、目的に応じた所定の動作を実行するために情報を獲得すべき複数の項目ごとに、項目番号と、情報の型と、項目名とを定義した情報である。図3に示すテーブル情報18は、図2に示すスロットテーブル16の各スロット17に入力される情報を決定付ける。すなわち、スロットテーブル16の項目番号01で識別されるスロット17Aには、項目名が「訪問日時」の項目の情報として日時型の情報が入力され、項目番号02で識別されるスロット17Bには、項目名が「訪問先」の項目の情報として選択肢型の情報が入力され、項目番号03で識別されるスロット17Cには、項目名が「次回予定日」の項目の情報として日時型の情報が入力され、項目番号04で識別されるスロット17Dには、項目名が「特記事項」の項目の情報として自由記述型の情報が入力されることが、図3に示すテーブル情報18に基づいて決定される。
 上述のテーブル情報18は、例えば、目的に応じた対話処理装置10を構築する際に装置構築者によって入力され、対話処理装置10の内部に永続的に保持される。そして、ユーザ50との間の対話処理を開始する際に、このテーブル情報18を参照してスロットテーブル16が作成される。また、テーブル情報18は、複数の項目に対応する複数の項目別処理部12を構築するための情報としても用いられる。さらに、対話制御部11が後述のようにユーザ50に対して応答を出力する場合にも、このテーブル情報18が参照される。
 対話制御部11は、複数の項目別処理部12と連携してユーザ50との対話を制御する。対話制御部11は、各々独立して動作する複数の項目別処理部12を取りまとめ、ユーザ50の入力に応じた入力テキストから、スロットテーブル16の各スロット17に入力する情報を獲得する役割を持つ。
 具体的には、対話制御部11は、ユーザ50の入力を受け取って、ユーザ50の入力に応じた入力情報を複数の項目別処理部12の各々に送る。以下では、入力情報がテキスト(入力テキスト)であるものとして説明するが、これに限らない。ユーザ50の入力に応じた入力情報がテキストの場合、ユーザ50の入力はマイクにより取得された音声であってもよいし、キーボードなどで入力されたテキストであってもよい。ユーザ50の入力がテキストであれば、対話制御部11は、ユーザ50が入力したテキストをそのまま入力テキストとして複数の項目別処理部12の各々に送る。ユーザ50の入力が音声の場合、対話制御部11は、この音声を音声認識処理によりテキストに変換し、得られたテキストを入力テキストとして複数の項目別処理部12の各々に送る。なお、ユーザ50が入力した音声に対する音声認識処理を対話制御部11の外部で行い、音声から変換されたテキストを対話制御部11が受け取る構成であってもよい。音声認識処理は公知技術を利用すればよいため、詳細な説明を省略する。
 その後、対話制御部11は、複数の項目別処理部12の各々から送られる後述の候補およびスコアを受け取る。そして、スコアが第1閾値以上の候補(第1基準を満たす候補)があれば、その候補を、その候補を送った項目別処理部12に対応する項目の情報として確定し、スロットテーブル16の対応する項目のスロット17に入力する。例えば、項目名が「訪問日時」の項目に対応する項目別処理部12Aから送られた候補のスコアが第1閾値以上であれば、対話制御部11は、項目別処理部12Aから送られた候補を、項目名が「訪問日時」の項目の情報として確定し、スロットテーブル16のスロット17Aに入力する。なお、スコアはその候補が獲得すべき情報であることの確からしさの度合いを示す情報の一例であり、スコア以外の情報を用いてもよい。例えば、スコアのような数値化された情報に限らず、その候補が獲得すべき情報であることの確からしさの度合いを示すラベル(例えば、「確実」、「あいまい」、「非該当」などのラベル)などを用いることもできる。この場合、ラベルが「確実」の候補は第1基準を満たす候補となり、ラベルが「あいまい」の候補は第1基準を満たさず、且つ、第2基準を満たす候補となる。
 また、対話制御部11は、スロットテーブル16に情報が入力されていないスロット17がある場合、つまり、スロット17に入力する情報が未確定の項目がある場合に、その項目の情報を問い合わせる応答をユーザ50に対して出力する。例えば、ユーザ50の入力がテキストであれば、対話制御部11は、未確定の項目の情報を問い合わせる応答テキストを生成し、この応答テキストをユーザ50が使用する表示装置に表示させる。また、ユーザ50の入力が音声であれば、対話制御部11は、生成した応答テキストを音声合成処理により音声に変換し、得られた音声をユーザ50が使用するスピーカから出力させる。なお、応答テキストに対する音声合成処理を対話制御部11の外部で行い、ユーザ50が使用するスピーカから出力させる構成であってもよい。音声合成処理は公知技術を利用すればよいため、詳細な説明を省略する。
 未確定の項目の情報を問い合わせる応答テキストは、例えば、「xxxは何ですか?」といったベースとなる汎用の応答テキストを用意しておき、「xxx」の部分に情報が未確定の項目名を挿入することで生成することができる。例えば、項目名が「次回予定日」の項目の情報が未確定であれば、ベースとなる応答テキストに「次回予定日」を挿入することで、「次回予定日は何ですか?」といった応答テキストを生成することができる。また、例えば「xxxはいつですか?」といった日時型に特有のベースとなる応答テキストを個別に用意しておき、問い合わせる情報が日時型であれば、その応答テキストを選択して項目名を挿入し、「次回予定日はいつですか?」といった応答テキストを生成するようにしてもよい。情報が未確定の項目が複数ある場合には、対話制御部11は、例えば項目番号が小さい項目から順に、その項目の情報を問い合わせる応答をユーザ50に出力すればよい。
 また、対話制御部11は、複数の項目別処理部12のいずれかから、スコアが第1閾値未満で、且つ、第2閾値以上の候補(第1基準を満たさず、且つ、第2基準を満たす候補)を受け取った場合は(ただし、第1閾値>第2閾値)、その候補が正しいか否かを問い合わせる応答をユーザ50に対して出力する。この場合の応答テキストは、例えば、「xxxはyyyですか?」といったベースとなる汎用の応答テキストを用意しておき、「xxx」の部分に問い合わせの対象となる項目名を挿入し、「yyy」の部分に問い合わせの対象となる候補を挿入することで生成することができる。例えば、項目名が「訪問先」の項目に対応する項目別処理部12Bから受け取った候補が「山下工業」であり、その候補のスコアが第1閾値未満で、且つ、第2閾値以上であった場合、ベースとなる応答テキストに「訪問先」と「山下工業」を挿入することで、「訪問先は山下工業ですか?」といった応答テキストを生成することができる。
 項目別処理部12から受け取った候補が正しいか否かを問い合わせる応答をユーザ50に対して出力した場合、対話制御部11は、ユーザ50からの次の入力に応じた入力テキストが例えば「はい」、「そうです」といった肯定表現を含む場合、問い合わせの対象とした候補を、問い合わせの対象とした項目に対応する情報として確定し、スロットテーブル16の対応する項目のスロット17に入力する。一方、ユーザ50からの次の入力に応じた入力テキストが例えば「いいえ」、「違います」といった否定表現を含む場合、あるいは肯定表現も否定表現も含まない場合は、対話制御部11は、その入力テキストを問い合わせの対象とした項目に対応する項目別処理部12に送り、この項目別処理部12から候補およびそのスコアが再度送られてくるのを待つ。なお、入力テキストを問い合わせの対象とした項目に対応する項目別処理部12だけでなく、全ての項目別処理部12に入力テキストを送ってもよい。また、対話制御部11は、複数の項目別処理部12からスコアが第1閾値未満で、且つ、第2閾値以上の候補が送られてきた場合には、例えば項目番号が小さい項目から順に、候補が正しいか否かを問い合わせる応答をユーザ50に出力すればよい。
 対話制御部11は、スロットテーブル16の全てのスロット17が埋まるまで以上の処理を繰り返し、スロットテーブル16の全てのスロット17が埋まると、スロットテーブル16の各スロット17に入力された情報を用いて、目的に応じた所定の動作を実行する。本実施形態では、達成すべき目的が「商談記録」であるため、スロットテーブル16のスロット17Aに入力された「訪問日時」の情報と、スロット17Bに入力された「訪問先」の情報と、スロット17Cに入力された「次回予定日」の情報と、スロット17Dに入力された「特記事項」の情報とが、1つの商談記録として、データベースに登録される。なお、対話制御部11はスロットテーブル16の各スロット17に情報を入力する処理までを行い、目的に応じた所定の動作は、対話制御部11とは別のユニットが、スロットテーブル16の各スロット17に入力された情報に基づいて実行する構成であってもよい。
 複数の項目別処理部12は、それぞれ、対話制御部11から送られた入力テキストを受け取り、その入力テキストから自身が獲得すべき情報の候補を抽出して、抽出した候補をその候補が獲得すべき情報であることの確からしさを示すスコアとともに、対話制御部11に送る。これら項目別処理部12は、上述のように、情報の型ごとに事前に用意された汎用処理部のうち、自身が獲得すべき情報の型に対応する汎用処理部をカスタマイズすることで構築される。汎用処理部は、獲得すべき情報の型に応じた対話知識に基づいて候補の抽出およびスコアの算出を行う基本ルールを有し、項目名と項目別処理部12の動作を決定づける動作パラメータとが与えられることによって、項目別処理部12として機能する。
 図4は、項目名が「訪問日時」の項目に対応する項目別処理部12Aの詳細を説明する図である。項目別処理部12Aは、図4に示すように、日時型汎用処理部20Aに対して、項目名22Aと動作パラメータ23Aとが与えられることにより構築される。日時型汎用処理部20Aは、日時型の情報に対応する汎用処理部である。項目名22Aは「訪問日時」であり、動作パラメータ23Aは、項目別処理部12Aが獲得すべき情報が過去の日時である訪問日時であるため、「過去の日時」という情報獲得の条件である。
 日時型汎用処理部20Aは、対話知識21Aに基づいて、入力テキストから日時を表していると推定される部分を候補として抽出し、抽出した各候補が日時を表している確からしさを示すスコアを候補ごとに算出し、スコアが最も高い候補をスコアとともに出力する。対話知識21Aは、日時型汎用処理部20Aの動作フローやスコア算出のルール、日時を表す文字列のリスト、日時を表す文字列を所定形式の数値の列に変換するルールなどを含む。例えば、入力テキストに「今日の15時」という文字列が含まれている場合、日時型汎用処理部20Aは対話知識21Aに基づき、「今日の15時」という文字列を「2017/06/26 15:00」といった所定形式の数値の列に変換する。また、対話知識21Aは、入力テキストに日時を表す文字列が項目名22Aとともに含まれている場合は、その文字列(候補)のスコアを最大にするといったルールが含まれていてもよい。
 また、スコアの算出は、予め定めたスコア算出ルールに従って行うことができる。例えば、入力テキストに項目名22Aの一部が含まれている場合にベーススコアとして0.7を与え、更に動作パラメータ23Aに該当する場合、項目名22Aの全てが含まれる場合にそれぞれ、ベーススコアに0.1を加算するといった算出ルールに従ってスコアを算出する。例えば「今日の15時にxxにyyを紹介しました。」が入力されると、「今日の15時」が項目名22Aの一部の日時に該当するのでベーススコアとして0.7が与えられる。また、「紹介しました」という過去についての入力のため、「今日の15時」は過去の日時を指し、動作パラメータ23Aに該当するため0.1が加算され、スコアは0.8となる。一方、「訪問日時は今日の15時で・・・」や「今日の15時にxxを訪問しました。」など、入力テキストに項目名22Aの全てが含まれている場合はさらに0.1が加算されるため、スコアは0.9となる。
 なお、入力テキストに項目名22Aが含まれておらず、動作パラメータ23Aにも該当しない場合は、スコアをゼロとするのではなく、入力テキストの文字列から項目名22A、動作パラメータ23Aに設定された情報との類似度などからスコアを算出する。その場合、ベーススコアより低いスコアを設定することが望ましい。
 日時型汎用処理部20Aは、項目名22Aと動作パラメータ23Aとが与えられることにより、「訪問日時」の情報を獲得するための項目別処理部12Aとしてカスタマイズされる。項目別処理部12Aは、動作パラメータ23Aとして与えられた「過去の日時」を情報獲得の条件として、入力テキストから「訪問日時」の候補を抽出し、その候補が「訪問日時」である確からしさを表すスコアを算出し、スコアが最も高い候補をスコアとともに対話制御部11に送る。
 図5は、項目名が「訪問先」の項目に対応する項目別処理部12Bの詳細を説明する図である。項目別処理部12Bは、図5に示すように、選択肢型汎用処理部20Bに対して、項目名22Bと動作パラメータ23Bとが与えられることにより構築される。選択肢型汎用処理部20Bは、選択肢型の情報に対応する汎用処理部である。項目名22Bは「訪問先」であり、動作パラメータ23Bは、項目別処理部12Bが獲得すべき情報がいくつかの選択肢の中から選ばれる社名等であるため、例えば「東京商事、海山建設、山田工業・・・」といった選択肢である。
 選択肢型汎用処理部20Bは、対話知識21Bに基づいて、入力テキストから動作パラメータ23Bとして与えられる選択肢のいずれかに一致すると推定される部分を候補として抽出し、抽出した各候補がその選択肢を表している確からしさを示すスコアを候補ごとに算出し、スコアが最も高い候補をスコアとともに出力する。対話知識21Bは、選択肢型汎用処理部20Bの動作フローやスコア算出のルールなどを含む。また、対話知識21Bは、入力テキストに動作パラメータ23Bとして与えられた選択肢のいずれかに一致すると推定される文字列が項目名22Bとともに含まれている場合は、その文字列(候補)のスコアを最大にするといったルールが含まれていてもよい。
 また、選択肢型汎用処理部20Bは、入力テキストが読みの情報を含む場合(例えば、ユーザ50から入力された音声に対する音声認識処理によって得られる読みの情報が入力テキストに付加される場合)、動作パラメータ23Bとして与えられる選択肢に読みの情報を付加しておき、入力テキストに含まれる読みの情報と選択肢の読みの情報とのマッチングにより、入力テキストから候補を抽出するようにしてもよい。
 また、スコアの算出は、予め定めたスコア算出ルールに従って行うことができる。例えば日時型の場合と同様に、入力テキストが項目名22Bや動作パラメータ23Bを含むか否かに応じて算出することができる。例えば、動作パラメータ23Bを含む場合にベーススコア(0.7)を与え、項目名22Bも含む場合はスコアを加算する算出ルールとする。また、上述の読みの情報を用いたマッチングの結果をスコアに反映させることも可能であり、その場合、読みの情報の類似度に応じてスコアをプラスするようにするとよい。例えば、ユーザ50が「訪問先は海山商事」や「海山商事を訪問しました」と発話し、認識結果も全て正しい場合は項目名の「訪問先」、項目名の一部である「訪問」が含まれているためスコアを加算(+0.1)する。更に、動作パラメータ23Bに設定されている選択肢である「海山商事」を含むため、更にスコアを加算(+0.2)する。動作パラメータ23Bとの関係におけるスコア評価は、例えば、選択肢との対象文字列の一致、読みの情報の類似度、項目名との距離などに基づき評価することができる。評価(スコアのプラス値)は適宜設定可能である。
 選択肢型の場合も、日時型の場合と同様、入力テキストが項目名22B、動作パラメータ23Bに該当しない場合は、スコアをゼロとするのではなく、例えば、入力テキストの読みの情報の一部のみが項目名22Bや動作パラメータ23Bに設定された情報と類似する場合など、一部の情報に基づき、項目名22B、動作パラメータ23Bに設定された情報との関係からスコアを算出できるようにする。その場合、ベーススコアより低いスコアを設定することが望ましい。後述する自由記述型汎用処理部20Dにおいても同様の考え方により、入力テキストが項目名、動作パラメータに該当しない場合におけるスコアを算出することが可能である。
 選択肢型汎用処理部20Bは、項目名22Bと動作パラメータ23Bとが与えられることにより、「訪問先」の情報を獲得するための項目別処理部12Bとしてカスタマイズされる。項目別処理部12Bは、入力テキストから、動作パラメータ23Bとして与えられた選択肢のいずれかに一致すると推定される文字列を「訪問先」の候補として抽出し、その候補が「訪問先」である確からしさを表すスコアを算出し、スコアが最も高い候補をスコアとともに対話制御部11に送る。
 図6は、項目名が「次回予定日」の項目に対応する項目別処理部12Cの詳細を説明する図である。項目別処理部12Cは、図6に示すように、日時型汎用処理部20Aに対して、項目名22Cと動作パラメータ23Cとが与えられることにより構築される。項目名22Cは「次回予定日」であり、動作パラメータ23Cは、項目別処理部12Cが獲得すべき情報が将来の日時である次回予定日であるため、「将来の日時」という情報獲得の条件である。
 項目別処理部12Cに用いる日時型汎用処理部20Aは、上述の項目別処理部12Aに用いた日時型汎用処理部20Aと共通であり、入力テキストから日時を表していると推定される部分を候補として抽出し、抽出した各候補が日時を表している確からしさを示すスコアを候補ごとに算出し、スコアが最も高い候補をスコアとともに出力する。この日時型汎用処理部20Aは、項目名22Cと動作パラメータ23Cとが与えられることにより、「次回訪問日」の情報を獲得するための項目別処理部12Cとしてカスタマイズされる。項目別処理部12Cは、動作パラメータ23Cとして与えられた「将来の日時」を情報獲得の条件として、入力テキストから「次回予定日」の候補を抽出し、その候補が「次回予定日」である確からしさを表すスコアを算出し、スコアが最も高い候補をスコアとともに対話制御部11に送る。
 図7は、項目名が「特記事項」の項目に対応する項目別処理部12Dの詳細を説明する図である。項目別処理部12Dは、図7に示すように、自由記述型汎用処理部20Dに対して、項目名22Dと動作パラメータ23Dとが与えられることにより構築される。自由記述型汎用処理部20Dは、自由記述型の情報に対応する汎用処理部である。項目名22Dは「特記事項」であり、動作パラメータ23Dは、「商談記録」に関する専門用語などを定義したユーザ辞書や、「特記事項」に対応するスロット17Dに入力する情報の文字数制限などである。
 自由記述型汎用処理部20Dは、対話知識21Dに基づいて、入力テキストから項目名に対応するスロット17に入力する情報の候補を抽出し、抽出した候補が項目名に対応するスロット17に入力する情報である確からしさを示すスコアを算出し、候補をスコアとともに出力する。対話知識21Dは、自由記述型汎用処理部20Dの動作フローやスコア算出のルール、入力テキストに項目名が含まれていればその項目名の後に続く文字列を候補として抽出してスコアを最大化するといったルールなどを含む。
 また、スコアの算出は、予め定めたスコア算出ルールに従って行うことができる。例えば、項目名22Dを含むか否かに応じてスコアを算出することができる。また、項目名22Dを含む場合にベーススコアを与え、入力テキスト中の項目名の出現位置によりスコアを加算するといった算出ルールに従って算出することができる。例えば入力テキストが「xxxxxx、特記事項はyyy」の場合、途中に「特記事項」とあるので「特記事項」以下の「yyy」の部分を自由記述内容として抽出して、ベーススコア(0.6)を与える。また、入力テキストが「特記事項はyyy」のように、先頭に項目名がある場合はスコアを加算(+0.2)する。さらに自由記述型の場合も日時型や選択肢型と同様に、読みの情報をスコアに反映させることも可能であり、表記は一致していなくても読みの情報が類似していれば項目名22Dを含むものとして、ベーススコアを与えるようにしてもよい。
 自由記述型汎用処理部20Dは、項目名22Dと動作パラメータ23Dとが与えられることにより、「特記事項」の情報を獲得するための項目別処理部12Dとしてカスタマイズされる。項目別処理部12Dは、入力テキストから、動作パラメータ23Dとして与えられたユーザ辞書を用いて文字数制限を超えない文字列を候補として抽出し、その候補が「特記事項」である確からしさを表すスコアを算出して、候補をスコアとともに対話制御部11に送る。
 以上のように、本実施形態の対話処理装置10が備える複数の項目別処理部12は、それぞれ、自身が獲得すべき情報の型に対応する汎用処理部に対して、項目名および動作パラメータが与えられることで構築される。汎用処理部は、情報の型に応じて事前に用意されたものを利用する。したがって、本実施形態の対話処理装置10を構築する際には、目的に応じた所定の動作を実行するために必要な項目ごとに、その情報の型に応じた汎用処理部を選択して項目名と動作パラメータを与えて項目別処理部12を構築し、複数の項目別処理部12を取りまとめる対話制御部11を設けるだけで、適切な対話処理が可能な対話処理装置10を構築できる。
 なお、本実施形態では、達成すべき目的が「商談記録」である場合を想定するため、汎用処理部として日時型の情報に対応する日時型汎用処理部20A、選択肢型の情報に対応する選択肢型汎用処理部20Bおよび自由記述型の情報に対応する自由記述型汎用処理部20Dを例示した。しかし、様々な情報の型に応じた汎用処理部を事前に用意しておくことで、様々な目的に応じた項目ごとの情報を獲得する項目別処理部を容易に構築できる。
 例えば、数値型の情報に対応する汎用処理部を事前に用意し、この汎用処理部に対して項目名として「宿泊予約」、動作パラメータとして「単位(人)、有効桁、上限下限」などを与えることで、「宿泊予約」の目的を達成するために必要な「宿泊人数」の情報を獲得する項目別処理部を構築できる。また、住所型の情報に対応する汎用処理部を事前に用意し、この汎用処理部に対して項目名として「目的地」、動作パラメータとして「住所データ、地図データ」などを与えれば、「経路探索」の目的を達成するために必要な「目的地」の情報を獲得する項目別処理部を構築できる。
 また、上述の対話制御部11に対しても項目別処理部12と同様の仕組みを適用し、複数の項目別処理部12を取りまとめる基本ルールを有する汎用対話制御部をカスタマイズすることで、対話制御部11を構築するようにしてもよい。図8は、このように構築される対話制御部11の詳細を説明する図である。この対話制御部11は、図8に示すように、汎用対話制御部30に対して動作パラメータ32が与えられることにより構築される。
 汎用対話制御部30は、対話知識31に基づき、ユーザ50との対話を制御する。対話知識31は、入力テキストを各項目別処理部12に送って候補をスコアとともに受け取り、スコアが第1閾値以上の候補をスロットテーブル16の該当するスロット17に入力するといった動作フロー、ユーザとの対話のルール、ユーザ50への応答に用いる上述のベースとなる汎用の応答テキストなどを含む。この汎用対話制御部30は、動作パラメータ32が与えられることにより、対話処理装置10が達成すべき目的に応じた対話制御部11にカスタマイズされる。動作パラメータ32は、例えば、スロットテーブル16の各スロット17に対応する項目名や、全てのスロット17が埋まった場合に実行する動作などである。
 本実施形態の対話処理装置10では、ユーザ50との対話の履歴が対話履歴蓄積部13に蓄積される。対話履歴蓄積部13に蓄積された対話履歴は、例えば、項目別処理部12の対話知識21A,21B,21D(以下、これらを特に区別しない場合は「対話知識21」と表記する)を更新するために利用することができる。本実施形態の対話処理装置10は、対話履歴を用いて対話知識21を更新する更新部14を備える。
 更新部14は、対話履歴蓄積部13に蓄積された対話履歴に基づいて、複数の項目別処理部12のいずれかに対応する項目の情報として確定すべき情報を確定できなかった事象を検出し、該情報を該項目の情報として確定できるように、該項目に対応する項目別処理部12の対話知識21を更新する。具体的には、例えば対話履歴蓄積部13に蓄積された対話履歴を、対話処理装置10の運用を管理する管理者に対して閲覧可能に提示する。管理者は対話履歴を確認して、入力テキストに含まれるある項目の情報が確定されずにユーザ50に対して問い合わせを行っている場合に、その情報と項目名を対話処理装置10に入力する。更新部14は、この管理者からの入力をもとに上述の事象を検出し、管理者から入力された情報が管理者から入力された項目名の項目別処理部12において適切に獲得されるように、その項目別処理部12の対話知識21を更新する。
 また、更新部14は、対話履歴蓄積部13に蓄積された対話履歴から、対話制御部11がユーザ50に対して出力した、スコアが第1閾値未満で、且つ、第2閾値以上の候補が正しいか否かを問い合わせる応答と、その後の肯定表現を含む入力テキストの組み合わせの対話パターンを上述の事象として検出し、その対話パターンに含まれる候補のスコアが第1閾値以上となるように、その候補を対話制御部11に送った項目別処理部12の対話知識21を更新してもよい。
 本実施形態の対話処理装置10では、対話制御部11が、調整可能な制御パラメータに従ってユーザ50との対話を制御することができる。ここで、ユーザ50との対話を制御する制御パラメータとは、例えば、応答テキストの言葉づかい(親密、丁寧など)や、応答テキストを音声合成して出力する場合の合成音の声質やスピードなどである。こうした制御パラメータをユーザ50の属性(年齢、性別など)に応じて適宜調整することで、ユーザ50にとって満足度の高い対話を実現することができる。本実施形態の対話処理装置10は、対話制御部11がユーザ50との対話を制御する制御パラメータを調整するパラメータ調整部15を備える。
 パラメータ調整部15は、ユーザ50の属性を取得して、取得した属性に応じて上述の制御パラメータを調整する。ユーザ50の属性は、例えば、ユーザ50による明示的な指定(例えば年齢や性別の入力)を受け付けることで取得できる。あるいは、ユーザ50の顔画像をカメラで撮影し、この顔画像を解析してユーザ50の属性を推定するようにしてもよい。また、ユーザ50との対話履歴を解析してユーザ50の大まかな性格(厳格、気さくなど)を推定し、これをユーザ50の属性に含めてもよい。ユーザ50の属性に応じた制御パラメータの値は、例えば、様々な属性のユーザ50を対象として制御パラメータの値を変えながら対話処理を行ったときのユーザ50の満足度などを収集して統計処理することにより、最適な値を決めることができる。
 次に、以上のように構成される本実施形態の対話処理装置10の動作について説明する。図9は、本実施形態の対話処理装置10の動作例を説明する図であり、ユーザ50が「今日の15時に東京商事に行きました」という入力を行った場合の対話処理装置10の動作例を示している。
 対話制御部11は、ユーザ50の入力を受け取り、「今日の15時に東京商事を訪問しました」という入力テキストを複数の項目別処理部12の各々に送る(1)。複数の項目別処理部12のうち、項目名が「訪問日時」の項目に対応する項目別処理部12Aは、対話制御部11から受け取った「今日の15時に東京商事を訪問しました」という入力テキストから「今日の15時」を抽出して「2017/06/26 15:00」に変換する。スコアとしては、入力テキストが項目名22Aの「訪問」を含むとともに、「訪問しました」といった過去の日時を示しており、動作パラメータ23Aとして与えられた過去の日時という条件に合致するため、算出ルールに基づきベーススコア0.7に0.2が加算された0.9という高い値が算出される。このように、「今日の15時に東京商事を訪問しました。」から抽出された「今日の15時」のスコアは0.9となり、この「今日の15時」を変換した候補「2017/06/26 15:00」とともに、スコア0.9を対話制御部11に送る(2A)。なお、ここではスコアの値域が0~1.0であり、第1閾値は0.9、第2閾値は0.7であるものとする。
 また、複数の項目別処理部12のうち、項目名が「訪問先」の項目に対応する項目別処理部12Bは、対話制御部11から受け取った「今日の15時に東京商事に行きました」という入力テキストから「訪問」、「東京商事」を抽出し、スコアを算出する。「訪問」は項目名22Bと一致するためスコアが0.8、「東京商事」は動作パラメータ23Bとして与えられた選択肢に含まれるため、スコアとして0.9という高い値が算出される。この場合、項目別処理部12は「東京商事」を候補としてスコア:0.9とともに対話制御部11に送る(2B)。
 また、複数の項目別処理部12のうち、項目名が「次回予定日」の項目に対応する項目別処理部12Cは、対話制御部11から受け取った「今日の15時に東京商事を訪問しました」という入力テキストから「今日の15時」を抽出して「2017/06/26 15:00」に変換し、これを候補としてスコア:0.45とともに対話制御部11に送る(2C)。「今日の15時」は動作パラメータ23Cとして与えられた将来の日時という条件に合致しないため、スコアは0.45という比較的低い値となっている。
 また、複数の項目別処理部12のうち、項目名が「特記事項」の項目に対応する項目別処理部12Dは、対話制御部11から受け取った「今日の15時に東京商事を訪問しました」という入力テキストをそのまま候補として抽出し、スコア:0.12とともに対話制御部11に送る(2D)。この候補は「特記事項」という項目名の後に続く文字列ではないため、スコアは0.12という低い値となっている。
 複数の項目別処理部12の各々から候補とスコアを受け取った対話制御部11は、スコアが第1閾値以上の候補を、その候補を送った項目別処理部12に対応する項目の情報として確定し、スロットテーブル16の対応する項目のスロット17に入力する(3)。本例では、項目別処理部12Aから送られた「2017/06/26 15:00」のスコアが0.95であり、項目別処理部12Bから送られた「東京商事」のスコアが0.92である。このため対話制御部11は、「2017/06/26 15:00」を「訪問日時」の情報、「東京商事」を「訪問先」の情報として確定し、スロットテーブル16の「訪問日時」に対応するスロット17Aに「2017/06/26 15:00」を入力し、「訪問先」に対応するスロット17Bに「東京商事」を入力する。
 なお、スコアが第1閾値未満で、且つ、第2閾値以上の候補を受け取った場合、対話制御部11は、その候補が正しいか否かを問い合わせる応答をユーザ50に対して出力するが、本例では、このような候補を受け取っていないため、候補が正しいか否かを問い合わせる応答は行わない。
 次に、対話制御部11は、スロットテーブル16の全てのスロット17が埋まったか否かを確認し、情報が未入力のスロット17があれば、そのスロット17に入力する情報を問い合わせる応答をユーザ50に対して出力する(4)。本例では、「次回予定日」に対応するスロット17Cと「特記事項」に対応するスロット17Dが未入力であるため、項目番号が小さいスロット17Cに入力する「次回予定日」の情報を問い合わせる「次回予定日は何ですか?」といった応答を、ユーザ50に対して出力する。
 本実施形態の対話処理装置10は、スロットテーブル16の全てのスロット17が埋まるまで以上の動作を繰り返し、ユーザ50との対話を通じて各項目の情報を獲得してスロットテーブル16の各スロット17に入力していく。そして、全てのスロット17が埋まると、対話制御部11が、スロットテーブル16に基づいて「商談記録」などの目的に応じた動作を実行する。
 図10は、対話制御部11による処理手順の一例を示すフローチャートであり、ユーザ50からの入力を受け取るたびに対話制御部11が実行する処理の流れを示している。
 対話制御部11は、ユーザ50からの入力を受け取ると、まず、その入力に応じた入力テキストを複数の項目別処理部12の各々に送る(ステップS101)。そして、対話制御部11は、各項目別処理部12から候補とスコアを受け取る(ステップS102)。
 次に、対話制御部11は、各項目別処理部12から受け取った候補の中に、スコアが第1閾値以上の候補があるか否かを判定する(ステップS103)。そして、スコアが第1閾値以上の候補があれば(ステップS103:Yes)、その候補をスロットテーブル16の対応するスロット17に入力する(ステップS104)。一方、スコアが第1閾値以上の候補がなければ(ステップS103:No)、ステップS104の処理は行わずに次のステップS105に進む。
 次に、対話制御部11は、各項目別処理部12から受け取った候補の中に、スコアが第1閾値未満で、且つ、第2閾値以上の候補があるか否かを判定する(ステップS105)。そして、スコアが第1閾値未満で、且つ、第2閾値以上の候補があれば(ステップS105:Yes)、対話制御部11は、その候補が正しいか否かを問い合わせる応答をユーザ50に対して出力し(ステップS106)、一連の処理を終了する。
 一方、スコアが第1閾値未満で、且つ、第2閾値以上の候補がなければ(ステップS105:No)、対話制御部11は、スロットテーブル16の全てのスロット17が埋まったか否かを判定する(ステップS107)。そして、情報が入力されていないスロットがあれば(ステップS107:No)、対話制御部11は、その未確定のスロット17に入力する情報を問い合わせる応答をユーザ50に対して出力し(ステップS108)、一連の処理を終了する。一方、スロットテーブル16の全てのスロット17が埋まったら(ステップS107:Yes)、対話制御部11は、スロットテーブル16の各スロット17に入力された情報を用いて目的に応じた所定の動作を実行し(ステップS109)、一連の処理を終了する。
 図11は、項目別処理部12による処理手順の一例を示すフローチャートであり、対話制御部11から入力テキストが送られるたびに項目別処理部12が実行する処理の流れを示している。
 項目別処理部12は、対話制御部11から送られた入力テキストを受け取ると(ステップS201)、その入力テキストから候補の抽出とスコア算出を行う(ステップS202)。次に、項目別処理部12は、ステップS202で抽出した候補と、その候補に対して算出したスコアとともに対話制御部11に送って(ステップS203)、一連の処理を終了する。なお、項目別処理部12は、入力テキストを所定単位の文字列などの部分テキストに分割して処理してもよい。その場合、分割の方法としては、例えば入力テキストを意味解析して意味のまとまりを単位として入力テキストを区切るといった方法を用いることができる。また、分割の方法は獲得すべき情報の型に応じて異なっていてもよく、上述の対話知識21に分割のルールを含めた構成としてもよい。スコアの算出は分割した各部分テキスト対して行い、算出したスコアが最も高い部分テキストを候補とし、その候補をスコアとともに対話制御部11に送るようにするとよい。
 以上、具体的な例を挙げながら詳細に説明したように、本実施形態の対話処理装置10は、情報の型ごとに事前に用意された汎用処理部をカスタマイズすることで構築された複数の項目別処理部12と、これら複数の項目別処理部12を取りまとめる対話制御部11との組み合わせにより、達成すべき目的に応じた対話処理を実現するようにしている。したがって、従来の対話シナリオに基づいて対話処理を行う対話処理装置のように、達成すべき目的に応じた大量の対話シナリオを作り込むといった煩雑な作業を行うことなく適切な対話処理が可能となり、簡便な構成で所定の目的を達成するための対話処理を実現できる。
 また、本実施形態の対話処理装置10は、対話制御部11が入力テキストを複数の項目別処理部12の全てに送り、項目ごとの情報を獲得するための処理は複数の項目別処理部12の各々が独立して行う構成としているので、ユーザ50の1回の入力から複数の項目の情報を同時に獲得することができる。つまり、従来技術ではユーザ50の1回の入力から1つの項目の情報しか獲得できなかったが、本実施形態ではユーザ50の1回の入力から複数の項目の情報を獲得することができ、効率のよい対話を実現することができる。
(第1変形例)
 なお、以上の説明では、項目別処理部12から送られた候補のスコアが第1閾値未満で、且つ、第2閾値以上の場合に、その候補が正しいか否かをユーザ50に問い合わせるための応答テキストを対話制御部11が作成するものとしたが、その候補を送った項目別処理部12が応答テキストを作成してもよい。この場合、項目別処理部12は、入力テキストから抽出した候補のスコアが第1閾値未満で、且つ、第2閾値以上の場合、その候補とスコアを対話制御部11に送る代わりに、その候補が正しいか否かを問い合わせる応答テキストを対話制御部11に送る。対話制御部11は、いずれかの項目別処理部12から応答テキストを受け取った場合、その応答テキスト、あるいは、音声合成処理によりその応答テキストから変換された合成音をユーザ50に対して出力する。
(第2変形例)
 また、以上の説明では、スコアが第1閾値未満で、且つ、第2閾値以上の候補のみを対象として、その候補が正しいか否かをユーザ50に問い合わせるものとしたが、問い合わせの頻度をユーザ50が指定できるようにしてもよい。例えば、対話処理装置10の動作モードとして、「標準モード」と「確実モード」を設け、ユーザ50により「標準モード」が選択された場合は、上述の例と同様にスコアが第1閾値未満で、且つ、第2閾値以上の候補のみを対象として、その候補が正しいか否かをユーザ50に問い合わせるようにし、ユーザ50により「確実モード」が選択された場合は、スコアが第2閾値以上の全ての候補を対象として、その候補が正しいか否かをユーザ50に問い合わせるようにしてもよい。また、対話処理装置10の動作モードとしてさらに「簡易モード」を追加し、ユーザ50により「簡易モード」が選択された場合は、ユーザ50に対する問い合わせを行わずに、スコアが第1閾値未満で、且つ、第2閾値以上の候補を対応する項目の情報として確定するようにしてもよい。また、ユーザ50により「確実モード」が選択された場合は第1閾値の値を下げ、ユーザ50により「簡易モード」が選択された場合は第2閾値の値を上げるといったように、ユーザ50により選択された動作モードに応じてスコアに対する閾値を変化させる構成としてもよい。また、最後に入力された内容がこれでよいかを確認するモードや、選択したモードに関係なく、最終的に確定する内容に対して確認する仕組みを設けてもよい。
(第3変形例)
 また、本実施形態の対話処理装置10は、スロットテーブル16の各スロット17に入力する情報を獲得するための複数の項目別処理部12だけでなく、ユーザ50との対話を円滑に進めるための対話処理部を備えた構成としてもよい。例えば、ユーザ50との対話処理の開始時に挨拶の応答を行う対話処理部を備えていてもよい。このような対話処理部は、項目別処理部12と同様の仕組みで構築することもできる。すなわち、例えば一問一答型の汎用処理部に対して、様々な挨拶のパターンを示す動作パラメータを与えることで、ユーザ50との対話処理の開始時に挨拶の応答を行う対話処理部を構築することができる。
<第2実施形態>
 次に、第2実施形態について説明する。本実施形態は、達成すべき目的が互いに異なる複数の対話処理装置10を組み合わせて、多目的型の対話処理システムを構築した例である。
 図12は、第2実施形態に係る対話処理システム100の概要を示すブロック図である。対話処理システム100は、図12に示すように、複数の対話処理装置10A,10B,10C(以下、これらを特に区別しない場合は「対話処理装置10」と表記する)と、選択部40とを備える。複数の対話処理装置10は、それぞれ上述の第1実施形態の対話処理装置10と同様の構成であるが、達成すべき目的(目的に応じて実行する所定の動作)が互いに異なっている。本実施形態では、対話処理装置10Aは「商談記録」を目的として構築され、対話処理装置10Bは「新規顧客登録」を目的として構築され、対話処理装置10Cは「受注記録」を目的として構築されたものとする。
 選択部40は、ユーザ50の入力に応じた入力テキストに基づいて、ユーザ50が目的とする所定の動作を判断し、複数の対話処理装置10の中からユーザ50との対話を行う対話処理装置10を選択する。例えば、ユーザ50の入力に応じた入力テキストに「商談記録」に特有の文字列が含まれている場合、選択部40は、ユーザ50の目的が「商談記録」であると判断し、ユーザ50との対話を行う対話処理装置10として、「商談記録」に対応する対話処理装置10Aを選択する。また、ユーザ50の入力に応じた入力テキストに「新規顧客登録」に特有の文字列が含まれている場合、選択部40は、ユーザ50の目的が「新規顧客登録」であると判断し、ユーザ50との対話を行う対話処理装置10として、「新規顧客登録」に対応する対話処理装置10Bを選択する。また、ユーザ50の入力に応じた入力テキストに「受注記録」に特有の文字列が含まれている場合、選択部40は、ユーザ50の目的が「受注記録」であると判断し、ユーザ50との対話を行う対話処理装置10として、「受注記録」に対応する対話処理装置10Cを選択する。
 また、選択部40は、入力テキストに基づいてユーザ50が目的とする所定の動作を判断できない場合(例えば、入力テキストに対話処理装置10の目的を表す文字列が含まれていない場合)は、全ての対話処理装置10の対話制御部11を介して各項目別処理部12に入力テキストを送り、各項目別処理部12においてスコアが算出されるようにする。各対話処理装置10の対話制御部11は、項目別処理部12から送られたスコアから最も高いスコアを選択して選択部40に送る。そして、選択部40は、各対話処理装置10の対話制御部11から送られたスコアに基づき、入力テキストを処理する対話処理装置10を選択するようにするとよい。例えば、入力テキストが「15時にxxを訪問しました」である場合、この入力テキストには「商談」、「新規顧客」、「受注」などの文字列は含まれないため、この入力テキストを処理すべき対話処理装置10を判断できない。そのため、各対話処理装置10に対して入力テキストを送って各項目別処理部12でのスコアの算出結果に基づき、例えば「商談記録」を目的とする対話処理装置10から「訪問先:xx」のスコア0.85が送られ、他の対話処理装置10からそれ以上のスコアが送られてこなければ、ユーザ50が目的とする所定の動作は「商談記録」であると推定し、入力テキストを処理する対話処理装置10として「商談記録」を目的とする対話処理装置10を選択する。また、この場合、選択部40からユーザ50に対して、「商談記録の入力でよろしいですか?」「訪問日時がxxx、訪問先がxxでよろしいですか?」といった問い合わせの処理を行うようにしてもよい。
 以上のように、本実施形態の対話処理システム100は、達成すべき目的が互いに異なる複数の対話処理装置10を組み合わせて構築され、各対話処理装置10は上述の第1実施形態と同様の構成であるため、第1実施形態の対話処理装置10と同様に、大量の対話シナリオを作り込むといった煩雑な作業を行うことなく、簡便な構成で多目的の対話処理を適切に実現することができる。
<その他の変形例>
 なお、上述の各実施形態および変形例では、複数の項目別処理部12と対話制御部11との組み合わせにより対話処理装置10が構成され、複数の対話処理装置10と選択部40との組み合わせにより対話処理システム100が構成されるものとして説明したが、対話処理装置10や対話処理システム100の構成としては様々なバリエーションが考えられる。例えば、上述の項目別処理部12、対話処理装置10、対話処理システム100をそれぞれ部品(以下では、項目別処理部12を「小エージェント」、対話処理装置10を「中エージェント」、対話処理システム100を「大エージェント」とする)として捉え、これら小エージェント、中エージェント、大エージェントの様々な組み合わせにより、階層数も含め様々な構成とすることができる。
 また、上述の各実施形態および変形例では、簡単な対話シナリオを例に説明したが、小エージェント、中エージェント、大エージェントの組み合わせにより、膨大な量のシナリオ作成や様々な対話のバリエーションにも対応可能である。例えば、上述の各実施形態および変形例では、中エージェントは複数の小エージェントから構成されるものとして説明しているが、目的を達成するための対話の単位に応じて、中エージェントを複数の小エージェントから構成する場合のみならず、大エージェント、中エージェント、小エージェントそれぞれ単一のエージェントの組み合わせとして実現してもよいし、ユーザ50からの入力を小エージェントのみで処理する構成としてもよい。また、複数の小エージェントを、小エージェント群αとこの小エージェント群αのうちのいずれかにつながる小エージェント群βといったように階層で構成するなど、エージェントを自由に組み合わせて対話目的を達成する構成とすることができる。また、上述の大エージェント、中エージェント、小エージェントの組み合わせのみならず、各エージェントと他の仕組みで生成された既存の対話シナリオとのインタフェースを設けることで、各エージェントと既存の対話シナリオとを組み合わせることも可能である。
 以下に、様々な構成のバリエーションの簡単な具体例を示す。例えば、対話目的があいさつの場合は、ユーザ50からの入力テキスト(こんにちは)に対してエージェントは同じく「こんにちは」を返答することで対話目的が達成されるため、ユーザ50からの入力情報を処理するエージェントして小エージェント(第1階層のみ)で構成することができる。続いて、宿泊予約が対話目的の場合を考える。この場合は、例えば「宿泊プランを聞き出す」という目的の中エージェントを設定することで実現できるが、図9に示すような中エージェント、複数の小エージェントの構成のみで細かな宿泊プラン(例えば値段や条件(禁煙、風呂付など)など)を聞き出すことができない場合もある。このような場合は、例えば図13に示すように、階層構造の小エージェント(項目別処理部12)群α,βを利用することで対応するこができる。小エージェント群αの中の1つがプランを選択させるための小エージェントとし、当該小エージェントから「値段と条件(禁煙、風呂付)のご希望は?」といった応答をすることで、再度、中エージェントを介してユーザ50から選択プランに対する回答が得られ、小エージェント群βの中の小エージェントで選択されたプランを確定情報として処理することで実現できる。このように対話目的に応じて、様々なエージェントの組み合わせにより様々な目的に応じた対話処理を実現することが可能となる。
<補足説明>
 上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100は、例えば、一般的なコンピュータを構成するハードウェアと、コンピュータで実行されるプログラム(ソフトウェア)との協働により実現することができる。例えば、コンピュータが所定のプログラムを実行することによって、上述の対話制御部11、項目別処理部12A~12D、更新部14、パラメータ調整部15などの対話処理装置10を構成する機能的な構成要素や、対話処理装置10A~10Cおよび選択部40などの対話処理システム100を構成する機能的な構成要素を実現することができる。また、コンピュータが備える大容量記憶装置を用いて、上述の対話履歴蓄積部13などを実現することができる。
 図14は、上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100のハードウェア構成例を示すブロック図である。対話処理装置10や対話処理システム100は、例えば図14に示すように、CPU101などのハードウェアプロセッサ(プロセッサ回路)と、RAM102やROM103などの記憶装置と、SSD104などの大容量記憶装置と、ネットワークを介して外部と通信を行う通信I/F105と、周辺機器を接続するための機器I/F106と、を備えた一般的なコンピュータとしてのハードウェア構成を用いて実現できる。
 このとき、上記のプログラムは、例えば、磁気ディスク、光ディスク、半導体メモリ、またはこれに類する記録媒体に記録されて提供される。プログラムを記録する記録媒体は、コンピュータシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。また、上記プログラムを、コンピュータに予めインストールするように構成してもよいし、ネットワークを介して配布される上記のプログラムをコンピュータに適宜インストールするように構成してもよい。
 上記のコンピュータで実行されるプログラムは、上述の対話制御部11、項目別処理部12A~12D、更新部14、パラメータ調整部15などの各部、あるいは、対話処理装置10A~10Cおよび選択部40などの各部を含むモジュール構成となっており、プロセッサがこのプログラムを適宜読み出して実行することにより、上述した各部がRAM102などの主記憶上に生成されるようになっている。
 なお、上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100は、上述した機能的な各部の一部または全部を、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)などの専用のハードウェアにより実現する構成であってもよい。
 また、上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100は、複数台のコンピュータを通信可能に接続したネットワークシステムとして構成し、上述した各部を複数台のコンピュータに分散して実現する構成であってもよい。また、上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100は、クラウドシステム上で動作する仮想マシンであってもよい。
 以上、本発明の実施形態を説明したが、この実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims (9)

  1.  ユーザとの対話を通じて、所定の動作を実行するための1又は複数の項目の情報を獲得する対話処理装置であって、
     前記1又は複数の項目に対応する1又は複数の項目別処理部と、
     前記1又は複数の項目別処理部と連携してユーザとの対話を制御する対話制御部と、を備え、
     前記対話制御部は、ユーザの入力に応じた入力情報を前記1又は複数の項目別処理部の各々に送り、
     前記1又は複数の項目別処理部の各々は、前記対話制御部から受け取った前記入力情報から自身が獲得すべき情報の候補を抽出して、抽出した候補を該候補が獲得すべき情報であることの確からしさの度合いを示す情報とともに前記対話制御部に送り、
     前記対話制御部は、前記1又は複数の項目別処理部の各々から受け取った候補のうち、前記確からしさの度合いが第1基準を満たす候補を、該候補を送った項目別処理部に対応する項目の情報として確定し、情報が未確定の項目があれば、該項目の情報を問い合わせる応答をユーザに対して出力し、
     前記1又は複数の項目別処理部の各々は、獲得すべき情報の型に応じた対話知識に基づいて前記候補の抽出および前記確からしさの度合いを算出する基本ルールを有する汎用処理部に対して、対応する項目の項目名と自身の動作を決定付ける動作パラメータとが与えられることにより構築される
     対話処理装置。
  2.  前記対話制御部は、前記1又は複数の項目別処理部のいずれかから前記確からしさの度合いが前記第1基準を満たさず、且つ、前記第1基準とは異なる第2基準を満たす候補を受け取った場合、該候補が正しいか否かを問い合わせる応答をユーザに対して出力する
     請求項1に記載の対話処理装置。
  3.  前記対話制御部は、前記1又は複数の項目のうち、前記所定の動作を実行するために必要な情報が確定すると、確定した項目の情報に基づいて前記所定の動作を実行する
     請求項1または2に記載の対話処理装置。
  4.  ユーザとの対話の履歴を蓄積する対話履歴蓄積部と、
     前記履歴に基づいて、前記1又は複数の項目別処理部のいずれかに対応する項目の情報として確定すべき情報を確定できなかった事象を検出し、該情報を該項目の情報として確定できるように、該項目に対応する項目別処理部の前記対話知識を更新する更新部と、をさらに備える
     請求項1乃至3のいずれか一項に記載の対話処理装置。
  5.  ユーザとの対話の履歴を蓄積する対話履歴蓄積部をさらに備え、
     前記対話制御部は、前記履歴に基づいて、前記1又は複数の項目のうちのいずれかの項目の情報として確定すべき情報が前記入力情報に含まれると判断した場合、該項目に対応する項目別処理部に該入力情報を送らずに、該入力情報から抽出した情報を該項目の情報として確定する
     請求項1に記載の対話処理装置。
  6.  ユーザとの対話の履歴を蓄積する対話履歴蓄積部をさらに備え、
     前記対話制御部は、前記履歴に基づいて、前記1又は複数の項目のうちのいずれかの項目の情報として確定すべき情報が前記入力情報に含まれると判断した場合、該項目に対応する項目別処理部から受け取った候補の前記確からしさの度合いが前記第1基準を満たさず、且つ、前記第2基準を満たす場合であっても、該候補が正しいか否かを問い合わせる応答をユーザに対して出力せずに、該候補を該項目の情報として確定する
     請求項2に記載の対話処理装置。
  7.  ユーザの属性を取得して、取得した属性に応じて前記対話制御部がユーザとの対話を制御する制御パラメータを調整するパラメータ調整部をさらに備える
     請求項1乃至6のいずれか一項に記載の対話処理装置。
  8.  請求項1乃至7のいずれか一項に記載の対話処理装置であって、前記所定の動作が互いに異なる複数の前記対話処理装置と、
     前記入力情報に基づいてユーザが目的とする前記所定の動作を判断し、該所定の動作に対応する前記対話処理装置を選択する選択部と、
     を備える対話処理システム。
  9.  ユーザとの対話を通じて、所定の動作を実行するための1又は複数の項目の情報を獲得する対話処理装置であって、
     前記1又は複数の項目に対応する1又は複数の項目別処理部と、
     前記1又は複数の項目別処理部と連携してユーザとの対話を制御する対話制御部と、を備え、
     前記対話制御部は、ユーザの入力に応じた入力情報を前記1又は複数の項目別処理部の各々に送り、
     前記1又は複数の項目別処理部の各々は、前記対話制御部から受け取った前記入力情報から自身が獲得すべき情報の候補を抽出して、抽出した候補を該候補が獲得すべき情報であることを示す情報とともに前記対話制御部に送り、
     前記対話制御部は、前記1又は複数の項目別処理部の各々から受け取った候補のうち、前記獲得すべき情報であることを示す情報が第1基準を満たす候補を、該候補を送った項目別処理部に対応する項目の情報として確定し、情報が未確定の項目があれば、該項目の情報を問い合わせる応答をユーザに対して出力し、
     前記1又は複数の項目別処理部の各々は、獲得すべき情報の型に応じた対話知識に基づいて前記候補の抽出および前記獲得すべき情報であることを示す情報を導出するためのルールを有し、対応する項目の項目名と自身の動作を決定付ける情報とが与えられることにより構築される
     対話処理装置。
PCT/JP2018/035497 2017-09-28 2018-09-25 対話処理装置および対話処理システム WO2019065647A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201880058572.1A CN111095237B (zh) 2017-09-28 2018-09-25 对话处理装置及对话处理系统
US16/811,197 US10896074B2 (en) 2017-09-28 2020-03-06 Interactive processing device and interactive processing system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-187858 2017-09-28
JP2017187858A JP7000096B2 (ja) 2017-09-28 2017-09-28 対話処理装置および対話処理システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/811,197 Continuation US10896074B2 (en) 2017-09-28 2020-03-06 Interactive processing device and interactive processing system

Publications (1)

Publication Number Publication Date
WO2019065647A1 true WO2019065647A1 (ja) 2019-04-04

Family

ID=65901392

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/035497 WO2019065647A1 (ja) 2017-09-28 2018-09-25 対話処理装置および対話処理システム

Country Status (4)

Country Link
US (1) US10896074B2 (ja)
JP (1) JP7000096B2 (ja)
CN (1) CN111095237B (ja)
WO (1) WO2019065647A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443355A (zh) * 2019-08-06 2019-11-12 苏州思必驰信息科技有限公司 应用于复合对话任务的对话方法及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023007536A1 (ja) * 2021-07-26 2023-02-02 三菱電機ビルソリューションズ株式会社 問合せ受付装置、問合せ受付システム、および問合せ受付方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004045900A (ja) * 2002-07-12 2004-02-12 Toyota Central Res & Dev Lab Inc 音声対話装置及びプログラム
WO2007088877A1 (ja) * 2006-01-31 2007-08-09 Honda Motor Co., Ltd. 会話システムおよび会話ソフトウェア
JP2008506156A (ja) * 2004-07-06 2008-02-28 ボクシィファイ, インコーポレイテッド マルチスロット対話システムおよび方法
JP2013542484A (ja) * 2010-08-30 2013-11-21 本田技研工業株式会社 対話システムにおける思考追跡および行動選択
US20140136212A1 (en) * 2012-11-14 2014-05-15 Electronics And Telecommunications Research Institute Spoken dialog system based on dual dialog management using hierarchical dialog task library

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264198A (ja) 2006-03-28 2007-10-11 Toshiba Corp 対話装置、対話方法、対話システム、コンピュータプログラム及び対話シナリオ生成装置
JP6604542B2 (ja) * 2015-04-02 2019-11-13 パナソニックIpマネジメント株式会社 対話方法、対話プログラム及び対話システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004045900A (ja) * 2002-07-12 2004-02-12 Toyota Central Res & Dev Lab Inc 音声対話装置及びプログラム
JP2008506156A (ja) * 2004-07-06 2008-02-28 ボクシィファイ, インコーポレイテッド マルチスロット対話システムおよび方法
WO2007088877A1 (ja) * 2006-01-31 2007-08-09 Honda Motor Co., Ltd. 会話システムおよび会話ソフトウェア
JP2013542484A (ja) * 2010-08-30 2013-11-21 本田技研工業株式会社 対話システムにおける思考追跡および行動選択
US20140136212A1 (en) * 2012-11-14 2014-05-15 Electronics And Telecommunications Research Institute Spoken dialog system based on dual dialog management using hierarchical dialog task library

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NAGAMORI, MAKOTO ET AL: "A Framework for Multi-Domain Conversational Systems", IPSJ SIG TECHNICAL REPORT, vol. 2000, no. 53, 2 June 2000 (2000-06-02), pages 83 - 89 *
UENO, SHINICHI ET AL: "Planning using User and Situation Models in Spoken Dialogue System", DOCUMENT OF 40TH SPECIAL INTEREST GROUP ON SPOKEN LANGUAGE UNDERSTANDING AND DIALOGUE PROCESSING, 5 March 2004 (2004-03-05), pages 65 - 72, XP003013144 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443355A (zh) * 2019-08-06 2019-11-12 苏州思必驰信息科技有限公司 应用于复合对话任务的对话方法及系统
CN110443355B (zh) * 2019-08-06 2021-11-16 思必驰科技股份有限公司 应用于复合对话任务的对话方法及系统

Also Published As

Publication number Publication date
JP7000096B2 (ja) 2022-01-19
CN111095237B (zh) 2023-10-13
US20200210253A1 (en) 2020-07-02
JP2019061620A (ja) 2019-04-18
US10896074B2 (en) 2021-01-19
CN111095237A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
JP6719082B2 (ja) 決定木生成装置、決定木生成方法、決定木生成プログラム及び質問システム
CN101567189B (zh) 声音识别结果修正装置、方法以及系统
US6631346B1 (en) Method and apparatus for natural language parsing using multiple passes and tags
JP6448765B2 (ja) 対話装置、方法及びプログラム
US20190139537A1 (en) Dialogue system and dialogue method
US20160188574A1 (en) Intention estimation equipment and intention estimation system
US20180090132A1 (en) Voice dialogue system and voice dialogue method
WO2013080406A1 (ja) 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
CN105895103A (zh) 一种语音识别方法及装置
JP7279098B2 (ja) 対話システム、対話方法及び対話プログラム
JP2012198277A (ja) 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
JP6762819B2 (ja) 入力支援装置およびプログラム
WO2019159986A1 (ja) 情報提供装置、情報提供方法、およびプログラム
JP2020077159A (ja) 対話システム、対話装置、対話方法、及びプログラム
WO2015119267A1 (en) Uttered sentence collection apparatus and method
JP2019040166A (ja) 音声合成辞書配信装置、音声合成配信システムおよびプログラム
WO2019065647A1 (ja) 対話処理装置および対話処理システム
JP2007102104A (ja) 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
CN114974221A (zh) 语音识别模型训练方法及装置、计算机可读存储介质
JP2015219582A (ja) 対話方法、対話装置、対話プログラム及び記録媒体
JP6391925B2 (ja) 音声対話装置、方法およびプログラム
CN114528812A (zh) 一种语音识别方法、系统、计算设备及存储介质
CN110634480A (zh) 语音对话系统与模型创建装置及其方法
JP2003157095A (ja) 音声認識装置及びその方法、プログラム
JP2004333641A (ja) 音声入力処理方法、音声対話用表示制御方法、音声入力処理装置、音声対話用表示制御装置、音声入力処理プログラム、音声対話用表示制御プログラム

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18862476

Country of ref document: EP

Kind code of ref document: A1