WO2020054451A1 - 対話装置 - Google Patents

対話装置 Download PDF

Info

Publication number
WO2020054451A1
WO2020054451A1 PCT/JP2019/033970 JP2019033970W WO2020054451A1 WO 2020054451 A1 WO2020054451 A1 WO 2020054451A1 JP 2019033970 W JP2019033970 W JP 2019033970W WO 2020054451 A1 WO2020054451 A1 WO 2020054451A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
word
response
registered
related information
Prior art date
Application number
PCT/JP2019/033970
Other languages
English (en)
French (fr)
Inventor
美祐 佐藤
可奈子 大西
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to US17/271,476 priority Critical patent/US20210312919A1/en
Priority to JP2020546851A priority patent/JP7166350B2/ja
Publication of WO2020054451A1 publication Critical patent/WO2020054451A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Definitions

  • the present invention relates to a dialogue device for interacting with a user.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2017-222402 describes an utterance candidate generation device capable of giving an appropriate response in response to a user utterance in an interactive system.
  • This utterance candidate generation device describes that a utterance candidate is generated based on a search result of an utterance database using a word extracted by morphological analysis of a user utterance and a dialogue action as a search query.
  • Patent Literature 1 is information obtained by crawling a predetermined site such as SNS (Social Network System), the quality of the utterance content may be poor.
  • the administrator can generate the utterance content in order to improve the utterance content, but it costs a great deal.
  • an object of the present invention is to provide an utterance device that can improve the quality of utterance content at low cost.
  • a storage unit that structurally stores a plurality of registered words using related information indicating mutual relevance, an analysis unit that analyzes a user's utterance content, and extracts a main word from the utterance content
  • An extraction unit a search unit that searches the storage unit using the main word as a key, and acquires a corresponding registered word and related information as a response word and response related information, and a search unit that obtains the response word and response related information.
  • a response unit that generates and outputs a response content using the response unit.
  • a response content for dialogue with a user is generated by using a storage unit that structurally stores a plurality of registered words using related information indicating mutual relevance. Therefore, the quality of the conversation contents can be improved at low cost.
  • the quality of conversation contents can be improved at low cost.
  • FIG. 1 is a block diagram illustrating a functional configuration of a dialog device according to an embodiment of the present disclosure. It is the schematic diagram which showed the graph database typically.
  • FIG. 3 is a schematic diagram showing edge information including time information and node information.
  • FIG. 4 is a diagram showing a specific example of a template database 106.
  • 6 is a flowchart illustrating a processing operation of the interactive device.
  • FIG. 5 is a schematic diagram of a graph database 105 including similarities in edge information. It is a schematic diagram which shows the processing concept for selecting common node information.
  • FIG. 2 is a diagram illustrating an example of a hardware configuration of a dialog device 100 according to an embodiment of the present disclosure.
  • FIG. 1 is a block diagram illustrating a functional configuration of a dialog device 100 according to an embodiment of the present disclosure.
  • the interaction device 100 receives the utterance information from the user terminal 200 and transmits the interaction information corresponding to the interaction information, so that the user of the user terminal 200 can enjoy the interaction.
  • the dialogue device 100 includes a dialogue unit 101 (response unit), an extraction unit 102 (analysis unit, extraction unit), a search unit 103 (search unit), a dialogue information generation unit 104 (response unit), It is configured to include a graph database 105 (storage unit) and a template database 106.
  • the dialogue unit 101 is a unit that receives the text information that is the utterance information transmitted from the user terminal 200, and transmits the text information that is the dialogue information to the user terminal 200.
  • the dialogue unit 101 transmits and receives data to and from the user terminal 200 via a network.
  • the present invention is not limited to this. In this case, a dialogue by voice or a dialogue by input / output of text information is performed.
  • the extraction unit 102 is a part that analyzes text information transmitted from the user terminal 200 and extracts focus information (topic information) that is a topic of speech information.
  • the focus information is information extracted based on a feature vector (semantic vector) of a word obtained by morphological analysis of text information and characters before and after the word, and is expressed as a word or a text.
  • This focus information extraction processing is a known technique.
  • the focus information is referred to as topic information.
  • the search unit 103 is a unit that searches the graph database 105 using topic information as a key, and acquires edge information and node information derived from the topic information.
  • the search unit 103 selects and acquires one piece of edge information and one piece of node information according to a predetermined condition from the plurality of pieces of searched edge information and node information. For example, the search unit 103 randomly selects one piece of edge information and one piece of node information corresponding to the one piece of edge information.
  • the search unit 103 changes the topic information after generating the first sentence of the dialog information to generate a plurality of sentences according to the setting of the dialog device 100, and repeats the search processing of other node information and the like. You may decide to do it.
  • the search unit 103 searches the graph database 105 using the node information used for creating the first sentence of conversation information as topic information, and acquires edge information and node information derived from the topic information.
  • the interaction information generation unit 104 is a unit that generates interaction information based on the acquired edge information and node information. Specifically, it is as follows.
  • the dialog information generation unit 104 refers to the template database 106 and acquires a template corresponding to the acquired edge information. For example, if the edge information indicates “affiliated team”, a template for inserting the assigned team name indicated by the node information associated with the edge information is acquired.
  • a template is prepared for each edge information. In some cases, a past version (past-form template) and a current version (current-form template) are prepared.
  • a template is a fixed form sentence, and is data that constitutes a sentence by pasting node information and topic information corresponding to edge information.
  • the dialogue information generation unit 104 determines whether or not the state indicated by the node information associated with the edge information or the relationship with the focus information is currently continuing based on the time information attached to the edge information. Then, the dialog information generation unit 104 acquires a past version or a current version of the template, depending on whether or not the template is currently being continued.
  • the graph database 105 including the edge information attached to the time information will be described later.
  • the dialog information generation unit 104 generates the dialog information by inserting the node information and the topic information based on the edge information into the designated position of the acquired template.
  • the dialog information generation unit 104 determines that the topic information needs a supplementary sentence. Then, supplementary sentence generation processing may be performed. The supplementary sentence generation processing will be described later.
  • the dialogue information generation unit 104 generates dialogue information using the edge information and the node information. By repeating this process a specified number of times, conversation information of a plurality of sentences is generated. In addition, a connective for connecting the pieces of dialog information may be appropriately inserted.
  • the graph database 105 is a database that stores node information and edge information for generating conversation information in a structurally related manner.
  • FIG. 2 is a diagram schematically showing a specific example of the graph database 105.
  • the graph database 105 describes a plurality of registered words structurally using related information indicating mutual relevance, and describes information indicating the relationship between words. As shown in FIG. 2, a word is treated as node information, and the relationship between the node information is indicated by edge information. For example, another node information: Yokohama is derived from the node information: Shunsuke Nakamura using the edge information: hometown. This indicates that the node information: Yokohama is associated with the hometown of Shunsuke Nakamura.
  • node information Shunsuke Nakamura and node information: Yokohama are associated by edge information: hometown.
  • the derivation direction of the node information is represented by an arrow in FIG.
  • the derivation destination node information is information for explaining the derivation source node information, and for that purpose, the derivation direction is defined.
  • Node information From Yokohama, another node information may be used to associate with other node information.
  • the graph database 105 can structure the knowledge data using the node information by repeatedly associating the node information with other node information using the edge information.
  • the graph database 105 may be manually generated by a database operator, but is generated from an information site or a dictionary site on the Internet according to a known graph database generation algorithm.
  • FIG. 3 is a schematic diagram showing edge information including time information and node information.
  • the edge information: the belonging team includes a start time and an end time. This indicates the period during which the node information: Shunsuke Nakamura belonged to the node information: Yokohama F Marinos, and the edge information: the team to which he belonged.
  • the end time is not indicated, it can be determined that it is currently ongoing. If the start time and the end time are not included, it can be regarded as edge information having no present and past concepts. In that case, it will be treated as if it is currently ongoing. For example, when a hometown is considered as the edge information, the edge information: hometown is not information having a temporal end.
  • Such edge information need not include the start time and end time. Alternatively, only the star time may be included in the edge information. It is not necessary to limit to the start time or the like as information for indicating whether or not the continuation is currently being performed, and information that is “currently being continued” may be simply included in the edge information.
  • FIG. 4 is a diagram showing a specific example of the template database 106. As shown in FIG. 4, templates are described for the present form and the past form. Further, a blank is formed for inserting node information of topic information and node information to which the topic information is derived. Further, the template database 106 stores a template corresponding to the edge information. FIG. 4 shows edge information: a template of the team to which the user belongs. This template is configured such that node information and edge information corresponding to topic information: node information derived from the team to which the team belongs are inserted in the blanks.
  • FIG. 5 is a flowchart showing the operation of the interactive device 100.
  • the extraction unit 102 analyzes the utterance information (S101).
  • the extraction unit 102 extracts topic information from the utterance information of the user (S102).
  • the search unit 103 selects and acquires one piece of edge information and one piece of node information according to a predetermined rule (for example, randomly selected) (S105). A plurality of pieces of edge information and a plurality of pieces of node information may be selected by setting in advance.
  • the search unit 103 may acquire node information and edge information common to the conversation information generated before that. Details of the processing will be described later.
  • the dialog information generation unit 104 acquires a template corresponding to the edge information (S106).
  • the conversation information generation unit 104 generates conversation information by inserting the topic information and the acquired node information into the template (S107).
  • the dialog information generation unit 104 combines the dialog information generated in S107 with the dialog information generated earlier (S109).
  • the conversation information generation unit 104 changes the topic information in order to generate the next conversation information. For example, the dialog information generation unit 104 changes the new topic information to the node information acquired in S105 (S110). Then, the dialog information generation unit 104 increments i by one (S111), and generates dialog information until the number reaches a predetermined number.
  • the dialogue unit 101 When the number reaches a predetermined number (S104: NO), the dialogue unit 101 outputs the dialogue information generated by the dialogue information generation unit 104 to the user terminal 200 (S112).
  • step S105 in the interactive device 100 according to an embodiment of the present disclosure.
  • the search unit 103 searched for one piece of edge information and one piece of node information selected at random, but is not limited to this. .
  • the search unit 103 may select, from a plurality of pieces of edge information derived from topic information, node information having the highest similarity between node information or node information having a similarity equal to or more than a predetermined value.
  • FIG. 6 is a schematic diagram of the graph database 105 including the similarity in the edge information. As shown in the figure, in the graph database 105, node information is connected using edge information, but the similarity between the node information is included in the edge information. Since the node information is a word, the degree of similarity between words is included in the edge information. This similarity is calculated by a known natural language analysis algorithm such as word2vec when constructing the graph database 105, and is added to the edge information.
  • word2vec when constructing the graph database 105
  • the similarity between the node information: Shunsuke Nakamura and the node information: Yokohama F Marinos is 0.53.
  • the similarity between the node information: Shunsuke Nakamura and the node information: Yokohama is 0.20
  • the similarity between the node information: Shunsuke Nakamura and the node information: Celtic FC is 0.52.
  • the search unit 103 selects edge information: team to belong to, node information: Yokohama F Marinos.
  • the search unit 103 may select one piece of edge information and one piece of node information according to the category of topic information.
  • topic information: Shunsuke Nakamura is derived and structured as node information: person as edge information: category. This indicates that the category of the topic information: Shunsuke Nakamura is “person”.
  • the search unit 103 when the topic information is structured by being derived from the node information: person as the edge information: category, the search unit 103 outputs the “hometown” among the plurality of searched edge information and node information. Node information derived from predetermined edge information such as “birthday” may be selected.
  • the above is an example, and the edge information: category is not limited to node information: person.
  • the search unit 103 may select the predetermined node information.
  • the search unit 103 may acquire node information and edge information common to the topic information extracted from the utterance information uttered first by the user.
  • description will be made with reference to FIG.
  • FIG. 7 is a schematic diagram showing a processing concept for selecting common node information.
  • the retrieval unit 103 acquires the edge information: hometown and the node information: Yokohama-shi using the node information: Shunsuke Nakamura as the topic information as a key, and the dialog information generation unit 104 It generates eye dialog information "Shunsuke Nakamura is from Yokohama".
  • the search unit 103 searches for other node information using the node information: Yokohama as a key so that the dialog information generation unit 104 generates the dialog information of the second sentence. Specifically, first, the search unit 103 searches for a plurality of other node information derived from the node information. In this example, the node information derived in the reverse direction is searched by the edge information. Then, from among them, other node information associated with the common node information common to the node information that was the topic information: Shunsuke Nakamura is selected. In the example of FIG. 7, the common node information: node information associated with the Japanese national soccer team: Masayuki Okano and the edge information: hometown are selected as other node information and other edge information.
  • the dialogue information generation unit 104 selects a template from the template database using the other node information: Masayuki Okano, other edge information: hometown, common node information: Japan representative of soccer, and the edge information: team belonging thereto.
  • a template for using the common node information is prepared.
  • the first edge information for example, hometown
  • the time information thereof and the second edge information (for example, belonging team)
  • a template corresponding to the time information is prepared.
  • the conversation information generation unit 104 can generate conversation information by inserting topic information, common node information, other node information, and node information, respectively.
  • the dialogue information generation unit 104 extracts a template “[other node information] is the same as“ common node information ”as [topic information node information]” and extracts the dialogue information. You may make it generate
  • the node information when there is no node information having common node information, the node information may be selected using the similarity between words. When node information is selected using the similarity between words, if there is no node information whose similarity has reached a predetermined value or more, the node information may be selected at random. If there is no node information whose inter-word similarity has reached a predetermined value or more, search / selection of node information having a common node may be performed.
  • FIG. 8 is a schematic diagram showing a part of the graph database 105.
  • Node information Shinji Kagawa
  • node information Bill Kauritz
  • edge information Fan.
  • Bill Kaulitz is a little-known person in Japan, and is included in the graph database 105 as a little-known person.
  • FIG. 9 is a flowchart showing the operation of the interactive device 100 capable of generating a supplementary sentence.
  • Steps S101 to S109 are the same as the processing shown in FIG.
  • the search unit 103 determines whether the node information extracted based on the topic information is maniac information (S109a).
  • the search unit 103 determines whether or not the node information is maniac information in the graph database 105 based on the number of edge information directed to the node information.
  • the number of edge information directed to the node information is small, for example, 30 or less, it can be determined that the node information is not referred to by another node information. That is, the node information can be determined to be generally unknown information.
  • the search unit 103 does not judge the node information extracted from the uttered content of the user, even if the node information can be judged to be maniac information.
  • the interactive device 100 includes a history information storage unit that stores, as history information, node information obtained from the utterance information of the user, which is extracted by the extraction unit 102.
  • the search unit 103 searches for the node information stored as the history information. Does not judge that the information is maniac even if the above conditions are satisfied.
  • the search unit 103 determines that the node information is maniac information
  • the search unit 103 searches for supplementary node information and edge information for supplementing the node information. For example, based on the category of the node information, the search unit 103 selects one or a plurality of pieces of edge information using a property list table in order to specify supplementary node information for capturing the node information.
  • the search unit 103 specifies node information based on the selected edge information: occupation / nationality. This node information becomes supplementary node information for supplementing the node information extracted based on the topic information.
  • FIG. 10 shows a specific example of the property list table.
  • This property list table (not shown) is provided in the interactive device 100.
  • the property table describes a category, a property list, and a template in association with each other.
  • the category is information indicated by edge information, and in this category column, edge information: node information specified by the category is described.
  • the property list indicates edge information for specifying supplementary node information for supplementing the node information.
  • the edge information and the node information specified by the property list are information for supplementing the maniac node information.
  • the category is “person”
  • the property list is “nationality” and “occupation”
  • the template is associated with the category.
  • the template here is "[node information determined to be maniac] is [node information indicating occupation] of [node information indicating nationality]”.
  • the conversation information generation unit 104 first obtains node information derived from edge information: category from node information determined to be maniac (S109b). As shown in FIG. 8, the information derived from the node information: Bill Kaulitz in the edge information: category is node information: person. Therefore, Bill Kauritz is known to be a person.
  • the dialogue information generation unit 104 specifies edge information for specifying supplementary node information based on the edge information: category of the node information with reference to the property list table (S109c).
  • the property list indicates that the edge information is: nationality / occupation.
  • the dialog information generation unit 104 acquires node information derived from the edge information specified in S109c, from the maniac node information (S109d). As shown in FIG. 10, supplementary node information derived from maniac node information: Bill Kauritz and edge information: nationality / occupation is supplementary node information: singer and Germany, respectively. Therefore, the dialog information generation unit 104 can generate a supplementary sentence indicating that Bill Kaulitz is from Germany and is a singer.
  • the dialogue information generation unit 104 acquires a template according to the category of the node information obtained from the topic information with reference to the property list table (S109e).
  • the category of the node information obtained from the topic information is “person”
  • a template corresponding to “person” is acquired.
  • the dialogue information generation unit 104 generates dialogue information as a supplementary sentence by inserting the supplementary node information into the acquired template (S109f).
  • the template is “[node information determined to be maniac] is [edge information: node information of nationality] [edge information: node information of occupation]”. By inserting the information, conversation information serving as a supplementary sentence can be generated.
  • the dialogue apparatus 100 includes a graph database 105 that structurally stores node information that is a plurality of registered words using edge information that is related information indicating mutual relevance.
  • the graph database 105 stores edge information having directionality in association with node information.
  • the directionality is not necessarily required, but the directionality is provided. This makes it possible to accurately grasp the relationship between node information.
  • the extraction unit 102 analyzes the utterance content of the user accepted by the dialogue unit 101, and extracts topic information as a main word from the utterance content.
  • the extraction unit 102 extracts node information: Shunsuke Nakamura.
  • the search unit 103 searches the graph database 105 using node information as topic information as a key, and acquires corresponding node information (response information) and edge information (response-related information).
  • the search unit 103 acquires the edge information: the team to which the user belongs, and the node information: Yokohama Marinos.
  • the dialogue information generation unit 104 generates dialogue information that is a response content using the acquired node information and edge information.
  • the dialogue unit 101 outputs the generated dialogue information to the user terminal 200.
  • dialog information can be generated using a graph database that stores node information in association with each other using edge information. Therefore, high-quality dialog information can be automatically generated. Further, since the graph database 105 is used, the generation cost can be reduced. The reduction in the generation cost contributes to a reduction in the processing load of a processor such as a CPU in the dialog device 100 and simplification of a processing algorithm for generating the dialog.
  • the dialog information generation unit 104 obtains a template corresponding to the obtained edge information, generates node information by inserting node information into the template, and the dialog unit 101 outputs the dialog information. .
  • the graph database 105 stores continuation information indicated by a start time and an end time indicating whether or not the state of the node information associated with the edge information is continued.
  • the conversation information generation unit 104 generates conversation information based on continuation information indicated from the start time and the end time.
  • the continuation state does not necessarily have to be indicated by the start time and the end time, and information indicating that the continuation is in progress may be added to the edge information.
  • the graph database 105 stores a plurality of other node information in association with the node information corresponding to the topic information by edge information.
  • the search unit 103 may randomly select one piece of node information from a plurality of pieces of other node information, and use the selected piece of node information as the response word to be inserted into the template and the response-related information for selecting the template.
  • node information can be narrowed down to one, and natural conversation information can be generated.
  • the information is not limited to one piece of node information, but may be two or more pieces of node information.
  • the graph database 105 further stores the similarity between the node information.
  • the search unit 103 selects one piece of node information based on the similarity, and May be obtained as response-related information for selecting a response word and a template to be inserted into the response word.
  • the graph database 105 stores a plurality of pieces of other node information in association with the node information that matches the topic information.
  • the search unit 103 determines, based on the node information (for example, a person) of the edge information indicating a predetermined relevance (for example, a category), of the other node information associated with the edge information from the node information that matches the topic information.
  • Node information hometown is Yokohama, birthday date
  • the edge information for example, hometown, birthday.
  • the searching unit 103 selects node information according to the category of topic information, thereby enabling a natural dialogue having mutual relevance.
  • “category” is taken as an example of the edge information indicating the predetermined relevance in the topic information, but the present invention is not limited to this. Any edge information that is highly relevant to the topic information may be used.
  • the search unit 103 determines the degree of familiarity with the extracted node information based on the topic information. That is, it is determined whether supplementary information is necessary. Then, when the familiarity degree satisfies the predetermined condition, the search unit 103 searches for the edge information (category) indicating the predetermined relevance of the node information (maniac word: Bill Kaulitz) extracted based on the topic information. Based on the node information (person), a supplementary response word (complementary node information: singer) to be inserted into the supplemental template and supplementary response related information (complementary edge information: Occupation).
  • the conversation information generation unit 104 generates supplementary conversation information using supplementary node information and supplementary edge information in addition to the conversation information.
  • the search unit 103 can determine whether or not the word is a maniac word in the graph database 105 based on the derived direction. That is, when certain node information is associated with edge information from many other node information, it can be determined that the node information is quoted by a large number of node information. It can be determined as a known word. Conversely, when the number is small (less than a predetermined value), it can be determined that the word is a generally unknown maniac word.
  • “category” is taken as an example of the edge information indicating a predetermined relevance, but the present invention is not limited to this. Any edge information that is highly relevant in complementing the node information may be used.
  • the search unit 103 sets the acquired node information ( Other node information (Masayuki Okano in FIG. 7) associated with (Yokohama-shi in FIG. 7) is acquired as a response word inserted in the template.
  • the other node information (Masayuki Okano in FIG. 7) acquired as the response word and the node information (Shunsuke Nakamura in FIG. 7) that matches the topic information are based on the edge information (the team in FIG. 7). And share the associated node information (Japan representative for soccer in FIG. 7). That is, the search unit 103 acquires, as a response word, other node information associated with the common node information shared with the node information of the topic information.
  • the dialogue information generation unit 104 generates a second response content including other node information (response word) in addition to the first response content.
  • each functional block is realized by an arbitrary combination of at least one of hardware and software.
  • a method of implementing each functional block is not particularly limited. That is, each functional block may be realized using one device physically or logically coupled, or directly or indirectly (for example, two or more devices physically or logically separated). , Wired, wireless, etc.), and may be implemented using these multiple devices.
  • the functional block may be realized by combining one device or the plurality of devices with software.
  • Functions include judgment, decision, judgment, calculation, calculation, processing, derivation, investigation, search, confirmation, reception, transmission, output, access, resolution, selection, selection, establishment, comparison, assumption, expectation, deemed, Broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, assigning, but not limited to these I can't.
  • a functional block (configuration unit) that causes transmission to function is called a transmitting unit (transmitting unit) or a transmitter (transmitter).
  • the realization method is not particularly limited.
  • the interaction device 100 or the like may function as a computer that performs a process of the interactive method according to the present disclosure.
  • FIG. 11 is a diagram illustrating an example of a hardware configuration of the interactive device 100 according to an embodiment of the present disclosure.
  • the interactive device 100 described above may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the term “apparatus” can be read as a circuit, a device, a unit, or the like.
  • the hardware configuration of the interactive device 100 may be configured to include one or more devices illustrated in the drawing, or may be configured to exclude some devices.
  • the functions of the interactive device 100 are performed by reading predetermined software (program) on hardware such as the processor 1001 and the memory 1002, so that the processor 1001 performs an operation and controls communication by the communication device 1004, And at least one of data reading and writing in the storage 1003 is controlled.
  • predetermined software program
  • the processor 1001 controls the entire computer by operating an operating system, for example.
  • the processor 1001 may be configured by a central processing unit (CPU: Central Processing Unit) including an interface with a peripheral device, a control device, an arithmetic device, a register, and the like.
  • CPU Central Processing Unit
  • the above-described extraction unit 102, search unit 103, conversation information generation unit 104, and the like may be realized by the processor 1001.
  • the processor 1001 reads out a program (program code), a software module, data, and the like from at least one of the storage 1003 and the communication device 1004 to the memory 1002, and executes various processes according to these.
  • a program program that causes a computer to execute at least a part of the operation described in the above embodiment is used.
  • the extraction unit 102, the search unit 103, and the dialog information generation unit 104 of the dialog device 100 may be realized by a control program stored in the memory 1002 and operated by the processor 1001, and similarly realized for other functional blocks. May be done.
  • the various processes described above are executed by one processor 1001, the processes may be executed simultaneously or sequentially by two or more processors 1001.
  • Processor 1001 may be implemented by one or more chips.
  • the program may be transmitted from a network via a telecommunication line.
  • the memory 1002 is a computer-readable recording medium, and includes, for example, at least one of a ROM (Read Only Memory), an EPROM (Erasable Programmable ROM), an EEPROM (Electrically Erasable Programmable ROM), and a RAM (Random Access Memory). May be done.
  • the memory 1002 may be called a register, a cache, a main memory (main storage device), or the like.
  • the memory 1002 can store a program (program code), a software module, and the like that can be executed to execute the interactive method according to an embodiment of the present disclosure.
  • the storage 1003 is a computer-readable recording medium such as an optical disk such as a CD-ROM (Compact Disc), a hard disk drive, a flexible disk, and a magneto-optical disk (eg, a compact disk, a digital versatile disk, a Blu-ray). (Registered trademark) disk, smart card, flash memory (eg, card, stick, key drive), floppy (registered trademark) disk, magnetic strip, or the like.
  • the storage 1003 may be called an auxiliary storage device.
  • the above-described storage medium may be, for example, a database including at least one of the memory 1002 and the storage 1003, a server, or another appropriate medium.
  • the communication device 1004 is hardware (transmission / reception device) for performing communication between computers via at least one of a wired network and a wireless network, and is also referred to as, for example, a network device, a network controller, a network card, a communication module, or the like.
  • the communication device 1004 includes a high-frequency switch, a duplexer, a filter, a frequency synthesizer, and the like, for example, in order to realize at least one of frequency division duplex (FDD: Frequency Division Duplex) and time division duplex (TDD: Time Division Duplex). May be configured.
  • FDD Frequency Division Duplex
  • TDD Time Division Duplex
  • the dialogue unit 101 may be implemented physically or logically separated between the transmission unit and the reception unit.
  • the input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, and the like) that receives an external input.
  • the output device 1006 is an output device that performs output to the outside (for example, a display, a speaker, an LED lamp, and the like). Note that the input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).
  • the devices such as the processor 1001 and the memory 1002 are connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured using a single bus, or may be configured using a different bus for each device.
  • the interactive device 100 includes hardware such as a microprocessor, a digital signal processor (DSP), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array).
  • the hardware may implement some or all of the functional blocks.
  • the processor 1001 may be implemented using at least one of these pieces of hardware.
  • the notification of information includes physical layer signaling (for example, DCI (Downlink Control Information), UCI (Uplink Control Information)), upper layer signaling (for example, RRC (Radio Resource Control) signaling, MAC (Medium Access Control) signaling, Broadcast information (MIB (Master Information Block), SIB (System Information Block))), other signals, or a combination thereof may be used.
  • the RRC signaling may be referred to as an RRC message, and may be, for example, an RRC connection setup (RRC Connection Setup) message, an RRC connection reconfiguration (RRC Connection Reconfiguration) message, or the like.
  • LTE Long Term Evolution
  • LTE-A Long Term Evolution-Advanced
  • SUPER 3G IMT-Advanced
  • 4G 4th generation mobile communication system
  • 5G 5th generation mobile communication
  • FRA Full Radio Access
  • NR new Radio
  • W-CDMA registered trademark
  • GSM registered trademark
  • CDMA2000 Code Division Multiple Access 2000
  • UMB Universal Mobile Broadband
  • IEEE 802.11 Wi-Fi (registered trademark)
  • Systems using IEEE@802.16 WiMAX®
  • IEEE@802.20 UWB (Ultra-WideBand
  • Bluetooth® and other suitable systems and extensions based thereon. It may be applied to at least one of the next generation systems.
  • a plurality of systems may be combined (for example, a combination of at least one of LTE and LTE-A with 5G) and applied.
  • Information and the like can be output from an upper layer (or lower layer) to a lower layer (or upper layer). Input and output may be performed via a plurality of network nodes.
  • the input and output information may be stored in a specific place (for example, a memory) or may be managed using a management table. Information that is input and output can be overwritten, updated, or added. The output information or the like may be deleted. The input information or the like may be transmitted to another device.
  • the determination may be made based on a value represented by 1 bit (0 or 1), a Boolean value (Boolean: true or false), or a comparison of numerical values (for example, a predetermined value). Value).
  • Each aspect / embodiment described in the present disclosure may be used alone, may be used in combination, or may be used by switching with execution.
  • the notification of the predetermined information (for example, the notification of “X”) is not limited to explicitly performed, and is performed implicitly (for example, not performing the notification of the predetermined information). Is also good.
  • software, instructions, information, and the like may be transmitted and received via a transmission medium.
  • a transmission medium For example, if the software uses at least one of wired technology (coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), etc.) and wireless technology (infrared, microwave, etc.), the website, When transmitted from a server or other remote source, at least one of these wired and / or wireless technologies is included within the definition of a transmission medium.
  • the information, signals, etc. described in this disclosure may be represented using any of a variety of different technologies.
  • data, instructions, commands, information, signals, bits, symbols, chips, etc. that can be referred to throughout the above description are not limited to voltages, currents, electromagnetic waves, magnetic or magnetic particles, optical or photons, or any of these. May be represented by a combination of
  • At least one of the channel and the symbol may be a signal (signaling).
  • the signal may be a message.
  • a component carrier (CC: Component @ Carrier) may be called a carrier frequency, a cell, a frequency carrier, or the like.
  • system and “network” used in this disclosure are used interchangeably.
  • the information, parameters, and the like described in the present disclosure may be expressed using an absolute value, may be expressed using a relative value from a predetermined value, or may be expressed using another corresponding information. May be represented.
  • the radio resource may be indicated by an index.
  • MS mobile station
  • UE user equipment
  • terminal terminal
  • a mobile station can be a subscriber station, mobile unit, subscriber unit, wireless unit, remote unit, mobile device, wireless device, wireless communication device, remote device, mobile subscriber station, access terminal, mobile terminal, wireless terminal, by one of ordinary skill in the art. It may also be called a terminal, a remote terminal, a handset, a user agent, a mobile client, a client, or some other suitable term.
  • determining may encompass a wide variety of operations.
  • Judgment '', ⁇ decision '' for example, judgment (judging), calculation (calculating), calculation (computing), processing (processing), derivation (deriving), investigating (investigating), searching (looking up, search, inquiry) (E.g., searching in a table, database, or another data structure), ascertaining may be considered “determined", "determined", and the like.
  • determining” and “deciding” include receiving (eg, receiving information), transmitting (eg, transmitting information), input (input), output (output), and access. (accessing) (for example, accessing data in a memory) may be regarded as “determined” or “determined”.
  • ⁇ judgment '' and ⁇ decision '' means that resolving, selecting, selecting, establishing, establishing, comparing, etc. are regarded as ⁇ judgment '' and ⁇ decided ''. May be included.
  • “judgment” and “decision” may include deeming any operation as “judgment” and “determined”. “Judgment (determination)” may be read as “assuming”, “expecting”, “considering”, or the like.
  • connection means any direct or indirect connection or connection between two or more elements that It may include the presence of one or more intermediate elements between the two elements “connected” or “coupled.”
  • the coupling or connection between the elements may be physical, logical, or a combination thereof.
  • connection may be read as “access”.
  • two elements may be implemented using at least one of one or more wires, cables, and printed electrical connections, and as some non-limiting and non-exhaustive examples, in the radio frequency domain. , Can be considered “connected” or “coupled” to each other using electromagnetic energy having wavelengths in the microwave and optical (both visible and invisible) regions, and the like.
  • references to elements using designations such as “first,” “second,” etc., as used in this disclosure, does not generally limit the quantity or order of those elements. These designations may be used in the present disclosure as a convenient way to distinguish between two or more elements. Thus, references to first and second elements do not mean that only two elements can be employed, or that the first element must precede the second element in some way.
  • the term “A and B are different” may mean that “A and B are different from each other”.
  • the term may mean that “A and B are different from C”.
  • Terms such as “away” and “coupled” may be construed similarly to “different”
  • Dialogue device 100: Dialogue device, 200: User terminal, 101: Dialogue unit, 102: Extraction unit, 103: Search unit, 104: Dialogue information generation unit, 105: Graph database, 106: Template database.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

低コストで発話内容の品質を向上させることのできる発話装置を提供すること。 抽出部102は、対話部101が受け付けたユーザの発話内容を解析し、発話内容から主単語であるトピック情報を抽出する。上記本実施形態では、抽出部102は、ノード情報:中村俊輔を抽出する。検索部103は、トピック情報であるノード情報をキーにして、グラフデータベース105を検索して、対応するノード情報およびエッジ情報を取得する。対話情報生成部104は、取得したノード情報およびエッジ情報を用いて応答内容である対話情報を生成する。対話部101は、生成した対話情報をユーザ端末200に出力する。

Description

対話装置
 本発明は、ユーザと対話を行う対話装置に関する。
 特許文献1(特開2017-222402号公報)には、対話システムにおいてユーザ発話に応じて適切な応答を行うことができる発話候補生成装置について記載されている。この発話候補生成装置は、ユーザ発話を形態素解析して抽出した単語および対話行為を検索クエリとした発話データベースの検索結果に基づいた発話候補を生成することについての記載がある。
特開2017-222402号公報
 しかしながら、特許文献1に記載の発話データベースは、SNS(Social Network System)などの所定のサイトをクロールすることによって得た情報であることから、発話内容の品質が悪い場合があり得る。一方で、発話内容を向上させようとして管理者が発話内容を生成することもできるが、多大なコストがかかる。
 そこで、上述の問題を解決するために、本発明は、低コストで発話内容の品質を向上させることのできる発話装置を提供することを目的とする。
 本発明は、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部と、ユーザの発話内容を解析する解析部と、前記発話内容から主単語を抽出する抽出部と、前記主単語をキーにして、前記記憶部を検索して、対応する登録単語および関連情報を、応答単語および応答関連情報として取得する検索部と、前記応答単語および応答関連情報を用いて応答内容を生成して出力する応答部と、を備える。
 この発明によれば、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部を用いて、ユーザとの対話を行うための応答内容を生成する。よって、低コストで対話内容の品質を向上させることができる。
 本発明によると、低コストで対話内容の品質を向上させることができる。
本開示の一実施形態の対話装置の機能構成を示すブロック図である。 グラフデータベースを模式的に示した模式図である。 時間情報を含んだエッジ情報およびノード情報を示す模式図を示す。 テンプレートデータベース106の具体例を示す図である。 対話装置の処理動作を示すフローチャートである。 エッジ情報に類似度を含んだグラフデータベース105の模式図である。 共通するノード情報を選択するための処理概念を示す模式図である。 グラフデータベース105の一部を示す模式図である。 補足文を生成することができる対話装置100の動作を示すフローチャートである。 プロパティリストテーブルの具体例を示す。 本開示の一実施の形態に係る対話装置100のハードウェア構成の一例を示す図である。
 添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
[本実施形態]
 図1は、本開示の一実施形態の対話装置100の機能構成を示すブロック図である。図1に示される通り、対話装置100は、ユーザ端末200から発話情報を受信し、その対話情報に対応した対話情報を送信することで、ユーザ端末200のユーザは、対話を楽しむことができる。
 図1に示される通り、この対話装置100は、対話部101(応答部)、抽出部102(解析部、抽出部)、検索部103(検索部)、対話情報生成部104(応答部)、グラフデータベース105(記憶部)およびテンプレートデータベース106を含んで構成されている。
 対話部101は、ユーザ端末200から送信された発話情報であるテキスト情報を受信し、また、ユーザ端末200に対する対話情報であるテキスト情報を送信する部分である。図1においては、対話部101は、ネットワークを介してユーザ端末200と送受信しているが、これに限るものではなく、直接対話してもよい。その場合、音声による対話またはテキスト情報の入出力による対話を行う。
 抽出部102は、ユーザ端末200から送信されたテキスト情報を解析して、発話情報の話題である焦点情報(トピック情報)を抽出する部分である。焦点情報は、テキスト情報を形態素解析して得られた単語およびその前後の文字における特徴ベクトル(意味ベクトル)に基づいて、抽出される情報であり、単語またはテキストで表される。この焦点情報の抽出処理は、公知の技術である。以下、焦点情報を、トピック情報とする。
 検索部103は、トピック情報をキーにして、グラフデータベース105を検索し、トピック情報から派生しているエッジ情報およびノード情報を取得する部分である。なお、検索部103は、検索した複数のエッジ情報およびノード情報のうち、所定条件に従った一のエッジ情報および一のノード情報を選択して取得する。例えば、検索部103は、ランダムに一のエッジ情報およびその一のエッジ情報に対応する一のノード情報を選択する。
 また、検索部103は、対話装置100の設定に応じて複数文を生成するために、一文目の対話情報を生成した後、トピック情報を変更して、他のノード情報等の検索処理を繰り返し行うことにしてもよい。例えば、検索部103は、一文目の対話情報の作成に用いたノード情報をトピック情報として、グラフデータベース105を検索して、そのトピック情報から派生するエッジ情報およびノード情報を取得する。
 対話情報生成部104は、取得されたエッジ情報およびノード情報に基づいて対話情報を生成する部分である。具体的には、以下の通りである。
 対話情報生成部104は、テンプレートデータベース106を参照して、取得したエッジ情報に応じたテンプレートを取得する。例えば、エッジ情報が「所属チーム」を示していれば、エッジ情報で関連付けられているノード情報が示す所属チーム名を挿入するためのテンプレートを取得する。テンプレートデータベース106において、テンプレートは、エッジ情報ごとに用意されている。また、テンプレートは、過去バージョン(過去形のテンプレート)および現在バージョン(現在形のテンプレート)が用意されている場合がある。なお、テンプレートとは、文章の定型文であって、エッジ情報に対応するノード情報およびトピック情報を貼り付けることで、文章を構成するデータである。
 対話情報生成部104は、エッジ情報に付随する時間情報に基づいて、エッジ情報で関連付けられているノード情報が示す状態または焦点情報との関係性が現在継続中であるか否かを判断する。そして、対話情報生成部104は、現在継続中であるか否かに応じて、過去バージョンまたは現在バージョンのテンプレートを取得する。時間情報に付随されるエッジ情報を含んだグラフデータベース105については、後述する。
 対話情報生成部104は、取得したテンプレートの指定された位置に、エッジ情報に基づいたノード情報、およびトピック情報を挿入することで、対話情報を生成する。
 なお、対話情報生成部104は、グラフデータベース105において、トピック情報であるノード情報に向かうエッジ情報が所定数以上(例えば30以上)である場合には、そのトピック情報には補足文が必要と判断し、補足文生成処理を行うことにしてもよい。その補足文生成処理は後述する。
 対話情報生成部104は、エッジ情報およびノード情報を用いて対話情報を生成する。これを指定された数だけ、繰り返し処理することで、複数文の対話情報を生成する。なお、対話情報同士をつなげるための接続詞を適宜挿入してもよい。
 グラフデータベース105は、対話情報を生成するためのノード情報およびエッジ情報を、構造的に関連付けて記憶するデータベースである。図2は、このグラフデータベース105の具体例を模式的に示す図である。グラフデータベース105は、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記述するものであり、単語と単語との関係を示す情報を記述している。図2に示される通り、単語は、ノード情報として扱われ、ノード情報同士の関係はエッジ情報で示されている。例えば、ノード情報:中村俊輔から、エッジ情報:出身地を用いて、他のノード情報:横浜が派生している。これは、中村俊輔の出身地として、ノード情報:横浜が関連付けられていることを示す。すなわち、ノード情報:中村俊輔と、ノード情報:横浜は、エッジ情報:出身地で関連付けられている。ノード情報の派生方向は、図2においては矢印によって表現されている。派生先のノード情報が、派生元のノード情報を説明するため情報であり、そのために派生方向が定義されている。
 なお、ノード情報:横浜から、さらに別のエッジ情報を用いて他のノード情報に関連付けられてもよい。グラフデータベース105は、ノード情報をエッジ情報を用いて他のノード情報に関連付けることを繰り返すことにより、ノード情報を用いた知識データを構造化することができる。
 グラフデータベース105は、データベース運用者が人手により生成してもよいが、インターネットの情報サイトまたは辞書サイトから、公知のグラフデータベース生成アルゴリズムに従って生成される。
 図3に、時間情報を含んだエッジ情報およびノード情報を示す模式図を示す。図3に示されるとおり、エッジ情報:所属チームには、スタート時間とエンド時間とが含まれている。これはノード情報:中村俊輔が、ノード情報:横浜Fマリノスに、エッジ情報:所属チームとして、所属していた期間を示す。エンド時間が示されていない場合には、現在継続中であると判断できる。また、スタート時間およびエンド時間が含まれていない場合には、現在および過去の概念がないエッジ情報と捉えることができる。その場合には、現在継続中と同じ扱いとなる。例えば、エッジ情報として出身地を考えた場合には、エッジ情報:出身地は、時間的な終わりがある情報ではない。そのようなエッジ情報には、スタート時間およびエンド時間を含ませる必要はない。またはスター時間のみをエッジ情報に含ませればよい。なお、現在継続中であるか否かを示すための情報としてスタート時間などに限定する必要はなく、単に“現在継続中”という情報がエッジ情報に含まれてもよい。
 図4は、テンプレートデータベース106の具体例を示す図である。図4に示されるとおり、現在形、過去形に分けて、テンプレートが記述されている。さらに、トピック情報のノード情報およびその派生先となるノード情報を挿入するための空欄が形成されている。また、テンプレートデータベース106は、エッジ情報に応じたテンプレートを記憶している。図4においては、エッジ情報:所属チームのテンプレートを示す。このテンプレートは、その空欄に、トピック情報に対応するノード情報およびエッジ情報:所属チームで派生するノード情報が挿入されるように構成されている。
 このように構成された対話装置100の動作について説明する。図5は、対話装置100の動作を示すフローチャートである。対話装置100において、対話部101が、ユーザ端末200から発話情報を受信すると、抽出部102は、その発話情報を解析する(S101)。
 抽出部102は、ユーザの発話情報からトピック情報を抽出する(S102)。ここで、対話情報生成部104は、i=1を設定し、生成する対話情報の数の管理を行う(S103)。i≦num(閾値)であるときには(S104:YES)、対話情報生成部104は、対話情報の数が、予め定めた数に達していないと判断し、検索部103は、トピック情報から派生するエッジ情報およびノード情報を検索する。検索部103は、複数のエッジ情報およびノード情報を検索した場合には、所定ルール(例えばランダムに選択)に従って一のエッジ情報および一のノード情報を選択して取得する(S105)。なお、事前の設定等により複数のエッジ情報および複数のノード情報を選択してもよい。
 また、ステップS105において、二文目以降の対話情報を生成する場合には、検索部103は、その前に生成された対話情報と共通するノード情報およびエッジ情報を取得してもよい。その処理の詳細については後述する。
 そして、対話情報生成部104は、エッジ情報に応じたテンプレートを取得する(S106)。対話情報生成部104は、トピック情報、および取得したノード情報をテンプレートに挿入して、対話情報を生成する(S107)。
 そして、対話情報生成部104は、i≧2であれば(S108:YES)、先に生成した対話情報に、S107において生成した対話情報を結合する(S109)。
 つぎに、対話情報生成部104は、つぎの対話情報を生成するために、トピック情報を変更する。例えば、対話情報生成部104は、新たなトピック情報をS105で取得したノード情報に変更する(S110)。そして、対話情報生成部104は、iを一つインクリメントし(S111)、事前に定められた数に達するまで対話情報の生成を行う。
 事前に定められた数に達すると(S104:NO)、対話部101は、対話情報生成部104で生成した対話情報をユーザ端末200に出力する(S112)。
[ノード情報の選択バリエーション]
 つぎに、本開示の一実施形態の対話装置100におけるステップS105の処理におけるバリエーションについて説明する。上述したとおり、検索部103は、トピック情報から派生するエッジ情報およびノード情報を検索する際、ランダムに選択した一のエッジ情報および一のノード情報を検索したが、当然にこれに限るものではない。
 例えば、検索部103は、トピック情報から派生する複数のエッジ情報の中から、ノード情報間の類似度の一番高いノード情報または所定値以上の類似度のノード情報を選択してもよい。図6に、エッジ情報に類似度を含んだグラフデータベース105の模式図を示す。図に示されているように、グラフデータベース105には、ノード情報同士がエッジ情報を用いて連結されているが、ノード情報同士の類似度がエッジ情報に含まれている。ノード情報は、単語であることから、単語間の類似度がエッジ情報に含まれていることになる。この類似度は、グラフデータベース105を構築する際に、word2vecなどの公知の自然言語解析アルゴリズムによって算出され、エッジ情報に付加されている。図6においては、ノード情報:中村俊輔と、ノード情報:横浜Fマリノスとの類似度は、0.53である。一方、ノード情報:中村俊輔と、ノード情報:横浜の類似度は、0.20であり、ノード情報:中村俊輔と、ノード情報:セルティックFCの類似度は、0.52である。この場合、検索部103は、エッジ情報:所属チーム、ノード情報:横浜Fマリノスを選択する。
 この類似度を用いた選択処理を採用した場合、以下の対話情報が生成される。
「中村俊輔は、横浜・F・マリノスに所属していたんだ」
 また、別のバリエーションとして、検索部103は、トピック情報のカテゴリに応じた一のエッジ情報および一のノード情報を選択してもよい。例えば、トピック情報:中村俊輔は、エッジ情報:カテゴリとして、ノード情報:人に対して派生して構造化されている。これは、トピック情報:中村俊輔のカテゴリは、“人”であることを示している。
 したがって、トピック情報が、エッジ情報:カテゴリとして、ノード情報:人に派生して構造化されている場合には、検索部103は、検索した複数のエッジ情報およびノード情報のうち、「出身地」「誕生日」など予め定めたエッジ情報で派生するノード情報を選択してもよい。上記は一例であり、エッジ情報:カテゴリとして、ノード情報:人に限定するものではない。グラフデータベース105において、予め定めたエッジ情報に対して、予め定めたノード情報に構造化されている場合には、検索部103は、その予め定めたノード情報を選択することとしてもよい。
 この特定のエッジ情報:出身地に対応するノード情報:横浜を選択する処理を採用する場合は、以下の対話情報が生成される。
「中村俊輔は、横浜出身なんだ。」
[共通ノード情報を用いた対話情報の生成]
 つぎに、二文目以降の対話情報を生成する際の処理について説明する。検索部103は、二文目以降の対話情報を生成する際において、最初にユーザが発話した発話情報から抽出したトピック情報と共通するノード情報およびエッジ情報を取得することにしてもよい。以下、図7を用いて、説明する。
 図7は、共通するノード情報を選択するための処理概念を示す模式図である。図7を例にとると、検索部103は、トピック情報であるノード情報:中村俊輔をキーにして、エッジ情報:出身地、ノード情報:横浜市を取得し、対話情報生成部104は、一文目の対話情報「中村俊輔は横浜市出身なんだよ」を生成する。
 そして、対話情報生成部104が、二文目の対話情報を生成するために、検索部103は、ノード情報:横浜市をキーにして、他のノード情報を検索する。具体的には、まず、検索部103は、ノード情報に対して派生された複数の他のノード情報を検索する。この例においては、エッジ情報で逆方向に派生されたノード情報を検索する。そして、その中から、トピック情報であったノード情報:中村俊輔と共通する共通ノード情報に関連付けられる他のノード情報を選択する。図7の例では、共通ノード情報:サッカー日本代表に関連付けられるノード情報:岡野雅行およびエッジ情報:出身地を、他のノード情報および他のエッジ情報として選択する。
 対話情報生成部104は、他のノード情報:岡野雅行、他のエッジ情報:出身地、共通ノード情報:サッカー日本代表、そのエッジ情報:所属チームを用いて、テンプレートデータベースからテンプレートを選択する。
 テンプレートデータベース106には、共通ノード情報を用いたときのためのテンプレートが用意されており、一つ目のエッジ情報(例えば出身地)、その時間情報、二つ目のエッジ情報(例えば所属チーム)、その時間情報に対応付けたテンプレートが用意されている。
 例えば、一つ目エッジ情報:出身地および二つ目のエッジ情報:所属チームに対応するテンプレートとして、「[トピック情報のノード情報]と同じ[共通ノード情報]だった[他のノード情報]も[ノード情報]出身なんだ」が用意されている。なお、説明の便宜上時間情報についての説明は割愛しているが、時間情報(現在または過去)を考慮したテンプレートも用意されている。
 対話情報生成部104は、トピック情報、共通ノード情報、他のノード情報、ノード情報をそれぞれ挿入することで、対話情報を生成することができる。
 この処理によって、対話に関連性ができ自然な対話情報を生成することができる。
 なお、テンプレートデータベース106のデータベースを簡略化するために、以下の処理も考えられる。
 すなわち、二文目用のテンプレートまたは共通ノード情報専用のテンプレートを用意しておくことは手間がかかる。したがって、通常のテンプレートとして、「[他のノード情報]も[ノード情報]出身なんだ」を用意しておき、対話情報生成部104は、他のノード情報および他のエッジ情報をテンプレートに挿入することで対話情報を生成することができる。
 この場合、さらに三文目として、対話情報生成部104は、「[他のノード情報]は、[トピック情報のノード情報]と同じ「共通ノード情報」なんだ」とのテンプレートを取り出し、対話情報を生成するようにしてもよい。トピック情報および共通ノード情報は、すでに、検索部103が取得していることから、二文目および三文目を同タイミングで生成することができる。
 上記バリエーションについては、それぞれ組み合わせて利用することもできる。例えば、共通ノード情報を有するノード情報が存在しない場合には、単語間類似度を用いてノード情報を選択してもよい。また、単語間類似度を用いてノード情報を選択する場合に、その類似度が所定値以上に達したノード情報が存在しない場合には、ランダムでノード情報を選択してもよい。なお、単語間類似度が所定以上に達したノード情報が存在しない場合に、共通ノードを有するノード情報の検索・選択を行ってもよい。
[補足文生成処理]
 つぎに、本開示の第2の実施形態について説明する。この実施形態においては、対話情報に挿入されるノード情報が一般に知られていない単語(いわゆるマニアックな単語)である場合に、その補足をするための補足文を生成することに特徴がある。
 図8を用いて、この実施形態の前提となる状況について説明する。図8は、グラフデータベース105の一部を示す模式図である。ノード情報:香川真司に対して、ノード情報:ビル・カウリッツから、エッジ情報:ファンで派生している。ビル・カウリッツは、日本においてはあまり知られていない人物とし、グラフデータベース105においても、あまり知られていない人物としてデータベース化されている。
 このようなグラフデータベースがあった場合において、対話装置100は、ユーザに対する対話情報として、「ビル・カウリッツは、香川真司のファンなんです」と出力したとする。上記したとおり、ビル・カウリッツは、日本ではあまり知られていない人物であることから、ユーザは理解できない場合がある。
 そのため、ビル・カウリッツを補足するための補足文を生成する必要がある。以下、その処理について説明する。
 図9は、補足文を生成することができる対話装置100の動作を示すフローチャートである。
 ステップS101~S109までは、図5に示される処理と同じである。トピック情報に基づいた一文目の対話情報が生成されると、検索部103は、そのトピック情報に基づいて抽出されたノード情報がマニアックな情報であるか否かを判断する(S109a)。検索部103は、そのノード情報がマニアックな情報であるか否かの判断基準としては、グラフデータベース105において、ノード情報に向けられるエッジ情報の数に基づいて判断する。ノード情報に向けられるエッジ情報の数が少ない、例えば、30以下である場合には、そのノード情報は別のノード情報から参照されることがないと判断できる。すなわち、そのノード情報は、一般的に知られていない情報と判断することができる。
 なお、ユーザが発話した発話内容から抽出したノード情報については、検索部103は、マニアックな情報と判断できる場合であっても、マニアックな情報と判断しない。例えば、対話装置100は、抽出部102が抽出した、ユーザの発話情報から得たノード情報を履歴情報として記憶する履歴情報記憶部を備え、履歴情報として記憶されたノード情報については、検索部103は、上記の条件を満たしたとしてもマニアックな情報と判断しない。
 検索部103は、ノード情報がマニアックな情報であると判断すると、そのノード情報を補足するための補足用ノード情報およびエッジ情報の検索を行う。例えば、検索部103は、ノード情報のカテゴリに基づいて、ノード情報を捕捉するための補足用ノード情報を特定するために、一または複数のエッジ情報を、プロパティリストテーブルを用いて選択する。検索部103は、選択したエッジ情報:職業・国籍に基づいたノード情報を特定する。このノード情報が、トピック情報に基づいて抽出されたノード情報を補足するための補足用ノード情報となる。
 以下詳細に説明する。図10にプロパティリストテーブルの具体例を示す。このプロパティリストテーブル(図示せず)は、対話装置100に備えられている。図に示されるとおり、このプロパティテーブルには、カテゴリ、プロパティリスト、およびテンプレートが対応付けて記述されている。カテゴリは、エッジ情報により示される情報であり、このカテゴリ欄には、エッジ情報:カテゴリにより特定されるノード情報が記述される。プロパティリストは、ノード情報を補足するための補足用ノード情報を特定するためのエッジ情報を示す。このプロパティリストで特定されるエッジ情報およびそのノード情報が、マニアックなノード情報を補足するための情報である。
 例えば、図10において、カテゴリが“人”に対して、プロパティリストが“国籍”および“職業”、およびテンプレートが対応付けられている。ここでのテンプレートは、「[マニアックと判断されたノード情報]は、[国籍を示すノード情報]の[職業を示すノード情報]です。」である。
 対話情報生成部104は、このプロパティリストテーブルを用いて、まずマニアックと判断されたノード情報からエッジ情報:カテゴリで派生するノード情報を取得する(S109b)。図8に示されるとおり、ノード情報:ビル・カウリッツからエッジ情報:カテゴリで派生する情報は、ノード情報:人である。従って、ビル・カウリッツは人であることが分かる。
 また、対話情報生成部104は、プロパティリストテーブルを参照して、ノード情報のエッジ情報:カテゴリに基づいて、補足用ノード情報を特定するためのエッジ情報を特定する(S109c)。図10の例では、ノード情報のカテゴリが人である場合のプロパティリストは、エッジ情報:国籍/職業であることを示す。
 そして、対話情報生成部104は、マニアックなノード情報から、S109cで特定されたエッジ情報で派生するノード情報を取得する(S109d)。図10に示されるとおり、マニアックなノード情報:ビル・カウリッツから、エッジ情報:国籍/職業で派生する補足用ノード情報は、それぞれ補足用ノード情報:歌手、ドイツである。したがって、対話情報生成部104は、ビル・カウリッツはドイツ出身で、歌手であることを示す補足文を生成することができる。
 対話情報生成部104は、プロパティリストテーブルを参照して、トピック情報から得られたノード情報のカテゴリに応じたテンプレートを取得する(S109e)。図10の例ではトピック情報から得られたノード情報のカテゴリは“人”であることから、“人”に対応するテンプレートを取得する。そして、対話情報生成部104は、取得したテンプレートに、補足用ノード情報を挿入することで、補足文となる対話情報を生成する(S109f)。図10の例では、テンプレートは「[マニアックと判断されたノード情報]は、[エッジ情報:国籍のノード情報]の[エッジ情報:職業のノード情報]です」であることから、それぞれノード情報を挿入することで補足文となる対話情報を生成することができる。
 つぎに、本実施形態の対話装置100の作用効果について説明する。本実施形態における対話装置100は、複数の登録単語であるノード情報を、相互に関連性を示す関連情報であるエッジ情報を用いて構造的に記憶するグラフデータベース105を備える。
 なお、上記実施形態においては、グラフデータベース105は、方向性を持たせたエッジ情報で、ノード情報同士を関連付けて記憶しているが、必ずしも方向性は必要ではないが、方向性を持たせた方が、ノード情報同士の関連性を正確に把握することができる。
 そして、抽出部102は、対話部101が受け付けたユーザの発話内容を解析し、発話内容から主単語であるトピック情報を抽出する。上記本実施形態では、抽出部102は、ノード情報:中村俊輔を抽出する。
 検索部103は、トピック情報であるノード情報をキーにして、グラフデータベース105を検索して、対応するノード情報(応答情報)およびエッジ情報(応答関連情報)を取得する。上記本実施形態では、検索部103は、エッジ情報:所属チーム、ノード情報:横浜マリノスを取得する。
 対話情報生成部104は、取得したノード情報およびエッジ情報を用いて応答内容である対話情報を生成する。対話部101は、生成した対話情報をユーザ端末200に出力する。
 この構成により、ノード情報同士を、エッジ情報を用いて相互に関連付けて記憶するグラフデータベースを用いて、対話情報を生成することができる。よって、質のよい対話情報を自動的に生成することができる。さらに、グラフデータベース105を用いるため、その生成コストを低減させることができる。生成コストの低減は、対話装置100におけるCPU等のプロセッサの処理負荷低減、また対話生成のための処理アルゴリズムの簡易化に貢献する。
 また、対話装置100において、対話情報生成部104は、取得したエッジ情報に対応するテンプレートを取得し、当該テンプレートにノード情報を挿入して対話情報を生成し、対話部101が対話情報を出力する。
 この構成により、エッジ情報に応じたテンプレートに基づいて対話情報を生成することができる。よって、自然な形の対話を可能にする。例えば、エッジ情報:所属チームに対応するテンプレートを取得することで、自然な対話となる対話情報を生成できる。
 また、対話装置100において、グラフデータベース105は、エッジ情報で関連付けられるノード情報の状態が継続しているか否かを示すスタート時間およびエンド時間で示される継続情報を記憶する。対話情報生成部104は、このスタート時間およびエンド時間から示される継続情報に基づいて対話情報を生成する。
 この構成により、関連付けられるノード情報が過去の状態であるか、現在継続している状態であるかに応じた対話情報を生成することができる。よって、自然な対話を可能にする。なお、必ずしもスタート時間およびエンド時間で継続状態を示す必要はなく、単に継続中という情報がエッジ情報に付随させてもよい。
 また、対話装置100において、グラフデータベース105は、トピック情報に一致するノード情報に対して複数の他のノード情報がそれぞれエッジ情報で関連付けて記憶されているとする。この場合、検索部103は、複数の他のノード情報から一のノード情報をランダムに選択して、テンプレートに挿入される応答単語およびテンプレートを選択するための応答関連情報とすることとしてもよい。
 この構成により、ノード情報を一つに絞り込むことができ、自然な対話情報を生成することができる。なお、一のノード情報に限るものではなく、2つまたはそれ以上のノード情報としてもよい。
 また、対話装置100において、グラフデータベース105は、さらにノード情報同士の類似度を記憶している。グラフデータベース105において、トピック情報に一致するノード情報に対して複数の他のノード情報が関連付けて記憶されている場合、検索部103は、類似度に基づいて一のノード情報を選択して、テンプレートに挿入される応答単語およびテンプレートを選択するための応答関連情報として取得することとしてもよい。
 この構成により、トピック情報に類似するノード情報を選択することができ、ユーザの発話に対して関連性のある対話情報を生成することができる。
 また、対話装置100において、グラフデータベース105が、トピック情報に一致するノード情報に対して複数の他のノード情報が関連付けて記憶されているとする。
 検索部103は、トピック情報に一致するノード情報からエッジ情報で関連付けられる他のノード情報のうち、所定の関連性(例えば、カテゴリ)を示すエッジ情報のノード情報(例えば、人)に基づいて他のエッジ情報(例えば、出身地、誕生日)で関連付けられるノード情報(出身地が横浜、誕生日の日付)を選択する。
 トピック情報のカテゴリが“人”である場合に、その“人”の誕生日、出身地を対話情報とすることが対話する上で自然な場合がある。本実施形態においては、検索部103は、トピック情報のカテゴリに応じたノード情報を選択するようにしたことで、相互に関連性のある自然な対話を可能にする。なお、本実施形態においては、トピック情報において所定の関連性を示すエッジ情報として“カテゴリ”を例に挙げたが当然にこれに限定するものではない。トピック情報に関連性の高いエッジ情報であればよい。
 また、本実施形態の対話装置100において、検索部103は、トピック情報に基づいて抽出されたノード情報に対する精通度合いを判定する。すなわち補足情報が必要か否かを判断する。そして、検索部103は、精通度合いが所定条件を満たす場合には、トピック情報に基づいて抽出されたノード情報(マニアックな単語:ビル・カウリッツ)の所定の関連性を示すエッジ情報(カテゴリ)のノード情報(人)に基づいて、補足用のテンプレートに挿入される補足応答単語(補足用のノード情報:歌手)および補足用のテンプレートを選択するための補足応答関連情報(補足用のエッジ情報:職業)として取得する。対話情報生成部104は、対話情報に加えて、補足用のノード情報および補足用のエッジ情報を用いた補足用の対話情報を生成する。
 この構成により、精通度合いの小さいノード情報、いわゆるマニアックな単語については、補足のための対話情報を生成することで、ユーザにとって理解が困難な対話をすることを防止することができる。
 例えば、検索部103は、マニアックな単語であるか否かは、グラフデータベース105においてその派生方向に基づいて判断することができる。すなわち、あるノード情報に対して多くの他のノード情報からエッジ情報を使って関連付けがなされている場合には、そのノード情報は、多数のノード情報に引用されていると判断でき、一般的に知られている単語と判断できる。逆にその数が少ない場合(所定値未満である場合)には、一般的には知られていないマニアックな単語であると判断できる。なお、本実施形態においては、所定の関連性を示すエッジ情報として“カテゴリ”を例に挙げたが当然にこれに限定するものではない。ノード情報を補足する上で関連性の高いエッジ情報であればよい。
 また、対話装置100において、トピック情報に対して取得されたノード情報(図7における横浜市)を用いた第1の応答内容が生成された後、検索部103は、この取得されたノード情報(図7における横浜市)に関連付けられる他のノード情報(図7における岡野雅行)を、テンプレートに挿入される応答単語として取得する。ここで、応答単語として取得された他のノード情報(図7における岡野雅行)と、トピック情報に一致するノード情報(図7における中村俊輔)とは、エッジ情報(図7における所属チーム)を用いて関連付けられるノード情報(図7におけるサッカー日本代表)を共通にする。すなわち、検索部103は、トピック情報のノード情報と共通にする共通ノード情報に関連付けられる他のノード情報を、応答単語として、取得する。
 対話情報生成部104は、第1の応答内容に加えて、他のノード情報(応答単語)を含んだ第2の応答内容を生成する。
 この構成により、自然な形で対話を発展させることができる。
 上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
 機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
 例えば、本開示の一実施の形態における対話装置100などは、本開示の対話方法の処理を行うコンピュータとして機能してもよい。図11は、本開示の一実施の形態に係る対話装置100のハードウェア構成の一例を示す図である。上述の対話装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話装置100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 対話装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の抽出部102、および検索部103、対話情報生成部104などは、プロセッサ1001によって実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、対話装置100の抽出部102、検索部103、対話情報生成部104は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る対話方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の対話部101などは、通信装置1004によって実現されてもよい。対話部101は、送信部と受信部とで、物理的に、または論理的に分離された実装がなされてもよい。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
 また、対話装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
 情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
 本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。
 本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
 本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
 なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC:Component Carrier)は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。
 本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
 また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。
 上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル(例えば、PUCCH、PDCCHなど)及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
 本開示においては、「移動局(MS:Mobile Station)」、「ユーザ端末(user terminal)」、「ユーザ装置(UE:User Equipment)」、「端末」などの用語は、互換的に使用され得る。
 移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。
 本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
 「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
 本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
 上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。
 本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
 本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
 本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい
100…対話装置、200…ユーザ端末、101…対話部、102…抽出部、103…検索部、104…対話情報生成部、105…グラフデータベース、106…テンプレートデータベース。 

Claims (9)

  1.  複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部と、
     ユーザの発話内容を解析する解析部と、
     前記発話内容から主単語を抽出する抽出部と、
     前記主単語をキーにして、前記記憶部を検索して、対応する登録単語および関連情報を、応答単語および応答関連情報として取得する検索部と、
     前記応答単語および前記応答関連情報を用いて応答内容を生成して出力する応答部と、
    を備える対話装置。
  2.  応答内容を生成するためのテンプレートと応答関連情報とを対応付けたテンプレートデータベースをさらに備え、
     前記応答部は、取得された前記応答関連情報に対応するテンプレートを取得し、当該テンプレートに前記応答単語を挿入した応答内容を生成して出力する、
    請求項1に記載の対話装置。
  3.  前記記憶部は、前記関連情報で関連付けられる登録単語で示されている状態が継続しているか否かを示す継続情報を記憶し、
     前記応答部は、前記継続情報に基づいて応答内容を生成する、
    請求項1または2に記載の対話装置。
  4.  前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語がそれぞれ関連情報で関連付けて記憶されている場合、前記検索部は、前記複数の他の登録単語から登録単語をランダムに選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  5.  前記記憶部は、さらに前記登録単語同士の類似度を記憶しており、
     前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語が記憶されている場合、前記検索部は、前記類似度に基づいて登録単語を選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  6.  前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語が記憶されている場合、
     前記検索部は、前記主単語に一致する登録単語から関連情報で関連付けられる他の登録単語のうち所定の関連性を示す関連情報の登録単語に基づいて他の関連情報で関連付けられる登録単語を選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  7.  前記検索部は、前記主単語に基づいて応答単語として取得された登録単語に対して補足情報が必要か否かを判断し、
     前記検索部は、補足情報が必要である場合には、前記応答単語として抽出された登録単語の所定の関連性を示す関連情報の登録単語に基づいて、補足応答単語および補足応答関連情報として取得し、
     前記応答部は、前記応答内容に加えて、前記補足応答単語および補足応答関連情報を用いた補足応答内容をさらに生成する、請求項1~6のいずれか一項に記載の対話装置。
  8.  前記記憶部は、前記関連情報に方向性を持たせて前記登録単語同士を関連付け、
     前記検索部は、前記応答単語として抽出された登録単語に対して、所定数未満の他の登録単語から前記関連情報で関連付けがなれているか否かを判断することで、補足情報が必要であるか否かを判断する、
    請求項7に記載の対話装置。
  9.  前記検索部は、主単語に対して取得された登録単語を用いた第1の応答内容が生成された後、前記登録単語に関連付けられる他の登録単語を、応答単語として取得し、
     当該応答単語は、前記主単語に一致する登録単語が関連情報を用いて関連付けられる登録単語に、共通して関連付けられており、
     前記応答部は、前記第1の応答内容に加えて、他の登録単語を含んだ第2の応答内容を生成する、
    請求項1~8のいずれか一項に記載の対話装置。
PCT/JP2019/033970 2018-09-13 2019-08-29 対話装置 WO2020054451A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/271,476 US20210312919A1 (en) 2018-09-13 2019-08-29 Conversation device
JP2020546851A JP7166350B2 (ja) 2018-09-13 2019-08-29 対話装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-171815 2018-09-13
JP2018171815 2018-09-13

Publications (1)

Publication Number Publication Date
WO2020054451A1 true WO2020054451A1 (ja) 2020-03-19

Family

ID=69778275

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/033970 WO2020054451A1 (ja) 2018-09-13 2019-08-29 対話装置

Country Status (3)

Country Link
US (1) US20210312919A1 (ja)
JP (1) JP7166350B2 (ja)
WO (1) WO2020054451A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190098110A (ko) * 2019-08-02 2019-08-21 엘지전자 주식회사 지능형 프레젠테이션 방법
US11928096B2 (en) * 2020-12-16 2024-03-12 Sap Se Systems and methods using generic database search models
US20230076773A1 (en) * 2021-08-27 2023-03-09 Microsoft Technology Licensing, Llc Knowledge base with type discovery
US20230067688A1 (en) * 2021-08-27 2023-03-02 Microsoft Technology Licensing, Llc Knowledge base with type discovery

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
WO2017212689A1 (ja) * 2016-06-08 2017-12-14 シャープ株式会社 応答装置および応答装置の制御方法、制御プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148366A (en) * 1989-10-16 1992-09-15 Medical Documenting Systems, Inc. Computer-assisted documentation system for enhancing or replacing the process of dictating and transcribing
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム
US20070174258A1 (en) * 2006-01-23 2007-07-26 Jones Scott A Targeted mobile device advertisements
US7848917B2 (en) 2006-03-30 2010-12-07 Microsoft Corporation Common word graph based multimodal input
JP4609527B2 (ja) * 2008-06-03 2011-01-12 株式会社デンソー 自動車用情報提供システム
US20100017381A1 (en) * 2008-07-09 2010-01-21 Avoca Semiconductor Inc. Triggering of database search in direct and relational modes
JP5380543B2 (ja) 2009-09-25 2014-01-08 株式会社東芝 音声対話装置およびプログラム
WO2013155619A1 (en) * 2012-04-20 2013-10-24 Sam Pasupalak Conversational agent
KR101353521B1 (ko) * 2012-05-10 2014-01-23 경북대학교 산학협력단 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치
JP2015118710A (ja) 2015-01-09 2015-06-25 株式会社東芝 対話装置、方法及びプログラム
GB201814121D0 (en) * 2018-08-30 2018-10-17 Liopa Ltd Liopa

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
WO2017212689A1 (ja) * 2016-06-08 2017-12-14 シャープ株式会社 応答装置および応答装置の制御方法、制御プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUBOMURA, CHIAKI ET AL.: "Control of Topics Using an Associative Concept Dictionary", IEICE TECHNICAL REPORT, vol. 113, no. 253, 12 October 2013 (2013-10-12), pages 25 - 30 *
YAMAUCHI, YUKI ET AL.: "Answer Sentence Generation for Guiding Users to New Topics with Relationships between Words in Spoken Dialog Systems", IEICE TECHNICAL REPORT, vol. 112, no. 369, 13 December 2012 (2012-12-13), pages 13 - 19 *

Also Published As

Publication number Publication date
JPWO2020054451A1 (ja) 2021-08-30
US20210312919A1 (en) 2021-10-07
JP7166350B2 (ja) 2022-11-07

Similar Documents

Publication Publication Date Title
WO2020054451A1 (ja) 対話装置
JP6802364B2 (ja) 対話システム
JP7054732B2 (ja) 対話システム
JP7087095B2 (ja) 対話情報生成装置
JP6967089B2 (ja) 対話システム
JP7054731B2 (ja) 対話システム
JP7043593B2 (ja) 対話サーバ
JP6975323B2 (ja) 対話サーバ
WO2020235136A1 (ja) 対話システム
WO2020003928A1 (ja) エンティティ特定システム
WO2019187463A1 (ja) 対話サーバ
JP7438191B2 (ja) 情報処理装置
WO2019235100A1 (ja) 対話装置
JP2019179394A (ja) 情報提示システム
US11914601B2 (en) Re-ranking device
JP2019175054A (ja) 文章マッチングシステム
US11468106B2 (en) Conversation system
JP2020035261A (ja) トピック分割装置

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020546851

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19859163

Country of ref document: EP

Kind code of ref document: A1