WO2020235136A1 - 対話システム - Google Patents

対話システム Download PDF

Info

Publication number
WO2020235136A1
WO2020235136A1 PCT/JP2020/002404 JP2020002404W WO2020235136A1 WO 2020235136 A1 WO2020235136 A1 WO 2020235136A1 JP 2020002404 W JP2020002404 W JP 2020002404W WO 2020235136 A1 WO2020235136 A1 WO 2020235136A1
Authority
WO
WIPO (PCT)
Prior art keywords
key
search
new candidate
new
question sentence
Prior art date
Application number
PCT/JP2020/002404
Other languages
English (en)
French (fr)
Inventor
昂宗 橋本
友理子 尾▲崎▼
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to JP2021520045A priority Critical patent/JP7216199B2/ja
Priority to US17/611,203 priority patent/US20220229996A1/en
Publication of WO2020235136A1 publication Critical patent/WO2020235136A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Definitions

  • the present invention relates to a dialogue system that interacts with a user.
  • Patent Document 1 the output of answers to questions written in natural sentences is controlled to avoid the risk of selecting answers that do not match the intent of the customer's question, and the narrowing down of answers is efficiently processed. There is a description about the question and answer control program to do.
  • an object of the present invention is to provide a dialogue system capable of adding appropriate response contents.
  • the dialogue system of the present invention is one search history information including an acquisition key which is a keyword acquired from an input sentence acquired by a user operation, a new candidate key which is an unknown word, and a response content searched by the acquisition key. It is provided with an acquisition unit for acquiring the above, a search key included in the response content based on the one search history information, and a generation unit for generating a new response content based on the new candidate key.
  • an appropriate response content can be added by using the search key and the new candidate key. Therefore, the number of dialogues can be reduced.
  • the number of dialogues can be reduced by adding appropriate response contents.
  • FIG. 1 is a block diagram showing a functional configuration of the dialogue system 100 of the present embodiment.
  • the dialogue system 100 is a system that interactively responds to a sentence input by the user.
  • the dialogue system 100 in the present embodiment functions as an FAQ system, and based on a sentence input by the user, performs a dialogue process (presentation of search results and instructions for the search result) and asks a question sentence and its answer desired by the user.
  • a dialogue process presentation of search results and instructions for the search result
  • the dialogue system 100 includes a sentence acquisition unit 101, a key acquisition unit 102, a search unit 103, a presentation unit 104, a storage unit 105, a new candidate acquisition unit 106, a usefulness determination unit 107, and an extension processing unit 108. And the question sentence generation unit 109 are included.
  • the sentence acquisition unit 101 is a part that acquires an input sentence input by the user.
  • the input text transmitted from the user terminal operated by the user via the network may be acquired, or the input text input directly from the keyboard or the like may be acquired.
  • the key acquisition unit 102 divides the input sentence into word units by performing known natural language processing such as morphological analysis, and among the divided words, the key registered in the key DB (not shown) is used. This is the part to be acquired as the acquisition key.
  • the key DB is a database in which a key, which is a word, is extracted by morphological analysis of a question sentence in advance.
  • the key acquisition unit 102 acquires a new candidate key that is an unknown word.
  • the new candidate key is a key that is not registered in the key DB.
  • the acquisition key includes a search use key and a search unused key
  • the search use key is a key used for the question sentence search described later.
  • the search unused key is a key that was not used for the question sentence search.
  • the dialogue system 100 searches for a question sentence while interacting with the user and performs a process of narrowing down the question text. Therefore, there may be keys that were not used in obtaining the final question.
  • the search unit 103 is a part that searches the question sentence by referring to the question sentence DB 105a using the acquisition key acquired by the key acquisition unit 102.
  • the presentation unit 104 is a part that presents the question text searched by the search unit 103 to the user as a question text candidate.
  • the presentation may be performed by transmitting the question text to the user terminal of the user via the network, or the question text may be displayed on a display or the like.
  • the presentation unit 104 stores the search use key used for the search, the search unused key not used for the search, the new candidate key, and the like as search history information in the history DB 105b.
  • the search unit 103 and the presentation unit 104 cooperate with each other to sequentially present a plurality of interrogative sentences searched to the user to the user, and receive a user instruction (affirmation or denial) for the question text. , Perform interactive processing. Then, the search unit 103 and the presentation unit 104 can narrow down to one or several question sentences.
  • the storage unit 105 stores the question sentence DB 105a and the history DB 105b.
  • the question text DB 105a is used for searching the question text and the question text to be searched, and describes the search key including the question text and the answer to the question text.
  • a new interrogative sentence is added to the interrogative sentence DB 105a.
  • the history DB 105b is a part that stores information used by the user to search for a question sentence. As shown in FIG. 2B, the history DB 105b describes the input sentence, the acquisition key, the unused key, the new candidate key, the reached question sentence, and the search use key used for the search in association with each other.
  • the new candidate acquisition unit 106 is a part that refers to the history DB 105b and acquires a search use key, a search unused key, a new candidate key, and a corresponding question sentence (question sentence to be edited).
  • the usefulness determination unit 107 is a part that determines the usefulness of the new candidate key with reference to the history DB 105b.
  • the new candidate key is useful, is the new candidate key related to the difference key described later, or is the frequency of reaching the difference key from the new candidate key to a predetermined number or more? Based on such. The detailed judgment will be described later with reference to the figure.
  • the usefulness determination unit 107 determines linguistic relevance, category, etc. by analyzing data with reference to the question sentence DB 105a or the key DB. In addition, the usefulness determination unit 107 has data (corpus) for natural language processing as needed, and can also determine linguistic relevance. For example, it is possible to determine whether or not the dependencies of words are the same.
  • the extended processing unit 108 is a part that determines an extended method for the question text to be edited. For example, the extension processing unit 108 adds a part of the edit target question sentence to the edit target question sentence, which is a method of replacing a part of the edit target question sentence with a new candidate key determined to be useful, according to the content determined to be useful.
  • the extension processing unit 108 determines that the new candidate key is useful, and in that case, generates a question sentence by exchanging the difference key and the new candidate key. To do. Prior to this processing, the extended processing unit 108 associates the content determined to be useful with the method of generating the question sentence in advance.
  • the question sentence generation unit 109 is a part that generates a new question sentence from the question sentence to be edited according to the determined extension method. At the time of generation, particles and the like may be appropriately changed according to the meaning of the new candidate key.
  • the question sentence generation unit 109 performs the same generation process when there is the same new candidate key in the same domain (category) in addition to the question sentence to be edited.
  • the interrogative text DB105a or the history DB105b stores the domain in association with the interrogative text.
  • the question sentence generation unit 109 registers the generated familiar question sentence in the question sentence DB 105a. This enables dialogue using new interrogative sentences.
  • the question sentence generation unit 109 newly generates a search key corresponding to the new question sentence by referring to the key DB or the like. It is also possible to partially divert the search key associated with the question text to be edited.
  • the answer corresponding to the new question text is directly linked to the answer corresponding to the question text to be edited.
  • FIG. 3 is a diagram schematically showing a new question sentence generation process.
  • FIG. 3A shows an input sentence, an acquisition key, and a new candidate key.
  • the key acquisition unit 102 acquires the acquisition key and the new candidate key from the input sentence, and the search unit 103 and the presentation unit 104 perform the search process of the question sentence based on the acquisition key, and the user
  • the search result (question sentence candidate) is presented to the user, and whether or not the question sentence is in line with the user's intention is asked.
  • the presenting unit 104 displays the input sentence, the acquisition key, the search unused key, the new candidate key, and the interrogative sentence in the history DB 105b. And memorize the search usage key.
  • the key acquisition unit 102 acquires the acquisition key "email", the acquisition key "photo”, and the new candidate key "cannot send” from the input sentence "cannot send an email with a photo”. Then, in FIG. 3A, the acquisition key "photograph” is distinguished as a key that was not used for the search and as a search unused key. Hereinafter, the search unused key "photograph” is used.
  • FIG. 3B shows a search result and a search key associated with the searched question text.
  • the search result the question text "mail is an error" is acquired according to the dialogue processing (search unit and presentation unit) by the dialogue system 100.
  • the input sentence, the acquisition key, the search unused key, the new candidate key, the question sentence, and the search use key used for the search of these Ichiren are stored in the history DB 105b.
  • FIG. 3C shows a newly generated new question sentence and a search key included in the question sentence.
  • a new question sentence "mail cannot be sent” and search keys "mail" and "cannot be sent” are generated.
  • the question sentence generation unit 109 generates a new question sentence by referring to the history DB 105b, extracting an edit target question sentence to be edited, and editing using the corresponding search unused key or the like.
  • the question sentence generation unit 109 acquires the search result: question sentence “mail is an error” stored in the history DB 105b as the question sentence to be edited (FIG. 3 (b)). Then, the question sentence generation unit 109 adds a new candidate key "cannot be sent" stored in the history DB 105b instead of the search key "error” to generate a new question sentence "mail cannot be sent”. ..
  • FIG. 4A shows the input text “cannot send an email with a photo”, the acquisition key “mail”, the unused search key “photo”, and the new candidate key “cannot send”.
  • FIG. 4B shows the search results searched based on the acquisition key: the question text candidate “mail is an error”, and the search keys “mail” and “error” included in the question text.
  • the usefulness judgment unit 107 acquires a key not included in the input sentence as a difference key from the search key of the question sentence of the search result. Then, the usefulness determination unit 107 determines the relationship between the difference key and each of the search unused key and the new candidate key. In FIG. 4, the usefulness determination unit 107 uses the search key “error” as the difference key “error” because it is a key that is not included in the input text. Then, the usefulness determination unit 107 determines the relationship between the difference key "error” and the search unused key "photograph", and the relationship between the search key "error” and the new candidate key "cannot be sent". ..
  • the usefulness determination unit 107 determines that the new candidate key "cannot be sent” is a similar word to the difference key "error”, and determines that it is relevant. On the other hand, the usefulness determination unit 107 determines that the unused search key "photograph” and the difference key "error” are not related because they are neither fluctuations, similar words, or synonyms.
  • the relevance may be determined based on the inter-word distance between the difference key and the new candidate key.
  • the inter-word distance is calculated based on the distance of the feature vector of the word.
  • the question sentence generation unit 109 generates a new question sentence using the new candidate key determined by the usefulness judgment unit 107 to be relevant.
  • FIG. 5 is a diagram schematically showing a determination process in consideration of dependency in determining the relationship between the search key and the new candidate key.
  • the usefulness judgment unit 107 includes the acquisition key "email" and the new candidate key "cannot be sent” in the input sentence, the search key "email” and the difference key "error” in the question sentence which is the search result. Determines if they are the same dependency.
  • the usefulness determination unit 107 uses data (corpus, etc.) for performing natural language processing to determine that each key is a term that explains the state of "mail”. , Judge that they are the same dependency.
  • FIG. 6 is a diagram showing that the usefulness of the new candidate key is judged based on the frequency of reaching the target question sentence.
  • FIG. 6A shows a search result: a question sentence and its search key. In the figure, the question text "mail is an error” and the search keys "mail" and "error” are shown.
  • FIG. 6 (b) shows an input sentence (including a search use key and a new candidate key) and the frequency of reaching the question sentence of FIG. 6 (a) from this input sentence.
  • the frequency is shown to be 20 cases.
  • the usefulness determination unit 107 refers to the history DB 105b, extracts one question sentence to be edited from the search result, and extracts a new candidate key corresponding to the question sentence. Then, the number of cases registered in the history DB 105b of this new candidate key is counted.
  • the usefulness judgment unit 107 selects one question sentence "mail is an error" as an edit target from the history DB 105b, and extracts the corresponding new candidate key "cannot be sent”. Then, the number of registrations of the history DB 105b of the new candidate key "cannot be sent” is counted. This number corresponds to the frequency with which one question "mail is in error" is reached from each of the input sentences including the new candidate key "cannot be sent”.
  • the usefulness determination unit 107 determines that the new candidate key in this input sentence is useful when this frequency is equal to or higher than a predetermined value. Then, the question sentence generation unit 109 generates a new question sentence based on the new candidate key and one question sentence to be edited. In determining the usefulness, the input sentences do not have to be the same. The usefulness of the new candidate key may be determined based on the frequency with which the search key in the finally reached question sentence and the new candidate key in the input sentence that is the starting point of the question sentence match.
  • the new candidate key of the input text is useful. You may judge.
  • the usefulness of the new candidate key may be judged based on the frequency of replacement of the new candidate key when the question text arrives. For example, the usefulness determination unit 107 selects the question text “mail is an error” of the search result to be edited from the history DB 105b. Then, the input text "mail cannot be sent” including the corresponding acquisition key "mail” and the new candidate key “cannot be sent", and the difference key "error” are extracted.
  • the usefulness determination unit 107 pays attention only to this difference key "error”, and counts the number of records including the difference key "error” from the new candidate key "cannot be sent” in the history DB 105b.
  • the usefulness determination unit 107 can count that the frequency of replacement with the difference key "error" is 30 times for the new candidate key "cannot be sent".
  • the question sentence generation unit 109 uses this new candidate key to generate a new question sentence based on the question sentence to be edited.
  • the validity of the new candidate key may be judged based on the total number of new candidate keys replaced by focusing only on the new candidate key without considering other acquisition keys.
  • a predetermined frequency for example, 30 times or more, it is determined that the new candidate key that is the basis of the replacement is valid.
  • the question sentence generation unit 109 may take out the question sentence associated with the difference key "error" as the question sentence to be edited, and generate a new question sentence based on this question sentence.
  • FIG. 7 is a schematic diagram showing a new question sentence generation process using the search unused key.
  • the acquisition keys "email” and “with photo” are acquired from the input text "about the email with a photo”.
  • the search usage key "mail” is a key used for the search
  • the search unused key "with photo” is a key that was not used for the search of the question text as a result.
  • FIG. 7B shows the generation of a new question sentence using the unused search key "with photo”. If the search unused key "with photo” does not conflict with other search keys, a new question sentence is generated using this search unused key.
  • the dependency between the search key "Cannot send” and the search key "Mail” explains the search key "Mail” with the search key "Cannot send”. Indicates a dependency. If it can be determined that the relationship between the unused key "with photo” and the search key "mail” is not such a dependency, and the unused key "with photo” and the search key "mail” A new question text using the answer unused key is generated when other dependencies are possible between and.
  • the question sentence generation unit 109 refers to the history DB 105b and acquires the question sentence to be edited.
  • the question sentence generation unit 109 acquires the search unused key corresponding to the question sentence in the history DB 105b.
  • the question sentence generation unit 109 determines whether or not the unused key of the search sentence conflicts with each other in the relationship between the search keys of the question sentence to be edited. If there is no conflict, the search unused key is applied to the question text to be edited to generate a new question text.
  • a new question sentence is generated using only the search unused key, but of course, a new question sentence may be generated in combination with the new candidate key.
  • a question sentence may be generated using a new candidate key, and a search unused key may be added to the question sentence to generate a new question sentence.
  • FIG. 8 is a diagram showing a process of generating a new question sentence based on another question sentence in accordance with a process of generating a new question sentence based on one question sentence.
  • the question sentence generation unit 109 refers to the history DB 105b and generates a new question sentence "mail cannot be sent” based on the question sentence "mail is an error". At that time, the new candidate key "cannot be sent” and the difference key "error" are acquired.
  • the question sentence generation unit 109 further performs the same processing as in FIG. 8A when the question sentence "short message is an error" is registered in the question sentence DB 105a. Generates a new question "Short message cannot be sent” based on.
  • the question sentence generation unit 109 refers to the question sentence DB 105a by using the difference key "error” handled when generating the new question sentence "mail cannot be sent", and the question sentence having the search key "error”. To get. Then, when the question sentence has the same syntax as the question sentence "mail is an error", a new question sentence is generated by using the new candidate key "cannot be sent" which was also handled in the previous question sentence generation. ..
  • the domain indicates, for example, a question text or a category in each acquisition key.
  • This domain is defined for each question sentence or acquisition key.
  • a domain is defined for each question sentence.
  • a key DB for defining a key may be separately provided, and a domain may be defined for each key.
  • the question text "mail is an error” is associated with the domain "mail related”.
  • the domain "mail-related" is associated with the question text "short message is an error”.
  • the question sentence "WIFI is an error” is associated with the domain "WIFI related”. Therefore, since the domain of the question sentence "WIFI is an error" is different, a new question sentence is not generated based on this question sentence.
  • FIG. 9 is a flowchart showing the operation of the dialogue system 100 that generates a new question sentence.
  • the sentence acquisition unit 101 acquires the input sentence input by the user (S101).
  • the key acquisition unit 102 acquires the acquisition key and the new candidate key (S102).
  • the search unit 103 searches the question sentence DB 105a using the acquisition key and acquires the question sentence candidate. Then, the presentation unit 104 presents the searched question sentence candidate to the user (S104). If the presented question text candidate is a desired question text, the user indicates that fact, and if not, the user indicates a negative intention, and the search unit 103 searches while exchanging the acquisition key. repeat. Then, when the user obtains the desired question text, the FAQ process ends (S104).
  • the presentation unit 104 stores the input sentence, the acquisition key, the search use key, the new candidate key, the finally arrived question sentence, the search use key, and the difference key in the history DB 105b as the search history. To do. Up to this point, it is a general search process for question sentences.
  • S105 and later are the processes for generating a new question sentence.
  • the new question sentence generation process is started.
  • the new candidate acquisition unit 106 refers to the history DB 105b, selects one question sentence which is an arbitrary search result to be edited, and refers to the record for this one question sentence.
  • the new candidate acquisition unit 106 acquires a new candidate key in the input sentence associated with the one question sentence (S105).
  • the usefulness determination unit 107 determines the usefulness of the new candidate key (S106). As described above, the usefulness determination unit 107 determines whether or not there is a predetermined relationship between the new candidate key and the difference key, and whether or not the new candidate key is useful based on the historical information. , Etc., to determine the usefulness of the new candidate key (S106).
  • the extension processing unit 108 determines the extension method based on the interrogative sentence (S107). For example, the extended processing unit 108 replaces a part of the existing question text with a new candidate key determined to be useful to generate a new question text, or adds a new candidate key to the existing question text. Determines whether to generate a new question or both by adding. The determination may be made by a preset method, or may be determined based on the dependency relationship between the acquisition key and the difference key, and the dependency relationship between the acquisition key and the new candidate key.
  • the question sentence generation unit 109 generates a new question sentence according to the extension method determined by the extension processing unit 108 (S108). Further, the question sentence generation unit 109 refers to the history DB 105b to determine whether or not another question sentence can be extended based on the domain, and if possible, a new question based on the other question sentence. Generate a statement (S109).
  • the dialogue system 100 has a search history including an acquisition key which is a keyword acquired from an input sentence acquired by a user operation, a new candidate key which is an unknown word, and a question sentence which is a response content searched by using the acquisition key.
  • a history DB 105b for storing information is provided.
  • the question sentence generation unit 109 generates a new question sentence based on the search key included in the question sentence and the new candidate key based on the search history information.
  • the question text of the search result associated with the new candidate key in the history DB 105b is described as an edit target, but the present invention is not limited to this, and the search key and the new candidate key are used.
  • a new question may be generated based on a predetermined template.
  • the question sentence generation unit 109 generates a new question sentence by replacing the search key in the question sentence with a new candidate key.
  • the dialogue system 100 further includes a usefulness determination unit 107 for determining the usefulness of the new candidate key.
  • the question sentence generation unit 109 generates a new question sentence using the new candidate key determined to be useful by the usefulness determination unit 107.
  • the usefulness determination unit 107 uses a key not included in the input sentence among the search keys included in the question sentence as a difference key, and the relationship between the difference key and the new candidate key is established. In some cases, the new candidate key is considered useful.
  • the usefulness determination unit 107 determines that the difference key and the new candidate key are related when they are synonyms, belong to the same category, have high similarity, or are word-to-word distances within a predetermined value. ..
  • the usefulness determination unit 107 is based on the dependency relationship between the search use key and the new candidate key used for acquiring the question sentence, and the dependency relationship between the search use key and the difference key. To determine the usefulness of the new candidate key.
  • the usefulness determination unit 107 acquires the frequency of reaching the question sentence to be edited from the input sentence including the new candidate key.
  • the frequency can be acquired based on the information stored in the history DB 105b.
  • the usefulness determination unit 107 determines that the new candidate key is useful based on the above frequency. For example, when the frequency is equal to or higher than a predetermined value, it can be determined that many users are satisfied with the question text from the input text. Therefore, generating a new question sentence based on the new candidate key of the input sentence is a useful question sentence for many users.
  • the usefulness judgment unit 107 uses a key not included in the input sentence as a difference key among the search keys included in the question sentence, and from the input sentence including the new candidate key, the question sentence including the difference key or another The frequency of reaching the question text of is acquired, and the new candidate key is judged to be useful based on the frequency. That is, when focusing on the new candidate key "cannot be sent” and the difference key "error", there is a new candidate key "cannot be sent” in the input sentence regardless of the content of the input sentence and the question sentence obtained from the input sentence, and the question sentence. If there is a difference key "error" in the search key of, the usefulness of the new candidate key is judged based on the frequency with which the question text is obtained instead.
  • the question sentence generation unit 109 generates another new question sentence by using another question sentence in the same domain as the question sentence and the new candidate key. For example, by editing another question text in the same domain (category) using a new candidate key, a new other question text is generated. As a result, the generation of new question sentences can be efficiently extended.
  • the search unit 103 searches for a question sentence based on a plurality of acquisition keys acquired from the input sentence acquired by the user operation, and history together with the search unused key and the like that were not used in the search. Store in DB105b.
  • the question sentence generation unit 109 generates a new response content by using the search unused key that was not used for the search among the plurality of acquisition keys.
  • the unused search key is considered to be an important key in obtaining the question text.
  • each functional block may be realized by using one device that is physically or logically connected, or directly or indirectly (for example, by using two or more physically or logically separated devices). , Wired, wireless, etc.) and may be realized using these plurality of devices.
  • the functional block may be realized by combining the software with the one device or the plurality of devices.
  • Functions include judgment, decision, judgment, calculation, calculation, processing, derivation, investigation, search, confirmation, reception, transmission, output, access, solution, selection, selection, establishment, comparison, assumption, expectation, and assumption.
  • broadcasting notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, assigning, etc., but only these. I can't.
  • a functional block that functions transmission is called a transmitting unit (transmitting unit) or a transmitter (transmitter).
  • transmitting unit transmitting unit
  • transmitter transmitter
  • the dialogue system 100 in one embodiment of the present disclosure may function as a computer that performs a question sentence generation method in the dialogue processing of the present disclosure.
  • FIG. 10 is a diagram showing an example of the hardware configuration of the dialogue system 100 according to the embodiment of the present disclosure.
  • the above-mentioned dialogue system 100 may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the word “device” can be read as a circuit, device, unit, etc.
  • the hardware configuration of the dialogue system 100 may be configured to include one or more of the devices shown in the figure, or may be configured not to include some of the devices.
  • the processor 1001 For each function in the dialogue system 100, by loading predetermined software (program) on hardware such as the processor 1001 and the memory 1002, the processor 1001 performs an operation and controls communication by the communication device 1004, or the memory 1002. And by controlling at least one of reading and writing of data in the storage 1003.
  • predetermined software program
  • the processor 1001 operates, for example, an operating system to control the entire computer.
  • the processor 1001 may be configured by a central processing unit (CPU: Central Processing Unit) including an interface with peripheral devices, a control device, an arithmetic unit, a register, and the like.
  • CPU Central Processing Unit
  • the above-mentioned sentence acquisition unit 101, key acquisition unit 102, search unit 103, new candidate acquisition unit 106, usefulness determination unit 107, extension processing unit 108, question sentence generation unit 109, and the like are realized by the processor 1001. May be good.
  • the processor 1001 reads a program (program code), a software module, data, etc. from at least one of the storage 1003 and the communication device 1004 into the memory 1002, and executes various processes according to these.
  • a program program that causes a computer to execute at least a part of the operations described in the above-described embodiment is used.
  • the new candidate acquisition unit 106 and the like of the dialogue system 100 may be realized by a control program stored in the memory 1002 and operating in the processor 1001, and may be realized in the same manner for other functional blocks.
  • Processor 1001 may be implemented by one or more chips.
  • the program may be transmitted from the network via a telecommunication line.
  • the memory 1002 is a computer-readable recording medium, and is composed of at least one such as a ROM (Read Only Memory), an EPROM (Erasable Programmable ROM), an EPROM (Electrically Erasable Programmable ROM), and a RAM (Random Access Memory). May be done.
  • the memory 1002 may be referred to as a register, a cache, a main memory (main storage device), or the like.
  • the memory 1002 can store a program (program code), a software module, or the like that can be executed to implement the interactive processing method according to the embodiment of the present disclosure.
  • the storage 1003 is a computer-readable recording medium, and is, for example, an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, a magneto-optical disk (for example, a compact disk, a digital versatile disk, or a Blu-ray). It may consist of at least one (registered trademark) disk), smart card, flash memory (eg, card, stick, key drive), floppy (registered trademark) disk, magnetic strip, and the like.
  • the storage 1003 may be referred to as an auxiliary storage device.
  • the storage medium described above may be, for example, a database, server or other suitable medium containing at least one of memory 1002 and storage 1003.
  • the communication device 1004 is hardware (transmission / reception device) for communicating between computers via at least one of a wired network and a wireless network, and is also referred to as, for example, a network device, a network controller, a network card, a communication module, or the like.
  • the communication device 1004 includes, for example, a high frequency switch, a duplexer, a filter, a frequency synthesizer, and the like in order to realize at least one of frequency division duplex (FDD: Frequency Division Duplex) and time division duplex (TDD: Time Division Duplex). It may be composed of.
  • FDD Frequency Division Duplex
  • TDD Time Division Duplex
  • It may be composed of.
  • the above-mentioned sentence acquisition unit 101, presentation unit 104, and the like may be realized by the communication device 1004.
  • the text acquisition unit 101 and the presentation unit 104 may be physically or logically separated from each other, or may be the same implementation.
  • the input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, etc.) that receives an input from the outside.
  • the output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that outputs to the outside.
  • the input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).
  • each device such as the processor 1001 and the memory 1002 is connected by the bus 1007 for communicating information.
  • the bus 1007 may be configured by using a single bus, or may be configured by using a different bus for each device.
  • the dialogue system 100 includes hardware such as a microprocessor, a digital signal processor (DSP: Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array). It may be configured, and the hardware may realize a part or all of each functional block. For example, processor 1001 may be implemented using at least one of these hardware.
  • DSP Digital Signal Processor
  • ASIC Application Specific Integrated Circuit
  • PLD Programmable Logic Device
  • FPGA Field Programmable Gate Array
  • information notification includes physical layer signaling (for example, DCI (Downlink Control Information), UCI (Uplink Control Information)), higher layer signaling (for example, RRC (Radio Resource Control) signaling, MAC (Medium Access Control) signaling, etc. It may be carried out by notification information (MIB (Master Information Block), SIB (System Information Block)), other signals, or a combination thereof.
  • RRC signaling may be called an RRC message, and may be, for example, an RRC connection setup (RRC Connection Setup) message, an RRC connection reconfiguration (RRC Connection Reconfiguration) message, or the like.
  • Each aspect / embodiment described in the present disclosure includes LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G (4th generation mobile communication system), and 5G (5th generation mobile communication).
  • system FRA (Future Radio Access), NR (new Radio), W-CDMA (registered trademark), GSM (registered trademark), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi (registered trademark)) )), LTE 802.16 (WiMAX®), IEEE 802.20, UWB (Ultra-WideBand), Bluetooth®, and other systems that utilize suitable systems and have been extended based on these. It may be applied to at least one of the next generation systems. Further, a plurality of systems may be applied in combination (for example, a combination of at least one of LTE and LTE-A and 5G).
  • the input / output information and the like may be stored in a specific location (for example, memory) or may be managed using a management table. Input / output information and the like can be overwritten, updated, or added. The output information and the like may be deleted. The input information or the like may be transmitted to another device.
  • the determination may be made by a value represented by 1 bit (0 or 1), by a boolean value (Boolean: true or false), or by comparing numerical values (for example, a predetermined value). It may be done by comparison with the value).
  • the notification of predetermined information (for example, the notification of "being X") is not limited to the explicit one, but is performed implicitly (for example, the notification of the predetermined information is not performed). May be good.
  • Software is an instruction, instruction set, code, code segment, program code, program, subprogram, software module, whether called software, firmware, middleware, microcode, hardware description language, or another name.
  • Applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, procedures, features, etc. should be broadly interpreted to mean.
  • software, instructions, information, etc. may be transmitted and received via a transmission medium.
  • a transmission medium For example, a website that uses at least one of wired technology (coaxial cable, fiber optic cable, twist pair, digital subscriber line (DSL: Digital Subscriber Line), etc.) and wireless technology (infrared, microwave, etc.) When transmitted from a server, or other remote source, at least one of these wired and wireless technologies is included within the definition of transmission medium.
  • data, instructions, commands, information, signals, bits, symbols, chips, etc. may be voltage, current, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. It may be represented by a combination of.
  • a channel and a symbol may be a signal (signaling).
  • the signal may be a message.
  • the component carrier CC: Component Carrier
  • CC Component Carrier
  • system and “network” used in this disclosure are used interchangeably.
  • MS Mobile Station
  • UE User Equipment
  • Mobile stations can be subscriber stations, mobile units, subscriber units, wireless units, remote units, mobile devices, wireless devices, wireless communication devices, remote devices, mobile subscriber stations, access terminals, mobile terminals, wireless, depending on the trader. It may also be referred to as a terminal, remote terminal, handset, user agent, mobile client, client, or some other suitable term.
  • determining and “determining” used in this disclosure may include a wide variety of actions.
  • “Judgment” and “decision” are, for example, judgment (judging), calculation (calculating), calculation (computing), processing (processing), derivation (deriving), investigation (investigating), search (looking up, search, inquiry). It may include (eg, searching in a table, database or another data structure), ascertaining as “judgment” or “decision”.
  • judgment and “decision” are receiving (for example, receiving information), transmitting (for example, transmitting information), input (input), output (output), and access. (Accessing) (for example, accessing data in memory) may be regarded as “judgment” or “decision”.
  • judgment and “decision” mean that “resolving”, “selecting”, “choosing”, “establishing”, “comparing”, etc. are regarded as “judgment” and “decision”. Can include. That is, “judgment” and “decision” may include that some action is regarded as “judgment” and “decision”. Further, “judgment (decision)” may be read as “assuming”, “expecting”, “considering” and the like.
  • connection means any direct or indirect connection or connection between two or more elements, and each other. It can include the presence of one or more intermediate elements between two “connected” or “combined” elements.
  • the connection or connection between the elements may be physical, logical, or a combination thereof.
  • connection may be read as "access”.
  • the two elements use at least one of one or more wires, cables and printed electrical connections, and, as some non-limiting and non-comprehensive examples, the radio frequency domain. Can be considered to be “connected” or “coupled” to each other using electromagnetic energies having wavelengths in the microwave and light (both visible and invisible) regions.
  • the term "A and B are different” may mean “A and B are different from each other”.
  • the term may mean that "A and B are different from C”.
  • Terms such as “separate” and “combined” may be interpreted in the same way as “different”.
  • 100 ... Dialogue system, 101 ... Sentence acquisition unit, 102 ... Key acquisition unit, 103 ... Search unit, 104 ... Presentation unit, 105 ... Storage unit, 105a ... Question text DB, 105b ... History DB, 106 ... New candidate acquisition unit, 107 ... Usefulness judgment unit, 108 ... Extended processing unit, 109 ... Question sentence generation unit.

Abstract

本発明は、適切な応答内容を追加することができる対話システムを提供することを目的とする。 対話システム100は、ユーザ操作により取得された入力文章から取得されたキーワードである取得キーおよび未知語である新規候補キー、取得キーを用いて検索された応答内容である質問文を含む検索履歴情報を記憶する履歴DB105bを備える。そして、質問文生成部109は、検索履歴情報に基づいて、質問文に含まれる検索キーと、新規候補キーとに基づいて、新たな質問文を生成する。

Description

対話システム
 本発明は、ユーザと対話を行う対話システムに関する。
 下記特許文献1には、自然文で記述された質問への回答の出力を制御し、顧客の質問の意図に合致しない回答を選択するリスクを回避することや、回答の絞り込みを効率的に処理するための質問回答制御プログラムについての記載がある。
特開2015-36945号公報
 特許文献1に記載されているキーワードベースでの検索処理を行う技術においては、ユーザの入力から適切にキーワードを取得するために、キーワードを拡張し、その拡張に応じて回答候補を追加することが重要である。しかしながら、キーワードの拡張に応じて回答候補を追加すると、不適切な回答候補を含む場合があり、目的に合致しない回答へ導くという問題が生ずる。
 そこで、上述の課題を解決するために、本発明は、適切な応答内容を追加することができる対話システムを提供することを目的とする。
 本発明の対話システムは、ユーザ操作により取得された入力文章から取得されたキーワードである取得キーおよび未知語である新規候補キー、並びに前記取得キーにより検索された応答内容を含む一の検索履歴情報を取得する取得部と、前記一の検索履歴情報に基づいて、前記応答内容に含まれる検索キーと、前記新規候補キーとに基づいて、新たな応答内容を生成する生成部と、を備える。
 この発明によれば、検索キーと新規候補キーを用いて、適切な応答内容を追加することができる。よって、対話回数を削減することができる。
 本発明によると、適切な応答内容を追加することで、対話回数を削減することができる。
本実施形態の対話システム100の機能構成を示すブロック図である。 質問文DB105aおよび履歴DB105bの具体例を示す図である。 新規質問文生成処理を模式的に示した図である。 新規候補キーの追加に関する具体的な処理を示す図である。 検索キーと新規候補キーとの係り受けを考慮した判断処理を模式的に示す図である。 対象となる質問文に到達した頻度に基づいて新規候補キーの有用性を判断することを示す図である。 検索未利用キーを用いた新規質問文生成処理を示す模式図である。 一の質問文に基づいた新規質問文の生成処理にあわせて、他の質問文に基づいた新規質問文の生成処理を示す図である。 新規質問文生成を行う対話システム100の動作を示すフローチャートである。 本開示の一実施の形態に係る対話システム100のハードウェア構成の一例を示す図である。
 添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
 図1は、本実施形態の対話システム100の機能構成を示すブロック図である。この対話システム100は、ユーザにより入力された文章に対して対話応答するシステムである。本実施形態における対話システム100は、FAQシステムとして機能し、ユーザにより入力された文章に基づいて、対話処理(検索結果の提示およびそれに対する指示)をしながらユーザが希望する質問文およびその回答を提示する。
 図に示されるとおり、対話システム100は、文章取得部101、キー取得部102、検索部103、提示部104、記憶部105,新規候補取得部106、有用性判断部107、拡張処理部108、および質問文生成部109を含んで構成されている。
 文章取得部101は、ユーザが入力した入力文章を取得する部分である。ユーザが操作するユーザ端末からネットワークを介して送信された入力文章を取得してもよいし、直接キーボード等から入力された入力文章を取得してもよい。
 キー取得部102は、入力文章を形態素解析など、公知の自然言語処理を行うことにより、単語単位に分割し、分割した単語のうち、キーDB(図示せず)に登録されているキーを、取得キーとして取得する部分である。キーDBは、あらかじめ質問文を形態素解析などして単語であるキーを抜き出したデータベースである。キー取得部102は、取得キーのほか、未知語となる新規候補キーを取得する。新規候補キーは、キーDBに登録されていないキーである。
 取得キーは、検索利用キーと、検索未利用キーとがあり、検索利用キーは後述する質問文検索に用いられるキーである。検索未利用キーは、質問文検索に用いられなかったキーである。対話システム100は、ユーザと対話をしながら質問文を検索して、絞り込む処理を行う。したがって、最終的な質問文を得るにあたって、利用されなかったキーがあり得る。
 検索部103は、キー取得部102により取得された取得キーを用いて、質問文DB105aを参照し、質問文の検索を行う部分である。
 提示部104は、検索部103が検索した質問文を、質問文候補としてユーザに提示する部分である。提示は、ユーザのユーザ端末に、質問文をネットワークを介して送信することにより行ってもよいし、ディスプレイなどに質問文を表示してもよい。提示部104は、最終的に提示した質問文のほか、検索に用いた検索利用キー、検索に用いられなかった検索未利用キー、新規候補キー等を履歴DB105bに検索履歴情報として記憶する。
 検索部103と提示部104とは、連携をして、ユーザに対して検索した複数の質問文を順次、ユーザに提示することなどを行い、それに対するユーザ指示(肯定又は否定)を受け付けることにより、対話処理を行う。そして、検索部103および提示部104は、一またはいくつかの質問文に絞り込むことができる。
 記憶部105は、質問文DB105aと履歴DB105bとを記憶する。図2(a)に示されるように、質問文DB105aは、検索対象である質問文、質問文の検索に用いられ、当該質問文を含まれる検索キー、質問文に対する回答を記述する。本実施形態においては、後述するように、質問文DB105aに、新規の質問文が追加される。
 履歴DB105bは、ユーザが質問文の検索に用いた情報を記憶する部分である。図2(b)に示されるように、履歴DB105bは、入力文章、取得キー、未利用キー、新規候補キー、到達した質問文、検索に用いた検索利用キーを対応付けて記述する。
 新規候補取得部106は、履歴DB105bを参照して、検索利用キー、検索未利用キー、新規候補キーおよびそれに対応する質問文(編集対象質問文)を取得する部分である。
 有用性判断部107は、履歴DB105bを参照して、新規候補キーの有用性を判断する部分である。本実施形態において、新規候補キーに有用性がある場合とは、新規候補キーが、後述する差分キーと関連性があるか、または新規候補キーから差分キーに至った頻度が所定数以上であったかなどに基づく。詳細判断については図を用いて後述する。
 また、有用性判断部107は、質問文DB105aまたはキーDBを参照して、データ解析することで、言語的な関連性およびカテゴリーなどを判断する。また、有用性判断部107は、必要に応じて自然言語処理のためのデータ(コーパス)を有しており、言語的な関連性をも判断することができる。例えば、単語同士の係り受けが同じであるか否かを判断できる。 拡張処理部108は、編集対象質問文に対する拡張方式を決定する部分である。例えば、拡張処理部108は、有用性有りと判断された内容に応じて、編集対象質問文の一部を、有用性有りと判断された新規候補キーに入替える方式、編集対象質問文に付け足す形で、新規候補キーを追加する方式、またはその両方の方式を決定する部分である。例えば、拡張処理部108は、新規候補キーが差分キーと類義語である場合、新規候補キーは有用性有りと判断し、その場合、差分キーと新規候補キーとを入替えることで質問文を生成する。拡張処理部108は、この処理に先立って、有用性有りと判断される内容と、質問文生成の方式とを予め紐付けておく。
 質問文生成部109は、決定した拡張方式に従って、編集対象質問文から新規の質問文を生成する部分である。生成に際して、新規候補キーの意味に内容に応じて、助詞等を適宜変えてもよい。なお、質問文生成部109は、編集対象質問文のほかに、同じドメイン(カテゴリ)において、同じ新規候補キーがあった場合に、同様の生成処理を行う。その処理を行うために、質問文DB105aまたは履歴DB105bは、質問文に対応付けてドメインを記憶する。
 質問文生成部109は、生成した親近質問文を質問文DB105aに登録する。これにより、新規の質問文を利用した対話を可能にする。質問文生成部109は、新規の質問文に対応する検索キーを、キーDBなどを参照して、新たに生成する。また、編集対象質問文に対応付けられている検索キーを一部流用することもできる。また、新規の質問文に対応する回答は、編集対象の質問文に対応する回答が、そのまま紐付けられる。
 つぎに、本実施形態の新規質問文生成処理について説明する。図3は、新規質問文生成処理を模式的に示した図である。図3(a)は、入力文章、取得キー、および新規候補キーを示す。
 質問文検索時において、キー取得部102は、入力文章から、取得キーおよび新規候補キーを取得し、検索部103および提示部104は、取得キーに基づいて、質問文の検索処理を行い、ユーザに対して検索結果(質問文候補)を提示し、ユーザの意図に沿った質問文であるか否かを問う。検索および提示を繰り返すことによる対話処理を繰り返して、最終的に質問文に到達した場合、提示部104は、履歴DB105bに、入力文章、取得キー、検索未利用キー、新規候補キー、質問文、および検索利用キーを記憶する。
 図3(a)においては、キー取得部102は、入力文章「写真付きのメールが送れない」から、取得キー「メール」、取得キー「写真」、新規候補キー「送れない」を取得する。そして、図3(a)において、取得キー「写真」は、検索に利用されなかったキーとして、検索未利用キーとして、区別される。以降、検索未利用キー「写真」とする。
 図3(b)は、検索結果およびその検索された質問文に対応付けられる検索キーを示す。図3(b)においては、対話システム100による対話処理(検索部および提示部)に従って、検索結果:質問文「メールがエラー」が取得される。
 そして、これら一蓮の検索に用いられた入力文章、取得キー、検索未利用キー、新規候補キー、質問文、および検索利用キーが履歴DB105bに記憶される。
 図3(c)は、新規に生成された新規質問文およびその質問文に含まれる検索キーを示す。この例示では、新規質問文「メールが送れない」、検索キー「メール」「送れない」が生成されることになる。質問文生成部109は、履歴DB105bを参照して、編集対象となる編集対象質問文を抜き出し、それに対応する検索未利用キー等を利用して編集することで、新たな質問文を生成する。
 図3(c)では、質問文生成部109は、履歴DB105bに記憶されている検索結果:質問文「メールがエラー」を編集対象質問文(図3(b))として取得する。そして、質問文生成部109は、その検索キー「エラー」に代えて、履歴DB105bに記憶されている新規候補キー「送れない」を追加して、新規質問文「メールが送れない」を生成する。
 この新規候補キーの追加に関する具体的な処理について、図4を用いて説明する。図4(a)は、入力文章「写真付きのメールが送れない」、取得キー「メール」、検索未利用キー「写真」、および新規候補キー「送れない」を示す。図4(b)は、取得キーに基づいて、検索された検索結果:質問文候補「メールがエラー」、その質問文に含まれる検索キー「メール」「エラー」を示す。
 有用性判断部107は、検索結果の質問文の検索キーから、入力文章に含まれていないキーを差分キーとして取得する。そして、有用性判断部107は、差分キーと、検索未利用キーおよび新規候補キーとのそれぞれとの関連性を判断する。図4においては、有用性判断部107は、検索キー「エラー」が入力文章に含まれていないキーであることから、これを差分キー「エラー」とする。そして、有用性判断部107は、差分キー「エラー」と検索未利用キー「写真」との関連性、および検索キー「エラー」と新規候補キー「送れない」との関連性を、それぞれ判断する。
 ここでは、有用性判断部107は、新規候補キー「送れない」が、差分キー「エラー」の類似語であると判断して、関連性があると判断する。一方で、有用性判断部107は、検索未利用キー「写真」と、差分キー「エラー」とは、ゆらぎ、類似語、同義語の何れでもないため、関連性はないと判断する。
 なお、ゆらぎ等以外にも、差分キーと新規候補キーとの間のワード間距離に基づいて関連性を判断してもよい。ワード間距離は、ワード(単語)が有する特徴ベクトルの距離に基づいて計算される。これらは公知技術であり、例えば、Word2Vecなどが知られている。
 質問文生成部109は、有用性判断部107で関連性有りと判断した新規候補キーを用いて新たな質問文を生成する。
 図5は、検索キーと、新規候補キーとの関連性を判断する上で、係り受けを考慮した判断処理を模式的に示す図である。図に示されるとおり、有用性判断部107は、入力文章における取得キー「メール」および新規候補キー「送れない」と、検索結果である質問文の検索キー「メール」および差分キー「エラー」とは、同じ係り受けであるか否かを判断する。有用性判断部107は、図5の例においては、自然言語処理を行うためのデータ(コーパスなど)を利用して、いずれのキーも「メール」の状態を説明する用語であることを判断し、同じ係り受けであると判断する。
 図6は、対象となる質問文に到達した頻度に基づいて新規候補キーの有用性を判断することを示す図である。図6(a)は、検索結果:質問文とその検索キーを示す。図においては、質問文「メールがエラー」、検索キー「メール」「エラー」が示されている。
 図6(b)は、入力文章(検索利用キーおよび新規候補キーを含む)と、この入力文章から図6(a)の質問文に到達した頻度を示す。図6(b)においては、頻度が20件と示されている。有用性判断部107は、履歴DB105bを参照して、検索結果から編集対象となる一の質問文を抜き出し、それに対応する新規候補キーを取り出す。そして、この新規候補キーの履歴DB105bに登録されている件数を計数する。
 例えば、有用性判断部107は、履歴DB105bから、一の質問文「メールがエラー」を編集対象として選択し、それに対応する新規候補キー「送れない」を取り出す。そして、この新規候補キー「送れない」の履歴DB105bの登録数を計数する。この数は、新規候補キー「送れない」を含む入力文章のそれぞれから一の質問文「メールがエラー」に到達した頻度に相当する。
 有用性判断部107は、この頻度が所定値以上である場合には、この入力文章における新規候補キーは、有用性有りと判断する。そして、質問文生成部109は、この新規候補キーと編集対象となる一の質問文とに基づいて、新規質問文を生成する。なお、有用性の判断に際しては、入力文章が同じである必要は無い。最終的な到達した質問文における検索キーと、その質問文の起点となる入力文章の新規候補キーとが一致した頻度に基づいて当該新規候補キーの有用性を判断すればよい。
 頻度のほか、同じ入力文章(または同じ新規候補キー)の頻度に対して、同じ質問文に到達した検索件数が一定の割合以上であった場合、その入力文章の新規候補キーは有用性有りと判断してもよい。
 また、質問文の到達時における新規候補キーの入れ替わりの頻度に基づいて、その新規候補キーの有用性を判断してもよい。例えば、有用性判断部107は、履歴DB105bから、一の編集対象となる検索結果の質問文「メールがエラー」を選択する。そして、それに対応する取得キー「メール」および新規候補キー「送れない」を含んだ入力文章「メールが送れない」、およびその差分キー「エラー」を取り出す。
 有用性判断部107は、この差分キー「エラー」のみに着目し、履歴DB105bにおいて、新規候補キー「送れない」から差分キー「エラー」を含むレコードの数を計数する。
 このように新規候補キーから差分キーに入れ替わったということは、例えば、入力文章「メールが送れない」から、検索結果:質問文「メールがエラー」に到達した場合のほか、入力文章「メールが送れない」から、検索結果:質問文「WIFIがエラー」に到達した場合などを含む。
 本例では、検索結果として質問文「メールがエラー」に20回到達した場合があり、また別の検索結果として、質問文「WIFIのエラー」に10回到達した場合があったとする。
 この場合、有用性判断部107は、新規候補キー「送れない」に対して、差分キー「エラー」に入れ替わった頻度が30回と計数することができる。
 質問文生成部109は、この新規候補キーを使って、編集対象となる質問文に基づいて、新規の質問文を生成する。
 このように、他の取得キーを考慮せずに、新規候補キーのみに着目して、新規候補キーが入れ替わった総件数に基づいて、新規候補キーの有効性を判断してもよい。上記の場合、所定頻度以上、例えば30回以上の入れ替わりが発生した場合には、その入れ替わりのもとになった新規候補キーを有効と判断する。
 また、質問文生成部109は、編集対象となる質問文として、差分キー「エラー」に紐づく質問文を取り出し、この質問文に基づいて、新規質問文の生成を行うようにしてもよい。
 つぎに、検索未利用キーを用いた新規質問文を生成する処理について説明する。図7は、検索未利用キーを用いた新規質問文生成処理を示す模式図である。図7(a)に示されるとおり、入力文章「写真付きのメールについて」から、取得キー「メール」および「写真付き」が取得される。検索利用キー「メール」は検索に利用されたキーであり、検索未利用キー「写真付き」は、結果的に質問文の検索には利用されなかったキーである。
 そして、この例示において、検索結果として、質問文「メールが送れない」に到達したとする。この質問文においては、検索キー「メール」「送れない」が紐付けられている。
 図7(b)では、検索未利用キー「写真付き」を用いた新規質問文の生成が示される。検索未利用キー「写真付き」が、他の検索キーと係り受けが競合しない場合、この検索未利用キーを用いた新規質問文の生成が行われる。
 例えば、質問文「メールが送れない」に対して、検索キー「送れない」と検索キー「メール」との間の係り受けは、検索キー「メール」を、検索キー「送れない」で説明している係り受けを示している。回答未利用キー「写真付き」と検索キー「メール」との係り受けの関係が、そのような係り受けではないと判断できる場合、また、回答未利用キー「写真付き」と検索キー「メール」との間で、その他の係り受けが可能となる場合に、回答未利用キーを用いた新規質問文が生成される。
 図7(b)の例では、回答未利用キー「写真付き」を「メール」の修飾語としての係り受けが可能であることから、新規質問文「写真付きのメールが送れない」が生成される。また、その際、検索キーとして、「写真付き」「メール」「送れない」が取り出され、質問文DB105aに登録される。
 技術的処理としては以下の通りとなる。質問文生成部109は、質問文生成に際して、履歴DB105bを参照して編集対象となる質問文を取得する。質問文生成部109は、履歴DB105bにおいてその質問文に対応する検索未利用キーを取得する。質問文生成部109は、その検索未利用キーが、編集対象となる質問文の各検索キー同士の関係において、係り受けが競合しないか否かを判断する。競合しない場合には、その検索未利用キーを用いて編集対象となる質問文に適用して、新規質問文を生成する。
 なお、ここでは、検索未利用キーのみを用いて新規質問文を生成しているが、当然に、新規候補キーと組み合わせて新規質問文を生成してもよい。例えば、新規候補キーを用いて質問文を生成し、さらにその質問文に、検索未利用キーを追加して新規質問文を生成してもよい。
 つぎに、ある質問文に基づいて新規質問文を生成した際において、他の質問文もあわせて同様の形で新規質問文を生成するときの処理について説明する。図8は、一の質問文に基づいた新規質問文の生成処理にあわせて、他の質問文に基づいた新規質問文の生成処理を示す図である。
 図8(a)に示されるように、質問文生成部109は、履歴DB105bを参照して、質問文「メールがエラー」に基づいて、新規質問文「メールが送れない」を生成する。その際、新規候補キー「送れない」、差分キー「エラー」が取得される。
 そして、質問文生成部109は、さらに、図8(b)に示されるように、質問文DB105aに質問文「ショートメッセージがエラー」が登録されていた場合、図8(a)と同様の処理に基づいて、新規質問文「ショートメッセージが送れない」を生成する。
 これは、質問文DB105aにおける質問文に含まれている検索キー「エラー」が、他の質問文においても、共通していることから、同様のルールで、新規質問文が生成される。
 すなわち、質問文生成部109は、新規質問文「メールが送れない」を生成する際に扱った差分キー「エラー」を用いて、質問文DB105aを参照し、検索キー「エラー」がある質問文を取得する。そして、その質問文において、質問文「メールがエラー」と同様の構文をとる場合には、同様に先の質問文生成に扱った新規候補キー「送れない」を用いて新規質問文を生成する。
 なお、質問文または取得キーのドメインが共通していることが重要である。例えば、同じ「エラー」という用語が入っていても、ドメインが異なっている場合には、そのまま新規候補キーを適用することはそぐわないため、その場合には、新規質問文を生成することはしない。
 ドメインは、例えば質問文または各取得キーにおけるカテゴリを示す。このドメインは、質問文または取得キーごとに定義づけられており、例えば、質問文DB105aに、質問文ごとにドメインが定義づけられている。なお、キーを定義するキーDBを別途備え、キーごとにドメインを定義づけてもよい。上記の例においては、質問文「メールがエラー」は、ドメイン「メール関連」が対応付けられている。また、質問文「ショートメッセージがエラー」は、ドメイン「メール関連」が対応付けられている。一方、で、例えば質問文「WIFIがエラー」は、ドメイン「WIFI関連」が対応付けられている。したがって、質問文「WIFIがエラー」は、ドメインが異なるため、この質問文に基づいた新規質問文の生成は行われない。
 つぎに、このように構成された対話システム100の処理について説明する。図9は、新規質問文生成を行う対話システム100の動作を示すフローチャートである。
 文章取得部101は、ユーザにより入力された入力文章を取得する(S101)。キー取得部102は、取得キーおよび新規候補キーを取得する(S102)。検索部103は、取得キーを用いて質問文DB105aを検索して、質問文候補を取得する。そして、提示部104は、検索した質問文候補をユーザに提示する(S104)。ユーザは、提示された質問文候補が、希望の質問文である場合には、その旨を、そうではない場合には、否定の意図を示し、検索部103は、取得キーを入替えながら検索を繰り返す。そして、ユーザが希望の質問文を得た場合には、FAQ処理が終了となる(S104)。この終了の処理に伴って、提示部104は、検索履歴として、入力文章、取得キー、検索利用キー、新規候補キー、最終的に到達した質問文、検索利用キー、差分キーを履歴DB105bに記憶する。ここまでは、一般的な、質問文の検索処理である。
 S105以降が、新規質問文生成のための処理である。対話システム100のオペレータが任意に操作を行うことにより、新規質問文生成処理がスタートする。本例では、まず、新規候補取得部106は、履歴DB105bを参照して、編集対象となる任意の検索結果である一の質問文を選択し、この一の質問文に対するレコードを参照する。そして、新規候補取得部106は、その一の質問文に対応付けられている入力文章における新規候補キーを取得する(S105)。
 有用性判断部107は、新規候補キーの有用性を判断する(S106)。上述したとおり、有用性判断部107は、新規候補キーと、差分キーとの間で、所定の関連性があるか否か、また新規候補キーが履歴情報に基づいて有用性があるか否か、などに基づいて、新規候補キーの有用性を判断する(S106)。
 有用性があると判断されると、拡張処理部108は、質問文に基づいた拡張方法を決定する(S107)。例えば、拡張処理部108は、既存の質問文の一部を、有用性ありと判断された新規候補キーと入替えて新規質問文を生成するか、または既存の質問文に付け足す形で新規候補キーを追加することで、新規質問文を生成するか、またはその両方を行うか、を決定する。決定は、予め設定した方法としてもよいし、または、取得キーと差分キーとの係り受け関係、取得キーと新規候補キーとの係り受け関係に基づいて定めてもよい。
 質問文生成部109は、拡張処理部108により決定された拡張方法に従って新規質問文を生成する(S108)。さらに、質問文生成部109は、履歴DB105bを参照して、他の質問文を拡張できるか否かを、そのドメインに基づいて判断し、可能であれば、他の質問文に基づいて新規質問文を生成する(S109)。
 つぎに、本実施形態の対話システム100の作用効果について説明する。この対話システム100は、ユーザ操作により取得された入力文章から取得されたキーワードである取得キーおよび未知語である新規候補キー、取得キーを用いて検索された応答内容である質問文を含む検索履歴情報を記憶する履歴DB105bを備える。そして、質問文生成部109は、検索履歴情報に基づいて、質問文に含まれる検索キーと、新規候補キーとに基づいて、新たな質問文を生成する。
 これにより、適切な質問文を生成することができる。したがって、この質問文を利用した適切な検索を行うことができ、対話回数を削減することができる。また、対話システムの処理負荷を軽減することができる。ユーザ端末が対話システム100とネットワークを介して対話する場合には、そのネットワークのトラフィックを軽減することもできる。上記実施形態では、履歴DB105bにおいて新規候補キーに対応付けられている検索結果の質問文が編集対象として説明しているが、これに限るものではなく、検索キーと、新規候補キーとを用いて、所定のテンプレートに基づいて、新規の質問文を生成してもよい。
 また、対話システム100において、質問文生成部109は、質問文における検索キーを新規候補キーに置き換えることで、新たな質問文を生成する。
 また、対話システム100は、新規候補キーの有用性を判断する有用性判断部107をさらに備える。質問文生成部109は、 有用性判断部107により有用性があると判断された新規候補キーを用いて新たな質問文を生成する。
 これにより、適切な新規候補キーを選択して、それを用いた質問文を生成することができる。したがって、目的に合致しない質問文を生成することを防止することができる。
 また、対話システム100において、有用性判断部107は、質問文に含まれる検索キーのうち、入力文章に含まれていないキーを、差分キーとし、当該差分キーと新規候補キーとの関連性がある場合には、新規候補キーは有用性ありと判断する。
 例えば、有用性判断部107は、差分キーと新規候補キーとが、類義語、同じカテゴリに属する、類似度が高い、または所定値以内のワード間距離である場合には、関連性ありと判断する。
 これにより、適切な新規候補キーを選択することができる。
 また、対話システム100において、有用性判断部107は、質問文の取得に用いられた検索利用キーと新規候補キーとの係り受け関係と、検索利用キーと差分キーとの係り受け関係とに基づいて、新規候補キーの有用性を判断する。
 これにより、同じ係り受けである新規候補キーを選択することができ、より適切な新規候補キーを選択でき、よって、目的に合致した適切な質問文を新規に生成することができる。
 また、対話システム100は、有用性判断部107は、新規候補キーを含んだ入力文章から、編集対象となる質問文へ到達した頻度を取得する。なお、上記実施形態では履歴DB105bに記憶されている情報に基づいて、上記頻度を取得することができる。そして、有用性判断部107は、上記頻度に基づいて、当該新規候補キーを、有用性ありと判断する。例えば、その頻度が所定値以上である場合には、多くのユーザが、その入力文章からの質問文に納得したものと判断できる。よって、その入力文章の新規候補キーに基づいた新規質問文を生成することは、多くのユーザにとって有用な質問文となる。
 また、有用性判断部107は、質問文に含まれる検索キーのうち、入力文章に含まれていないキーを、差分キーとし、新規候補キーを含む入力文章から、差分キーを含む質問文または他の質問文へ到達した頻度を取得し、当該頻度に基づいて、当該新規候補キーを、有用性ありと判断する。すなわち、新規候補キー「送れない」、差分キー「エラー」に着目した場合、入力文章およびそこから得た質問文の内容にかかわらず、入力文章に新規候補キー「送れない」があり、質問文の検索キーに、差分キー「エラー」があった場合、その入れ替わって質問文が得られた頻度に基づいて、新規候補キーの有用性を判断する。
 また、対話システム100において、質問文生成部109は、質問文と同じドメインにある他の質問文と、新規候補キーとを用いて、他の新たな質問文を生成する。例えば、同じドメイン(カテゴリ)の他の質問文を、新規候補キーを用いた編集を行うことで、新たな他の質問文を生成する。これにより、新規質問文の生成を、効率的に拡張することができる。
 また、対話システム100において、検索部103は、ユーザ操作により取得された入力文章から取得された複数の取得キーに基づいて質問文を検索し、検索に用いられなかった検索未利用キー等とともに履歴DB105bに記憶する。質問文生成部109は、複数の取得キーのうち、検索に使われなかった検索未利用キーを用いて、新たな応答内容を生成する。
 これにより、新規候補キーにかぎらず、新たな質問文を生成することができる。検索未利用キーは、その質問文を得るに際して、重要なキーであると考えられる。
 上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
 機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
 例えば、本開示の一実施の形態における対話システム100などは、本開示の対話処理における質問文生成方法を行うコンピュータとして機能してもよい。図10は、本開示の一実施の形態に係る対話システム100のハードウェア構成の一例を示す図である。上述の対話システム100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話システム100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 対話システム100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の文章取得部101、キー取得部102、検索部103、新規候補取得部106、有用性判断部107、拡張処理部108、質問文生成部109はなどは、プロセッサ1001によって実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、対話システム100の新規候補取得部106等は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る対話処理方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の文章取得部101、提示部104などは、通信装置1004によって実現されてもよい。文章取得部101および提示部104とで、物理的に、または論理的に分離された実装がなされてもよし、同一の実装とされてもよい。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
 また、対話システム100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
 情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
 本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。
 本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
 本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
 なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC:Component Carrier)は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。
 本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
 本開示においては、「移動局(MS:Mobile Station)」、「ユーザ端末(user terminal)」、「ユーザ装置(UE:User Equipment)」、「端末」などの用語は、互換的に使用され得る。
 移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。
 本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
 「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
 本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。
 本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
 本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
 本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
100…対話システム、101…文章取得部、102…キー取得部、103…検索部、104…提示部、105…記憶部、105a…質問文DB、105b…履歴DB、106…新規候補取得部、107…有用性判断部、108…拡張処理部、109…質問文生成部。

Claims (10)

  1.  ユーザ操作により取得された入力文章から取得されたキーワードである取得キーおよび未知語である新規候補キー、並びに前記取得キーにより検索された応答内容を取得する取得部と、
     前記応答内容に含まれる検索キーと、前記新規候補キーとに基づいて、新たな応答内容を生成する生成部と、
    を備える対話システム。
  2.  前記生成部は、さらに前記応答内容を用いて新たな応答内容を生成する、
    請求項1に記載の対話システム。
  3.  前記生成部は、前記応答内容における検索キーを前記新規候補キーに置き換えることで、前記新たな応答内容を生成する、請求項2に記載の対話システム。
  4.  前記新規候補キーの有用性を判断する判断部をさらに備え、
     前記生成部は、前記有用性がある新規候補キーを用いて新たな質問文を生成する、
    請求項1~3のいずれか一項に記載の対話システム。
  5.  前記判断部は、
     前記応答内容に含まれる検索キーのうち、前記入力文章に含まれていないキーを、差分キーとし、
     当該差分キーと前記新規候補キーとの関連性がある場合には、前記新規候補キーは有用性ありと判断する、
    請求項4に記載の対話システム。
  6.  前記判断部は、
     前記差分キーと前記新規候補キーとが、類義語、同じカテゴリに属する、類似度が高い、または所定値以内のワード間距離である場合には、関連性ありと判断する、
    請求項5に記載の対話システム。
  7.  前記判断部は、
     前記応答内容の取得に用いられた検索利用キーと前記新規候補キーとの係り受け関係と、前記検索利用キーと前記差分キーとの係り受け関係とに基づいて、前記新規候補キーの有用性を判断する、
     請求項5または6に記載の対話システム。
  8.  前記判断部は、
     検索履歴を記述する検索履歴情報において、前記新規候補キーを含んだ入力文章から、前記応答内容へ到達した頻度を取得し、
     当該頻度に基づいて、当該新規候補キーを、有用性ありと判断する、
    請求項4に記載の対話システム。
  9.  前記生成部は、
     前記応答内容と同じドメインにある別の応答内容と、前記新規候補キーとを用いて、他の新たな応答内容を生成する、
    請求項1~8のいずれか一項に記載の対話システム。
  10.  ユーザ操作により取得された入力文章から取得されたキーワードである複数の取得キーおよび当該複数の取得キーのうち一部の取得キーを用いて検索された応答内容を取得する取得部と、
     前記複数の取得キーのうち、検索に使われなかった検索未利用キーを用いて、新たな応答内容を生成する生成部と、
    を備える対話システム。
PCT/JP2020/002404 2019-05-20 2020-01-23 対話システム WO2020235136A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021520045A JP7216199B2 (ja) 2019-05-20 2020-01-23 対話システム
US17/611,203 US20220229996A1 (en) 2019-05-20 2020-01-23 Interactive system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-094533 2019-05-20
JP2019094533 2019-05-20

Publications (1)

Publication Number Publication Date
WO2020235136A1 true WO2020235136A1 (ja) 2020-11-26

Family

ID=73459081

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/002404 WO2020235136A1 (ja) 2019-05-20 2020-01-23 対話システム

Country Status (3)

Country Link
US (1) US20220229996A1 (ja)
JP (1) JP7216199B2 (ja)
WO (1) WO2020235136A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230367962A1 (en) * 2022-05-11 2023-11-16 Outline It, Inc. Interactive writing platform

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102921A (ja) * 2015-12-02 2017-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 質問応答(q&a)データベースを拡張するためのシステム、方法、およびコンピュータ・プログラム(質問応答データベースの拡張)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004215094A (ja) 2003-01-07 2004-07-29 Sony Corp 電子機器装置及びキーワード生成装置
US8055669B1 (en) * 2003-03-03 2011-11-08 Google Inc. Search queries improved based on query semantic information
JP5556711B2 (ja) 2011-03-18 2014-07-23 富士通株式会社 カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
JP2016057986A (ja) * 2014-09-11 2016-04-21 株式会社東芝 音声翻訳装置、方法およびプログラム
JP6819988B2 (ja) * 2016-07-28 2021-01-27 国立研究開発法人情報通信研究機構 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム
US10446137B2 (en) * 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system
JP2019101667A (ja) * 2017-11-30 2019-06-24 シャープ株式会社 サーバ、電子機器、制御装置、電子機器の制御方法およびプログラム
US10810215B2 (en) * 2017-12-15 2020-10-20 International Business Machines Corporation Supporting evidence retrieval for complex answers

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102921A (ja) * 2015-12-02 2017-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 質問応答(q&a)データベースを拡張するためのシステム、方法、およびコンピュータ・プログラム(質問応答データベースの拡張)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Free Searching Using Keywords, Photos, Audio: Cutting Edge Web Searching Technique", NIKKEI PERSONAL COMPUTING, no. 817, 13 May 2019 (2019-05-13), pages 20 - 27 *
OTSUKA, ATSUSHI ET AL.: "Neural Question Generation Model to Identify Question Intention", DBSJ JAPANESE JOURNAL, vol. 17-J, 12 March 2019 (2019-03-12), pages 1 - 8, XP055762755, Retrieved from the Internet <URL:http://dbsj.org/wp-content/uploads/2019/02/DBSJ_17_06_otsuka.pdf> [retrieved on 20190331] *

Also Published As

Publication number Publication date
JPWO2020235136A1 (ja) 2020-11-26
JP7216199B2 (ja) 2023-01-31
US20220229996A1 (en) 2022-07-21

Similar Documents

Publication Publication Date Title
JP6802364B2 (ja) 対話システム
KR100785066B1 (ko) 휴대 단말기의 폰북 그룹 관리 방법
JP7166350B2 (ja) 対話装置
JP7054732B2 (ja) 対話システム
JP7087095B2 (ja) 対話情報生成装置
WO2020235136A1 (ja) 対話システム
JP7054731B2 (ja) 対話システム
JP2021124913A (ja) 検索装置
WO2020235135A1 (ja) 対話システム
WO2019193796A1 (ja) 対話サーバ
JP7043593B2 (ja) 対話サーバ
JP7016405B2 (ja) 対話サーバ
JP6975323B2 (ja) 対話サーバ
KR20220037217A (ko) 조건식 생성 인터페이스를 이용한 챗봇 서비스 제공 방법 및 장치
US11914601B2 (en) Re-ranking device
US11468106B2 (en) Conversation system
JP2019179394A (ja) 情報提示システム
US20220292506A1 (en) Authorization device
CN113468853A (zh) 摘要文本标注方法、装置和设备以及计算机存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20810211

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021520045

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20810211

Country of ref document: EP

Kind code of ref document: A1