CN107562770A - 信息处理方法以及记录介质 - Google Patents
信息处理方法以及记录介质 Download PDFInfo
- Publication number
- CN107562770A CN107562770A CN201710404504.3A CN201710404504A CN107562770A CN 107562770 A CN107562770 A CN 107562770A CN 201710404504 A CN201710404504 A CN 201710404504A CN 107562770 A CN107562770 A CN 107562770A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- represented
- interface
- enquirement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 34
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 208000024891 symptom Diseases 0.000 claims abstract description 62
- 230000004044 response Effects 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims description 66
- 201000010099 disease Diseases 0.000 claims description 61
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 61
- 238000010411 cooking Methods 0.000 claims description 3
- 230000007717 exclusion Effects 0.000 claims description 2
- 230000001052 transient effect Effects 0.000 claims 2
- 230000000694 effects Effects 0.000 description 281
- 230000009471 action Effects 0.000 description 92
- 238000012545 processing Methods 0.000 description 56
- 230000008569 process Effects 0.000 description 48
- 206010019233 Headaches Diseases 0.000 description 31
- 231100000869 headache Toxicity 0.000 description 31
- 208000002173 dizziness Diseases 0.000 description 25
- 206010037660 Pyrexia Diseases 0.000 description 22
- 206010011224 Cough Diseases 0.000 description 19
- 230000007704 transition Effects 0.000 description 19
- 230000006399 behavior Effects 0.000 description 17
- 238000012790 confirmation Methods 0.000 description 17
- 238000000926 separation method Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 13
- 238000007726 management method Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000012216 screening Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/22—Social work or social welfare, e.g. community support activities or counselling services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0489—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/021—Casings; Cabinets ; Supports therefor; Mountings therein incorporating only one transducer
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Human Resources & Organizations (AREA)
- Child & Adolescent Psychology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供一种信息处理方法以及记录介质。信息处理方法是通过与用户的对话来询问用户的症状的对话装置中的信息处理方法,包括:向与对话装置连接的显示器或扬声器输出与用户的症状有关的第1类别的表示开放式提问的第1提问信息,从与对话装置连接的键盘、触摸面板或麦克风接收表示对第1提问信息所表示的提问的应答的第1应答信息,在判断为第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向显示器或扬声器输出与用户的症状有关的第1类别的表示开放式提问的第2提问信息,在判定为第1应答信息所表示的应答包含表示否定表达的言语的情况下,向显示器或扬声器输出与用户的症状有关的第2类别的表示封闭式提问的第3提问信息。
Description
技术领域
本公开涉及用于与用户对话并进行信息处理的对话系统、该对话系统所使用的主体(agent)装置、对话方法以及程序。
背景技术
以往,已知通过由计算机等装置与用户对话来确定所需信息的系统。在该系统中,需要根据与用户的对话状态来进行适当的控制。专利文献1中公开了如下技术:根据对话状态,使用POMDP(部分可观测马尔可夫决策过程:Partially Observable Markov DecisionProcess)模型来决定行动。
现有技术文献
专利文献1:日本特开2010-129033号公报
非专利文献1:Steve Young等7人,“The Hidden Information State model:Apractical framework for POMDP-based spoken dialogue management”,ComputerSpeech&Language 24(2010)150-174
发明内容
发明要解决的技术问题
然而,在对话系统中,为了完成导出数千以上的结论这样的大规模任务,需要高效地进行与对话状态对应的控制。
用于解决问题的技术方案
本公开的一个技术方案涉及的信息处理方法是对话装置中的信息处理方法,所述对话装置通过与用户的对话来询问所述用户的症状,所述信息处理方法包括:向与所述对话装置连接的显示器或与所述对话装置连接的扬声器,输出与所述用户的症状有关的第1类别的第1提问信息,所述第1提问信息所表示的提问是开放式提问,从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示对所述第1提问信息所表示的提问的应答的第1应答信息,在判断为所述第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的所述第1类别的第2提问信息,所述第2提问信息所表示的提问是开放式提问,在判断为所述第1应答信息所表示的应答包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的第2类别的第3提问信息,所述第3提问信息所表示的提问是封闭式提问。
发明的效果
根据本公开,能实现进一步的改善。
附图说明
图1A是表示实施方式涉及的对话系统所提供的服务的形态的一例的概念图。
图1B是表示实施方式涉及的数据中心运营公司的一例的概念图。
图2是实施方式涉及的对话系统的概略构成图。
图3是表示实施方式涉及的对话系统中的对话处理的一例的流程图。
图4A是表示实施方式涉及的知识库的一例的图。
图4B是表示实施方式涉及的知识处理的一例的概念图。
图5是表示实施方式涉及的对话系统中的对话的时序(sequence)的一例的时序图。
图6A是关于对话状态的状态转换图(其一)。
图6B是关于对话状态的状态转换图(其二)。
图6C是关于对话状态的状态转换图(其三)。
图6D是关于对话状态的状态转换图(其四)。
图7是表示使用了实施方式涉及的对话系统的实验结果的图。
图8是表示对话系统所提供的服务(类型1)的概念图。
图9是表示对话系统所提供的服务(类型2)的概念图。
图10是表示对话系统所提供的服务(类型3)的概念图。
图11是表示对话系统所提供的服务(类型4)的概念图。
标号的说明
10对话系统;200决定部;201输入处理部;202分离部;203行动决定部;204合成部;205提供部;206知识库;207知识处理部;208输出处理部;1010用户;1100组;1101设备;1102家庭网关;1110数据中心运营公司;1111云服务器;1120服务提供商;1121服务器;1201应用程序;1202操作系统(OS);1203云服务器;2001主体;2002前端;2003、2006观测;2004、2007行动;2005后端。
具体实施方式
(成为本公开的基础的见解等)
很多情况下通过专业知识丰富的专家与专业知识贫乏的普通人利用对话交换信息,由此完成确定作为两者认同的结论的信息的任务。作为这样的任务的一例,例如可列举在医生与患者之间进行的问诊。在问诊中,在虽然有专业知识但却没有关于患者的自觉症状的信息的医生与虽然专业知识贫乏但能够通过回答问题或亲自诉说来提供关于自身症状的信息的患者之间,通过对话来增加成为线索的信息的量并反映于结论(诊断结果)。研究了使用计算机等机器完成该问诊等这样的通过与作为普通人的用户的对话来确定作为结论的信息的任务的对话系统。例如在基于POMDP模型的对话控制中,能够对包含语音识别、语言理解等的错误的不可靠输入进行处理,能够期待用于恰当地进行向用户的确认行为等的行动选择的最佳化。
但是,在问诊的例子中,可能会成为问诊的结论(诊断结果)的疾病的候选的数量会达到数千以上。也就是说,要将基于从患者获得的信息来确定疾病的候选的过程作为状态的转换来表现,包含逻辑上的条件分支和结论在内,需要数千以上的状态。若对话控制所需的状态(对话状态)的数量多达数千以上,则对话控制中的用于使向用户的确认行为等的行动选择最佳化的运算负荷会增大,可能会为了对话控制而需要例如大规模的计算机资源。在此之前,对用于通过小规模的对话控制来完成大规模的任务的技术并没有进行研究。
因此,本发明人研究了以下的改善措施。
(1)本公开的一个技术方案涉及的信息处理方法,是对话装置中的信息处理方法,所述对话装置通过与用户的对话来询问所述用户的症状,所述信息处理方法包括:向与所述对话装置连接的显示器或与所述对话装置连接的扬声器,输出与所述用户的症状有关的第1类别的第1提问信息,所述第1提问信息所表示的提问是开放式提问,从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示对所述第1提问信息所表示的提问的应答的第1应答信息,在判断为所述第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的所述第1类别的第2提问信息,所述第2提问信息所表示的提问是开放式提问,在判断为所述第1应答信息所表示的应答包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的第2类别的第3提问信息,所述第3提问信息所表示的提问是封闭式提问。
(2)在上述技术方案中,也可以:从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示有无所述第2类别的提问信息所表示的症状的第2应答信息,基于所述第2应答信息判断有无所述第3提问信息所表示的症状,在判断为有所述第3提问信息所表示的症状的情况下,所述第3提问信息所表示的症状被作为指定关键字进行管理,在判断为没有所述第3提问信息所表示的症状的情况下,所述第3提问信息所表示的症状被作为排除关键字进行管理,将表示基于所述指定关键字和所述排除关键字的组合而确定的所述用户的症状的信息输出到与所述对话装置连接的显示器或与所述对话装置连接的扬声器。
(3)在上述技术方案中,也可以:所述开放式提问是指用是或否进行应答的类型之外的提问,所述封闭式提问是指用是或否进行应答的类型的提问。
(4)本公开的另一技术方案涉及的信息处理方法,是对话装置中的信息处理方法,所述对话装置通过与用户的对话来筛选所述用户想要确定的事项,所述信息处理方法包括:向与所述对话装置连接的显示器或与所述对话装置连接的扬声器,输出与所述用户想要确定的事项有关的第1类别的第1提问信息,所述第1提问信息所表示的提问是开放式提问,从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示对所述第1提问信息所表示的提问的应答的第1应答信息,在判断为所述第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户想要确定的事项有关的所述第1类别的第2提问信息,所述第2提问信息所表示的提问是开放式提问,在判断为所述第1应答信息所表示的应答包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户想要确定的事项有关的第2类别的第3提问信息,所述第3提问信息所表示的提问是封闭式提问。
(5)在上述技术方案中,所述用户想要确定的事项可以包括病名、烹饪食谱、旅行计划、不动产物件和/或影像内容。
此外,这些总括性或具体的技术方案既可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意组合来实现。
以下,参照附图来详细说明本公开的实施方式。此外,以下说明的实施方式均表示本公开的总括性或具体的一例。以下的实施方式中示出的数值、形状、构成要素、构成要素的配置、步骤、步骤的顺序等是一例,并非限定本公开。另外,关于以下的实施方式中的构成要素中的未记载在表示独立权利要求中的构成要素,是能够任意附加的构成要素。另外,各图是示意图,不一定严格图示。
(所提供的服务的全貌)
首先,对本实施方式的对话系统所提供的服务的形态进行说明。
图1A是表示本实施方式的对话系统10所提供的服务的形态的一例的图。对话系统10具备组(group)1100、数据中心运营公司1110以及服务提供商1120。
组1100例如是企业、团体或者家庭等的设施(例如大厦、住宅等),其规模不限。组1100具备设备1101以及家庭网关1102。设备1101具有用于通过某种方法与用户交换信息的用户接口。设备1101例如是能够与互联网连接的设备(例如智能手机、个人计算机(PC)、电视机等)。此外,设备1101也可以是其自身不能与互联网连接的设备(例如洗衣机、电冰箱等),还可以是能够经由家庭网关1102与互联网连接的设备。此外,也存在不需要家庭网关1102的情况。用户1010使用设备1101。设备1101也可以是能够以无线方式与互联网连接的可携带式设备(例如智能手机、笔记本PC等),在该情况下,用户1010以及设备1101也可以不一定位于组1100内。此外,设备1101不限于1台设备,也可以通过多台设备来构成设备1101。
数据中心运营公司1110具备云服务器1111。云服务器1111是经由互联网与各种各样的设备进行协作的计算机,例如虚拟服务器。云服务器1111例如对难以通过通常的数据库管理工具等进行处理的海量数据(大数据)等进行管理。数据中心运营公司1110进行数据的管理、云服务器1111的管理等。此外,数据中心运营公司1110不限于仅进行数据的管理或者云服务器1111的管理的管理公司,也可以是兼顾进行其他业务的公司,例如也可以是开发或制造设备1101的设备制造商。另外,数据中心运营公司1110不限于一个公司,例如如图1B所示,在设备制造商和管理公司共同或者分担进行数据的管理或者云服务器1111的管理的情况下,设备制造商和管理公司这两者可以相当于数据中心运营公司1110。
服务提供商1120具备服务器1121。服务器1121例如通过一台或多台计算机来实现,其规模不限,可以具备大容量的硬盘等存储装置来作为存储介质,例如也可以只具备PC内的存储器等。此外,服务器1121也可以不一定具备存储介质。
接着,说明上述形态的对话系统10中的信息的流动。
首先,组1100的设备1101将经由用户接口取得的输入信息直接或者经由家庭网关1102发送到数据中心运营公司1110的云服务器1111。设备1101中的用于供用户1010对输入信息进行输入的用户接口例如是键盘、触摸面板或者使用了已有的语音识别技术的语音输入装置(麦克风)等。云服务器1111取得来自设备1101的输入信息。
接着,数据中心运营公司1110的云服务器1111将基于来自设备1101的输入信息的信息发送到服务提供商1120的服务器1121。基于该输入信息的信息既可以包含与输入信息的至少一部分相同的信息,也可以不包含该相同信息而是作为对输入信息实施了运算等处理而得到的结果的信息。另外,基于该输入信息的信息的发送单位可以是任意单位。服务器1121取得来自云服务器1111的信息。
并且,服务提供商1120的服务器1121根据来自云服务器1111的信息,确定向用户的提供用信息,为了将该提供用信息提供给用户1010而发送到云服务器1111。云服务器1111将来自服务器1121的提供用信息转送到设备1101或者将作为对该提供用信息实施了运算等处理而得到的结果的信息发送到设备1101。由此,可从设备1101的用户接口向用户1010提供信息。设备1101中的用于向用户1010提供信息的用户接口例如是显示器或者使用了已有的语音合成技术的语音输出装置(扬声器)等。
此外,也可以是:服务器1121不经由云服务器1111地与设备1101进行通信,由此进行从用户1010取得输入信息以及提供用信息的提供。另外,对话系统10也可以是与上述的例子不同的形态。例如,在对话系统10中,也可以省去数据中心运营公司1110以及服务提供商1120,也可以基于设备1101从用户取得的输入信息来确定提供用信息并将该提供用信息提供给用户。
(实施方式1)
(结构)
以下,对作为一例在使用了POMDP模型的对话系统10中用于进行与用户交换信息的对话方法的结构进行说明。
通常而言,POMDP模型由状态的集合S、行动的集合A、观测的集合Z、状态转换矩阵T、观测矩阵O、收益矩阵R、信念状态的初始状态B0这样的模型要素来定义。在使用了在某环境内主体对当前状态进行观测并决定应采取的行动的POMDP模型的现有对话系统下,使用户与环境相对应,使系统(计算机系统)与主体相对应,将用户的对话行为作为观测,将系统的对话行为视为行动。针对于此,在对话系统10中,进行一个主体和两个环境这一构造下的模型化。
图2是对话系统10的概略构成图。
如图2所示,对话系统10具备主体2001、作为第1环境的前端2002、作为第2环境的后端2005、和知识库206。
主体2001是作为对话主体的装置(主体装置)。主体2001例如可以安装于具备处理器(微处理器)、存储器等的计算机。具体而言,例如,可以通过处理器执行存储器所保存的程序等来实现主体2001的功能。主体2001在前端2002与后端2005之间对对话行为的交换进行斡旋(调停)。即,主体2001与前端2002和后端2005分别进行对话行为的授受。对话行为是由对话行为类型和附带信息构成的预定形式(预定对话行为形式)的信息。
前端2002是进行用户接口处理的装置,在与用户之间交换用自然语言表现的信息。前端2002例如可以安装于与主体2001相同或不同的计算机。例如,可以通过计算机的用户接口以及执行计算机的存储器所保存的程序的处理器等来实现前端2002的功能。
后端2005是进行检索处理等信息处理的装置,进行包括基于向知识库206的查询(检索处理)来提供信息在内的知识处理。后端2005例如可以安装于与主体2001相同或不同的计算机。例如,通过计算机的通信接口以及执行计算机的存储器所保存的程序的处理器等来实现后端2005的功能。
在主体2001与前端2002和后端2005的各方由互相分离的多个装置实现的情况下,主体2001与前端2002和后端2005的各方直接或者经由其他装置进行通信。
知识库206是保持信息的装置,例如是将表示信息的数据结构化并进行管理的数据库管理装置。知识库206例如可以安装于与后端2005相同或者不同的计算机。例如,可以通过计算机中的存储器、硬盘等存储介质等来实现知识库206。在用于完成问诊任务的对话系统10中,知识库206保持有对问诊任务的完成有用的信息(例如使症状与疾病相关联的信息)。知识库206也可以由多台装置构成。
在图2中,例示了用于完成问诊任务的对话系统10中的对话行为。观测2003是主体2001从前端2002取得的对话行为的例子。观测2006是主体2001从后端2005取得的对话行为的例子。行动2004是主体2001向前端2002提供的对话行为的例子。另外,行动2007是主体2001向后端2005提供的对话行为的例子。观测2003、观测2006、行动2004以及行动2007都是预定对话行为形式的信息(对话行为)的例子。在该例中的字符串信息的对话行为中,括弧之前的部分(例如“Provide”、“Confirm”等)是对话行为类型,括弧内的部分(例如“头晕”、“头疼”等)是附带信息。对话行为类型例如表示预先确定的“Provide”、“Confirm”、“Check”、“push”等这样的多个值(对话行为类型值)的某个值,对话行为类型值例如由字符串表示。在该例中,将对话行为类型值由英语单词来表现,但这只不过是一例,可以基于任何语言或规则来表现。附带信息例如是表示关键字(key word,关键词)的字符串信息。
在对话系统10中,对应于在主体2001与前端2002及后端2005的集合之间授受的对话行为的序列,完成任务。在问诊任务的例子中,基于以对话的方式经由前端2002从用户收集到主体2001中的信息,在后端2005进行疾病的确定。
以下,对主体2001、前端2002以及后端2005的更详细的结构进行说明。
如图2所示,前端2002具有与用户接口处理相关的输入处理部201和输出处理部208。主体2001具备决定部200和提供部205。后端2005具备知识处理部207。
决定部200承担如下功能:根据从前端2002和后端2005的一方取得的对话行为,决定向前端2002和后端2005的一方提供的提供用对话行为。为了实现该功能的决定部200具备分离部202、行动决定部203和合成部204。此外,决定部200可以构成为也基于过去决定的对话行为类型的序列来决定提供用对话行为中的对话行为类型。
输入处理部201例如将用户利用键盘、触摸面板或者语音输入装置(麦克风)等用户接口等进行的输入即自然语言表达(字符串)通过已有的自然语言处理技术(例如语言理解技术)变换成对话行为,对对话行为附加可靠度并进行输出。由此,可通过分离部202取得对话行为以及可靠度。输入处理部201在用户的输入是语音的情况下也可以进行将所输入的语音通过语音识别技术进行文字化的前处理。
分离部202将从前端2002的输入处理部201或者后端2005的知识处理部207取得的对话行为分离为对话行为类型和附带信息。例如,对话行为“Provide(头疼)”被分离为对话行为类型“Provide”和附带信息“头疼”。分离部202将分离出的对话行为类型输入行动决定部203。即,分离部202从前端2002以及后端2005的集合逐次取得对话行为,从所取得的对话行为中分离附带信息,由此将对话行为类型的序列作为观测而逐次输入到行动决定部203。另外,分离部202将分离出的附带信息输入到合成部204。
行动决定部203利用使用了POMDP模型的已有的行动决定技术,基于作为观测而逐次输入的对话行为类型的序列,决定作为行动的对话行为类型并进行输出。通过行动决定部203,例如决定并输出对话行为类型“push”。在由POMDP模型参照的策略(policy)的学习中可以利用已有的技术。此外,在由POMDP处理的状态的概率分布(也称为信念状态)只能取0或1的值的情形下,能够将模型视为MDP(马尔可夫决策过程:Markov Decision Process)模型。也就是说,在由行动决定部203进行的行动的决定中,也包含基于MDP模型的处理。在这些模型(POMDP模型、MDP模型)中,能够通过强化学习(Reinforcement Learning)来进行用于选择性的行动决定而参照的策略的最佳化。此外,在行动决定部203中,基于观测,参照信念状态以及策略来决定行动。行动决定部203保持有作为表示该信念状态的信息的信念状态信息,可以根据观测和所决定的行动来更新信念状态信息。另外,行动决定部203也可以保持有作为所决定的行动的对话行为类型的历史记录。并且,行动决定部203也可以:也基于作为过去决定的行动的对话行为类型的序列来进行作为行动的对话行为类型的决定。
合成部204通过将由行动决定部203基于由分离部202分离出的对话行为类型来决定并输出的对话行为类型和由分离部202分离出的附带信息进行合成,从而生成并输出提供用对话行为。通过合成部204,例如输出对话行为“push(头疼)”。
提供部205承担如下功能:将由决定部200决定的提供用对话行为向前端2002和后端2005的一方提供。提供部205可以将成为从合成部204输出的对话行为的输出目的地的环境切换为前端2002和后端2005的某一方。具体而言,提供部205基于为了区分对话行为的输出目的地而预先确定的基准,判定应该使提供用对话行为的输出目的地为输出处理部208还是为知识处理部207。可以预先确定的基准例如是通过对话行为的开头的字符是大写字符还是小写字符来区分输出目的地的基准。例如如行动2004所示,如果提供用对话行为的开头的字符(即对话行为类型的开头的字符)是大写字符,则提供部205将该对话行为输出到输出处理部208。另外,例如如行动2007所示,如果提供用对话行为的开头的字符(即对话行为类型的开头的字符)是小写字符,则提供部205将该对话行为输出到知识处理部207。
输出处理部208通过应答文生成技术(例如已有的文生成技术)将从提供部205输出的对话行为所表示的意思表达变换成应答文,作为字符串而提供给用户。向用户提供字符串例如通过显示器、语音输出装置(扬声器)等用户接口来进行。输出处理部208也可以进行将应该向用户提供的字符串通过语音合成技术进行语音化的后处理。
知识处理部207参照知识库206,进行与从提供部205输出的对话行为相应的信息处理,将表示该结果的对话行为提供给分离部202。知识处理部207中的信息处理例如是从知识库206中检索并提取信息的检索处理,例如进行如下的检索处理:将作为在此之前从主体2001取得的对话行为中的附带信息所表示的字符串的关键字的列表作为检索关键字(检索用的关键字)的集合,在知识库的内容中进行AND(与)检索。知识处理部207基于检索处理的结果生成对话行为,将所生成的对话行为提供给主体2001的分离部202。例如,知识处理部207判定检索处理的结果是否已被充分筛选,在满足预先确定为表示已被充分筛选的预定条件(例如所检索出的信息的数量的上限等条件)而判定为已被充分筛选的情况下,生成并输出表示该检索结果的对话行为(向分离部202提供)。另一方面,在判定为未被充分筛选的情况下,知识处理部207推定为了筛选检索处理的结果而有效的关键字(检索关键字),生成并输出表示该关键字的对话行为(向分离部202提供)。表示为了筛选检索处理的结果而有效的关键字的对话行为的一例,例如是作为附带信息而含有“发烧”的“suggest(发烧)”。
通过具备如此结构,在主体2001的决定部200中,能够提取逐次取得的对话行为中的对话行为类型,基于过去的对话行为类型的序列,决定作为行动应输出的提供用对话行为中的对话行为类型。即,在主体2001中,不是基于对话行为中的附带信息进行判断,而是能够基于过去的对话行为类型的序列来进行应输出的对话行为类型的决定。
通过如此不是基于对话行为的种类(对话行为整体的值的各值)而是基于对话行为类型的种类(对话行为类型值的各值)来决定对话行为类型,能够将对话状态的数量抑制为少。将对话状态的数量抑制为少,对于基于强化学习的行动选择的最佳化是有利的。作为该最佳化的结果,主体2001可以使得能够根据状况来适当选择与用于从作为环境之一的前端2002取得(收集)作为观测2003的信息的提问的类型等相关的行动2004,也可以使得能够适当选择用于从作为环境的另外之一的后端取得观测2006作为信息处理结果的行动2007。经过这些选择(例如提问的类型不同的对话行为类型的选择等),可以通过主体2001进行对话的主体者的控制、不可靠信息的确认的控制等对话控制处理。
此外,对于所取得的对话行为中的对话行为类型和分离出的附带信息,主体2001只要保持所取得的最新的一个就足够。
另外,在后端2005中,若将对话开始之后所取得的附带信息的序列积累在作为存储器等的一个区域的栈中而进行管理,则能够完成使用了多个附带信息的高级任务。通过后端2005中的信息处理,例如可以收集“头疼”、“头晕”等这样的表示症状的附带信息,基于这些症状将“疾病A”、“疾病B”、“疾病C”等这样的疾病确定为期望的信息。在后端2005中,将所取得的对话行为的对话行为类型例如作为命令的种类进行处理,并仅根据当前的对话行为类型来进行处理即可,不需要管理对话行为类型的历史记录。
(工作)
以下,对具备上述结构的对话系统10的工作进行说明。
图3是表示对话系统10中的对话处理的一例的流程图。以下,结合该图,着眼于对话所涉及的主体2001的工作来进行说明。
在对话的开始时,首先,主体2001设定信念状态(步骤S31)。信念状态是指针对按照对话的进展状况和用户意图来定义的对话状态而总和成为1的概率值的集合(概率分布)。例如,设想为在对话开始时进入一个对话状态,将该状态的概率值设为1,将其以外的状态的概率值设为0。对于信念状态的设定,通过主体2001的决定部200将表示作为初始状态的信念状态的信念状态信息保持于存储器等存储介质来进行。
主体2001的决定部200基于信念状态信息所表示的信念状态来决定行动(步骤S32)。具体而言,决定部200的行动决定部203参照在何种信念状态时应采取何种行动这一基准的集合即策略,基于信念状态来决定作为行动的对话行为类型。在决定部200中,将包含行动决定部203所决定的对话行为类型的提供用对话行为传达给提供部205。
接着,主体2001判定通过步骤S32决定的行动所面向的环境是前端2002还是后端2005(步骤S33)。具体而言,提供部205基于预先确定的基准,根据提供用对话行为来判定输出目的地。然后,提供部205根据判定结果,将提供用对话行为提供给前端2002的输出处理部208和后端2005的知识处理部207的某一方。
在作为步骤S33中的判定结果是从主体2001向作为环境之一的前端2002提供了对话行为的情况下,前端2002执行与用户的交互(步骤S34)。也就是说,前端2002的输出处理部208将从提供部205取得的预定对话行为形式的行动(对话行为)变换成自然语言并提示给用户。另外,前端2002的输入处理部201以自然语言的形式取得来自用户的应答(回答),变换成对话行为的形式并提供给主体2001。
另一方面,在作为步骤S33中的判定结果是从主体2001向作为环境的另外之一的后端2005提供了对话行为的情况下,后端2005执行知识处理(步骤S35)。也就是说,后端2005的知识处理部207基于从提供部205取得的预定对话行为形式的行动(对话行为),进行知识库206的检索处理,将基于检索处理结果的信息变换成对话行为的形式并提供给主体2001。如果对话行为能够作为知识库206的检索用的命令(例如机器语言的命令)直接使用,则知识处理部207执行作为该对话行为的命令,如果不能直接使用,则变换成机器语言的命令并加以执行。另外,知识处理部207将作为检索处理结果的基于从知识库206返回的值等的信息变换成对话行为的形式并提供给主体2001。
接着步骤S34或者步骤S35,主体2001从前端2002或者后端2005受理(取得)预定对话行为形式的观测(对话行为)(步骤S36)。
接着,主体2001基于所取得的对话行为,判断是否应该结束对话处理(步骤S37)。例如,主体2001在作为观测而从前端2002取得“Acknowledge()”这一对话行为之后,判断为应该结束对话处理,使对话处理结束。
在步骤S37中未判断为结束的情况下,主体2001基于当前的信念状态、所决定的行动(对话行为类型的形式的行动)、和从环境获得的观测(对话行为类型的形式的观测),更新信念状态(步骤S38)。也就是说,决定部200根据所取得的对话行为中的对话行为类型的序列和所决定的对话行为类型的序列来更新表示信念状态的信念状态信息。
接着步骤S38,主体2001返回到步骤S32,对应于通过步骤S36取得的对话行为,进行行动的决定。
如此,在对话处理中,包含由主体2001进行的包括接下来的决定步骤以及提供步骤的对话控制处理。在对话处理中,通过反复进行的步骤S36,每当从前端2002和后端2005的某一方取得对话行为时,主体2001进行根据所取得的对话行为来决定提供用对话行为的决定步骤(步骤S32)。然后,主体2001进行将通过该决定步骤决定的提供用对话行为向前端2002和后端2005的某一方提供的提供步骤(步骤S33~S35)。在决定步骤中,主体2001基于从前端2002以及后端2005的集合逐次取得的对话行为中的对话行为类型的序列而非附带信息的序列,来决定提供用对话行为中的对话行为类型。主体2001可以基于对话行为类型的序列更新信念状态,基于信念状态决定作为行动的对话行为类型。
如此,主体2001中的信念状态成为通过行动的对话行为类型和观测的对话行为类型而逐次更新、并反映了对话处理开始之后的对话行为类型的全部序列的信念状态。因此,主体2001如果基于信念状态进行行动的决定,则能够采取符合对话的进展状况且符合用户意图的行动。
以下,使用图4A以及图4B对后端2005中的作为信息处理的一种的知识处理的一例进行说明。
图4A是表示由后端2005参照的知识库206的一例的图。
知识库206是在由后端2005的知识处理部207进行的知识处理中成为检索对象的数据库,例如将用于以症状作为检索关键字来检索疾病的知识进行结构化并加以管理。图4A的表示出知识库206的知识内容的形象(image)的一例。图4A的表中,对于成为某症状的行与某疾病的列的交点的单元,在是该疾病的情况下如果容易出现该症状则记述有“+”,如果不容易出现该症状则记述有“-”。作为检索关键字,例如也可以区分为指定出现症状的指定关键字和指定不出现症状的排除关键字来进行检索。通过利用指定症状的指定关键字和排除关键字中的一个以上的组合来进行AND检索,能够从疾病的集合中筛选符合的疾病。在图4A的例子中,通过设症状A为指定关键字(+)并设症状D为排除关键字(-)来进行AND检索,符合的疾病仅会成为疾病1。图4A只不过是便于说明的一例,在知识库206中,检索关键字(例如症状)和检索对象名(例如疾病)可以分别有很多(例如数十、数千以上等)。
图4B是将由后端2005的知识处理部207进行的知识处理的一例用问题树来表示的概念图。
图4B的例子是与使用图4A的表中例示的知识库206完成通过症状所涉及的提问来确定疾病这一问诊任务相关联的问题树的例子,在此,为了便于说明,示出了比较简单的问题树。图4B的问题树的根节点表示最初的提问,将是否出现症状A的提问表现为“症状A”。叶节点示出了通过提问而确定的疾病。位于根和叶的中间的各中间节点示出了第二个以后的提问。节点间的箭头(edge,边)与对提问的回答是“+”(表示出现提问症状的回答)还是“-”(表示未出现提问症状的回答)对应,问题树整体成为二分树。对于根节点,与全部疾病的集合对应,通过提问来逐次分割符合的疾病的集合,对疾病进行筛选。当不再有对疾病的集合进行分割的提问时,此时所剩余的疾病的集合(一个或者多个疾病)成为结论(检索处理结果)。该问题树根据提问的顺序不同而候选的筛选效率不同。为了使最坏情况下的提问次数尽可能少,可以选择使剩余的疾病的集合的“+”与“-”的比例尽可能接近1:1的问题。
作为后端2005的知识处理部207的工作是:从主体2001取得表示命令的对话行为,基于命令进行知识处理(检索处理等),将表示对命令的返回值的对话行为返回(提供)给主体2001。更具体而言,知识处理部207进行如下的检索处理:将所取得的对话行为中的对话行为类型所附带的附带信息(表示症状的关键字)作为检索关键字而积累到栈中,按照检索关键字的列表来进行知识库206的检索。知识处理部207判定检索对象的疾病是否已被充分筛选来作为检索处理结果,在已被充分筛选的情况下,将作为结论而筛选出的检索对象的信息(疾病)返回给主体2001。在判定为筛选不充分的情况下,知识处理部207将对筛选检索对象有效的检索关键字建议(提供)给主体2001。此外,在此示出的由后端2005进行的疾病的确定这一处理,只不过是由后端2005进行的信息处理的一例。由后端2005进行的信息处理例如也可以是如下处理:使用关键字进行互联网检索(互联网上的信息的检索),建议(提供)下一个有效的检索关键字,直到检索的结果成为预定数(例如一个、数个等)以下,当成为预定数以下时提供作为检索结果的信息。在该情况下,后端2005可以构成为包含对已有互联网检索程序的包装器(wrapper)。
以下,对由对话系统10进行的对话的时序进行说明。图5是表示由对话系统10进行的对话的时序的一例的时序图。
在图5中,将前端2002、主体2001以及后端2005各自(各对象)的处理区间(活性区间)用纵向长的长方形来表示,从对象向下的纵向的虚线表示时间经过,横向的矢线(箭头)中的实线箭头表示调出消息(即从主体2001提供对话行为),虚线箭头表示手续的结果通知消息(即由主体2001取得对话行为)。另外,在图5中附注有在后端2005内管理的栈50的内容(检索关键字的列表)。在栈50内附加于关键字的正(+)的符号意味着在知识库206的检索时该关键字被作为指定关键字来处理,附加于关键字的负(-)的符号意味着在知识库206的检索时该关键字被作为排除关键字来处理。
以下,结合图5,依次说明问诊任务所涉及的对话的例子的时序中的各步骤。
在步骤S101中,主体2001向后端2005赋予(提供)表示使保存用于知识库206的检索处理的检索关键字的栈50清空的命令的对话行为“clear()”。此外,规定为:如果主体2001提供的对话行为的开头是小写字符,则后端2005为提供目的地,如果是大写字符,则前端2002成为提供目的地。
在步骤S102中,主体2001从后端2005接收(取得)例如表示与命令相应的处理已结束等的对话行为“pass()”。
在步骤S103中,主体2001向前端2002提供表示“今天怎么了?”之意的提问的对话行为“What1st()”。由此,前端2002以例如“今天怎么了?”这一自然语言向用户进行提问。在该例中,对于该提问,用户进行表示症状的“头晕乎乎的。”这一回答。
在步骤S104中,主体2001从前端2002取得在前端2002将用户的“头晕乎乎的。”这一回答变换而得到的对话行为“Provide(头疼)”。
接着步骤S104,主体2001根据所取得的对话行为“Provide(头疼)”中的对话行为类型“Provide”来决定对话行为类型“Confirm”,通过将该“Confirm”与所取得的对话行为中的附带信息即“头疼”进行合成来生成提供用对话行为“Confirm(头疼)”。
在步骤S105中,主体2001将对话行为“Confirm(头疼)”提供给前端2002。由此,前端2002通过基于对话行为“Confirm(头疼)”变换而得到的自然语言“是头疼吗?”,向用户进行确认的提问。在该例中,对于该提问,用户对头疼进行纠正而进行“是头晕。”这一回答。
在步骤S106中,主体2001从前端2002取得在前端2002对用户的“是头晕。”这一回答(即对确认内容进行纠正的回答)变换而得到的对话行为“Correct(头晕)”。
接着步骤S106,主体2001根据所取得的对话行为“Correct(头晕)”中的对话行为类型“Correct”来决定对话行为类型“push”,通过将该“push”与所取得的对话行为中的附带信息即“头晕”进行合成来生成提供用对话行为“push(头晕)”。
在步骤S107中,主体2001将对话行为“push(头晕)”提供给后端2005。根据对话行为“push(头晕)”所表示的命令(例如用于设定检索关键字的命令),在后端2005的栈50中积存表示附带信息“头晕”的指定关键字。
在步骤S108中,主体2001从后端2005取得例如表示与命令相应的处理已结束等的对话行为“pass()”。
接着步骤S108,主体2001根据所取得的对话行为“pass()”中的对话行为类型“pass”来决定对话行为类型“WhatElse”,生成对话行为“WhatElse()”。
在步骤S109中,主体2001将对话行为“WhatElse()”提供给前端2002。此外,在主体2001中,因为根据逐次取得的对话行为中的对话行为类型的序列,在对话行为类型的决定时所参照的信念状态发生变化,所以即使在取得了相同内容的对话行为的情况下也可以决定不同的提供用对话行为并进行提供。前端2002通过基于对话行为“WhatElse()”变换而得到的自然语言“还有其他什么感觉吗?”,向用户进行进一步的提问。在该例中,对于该提问,用户进行表示进一步的症状的“还心悸。”这一回答。
在步骤S110中,主体2001从前端2002取得在前端2002对用户的“还心悸。”这一回答变换而得到的对话行为“Provide(心悸)”。
接着步骤S110,主体2001根据所取得的对话行为“Provide(心悸)”中的对话行为类型“Provide”来决定对话行为类型“push”,通过将该“push”与所取得的对话行为中的附带信息即“心悸”进行合成来生成提供用对话行为“push(心悸)”。
在步骤S111中,主体2001将对话行为“push(心悸)”提供给后端2005。根据对话行为“push(心悸)”所表示的命令(例如用于设定检索关键字的命令),在后端2005的栈50中进一步积存表示附带信息“心悸”的指定关键字。
在步骤S112中,主体2001从后端2005取得例如表示与命令相应的处理已结束等的对话行为“pass()”。
接着步骤S112,主体2001根据所取得的对话行为“pass()”中的对话行为类型“pass”来决定对话行为类型“WhatElse”,生成对话行为“WhatElse()”。
在步骤S113中,主体2001将对话行为“WhatElse()”提供给前端2002。前端2002通过基于对话行为“WhatElse()”变换而得到的自然语言“还有其他什么感觉吗?”,向用户进行进一步的提问。在该例中,对于该提问,用户进行表示没有其他症状的“没有了。”这一回答。
在步骤S114中,主体2001从前端2002取得在前端2002对用户的“没有了。”这一回答变换而得到的对话行为“Negative()”。
接着步骤S114,主体2001根据所取得的对话行为“Negative()”中的对话行为类型“Negative”来决定对话行为类型“solve1st”,生成提供用对话行为“solve1st()”。
在步骤S115中,主体2001将对话行为“solve1st()”提供给后端2005。根据对话行为“solve1st()”所表示的命令(例如用于检索执行的命令),在后端2005进行知识库206的检索处理。后端2005判定检索处理结果是否已被充分筛选。例如,后端2005判定作为检索处理结果的疾病是否已被筛选到预定数(例如一个、数个等)以下。后端2005在检索处理结果未被充分筛选的情况下,使用知识库206,确定为了筛选检索处理结果而有效的检索关键字并进行建议。在该例中,检索处理结果未被筛选到预定数以下,作为对筛选有效的检索关键字而建议“发烧”。此时,在该例中,在后端2005的栈50中,积存表示未决定是指定关键字还是排除关键字的状态的“发烧”的检索关键字。
在步骤S116中,主体2001从后端2005取得表示建议提问“发烧”症状的对话行为“suggest(发烧)”。
接着步骤S116,主体2001根据所取得的对话行为“suggest(发烧)”中的对话行为类型“suggest”来决定对话行为类型“Check”,通过将该“Check”与所取得的对话行为中的附带信息即“发烧”进行合成来生成提供用对话行为“Check(发烧)”。
在步骤S117中,主体2001将对话行为“Check(发烧)”提供给前端2002。前端2002通过基于对话行为“Check(发烧)”变换而得到的自然语言“有发烧吗?”,向用户进行关于发烧症状的提问。在该例中,对于该提问,用户进行表示未出现发烧症状的“没有。”这一回答。
在步骤S118中,主体2001从前端2002取得在前端2002对用户的“没有。”这一回答变换而得到的对话行为“Negative()”。
接着步骤S118,主体2001根据所取得的对话行为“Negative()”中的对话行为类型“Negative”来决定对话行为类型“set_negative”,生成提供用对话行为“set_negative()”。
在步骤S119中,主体2001将对话行为“set_negative()”提供给后端2005。根据对话行为“set_negative()”所表示的命令(例如用于在将最后积累到栈中的检索关键字设定为排除关键字之后通过检索关键字的列表执行检索的命令),在后端2005中,将栈50的“发烧”作为排除关键字来进行知识库206的检索处理。然后,后端2005判定检索处理结果是否已被充分筛选。在该例中,检索处理结果仍未被筛选到预定数以下,作为对筛选有效的检索关键字,进一步建议“咳嗽”。此时,在该例中,在后端2005的栈50中积存表示“咳嗽”的检索关键字。
在步骤S120中,主体2001从后端2005取得表示建议提问“咳嗽”症状的对话行为“suggest(咳嗽)”。
接着步骤S120,主体2001根据所取得的对话行为“suggest(咳嗽)”中的对话行为类型“suggest”来决定对话行为类型“Check”,通过将该“Check”与所取得的对话行为中的附带信息即“咳嗽”进行合成来生成提供用对话行为“Check(咳嗽)”。
在步骤S121中,主体2001将对话行为“Check(咳嗽)”提供给前端2002。前端2002通过基于对话行为“Check(咳嗽)”变换而得到的自然语言“有咳嗽吗?”,向用户进行关于咳嗽症状的提问。在该例中,对于该提问,用户进行表示出现咳嗽症状的“有。”这一回答。
在步骤S122中,主体2001从前端2002取得在前端2002对用户的“有。”这一回答变换而得到的对话行为“Positive()”。
接着步骤S122,主体2001根据所取得的对话行为“Positive()”中的对话行为类型“Positive”来决定对话行为类型“set_positive”,生成提供用对话行为“set_positive()”。
在步骤S123中,主体2001将对话行为“set_positive()”提供给后端2005。根据对话行为“set_positive()”所表示的命令(例如用于在将最后积累到栈中的检索关键字设定为指定关键字之后通过检索关键字的列表执行检索的命令),在后端2005中,将栈50的“咳嗽”设为指定关键字,进行知识库206的检索处理。然后,后端2005判定检索处理结果是否已被充分筛选。在该例中,检索处理的结果被筛选为预定数以下的一个即“疾病C”。
在步骤S124中,主体2001从后端2005取得表示作为结论的“疾病C”的对话行为“conclude(疾病C)”。
接着步骤S124,主体2001根据所取得的对话行为“conclude(疾病C)”中的对话行为类型“conclude”来决定对话行为类型“Present”,通过将该“Present”与所取得的对话行为中的附带信息即“疾病C”进行合成来生成提供用对话行为“Present(疾病C)”。
在步骤S125中,主体2001将对话行为“Present(疾病C)”提供给前端2002。前端2002通过基于对话行为“Present(疾病C)”变换而得到的自然语言“好像是疾病C。”,向用户提供结论。在该例中,对于该结论的提供,用户进行“知道了。”这一回答。
在步骤S126中,主体2001从前端2002取得在前端2002对用户的“知道了。”这一回答变换而得到的对话行为“Acknowledge()”。由此,主体2001使对话处理结束,对话的时序结束。
如此,主体2001进行斡旋来进行前端2002与后端2005的对话。
在上述的例子中,作为在主体2001与前端2002之间授受的信息的对话行为的时序成为接下来的对话行为时序1。
对话行为时序1=[What1st(),Provide(头疼),Confirm(头疼),Correct(头晕),WhatElse(),Provide(心悸),WhatElse(),Negative(),Check(发烧),Negative(),Check(咳嗽),Positive(),Present(疾病C),Acknowledge()]
另外,对对话行为时序1附加了在主体2001与后端2005之间授受的对话行为而得到的时序,成为接下来的对话行为时序2。
对话行为时序2=[clear(),pass(),What1st(),Provide(头疼),Confirm(头疼),Correct(头晕),push(头晕),pass(),WhatElse(),Provide(心悸),push(心悸),pass(),WhatElse(),Negative(),solve1st(),suggest(发烧),Check(发烧),Negative(),set_negative(),suggest(咳嗽),Check(咳嗽),Positive(),set_positive(),conclude(疾病C),Present(疾病C),Acknowledge()]
在对话行为时序2中,第奇数个对话行为相当于主体2001的行动,第偶数个对话行为相当于主体2001从作为环境的前端2002或者后端2005获得的观测。着眼于括弧内的附带信息,在观测和继其之后的行动之间一致。也就是说,主体2001(对话主体)针对Provide决定Confirm、针对Correct决定push等这样决定对话行为类型,而关于附带信息,只是简单地进行斡旋(调停)。根据这样的观测来决定行动的工作,通过主体2001的决定部200(即分离部202、行动决定部203以及合成部204)来实现。
(对话状态的考察)
以下,使用图6A~图6D对在上述的对话系统10的对话中转换的对话状态的数量的减少化等进行考察。
首先,使用上述的图5的例子所涉及的对话行为时序1,假定仅将与用户相关的前端作为环境的对话系统,对该假定的对话系统中的前端与主体(在此为包含知识处理功能的系统)的对话的例子进行考虑。
图6A是表示制作成包含对话行为时序1的状态转换的一例的状态转换图。此外,在POMDP模型中,通过在状态为s时采取行动a之后状态转换为s′时的转换概率T(s′|s,a)和在采取了行动a的结果状态s′中获得观测z的观测概率O(z|a,s′)来表现行动、观测和状态的关系。在此,对POMDP模型中的上述的概率进行阈值处理,将行动、观测和状态的关系用状态转换图来表示。以下说明的图6B~图6D的各状态转换图也与图6A是同样的。例如,状态转换图中的矢线表示状态的转换概率超过一定阈值的路径。另外,在图6A~图6D中,在表示各节点的圆,记述有状态的名字。在表示节点间的边的矢线,记述有作为从主体向环境的行动的对话行为。另外,在各节点(状态),记述有作为由主体进行的环境的观测的对话行为。由此,在状态转换图中示出:根据行动不同,环境的状态发生变化,在变化后的状态下进行观测。
在此,将对话行为时序1分成2个部分(part)来考察。首先,作为先行部分的[What1st(),Provide(头疼),Confirm(头疼),Correct(头晕),WhatElse(),Provide(心悸),WhatElse(),Negative()]的部分是以开放提问(open question)为主的进行用户主体的对话的部分。该部分在问诊任务中被称为以患者为中心的问诊。另一方面,作为后续部分的[Check(发烧),Negative(),Check(咳嗽),Positive(),Present(疾病C),Acknowledge()]的部分是以封闭提问(closed question)为主的进行系统(对话系统)主体的对话的部分。该部分在问诊任务中被称为以医生为中心的问诊。
关于先行部分(用户主体的对话部分),在图6A中,将该部分的状态(节点)配置成直线状。与该部分对应的对话行为的时序成为以Negative()这一观测结束的可变长度的时序。为了减少该部分的状态的数量,考虑使“s1a”~“s3a”简并(degeneracy)并设为环构造即可。通过环,能够应对可变长度的时序。
另外,关于后续部分(系统主体的对话部分),在图6A中,将该部分的状态(节点)配置成树构造。为了对对话行为时序1的系统主体的对话部分进行跟踪,在继“s4a”之后追寻状态的序列[s6a,s9a,s13a]这一路径即可。树构造的部分作为整体与图4B所例示的问题树对应,使得能够根据提问和回答而到达不同的结论。该系统主体的对话部分例如可能会随着知识库的规模而增大。也就是说,如果有1000个结论,则状态数成为1000以上。另外,在图4B的问题树中,因为是简单例子所以长度是统一的,但系统主体的对话部分的路径的长度是可变长度。也考虑将该部分设为环构造即可。
图6B是表示基于以上的考察而使得具有2个环构造的状态转换的例子的状态转换图。
图6B与图6A同样,与对话行为时序1的用户主体的对话部分[What1st(),Provide(头疼),Confirm(头疼),Correct(头晕),WhatElse(),Provide(心悸),WhatElse(),Negative()]、和系统主体的对话部分[Check(发烧),Negative(),Check(咳嗽),Positive(),Present(疾病C),Acknowledge()]对应。但是,在图6B中,作为对话行为的附带信息的“头疼”、“疾病C”等,进行泛化而用“*”表示。该泛化的部分的附带信息无论是哪一个,都认为与状态的对应关系不发生变化。
着眼于图6B的状态“s1b”,下一个状态是“s1b”或者“s2b”。也就是说,在使从“s1b”出发又返回“s1b”的环轮转0次以上之后,从环脱离而进入“s2b”。在“s1b”和“s2b”,记述有不同的观测,在针对作为行动的对话行为“WhatElse()”而观测到“Negative()”这一对话行为的情况下,从环脱离。
另外,着眼于状态“s3b”,下一个状态是“s3b”或者“s4b”。也就是说,在使从“s3b”出发又返回“s3b”的环轮转0次以上之后,从环脱离而进入“s4b”。在“s3b”和“s4b”,记述有相同的观测(“Negative()”以及“Positive()”),由于行动“Check(*)”也相同,所以用于脱离环的条件不明确。在这样的情况下,通过轮转环的转换概率与脱离环的转换概率之比,决定在轮转几次后脱离环。但是,如果考虑通过问诊来确定疾病这一问诊任务,则对于结束,是医生根据问诊的内容而决定的,并非应该基于次数来决定。或者也可能是将“s4b”除去而从“s3b”到“s5b”通过行动“Present(*)”进行转换即可(未图示)。但是,没有用于行动选择的信息。在此,关于是通过“Check(*)”这一行动来轮转环还是通过“Present(*)”这一行动来脱离环,即使是遵照通过强化学习得到的策略,如果状态和观测相同,也会始终选择相同的行动。也就是说,会成为进入无限环或者一次也没有轮转环而只是穿过。这会在仅将与用户相关的前端作为环境,不使用对话行为的附带信息而使状态极力简并的情况下发生。这样的话,则无法完成任务。
接着,使用上述的图5的例子所涉及的对话行为时序2,考虑将前端2002和后端2005分别设为环境的对话系统10。
图6C是表示对应于对话行为时序2而制作的状态转换的一例的状态转换图。图6C的状态转换图具有2个环构造,并且对应于2个环境。
对于贯穿整体而存在2个环,在图6B和图6C中是同样的。在图6C中,关于各节点的配置,左侧是在前端2002与主体2001之间授受的对话行为,右侧是在主体2001与后端2005之间授受的对话行为,以使两者对应的方式配置节点。
在此,与上述的对话行为时序1同样地,将对话行为时序2分成2个部分(part)来考察。也就是说,分成作为用户主体的对话部分的[clear(),pass(),What1st(),Provide(头疼),Confirm(头疼),Correct(头晕),push(头晕),pass(),WhatElse(),Provide(心悸),push(心悸),pass(),WhatElse(),Negative()]的部分和继其之后的后续部分的作为系统主体的对话部分的[solve1st(),suggest(发烧),Check(发烧),Negative(),set_negative(),suggest(咳嗽),Check(咳嗽),Positive(),set_positive(),conclude(疾病C),Present(疾病C),Acknowledge()]的部分。
在图6C中的用户主体的对话部分,存在第一个环,该环的结束条件通过来自前端2002的观测(具体是“Negative()”)来赋予。该第一个环的结束条件与图6B所示的第一个环的结束条件是同样的。另一方面,在图6C中的系统主体的对话部分,存在第二个环,环的结束条件通过来自后端2005的观测(具体是“conclude(*)”)来赋予。如果进行补充,则在“s5c”中应采取的行动是“Check(*)”,其转换目的地存在3个,但因为每个接着设想的观测都设定状态,所以若乘以观测概率则与观测相应的状态的概率会提高。也就是说,第二个环的结束条件不同于图6B,可能会将作为观测而赋予的对话行为反映于状态的概率,成为行动决定的基准,因此能够通过强化学习来获得适当的策略。
此外,在图6C中的第一个环,省略了与[Confirm(头疼),Correct(头晕)]这一时序对应的状态转换,使用接下来的图6D对其进行考察。
图6D是表示将图6C的“s2c”的状态进行分割并进行了用于应对不可靠性的扩展的状态转换的状态转换图。在图6D中,关于除“s2dlev0”、“s2dlev1”、“s2dposi”以及“s2dcorr”这4个节点之外的节点,与图6C中的相同名字的节点对应。
扩展的第一个是:与从前端2002的输入处理部201获得的言语理解的结果的可靠度相应的状态的分割。“s2dlev0”和“s2dlev1”的各节点是通过与预先设定的可靠度的阈值进行的大小比较而获知的节点,比阈值大的节点设为“s2dlev0”,如果小于阈值则设为“s2dlev1”。在该例中分割成两部分,但根据需要使分割数增加到数倍程度即可。例如,作为分割成4部分的情况下的各阈值的设定方式,可列举以使可靠度可取的值域进行4等分的方式设定阈值的方法、获得频度分布并将4分位点设定为阈值的方法等。
扩展的第二个是:在主体2001将从前端2002获得的信息向后端2005斡旋之前,设置与通过向前端2002进行确认来提高可靠性的情况对应的状态“s2dposi”和“s2dcorr”。
当沿着对话行为时序2的[Provide(头疼),Confirm(头疼),Correct(头晕),push(头晕),pass(),WhatElse(),Provide(心悸),push(心悸)]的部分来按照状态转换的状况来观察时,在观测到“Provide(头疼)”时的可靠度比较低的情况下设想为进入状态“s2dlev1”,决定“Confirm(头疼)”这一行动,状态转换为“s2dcorr”,观测到“Correct(头晕)”。接着,决定“push(头晕)”这一行动并转换为“s3c”,观测到“pass()”。接着,决定“WhatElse()”这一行动,当以比较高的可靠度观测到“Provide(心悸)”时设想为进入“s2dlev0”。在此,不进行确认而随着行动“push(心悸)”转换为“s3c”。
如此,能够将状态基于来自前端2002的观测的可靠度进行分割,并按分割后的每个状态关联各个行动。在图6D的例子中,可靠度的等级(即基于阈值的分割数)为2个,并且在可靠度高时不进行确认,在可靠度低时进行确认。如果可靠度的等级是2个,则这样的通过人工来设定对与可靠度相应的行动进行规定的策略是容易的。在使可靠度的等级为多级的情况下,按每个等级来设定是进行确认还是不进行确定,可能会需要试错。
此外,在关于图5的例子的说明中,对于对话行为时序2,说明了在观测的对话行为和继其之后的行动的对话行为之间附带信息一致的情况,而在图6D中,按[s2dlev1,s2dposi,s3c]的路径,例如也可能进行与[Provide(头疼),Confirm(头疼),Positive(),push(头疼)]这一时序对应的状态转换。如上所述,因为对于所取得的对话行为中的与对话行为类型分离的附带信息,主体2001保持着所取得的最新的一个,所以通过根据需要将所保持的最新的附带信息作为行动的对话行为进行补充,能够与图6D的状态转换对应。
(比较实验结果)
以下,对用于定量地表示对话系统10的效果的比较实验进行说明。
使用对话系统10进行了作为问诊任务的对话的模拟实验。图7是示出使用了对话系统10的模拟实验的结果的图。
在该模拟实验中,作为知识库206,使用了收集有39种症状与854种疾病的关系的知识库。另外,作为对话行为类型,使用了观测2003、观测2006、行动2004以及行动2007(参照图2)所包含的对话行为中的对话行为类型。作为在对话的模拟实验中与对话系统10的前端2002进行对话的用户的患者模拟器,进行一次与所指定的疾病关联的症状的回答(与对话行为“Provide()”相当的回答),然后,对对话系统10的提问进行回话。
其他的主要条件如下。
·前端2002中的言语理解的功能部分,以25%的比例生成错误的症状。
·与可靠度相应的状态的分割数为4,用于分割的3个阈值为0.2、0.5以及0.8。
·后端2005(知识处理部207)在使用症状所涉及的检索关键字进行检索而所确定出的疾病(疾病的候选)成为一个或者用于筛选疾病的关键字(症状)的候选用完时,将通过检索而确定出的疾病作为结论进行输出(提供给主体2001)。在除此以外的情况下,后端2005对为了筛选而有效的关键字进行建议(提供给主体2001)。
·如果作为结论而获得的疾病的数量在3个以内、且包含对患者模拟器指定的疾病,则成为正解。
在图7中,在以上的条件下,汇集了“无确认战略”、“有确认战略(hand-crafted)”和“有确认战略(强化学习)”这三种模型下的实验结果。在此,“无确认战略”是与图6C的状态转换图对应的模型。另外,对于“有确认战略(hand-crafted(手动制作))”,使得对于可靠度为0.5以上的2个状态不进行确认而对于可靠度小于0.5的2个状态进行确认,是与图6D的状态转换图对应的模型。“有确认战略(强化学习)”也是与图6D的状态转换图的类型相当的模型,但在该模型中,关于与可靠度相应的4个状态应采取的行动,是在确认(Confirm)之后进行“push”还是不确认而进行“push”,是按照通过POMDP模型下的强化学习而获得的策略来进行的。在某环境内主体对当前的状态进行观测并决定应采取的行动时,在强化学习中,学习如下策略:主体进行逐次选择的行动,由此从环境获得最多收益。关于“有确认战略(强化学习)”的模型的强化学习中的收益,进行了如下设定:以对于练习用的对话语料库中所表示的对话行为的序列所经过的路径为5、除此以外为-50作为基础,特别是将来自“s2dcorr”的“push(*)”设为100、将来自“s2dposi”的“push(*)”设为-1,如果进行用于错误纠正的确认而得到纠正则价值高,对于不需要纠正时的确认,则价值低。
图7的平均回合(turn)数是仅对前端2002与用户(患者模拟器)之间的交互进行计数而得到的回合数。另外,对于平均收益,除了“有确认战略(强化学习)”之外,对于不使用强化学习的模型也以相同的条件来算出。
作为实验结果,如图7那样,对于正解率,可以确认到“有确认战略(强化学习)”最高,“有确认战略(hand-crafted)”次高,“无确认战略”最低。另外,对于平均回合数,可以确认到“有确认战略(强化学习)”最少,“有确认战略(hand-crafted)”次少,“无确认战略”最多。另外,对于所获得的平均收益,可以确认到“有确认战略(强化学习)”最高,“有确认战略(hand-crafted)”次高,“无确认战略”最低。
此外,在通过“有确认战略(强化学习)”的模型的强化学习中使用的POMDP求解器(solver,解算机)得到的学习结果收敛之前所需要的时间小于1秒,而在与图6A的状态转换图对应的模型中POMDP求解器所需要的时间为30天以上。
(其他实施方式等)
如上所述,作为本公开所涉及的技术性的例示,使用实施方式1进行了说明。然而,上述的实施方式只不过是一例,当然能够进行各种变更、附加、省略等。
在上述的实施方式中,示出了后端2005进行知识库206的检索处理的例子,但后端2005中的信息处理也可以不是检索处理,可以是任何处理。后端2005也可以与知识库206以外的外部装置进行通信。另外,知识库206不一定需要位于后端2005的外部,也可以包含在后端2005中。
另外,在上述的实施方式中,示出了前端2002、后端2005各为一个的例子,但前端2002和后端2005分别不限定于一个,也可以设置多个。
另外,在上述的实施方式中,示出了附带信息是关键字的例子,但附带信息也可以是字符串以外的信息。例如,附带信息也可以是徽章、图形、图像、语音数据等。另外,例如,附带信息不仅是关键字,也可以是表示关键字的种类的槽位(slot)与关键字的组。
另外,在上述的实施方式中,设为了行动决定部203基于POMDP模型决定作为行动的对话行为类型,但行动决定部203也可以不必基于POMDP模型。行动决定部203例如也可以不依靠信念状态,而基于预先确定的策略和过去输入的对话行为类型的序列(历史记录)来决定对话行为类型。
另外,在上述的实施方式中,示出了提供部205根据对话行为中的开头字符是大写字符还是小写字符来判定对话行为的提供目的地是前端2002还是后端2005的例子。但是,因为对话行为中的对话行为类型的值(对话行为类型值)只要通过作为面向前端2002而预先确定的种类(第1种)或作为面向后端2005而预先确定的种类(第2种)来区分就可以了,所以也可以将该区分通过基于大写字符还是小写字符的区分以外的方法来实现。也可以是提供部205具有使对话行为类型值与是第1种还是第2种的种类(即区分提供目的地的种类)相关联的对应表。例如,提供部205可以基于由决定部200决定的提供用对话行为中的对话行为类型表示第1种和第2种的哪种的对话行为类型值,选择对话行为的提供目的地,并向所选择的提供目的地提供对话行为。
在上述的实施方式中,以将对话系统10用于问诊的情况为例进行了说明。但是,上述的对话行为类型不限于问诊,在通过对话来确定信息的任务中是共通的。
因此,不限于问诊的例子,能够将对话系统10适用于在各种领域中通过与用户的对话来确定信息的任务的完成。作为具体例子,对话系统10能够适用于烹饪等领域中的食谱检索、观光等领域中的旅行计划检索、不动产买卖等领域中的不动产物件检索和/或电视播送等领域中的影像内容检索等。在该情况下,在对话系统10(参照图2)中,例如在知识库206中预先保持有对预定的领域(对话系统10的适用领域等)有用的信息,在前端2002关于该领域而在其与用户之间交换用自然语言表达的信息即可。此外,对话系统10进行的对话处理与图3中例示的处理是同样的。
在将对话系统10用于食谱检索的情况下,在知识库206中例如保持有与食材、调味料、烹饪、烹调方法等关联的信息,在前端2002中,例如通过与用户的对话来取得与喜好的烹饪的风格和/或食材等有关的信息即可。另外,在将对话系统10用于旅行计划检索的情况下,知识库206例如保持有与去往目的地、人数、住宿天数、预算等有关的信息,在前端2002中,例如通过与用户的对话来取得与用户希望的旅行计划的去往目的地和/或人数等有关的信息即可。另外,在将对话系统10用于不动产物件检索的情况下,在知识库206中例如保持有住所区域、布局、建筑年龄、距最近车站的距离、房租等关联的信息,在前端2002中,例如通过与用户的对话来取得与用户希望的不动产物件的住所区域和/或布局等有关的信息即可。另外,在将对话系统10用于影像内容检索的情况下,在知识库206中,例如保持有与风格、演员、播送台、播送日期等有关的信息,在前端2002中,例如通过与用户的对话来取得与用户想要观看的节目的风格和/或演员等有关的信息即可。此外,无论在哪个任务中,通过与用户的对话从用户取得的信息的种类、取得顺序、总数等,都不需要是预先确定的一定值等,只要以满足用户所希望的信息被充分筛选并确定这一条件的方式动态地决定即可。
在以上的各例中,主体2001中的分离部202将从前端2002和后端2005的某一方取得的对话行为分离成对话行为类型和附带信息,但如前述那样,在确定信息的任务中,由于对话行为类型不管领域如何都是共通的,所以对话行为类型的值能够使用与问诊的例子同样的值。
此外,也可以根据具体的适用领域来适当追加对话行为类型。例如,在食谱检索中,除了实施方式中例示的对话行为类型之外,作为根据来自用户的信息请求来提示要推荐的食谱(推荐食谱)的信息的情形,可以追加从前端2002向主体2001的推荐信息请求的对话行为类型“RequestRecommend”、从主体2001向后端2005的推荐信息搜索的对话行为类型“seek_recommend”、从后端2005向主体2001的推荐信息提供的对话行为类型“inform_recommend”、从主体2001向前端2002的推荐信息提示“PresentRecommend”、以及推荐信息等。如此,能够根据领域来高效地进行信息的确定。
另外,上述实施方式中的各构成要素(主体2001、前端2002、后端2005等)的一部分或者全部也可以由1个系统LSI(Large Scale Integration:大规模集成电路)构成。系统LSI是将多个构成部集成于1个芯片上而制造出的超多功能LSI,具体而言,是包含微处理器、ROM、RAM等而构成的计算机系统。所述RAM中记录有计算机程序。所述微处理器按照所述计算机程序进行工作,由此系统LSI实现其功能。另外,构成上述各装置的构成要素的各部既可以单独地单芯片化,也可以以包含一部分或全部的方式单芯片化。另外,虽然此处设为LSI,但根据集成度不同,有时也称为IC、LSI、超大LSI(super LSI)、特大LSI(ultra LSI)。另外,集成电路化的方法不限于LSI,也可以通过专用电路或者通用处理器实现。也可以在LSI制造后利用能够进行编程的FPGA(Field Programmable Gate Array;现场可编程门阵列)或者可以对LSI内部的电路单元的连接和/或设定进行重构的可重构处理器(reconfigurable processor)。进而,随着半导体技术的发展或者派生的其他技术的出现,如果出现能够替代LSI的集成电路化的技术,当然也可以利用该技术进行功能块的集成化。也可能会存在适用生物技术的可能性。
另外,上述实施方式中的各构成要素的一部分或者全部也可以由计算机等能够装卸于装置的IC卡或者单体模块构成。所述IC卡或者所述模块是由微处理器、ROM、RAM等构成的计算机系统。所述IC卡或者所述模块也可以包含上述超多功能LSI。微处理器按照计算机程序进行工作,由此所述IC卡或者所述模块实现其功能。该IC卡或者该模块也可以具有抗篡改性。
另外,作为本公开的一个技术方案,例如也可以是包含图3、图5等所示的步骤的全部或一部分的对话方法。对话系统10中所使用的对话方法例如包括:主体2001根据从前端2002和后端2005的一方取得的对话行为来决定提供用对话行为的决定步骤;和主体2001将通过所述决定步骤决定的提供用对话行为向前端2002和后端2005的一方提供的提供步骤,基于从前端2002和后端2005的集合逐次取得的对话行为中的对话行为类型的序列而非附带信息的序列,在所述决定步骤中决定提供用对话行为中的对话行为类型。例如,所述决定步骤包括:从前端2002和后端2005的集合逐次取得对话行为,并对所取得的对话行为中的附带信息和对话行为类型进行分离的分离子步骤;将通过所述分离子步骤分离出的对话行为类型设为观测,基于该观测,参照成为用于对应于观测来决定行动的基准的信念状态信息,决定作为行动的对话行为类型的行动决定子步骤;通过将通过所述行动决定子步骤决定的对话行为类型与通过所述分离子步骤分离出的附带信息进行合成来生成提供用对话行为的合成子步骤;以及根据通过所述分离子步骤分离出的对话行为类型的序列即观测、和通过所述行动决定子步骤决定的对话行为类型的序列即行动来更新信念状态信息的更新步骤。另外,也可以是通过计算机实现该对话方法的计算机程序(例如进行包括所述决定步骤和所述提供步骤的对话控制处理的程序等),还可以是通过所述计算机程序形成的数字信号。另外,作为本公开的一个技术方案,也可以将所述计算机程序或者所述数字信号记录于计算机可读取的记录介质例如软盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)、半导体存储器等。另外,也可以是记录在上述的记录介质中的所述数字信号。另外,作为本公开的一个技术方案,也可以将所述计算机程序或所述数字信号经由电通信线路、无线或有线通信线路、以因特网为代表的网络、数据广播等进行传送。另外,作为本公开的一个技术方案,也可以是具有微处理器和存储器的计算机系统,所述存储器记录有上述计算机程序,所述微处理器按照所述计算机程序进行工作。另外,也可以通过将所述程序或所述数字信号记录在所述记录介质中转移、或经由所述网络等将所述程序或所述数字信号进行转移,由此通过独立的其他的计算机系统来实施。
另外,上述实施方式中示出的对话系统10所涉及的技术除了上述的服务的方式(参照图1)之外,例如可以在以下的云服务的类型中实现。但是,上述实施方式中示出的技术的适用并不限于在此说明的云服务的类型。
(服务的类型1:自己公司数据中心型云服务)
图8是表示服务的类型1(自己公司数据中心型云服务)下的对话系统所提供的服务的全貌的图。在本类型中,服务提供商1120从设备1101取得由用户1010输入的信息,经由设备1101向用户1010提供服务。在本类型中,服务提供商1120具有数据中心运营公司的功能。即,服务提供商1120保有对大数据进行管理的云服务器。在本类型中,不存在数据中心运营公司。在本类型中,服务提供商1120具有作为数据中心的云服务器1203,对操作系统(OS)1202以及应用程序(应用)1201进行管理。服务提供商1120通过使用OS1202以及应用1201,利用云服务器1203与设备1101进行通信,由此提供服务。
(服务的类型2:IaaS利用型云服务)
图9是示出服务的类型2(IaaS利用型云服务)下的对话系统所提供的服务的全貌的图。在此,IaaS是基础设施即服务(Infrastructure as a Service)的简称,是将用于构建及运行计算机系统的基础本身作为经由互联网的服务来提供的云服务提供模型。
在本类型中,数据中心运营公司1110对数据中心(云服务器)1203进行运营以及管理。另外,服务提供商1120对OS1202以及应用1201进行管理。服务提供商1120使用服务提供商1120管理的OS1202以及应用1201来提供服务。
(服务的类型3:PaaS利用型云服务)
图10是示出服务的类型3(PaaS利用型云服务)下的对话系统所提供的服务的全貌的图。在此,PaaS是平台即服务(Platform as a Service)的简称,是将成为用于构建及运行软件的根基的平台作为经由互联网的服务来提供的云服务提供模型。
在本类型中,数据中心运营公司1110对OS1202进行管理,对数据中心(云服务器)1203进行运营以及管理。另外,服务提供商1120对应用1201进行管理。服务提供商1120使用数据中心运营公司1110管理的OS1202以及服务提供商1120管理的应用1201来提供服务。
(服务的类型4:SaaS利用型云服务)
图11是示出服务的类型4(SaaS利用型云服务)下的对话系统所提供的服务的全貌的图。在此,SaaS是软件即服务(Software as a Service)的简称。SaaS利用型云服务例如是具有如下功能的云服务提供模型,即未保有数据中心(云服务器)的公司或个人等利用者能够经由互联网等网络使用保有数据中心(云服务器)的平台提供商提供的应用。
在本类型中,数据中心运营公司1110对应用1201进行管理,对OS1202进行管理,对数据中心(云服务器)1203进行运营以及管理。另外,服务提供商1120使用数据中心运营公司1110管理的OS1202以及应用1201来提供服务。
以上,无论在哪种云服务类型中,都是服务提供商120提供服务。另外,例如,服务提供商或者数据中心运营公司既可以自行开发OS、应用或者大数据的数据库等,另外也可以让第三方开发。
此外,也可以不依赖于上述的云服务的类型而通过图1所示的设备1101(例如智能手机、PC等)单体来构成对话系统10,例如也可以将知识库206配置在设备1101的外部的网络上并通过知识库206以及设备1101来构成对话系统10。
另外,通过将上述实施方式中示出的各构成要素以及功能进行任意组合而实现的实施方式也包含在本公开的范围中。
Claims (9)
1.一种信息处理方法,是对话装置中的信息处理方法,所述对话装置通过与用户的对话来询问所述用户的症状,所述信息处理方法包括:
向与所述对话装置连接的显示器或与所述对话装置连接的扬声器,输出与所述用户的症状有关的第1类别的第1提问信息,所述第1提问信息所表示的提问是开放式提问,
从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示对所述第1提问信息所表示的提问的应答的第1应答信息,
在判断为所述第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的所述第1类别的第2提问信息,所述第2提问信息所表示的提问是开放式提问,
在判断为所述第1应答信息所表示的应答包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户的症状有关的第2类别的第3提问信息,所述第3提问信息所表示的提问是封闭式提问。
2.根据权利要求1所述的信息处理方法,
从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示有无所述第2类别的提问信息所表示的症状的第2应答信息,基于所述第2应答信息判断有无所述第3提问信息所表示的症状,在判断为有所述第3提问信息所表示的症状的情况下,所述第3提问信息所表示的症状被作为指定关键字进行管理,在判断为没有所述第3提问信息所表示的症状的情况下,所述第3提问信息所表示的症状被作为排除关键字进行管理,
将表示基于所述指定关键字和所述排除关键字的组合而确定的所述用户的症状的信息输出到与所述对话装置连接的显示器或与所述对话装置连接的扬声器。
3.根据权利要求1所述的信息处理方法,
所述开放式提问是指用是或否进行应答的类型之外的提问,
所述封闭式提问是指用是或否进行应答的类型的提问。
4.一种非瞬时性记录介质,记录有使处理器执行权利要求1所述的方法的程序。
5.一种信息处理方法,是对话装置中的信息处理方法,所述对话装置通过与用户的对话来筛选所述用户想要确定的事项,所述信息处理方法包括:
向与所述对话装置连接的显示器或与所述对话装置连接的扬声器,输出与所述用户想要确定的事项有关的第1类别的第1提问信息,所述第1提问信息所表示的提问是开放式提问,
从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示对所述第1提问信息所表示的提问的应答的第1应答信息,
在判断为所述第1应答信息所表示的应答不包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户想要确定的事项有关的所述第1类别的第2提问信息,所述第2提问信息所表示的提问是开放式提问,
在判断为所述第1应答信息所表示的应答包含表示否定表达的言语的情况下,向所述显示器或所述扬声器输出与所述用户想要确定的事项有关的第2类别的第3提问信息,所述第3提问信息所表示的提问是封闭式提问。
6.根据权利要求5所述的信息处理方法,
从与所述对话装置连接的键盘、与所述对话装置连接的触摸面板或与所述对话装置连接的麦克风,接收表示所述第3提问信息所表示的事项是否与所述用户想要确定的事项关联的第2应答信息,基于所述第2应答信息判断所述第3提问信息所表示的事项是否与所述用户想要确定的事项关联,在判断为所述第3提问信息所表示的事项与所述用户想要确定的事项关联的情况下,所述第3提问信息所表示的事项被作为指定关键字进行管理,在判断为所述第3提问信息所表示的事项与所述用户想要确定的事项并不关联的情况下,所述第3提问信息所表示的事项被作为排除关键字进行管理,
将表示基于所述指定关键字和所述排除关键字的组合而确定的所述用户想要确定的事项的信息输出到与所述对话装置连接的显示器或与所述对话装置连接的扬声器。
7.根据权利要求5所述的信息处理方法,
所述用户想要确定的事项包括病名、烹饪食谱、旅行计划、不动产物件和/或影像内容。
8.根据权利要求5所述的信息处理方法,
所述开放式提问是指用是或否进行应答的类型之外的提问,
所述封闭式提问是指用是或否进行应答的类型的提问。
9.一种非瞬时性记录介质,记录有使处理器执行权利要求5所述的信息处理方法的程序。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016131739 | 2016-07-01 | ||
JP2016-131739 | 2016-07-01 | ||
JP2017012528A JP6832502B2 (ja) | 2016-07-01 | 2017-01-26 | エージェント装置、対話システム、対話方法及びプログラム |
JP2017-012528 | 2017-01-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107562770A true CN107562770A (zh) | 2018-01-09 |
Family
ID=59101301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710404504.3A Pending CN107562770A (zh) | 2016-07-01 | 2017-06-01 | 信息处理方法以及记录介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11055799B2 (zh) |
EP (2) | EP3438988A1 (zh) |
CN (1) | CN107562770A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065015A (zh) * | 2018-07-27 | 2018-12-21 | 清华大学 | 一种数据采集方法、装置、设备及可读存储介质 |
CN110675098A (zh) * | 2018-07-03 | 2020-01-10 | 松下电器(美国)知识产权公司 | 控制方法以及信息处理装置 |
CN112823347A (zh) * | 2018-10-02 | 2021-05-18 | 松下电器(美国)知识产权公司 | 信息提供方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704482A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 方法、装置以及程序 |
US11093533B2 (en) * | 2018-06-05 | 2021-08-17 | International Business Machines Corporation | Validating belief states of an AI system by sentiment analysis and controversy detection |
CN109033401A (zh) * | 2018-08-02 | 2018-12-18 | 宜宾学院 | 基于语料库的初中英语错题分析系统 |
CN110931137B (zh) * | 2018-09-19 | 2023-07-07 | 京东方科技集团股份有限公司 | 机器辅助对话系统、方法及装置 |
USD1014517S1 (en) | 2021-05-05 | 2024-02-13 | Fisher & Paykel Healthcare Limited | Display screen or portion thereof with graphical user interface |
JP2023048026A (ja) * | 2021-09-27 | 2023-04-06 | 富士フイルム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510197A (zh) * | 2008-02-15 | 2009-08-19 | 冲电气工业株式会社 | 信息检索系统 |
CN101872349A (zh) * | 2009-04-23 | 2010-10-27 | 国际商业机器公司 | 处理自然语言问题的方法和装置 |
WO2013166146A1 (en) * | 2012-05-01 | 2013-11-07 | Cincinnati Children's Hospital Medical Center | Neuro-cognitive diagnosis and therapy decision support system |
US20140122109A1 (en) * | 2012-10-29 | 2014-05-01 | Consuli, Inc. | Clinical diagnosis objects interaction |
WO2014147667A1 (en) * | 2013-03-22 | 2014-09-25 | Nec Corporation | System, method and program for evaluating a reflexivity |
CN104699741A (zh) * | 2013-12-05 | 2015-06-10 | 国际商业机器公司 | 分析自然语言问题来确定缺失信息以便提高回答的准确性 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010129033A (ja) | 2008-12-01 | 2010-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 対話心理学習装置とその方法、対話制御装置とその方法、プログラムと記録媒体 |
US8782063B2 (en) * | 2009-10-20 | 2014-07-15 | Universal Research Solutions, Llc | Generation and data management of a medical study using instruments in an integrated media and medical system |
JP5857090B2 (ja) | 2014-05-26 | 2016-02-10 | ソフトバンク株式会社 | 情報検索装置、情報検索プログラム、及び情報検索システム |
JP2016001242A (ja) | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | 質問文生成方法、装置、及びプログラム |
US10387793B2 (en) * | 2014-11-25 | 2019-08-20 | International Business Machines Corporation | Automatic generation of training cases and answer key from historical corpus |
WO2016092436A1 (en) * | 2014-12-10 | 2016-06-16 | Koninklijke Philips N.V. | System to create and adjust a holistic care plan to integrate medical and social services |
-
2017
- 2017-06-01 CN CN201710404504.3A patent/CN107562770A/zh active Pending
- 2017-06-19 US US15/627,350 patent/US11055799B2/en active Active
- 2017-06-20 EP EP18190248.7A patent/EP3438988A1/en not_active Ceased
- 2017-06-20 EP EP17176796.5A patent/EP3264301A1/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510197A (zh) * | 2008-02-15 | 2009-08-19 | 冲电气工业株式会社 | 信息检索系统 |
CN101872349A (zh) * | 2009-04-23 | 2010-10-27 | 国际商业机器公司 | 处理自然语言问题的方法和装置 |
WO2013166146A1 (en) * | 2012-05-01 | 2013-11-07 | Cincinnati Children's Hospital Medical Center | Neuro-cognitive diagnosis and therapy decision support system |
US20140122109A1 (en) * | 2012-10-29 | 2014-05-01 | Consuli, Inc. | Clinical diagnosis objects interaction |
WO2014147667A1 (en) * | 2013-03-22 | 2014-09-25 | Nec Corporation | System, method and program for evaluating a reflexivity |
CN104699741A (zh) * | 2013-12-05 | 2015-06-10 | 国际商业机器公司 | 分析自然语言问题来确定缺失信息以便提高回答的准确性 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675098A (zh) * | 2018-07-03 | 2020-01-10 | 松下电器(美国)知识产权公司 | 控制方法以及信息处理装置 |
CN109065015A (zh) * | 2018-07-27 | 2018-12-21 | 清华大学 | 一种数据采集方法、装置、设备及可读存储介质 |
CN112823347A (zh) * | 2018-10-02 | 2021-05-18 | 松下电器(美国)知识产权公司 | 信息提供方法 |
CN112823347B (zh) * | 2018-10-02 | 2024-06-07 | 松下电器(美国)知识产权公司 | 信息提供方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3438988A1 (en) | 2019-02-06 |
US20180005333A1 (en) | 2018-01-04 |
EP3264301A1 (en) | 2018-01-03 |
US11055799B2 (en) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107562770A (zh) | 信息处理方法以及记录介质 | |
Cai et al. | Large language models as tool makers | |
JP6832502B2 (ja) | エージェント装置、対話システム、対話方法及びプログラム | |
Lal Dey et al. | A qualitative enquiry into the appropriation of mobile telephony at the bottom of the pyramid | |
CN101681484B (zh) | 用于通过小数据速率通信系统的增强型通信的系统和方法 | |
CN110138982A (zh) | 基于人工智能的服务实现 | |
Cabrera et al. | Being global: How to think, act, and lead in a transformed world | |
CN108886487A (zh) | 多模态对话互通 | |
CN108476164A (zh) | 用于消息传送应用的自动建议和其他内容 | |
Moon | Global business strategy: Asian perspective | |
Venkatesan et al. | The AI marketing canvas: A five-stage road map to implementing artificial intelligence in marketing | |
Dash et al. | An exploratory study of customer perceptions of usage of chatbots in the hospitality industry | |
US20180039618A1 (en) | Computerized group task digital assistance | |
Steyvers | A knight in white satin armour? New institutionalism and mayoral leadership in the era of governance1 | |
CN107958015A (zh) | 内容特定关键词通知系统 | |
CN112434501A (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
Parikh et al. | A tourist place recommendation and recognition system | |
CN106844499A (zh) | 多轮会话交互方法及装置 | |
Reardon et al. | Conclusion: A window of opportunity | |
US11558509B1 (en) | Intelligent call routing using knowledge graphs | |
Wilson | Age of Invisible Machines: A Practical Guide to Creating a Hyperautomated Ecosystem of Intelligent Digital Workers | |
Carmona | The AI Organization: Learn from Real Companies and Microsoft’s Journey How to Redefine Your Organization with AI | |
Van Noort | Seeking strategic narrative alignment: the case of BRICS and Brazil on the issue of infrastructural development | |
Upadhyaya et al. | Smart Multi-linguistic Health Awareness System using RASA Model | |
Gretzel | Tourism in a technology-dependent world |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180109 |