CN109726269B - 信息处理方法、信息处理装置以及程序 - Google Patents
信息处理方法、信息处理装置以及程序 Download PDFInfo
- Publication number
- CN109726269B CN109726269B CN201811234895.XA CN201811234895A CN109726269B CN 109726269 B CN109726269 B CN 109726269B CN 201811234895 A CN201811234895 A CN 201811234895A CN 109726269 B CN109726269 B CN 109726269B
- Authority
- CN
- China
- Prior art keywords
- text information
- processing
- named entities
- replacement
- expressions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 135
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 230000014509 gene expression Effects 0.000 claims abstract description 173
- 238000012545 processing Methods 0.000 claims description 205
- 238000012360 testing method Methods 0.000 claims description 55
- 238000007781 pre-processing Methods 0.000 claims description 29
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 18
- 238000006467 substitution reaction Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 description 70
- 230000008569 process Effects 0.000 description 64
- 238000010586 diagram Methods 0.000 description 57
- 230000004044 response Effects 0.000 description 16
- 101100112111 Caenorhabditis elegans cand-1 gene Proteins 0.000 description 11
- 230000006399 behavior Effects 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 235000015220 hamburgers Nutrition 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000000470 constituent Substances 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010411 cooking Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 101150014742 AGE1 gene Proteins 0.000 description 2
- 101100492805 Caenorhabditis elegans atm-1 gene Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 241000219198 Brassica Species 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及信息处理方法、信息处理装置以及程序。信息处理方法包括:取得步骤,从存储有第1文本信息的存储装置取得第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文;确定步骤,确定在取得步骤中取得的第1文本信息所包含的一个以上的命名实体;替换步骤,将在确定步骤中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第1文本信息生成第2文本信息;以及学习步骤,使用在替换步骤中生成的第2文本信息作为教师数据来使对话系统的模型进行学习。
Description
技术领域
本公开涉及适用于对话系统的信息处理方法、信息处理装置以及程序。
背景技术
对话系统是由对话机器人等执行与用户的话语相应的任务(task)的系统。对话系统中有以实现餐饮店检索等特定任务为目的而与用户进行对话的任务导向型对话系统、以及就种类繁多的话题与用户进行对话的非任务导向型对话系统。
在对话系统中,要求高精度地理解用户的话语内容并进行适当的对话。因此尝试了通过机器学习等学习来生成对话系统模型(例如专利文献1)。
在专利文献1中,公开了通过学习来生成如下模型的技术,该模型对包含多样而浅显易懂的表达的话语,也会高精度地赋予对话行为的类型。
现有技术文献
专利文献
专利文献1:日本特开2015-1910号公报
非专利文献
非专利文献1:S.Sukhbaatar,A.Szlam,J.Weston,and R.Fergus(2015).End-to-end memory networks.Proceedings of NIPS.
发明内容
发明所要解决的问题
然而,由于成为教师数据的话语文(语句)中包含专有名词等命名实体(固有表达),因而难以高精度地生成对话系统的模型。另外,在上述专利文献1所公开的技术中,没有进行对于学习包含命名实体的话语文时的特殊考虑。
本公开是鉴于上述情况而做出的,目的在于提供能够使通过学习生成的对话系统的模型精度提高的信息处理方法、信息处理装置以及程序。
用于解决问题的技术方案
本公开的一个技术方案涉及的信息处理方法,包括:取得步骤,从存储有第1文本信息的存储装置取得所述第1文本信息,所述第1文本信息表示作为学习用数据集(dataset)的一个以上的话语文;确定步骤,确定在所述取得步骤中取得的所述第1文本信息所包含的一个以上的命名实体;替换步骤,将在所述确定步骤中确定的所述一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由所述第1文本信息生成第2文本信息;以及学习步骤,使用在所述替换步骤中生成的所述第2文本信息作为教师数据来使对话系统的模型进行学习。
此外,这些总括性的或者具体的技术方案既可以通过系统、方法、集成电路、计算机程序或者计算机可读取的CD-ROM等记录介质来实现,也可以通过系统、方法、集成电路、计算机程序以及记录介质的任意组合来实现。
发明效果
根据本公开的信息处理方法等,能够使通过学习生成的对话系统的模型的精度提高。
附图说明
图1是表示实施方式涉及的信息处理装置的构成的一例的框图。
图2是表示图1所示的数据加工部的详细构成的一例的框图。
图3是图2所示的知识库所存储的知识的一例。
图4是图2所示的上下文(语境)词典所存储的表达对(成对的表达)的一例。
图5是表示实施方式涉及的信息处理装置的工作的概要的流程图。
图6A是表示实施方式涉及的信息处理装置所进行的工作的详情的流程图。
图6B是表示图6A所示的步骤S103的处理的另一方式的流程图。
图7是表示实施例1涉及的替换处理被执行前的一段对话的一例的图。
图8是表示实施例1涉及的上下文词典的一例的图。
图9是表示实施例1涉及的替换处理被执行后的一段对话的一例的图。
图10是表示实施例2涉及的替换处理被执行前的一段对话的一例的图。
图11是表示实施例2涉及的上下文词典的一例的图。
图12是表示实施例2涉及的替换处理被执行后的一段对话的一例的图。
图13是表示实施例3涉及的替换处理被执行前的一段对话的一例的图。
图14是表示实施例3涉及的上下文词典的一例的图。
图15是表示实施例3涉及的替换处理被执行后的一段对话的一例的图。
图16是表示实施例4涉及的替换处理被执行前的一段对话的一例的图。
图17是表示实施例4涉及的上下文词典的一例的图。
图18是表示实施例4涉及的替换处理被执行后的一段对话的一例的图。
图19是表示实施例5涉及的替换处理被执行前的一段对话的一例的图。
图20是表示实施例5涉及的知识库的一部分的图。
图21是表示实施例5涉及的上下文词典的一例的图。
图22是表示实施例5涉及的替换处理被执行后的一段对话的一例的图。
图23是表示实施例6涉及的替换处理被执行前的一段对话的一例的图。
图24是表示实施例6涉及的知识库的一部分的图。
图25是表示实施例6涉及的上下文词典的一例的图。
图26是表示实施例6涉及的替换处理被执行后的一段对话的一例的图。
图27是表示实施例7涉及的替换处理被执行前的一段对话的一例的图。
图28是表示实施例7涉及的知识库的一部分的图。
图29是表示实施例7涉及的上下文词典的一例的图。
图30是表示实施例7涉及的替换处理被执行后的一段对话的一例的图。
图31是表示本公开的替换处理的效果的图。
图32是表示本公开的替换处理的效果的图。
图33是表示本公开的替换处理的效果的图。
标号说明
1、4、5存储装置;2数据加工部;3学习处理部;6预测处理部;7输出处理部;10信息处理装置;11取得部;12知识库;13确定部;14替换处理部;15上下文词典;16登记部;17替换执行部。
具体实施方式
本公开的一个技术方案涉及的信息处理方法,包括:取得步骤,从存储有第1文本信息的存储装置取得所述第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文;确定步骤,确定在所述取得步骤中取得的所述第1文本信息所包含的一个以上的命名实体;替换步骤,将在所述确定步骤中确定的所述一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由所述第1文本信息生成第2文本信息;以及学习步骤,使用在所述替换步骤中生成的所述第2文本信息作为教师数据来使对话系统的模型进行学习。
根据本技术方案,能够使用基于预定规则将话语文所包含的命名实体替换成吸收了命名实体的变化(variation)的抽象化表达而得到的教师数据来使对话系统的模型进行学习。由此,能够使通过学习生成的对话系统的模型的精度提高。
另外,例如也可以为,在所述替换步骤中,将在所述确定步骤中确定的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,并且附加与所述第1文本信息所示的一个以上的话语文的上下文相应的数值,由此,由所述第1文本信息生成第2文本信息。
在此,例如也可以为,与所述上下文相应的数值是与发现所述第1文本信息所示的一个以上的话语文中的该一个以上的命名实体的先后顺序相应的数值。
根据这些技术方案,对基于预定规则替换出的抽象化表达附加与上下文相应的数值,因此,能够使用属于相同概念的抽象化表达中的不同的实体(entity)在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据。由此,能够进一步使通过学习生成的对话系统的模型的精度提高。
另外,例如也可以为,在所述替换步骤中,将在所述确定步骤中确定的所述一个以上的命名实体中的、表示解决特定任务的目标物候选的设施(机构)名称替换成基于所述预定规则抽象出的表达即抽象化表达,并且将与如下位次相应的数值作为与所述上下文相应的数值进行附加,所述位次是基于与所述设施名称所示的设施中的服务有关的评价值的位次。
另外,例如也可以为,所述信息处理方法还包括处理步骤,在所述处理步骤中,使用在所述学习步骤中学习出的所述模型进行解决特定任务的处理,在所述取得步骤中,从存储有第3文本信息的存储装置取得所述第3文本信息,所述第3文本信息表示作为测试(test)用数据集的一个以上的话语文,在所述确定步骤中,确定在所述取得步骤中取得的所述第3文本信息所包含的一个以上的命名实体,在所述替换步骤中,将在所述确定步骤中确定的所述第3文本信息所包含的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,由此,由所述第3文本信息生成第4文本信息,在所述处理步骤中,使用在所述替换步骤中生成的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
根据本技术方案,能够使用基于预定规则将话语文所包含的命名实体替换成吸收了命名实体的变化的抽象化表达而得到的测试用数据集。由此,能够使通过学习生成的对话系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的对话系统一侧应该进行的响应内容的推定、输出等处理。
另外,例如也可以为,所述信息处理方法还包括预处理步骤,在所述预处理步骤中,作为预处理,对在所述替换步骤中生成的所述第2文本信息以及所述第4文本信息进行二元语法(bigram)处理,所述二元语法处理是以相邻的两个表达作为一个块单位进行切分的处理,在所述学习步骤中,使用在所述预处理步骤中进行了所述二元语法处理的所述第2文本信息作为教师数据来使所述模型进行学习,在所述处理步骤中,进一步使用在所述预处理步骤中进行了所述二元语法处理的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
另外,例如也可以为,所述信息处理方法还包括预处理步骤,在所述预处理步骤中,作为预处理,对在所述替换步骤中生成的所述第2文本信息以及所述第4文本信息进行将所包含的表达的形式标准化的标准化处理,在所述学习步骤中,使用在所述预处理步骤中进行了所述标准化处理的所述第2文本信息作为教师数据来使所述模型进行学习,在所述处理步骤中,进一步使用在所述预处理步骤中进行了所述标准化处理的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
另外,例如也可以为,所述信息处理方法还包括输出步骤,在所述输出步骤中,将在所述处理步骤中进行了解决所述特定任务的处理后的结果所包含的一个以上的抽象化表达、即基于所述预定规则替换出的一个以上的抽象化表达替换成原来的命名实体进行输出。
另外,本公开的一个技术方案涉及的信息处理装置,具备:取得部,其从存储有第1文本信息的存储装置取得所述第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文;确定部,其确定在所述取得部中取得的所述第1文本信息所包含的一个以上的命名实体;替换处理部,其将在所述确定部中确定的所述一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由所述第1文本信息生成第2文本信息;以及学习处理部,其使用在所述替换处理部中生成的所述第2文本信息作为教师数据来使对话系统的模型进行学习。
另外,本公开的一个技术方案涉及的程序使计算机执行上述技术方案所述的信息处理方法。
此外,这些总括性的或者具体的技术方案既可以通过系统、方法、集成电路、计算机程序或者计算机可读取的CD-ROM等记录介质来实现,也可以通过系统、方法、集成电路、计算机程序以及记录介质的任意组合来实现。
以下,参照附图,对本公开的实施方式进行说明。以下说明的实施方式均表示本公开的一个具体例。在以下的实施方式中表示的数值、形状、构成要素、步骤、步骤的顺序等为一例,并非旨在限定本公开。另外,对于以下的实施方式中的构成要素中的、没有记载在表示最上位概念的独立权利要求中的构成要素,作为任意的构成要素进行说明。另外,在所有的实施方式中,也可以组合各自的内容。
(实施方式)
下面,参照附图,进行对实施方式中的信息处理方法等的说明。
[信息处理装置10]
图1是表示实施方式涉及的信息处理装置10的构成的一例的框图。图2是表示图1所示的数据加工部2的详细构成的一例的框图。
图1所示的信息处理装置10具备存储装置1、4、5、学习处理部3、预测处理部6以及输出处理部7,适用于对话系统。在此,对话系统可以是任务导向型对话系统。
<存储装置1、4、5>
存储装置1存储学习处理部3进行学习处理时所使用的学习用数据集。在本实施方式中,存储装置1存储有表示作为学习用数据集的一个以上的话语文的第1文本信息,被用在学习处理部3进行学习处理时。学习用数据集中包含多个对话数据,多个对话数据的每一个中包含有一个以上的话语文。
存储装置4保存有学习处理部3使用学习用数据集来学习的模型。在本实施方式中,存储装置4存储有对话系统的模型,通过学习处理部3来学习。
存储装置5存储预测处理部6进行预测处理时所使用的测试用数据集。在本实施方式中,存储装置5存储有表示作为测试用数据集的一个以上的话语文的第3文本信息,被用在预测处理部6进行预测处理时。测试用数据集中也包含多个对话数据,多个对话数据的每一个中包含有一个以上的话语文。
存储装置1、4、5例如通过硬盘驱动器或者固态驱动器等可改写的非易失性存储器来构成。
<数据加工部2>
数据加工部2进行存储装置1所存储的学习用数据集的加工。在本实施方式中,数据加工部2将第1文本信息所包含的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第1文本信息生成第2文本信息。在此,所谓命名实体,是关于人名或地名等这样的专有名词、日期表达或者时间表达等的总称。命名实体中例如有组织名、人名、地名、日期表达、时间表达、金额表达、比例表达、专有物名等。另外,本实施方式的抽象化表达是命名实体被上位概念化以使得属于相同概念的抽象化表达中的不同实体成为在不同的对话间视作相同的表达而得到的。
另外,数据加工部2进行存储装置5所存储的测试用数据集的加工。在本实施方式中,数据加工部2将第3文本信息所包含的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第3文本信息生成第4文本信息。
此外,数据加工部2也可以对生成的第2文本信息以及第4文本信息进行将所包含的表达的形式标准化的标准化处理。在此,所谓标准化处理,例如是将单词的复数形式变为单数形式的处理、将单词的过去式变为现在式的处理等。另外,数据加工部2也可以对生成的第2文本信息以及第4文本信息进行二元语法处理,所述二元语法处理是以相邻的两个表达作为一个块单位进行切分的处理。
将会在后面对详细构成等进行说明。
<学习处理部3>
学习处理部3通过计算机等实现,基于深层学习等机器学习中所使用的预定算法,进行对话系统的模型的学习处理。学习处理部3使用由数据加工部2加工了的存储于存储装置1的学习用数据集,进行学习处理。学习处理部3使存储装置4存储进行了学习处理的模型。
在本实施方式中,学习处理部3使用在数据加工部2中生成的第2文本信息作为教师数据来使对话系统的模型进行学习。对话系统的模型是被机器学习的神经网络模型,例如也可以包括递归神经网络。
此外,也可以为,当在数据加工部2中对第2文本信息进行了二元语法处理的情况下,学习处理部3使用进行了二元语法处理的第2文本信息作为教师数据来使对话系统的模型进行学习。另外,也可以为,当在数据加工部2中对第2文本信息进行了标准化处理的情况下,学习处理部3使用进行了标准化处理的第2文本信息作为教师数据来使对话系统的模型进行学习。
<预测处理部6>
预测处理部6通过计算机等实现。预测处理部6使用测试用数据集,使存储装置4所存储的学习完的模型进行解决特定任务的处理。预测处理部6使用由数据加工部2加工了的存储于存储装置5的测试用数据集来进行该处理。预测处理部6将处理结果输出给输出处理部7。在此,所谓特定任务,例如是餐厅的预约(预订)、酒店的预约、汉堡的订购、租赁房屋的检索,但不限于这些。解决特定任务的处理是对用户为了解决特定任务而进行的话语的对话行为或者对话状态的推定、以及对相对于用户的话语的对话系统一侧应该进行的响应内容的推定、输出等,但不限于这些。
在本实施方式中,预测处理部6使用在学习处理部3中学习出的模型,进行解决特定任务的处理。更详细而言,预测处理部6使用在数据加工部2中生成的第4文本信息作为测试用数据来进行解决特定任务的处理。而且,预测处理部6将处理结果输出给输出处理部7。
此外,也可以为,当在数据加工部2中对第4文本信息进行了二元语法处理的情况下,预测处理部6使用进行了二元语法处理的第4文本信息作为测试用数据来进行解决特定任务的处理。另外,也可以为,当在数据加工部2中对第4文本信息进行了标准化处理的情况下,预测处理部6使用进行了标准化处理的第4文本信息作为测试用数据来进行解决特定任务的处理。
<输出处理部7>
输出处理部7对从预测处理部6取得的输出结果进行将该输出结果所包含的抽象化表达恢复为原来的命名实体的逆变换并输出。在本实施方式中,输出处理部7将进行了解决特定任务的处理后的结果所包含的一个以上的抽象化表达、即基于预定规则替换出的抽象化表达替换成原来的命名实体进行输出。
以下,对数据加工部2的详细构成进行说明。
[数据加工部2]
例如如图2所示,数据加工部2具备取得部11、知识库12、确定部13以及替换处理部14。此外,数据加工部2也可以在替换处理部14的后级进一步具备预处理部(未图示)。
<取得部11>
取得部11从存储有第1文本信息的存储装置1取得第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文。在本实施方式中,取得部11从存储装置1取得学习用数据集作为第1文本信息,并输出给确定部13。取得部11既可以取得学习用数据集中的每一段对话即表示一段对话的文本信息,也可以取得该一段对话所包含的一个以上的话语中的每一个话语即表示一个话语的文本信息,作为第1文本信息。
另外,取得部11从存储有第3文本信息的存储装置5取得第3文本信息,所述第3文本信息表示作为测试用数据集的一个以上的话语文。在本实施方式中,取得部11从存储装置5取得测试用数据集作为第3文本信息,并输出给确定部13。取得部11既可以按测试用数据集中的每一段对话即表示一段对话的每个文本信息作为第3文本信息进行输出,也可以取得该一段对话所包含的一个以上的话语中的每一个话语即表示一个话语的文本信息作为第3文本信息。
此外,取得部11例如通过CPU、ASIC或者FPGA等处理器构成,通过CPU等处理器执行计算机所保持的能够由计算机读取的程序来实现。
<知识库12>
知识库12将事实、常识及/或经验等知识形成计算机能够解读的形式而构成数据库。知识库12能够通过检索找到知识。此外,知识库12也可以位于数据加工部2的外部。即,知识库12不是数据加工部2的必须的构成。
图3是图2所示的知识库12所存储的知识的一例。图3中示出本实施方式涉及的存储有餐厅的信息的例子。更详细而言,在图3中,作为餐厅的候选(candidate),示出“the_sparkling_service”以及“gentle_deep_water”两个餐厅名。也就是说,在图3中,作为候选(candidate)的一例,示出了表示解决特定任务的目标物候选的设施名称。另外,在图3中,作为餐厅的内容(value)和其属性(slot),示出“paris”和“r_location”、“cheap”和“r_price”、“40”和“r_rating”、“french”和“r_cuisine”、“business”和“r_atmosphere”、“two”和“r_number”。也就是说,在图3中,示出餐厅的内容(value)和作为其属性(slot)而将该内容上位概念化得到的抽象化表达。换言之,抽象化表达是一个以上的命名实体分别基于预定规则被抽象出的表达。
<确定部13>
确定部13确定在取得部11中取得的第1文本信息所包含的一个以上的命名实体。在本实施方式中,确定部13参照知识库12,确定由取得部11取得的第1文本信息所包含的一个以上的命名实体,所述命名实体成为进行替换处理的对象。
另外,确定部13确定在取得部11中取得的第3文本信息所包含的一个以上的命名实体。在本实施方式中,确定部13参照知识库12,确定由取得部11取得的第3文本信息所包含的一个以上的命名实体,所述命名实体成为进行替换处理的对象。
<替换处理部14>
替换处理部14将在确定部13中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第1文本信息生成第2文本信息。
在本实施方式中,如图2所示,替换处理部14具备上下文词典15、登记部16以及替换执行部17。此外,替换处理部14也可以不具备上下文词典15以及登记部16。
《上下文词典15》
上下文词典15存储有按照上下文进行替换处理的表达对,能够通过检索找到知识。也就是说,上下文词典15存储有进行替换处理的对象的命名实体、以及与该命名实体对应的被替换的抽象化表达。
图4是图2所示的上下文词典15所存储的表达对的一例。在图4中,示出本实施方式涉及的存储有第1文本信息或者第3文本信息所包含的一个以上的命名实体以及与其成对的抽象化表达的例子。更详细而言,在图4中,作为替换源(source),示出“french”、“british”、“the_sparkling_service”以及“gentle_deep_water”。也就是说,如图4所示,在上下文词典15的替换源(source)中,登记有存在于知识库12的内容栏(value栏)以及候选(candidate)中的单词或者单词串等表达。
另外,在图4中,作为替换目标(destination),示出“cuisine_1”、“cuisine_2”、“cand_1”以及“cand_2”。也就是说,如图4所示,在上下文词典15的替换目标(destination)中,登记有对存在于知识库12的属性栏(slot栏)中的单词或者单词串等表达附加了与上下文相应的数值而得到的结果。该数值是对一个对话数据内的与slot栏中所示的同一表达对应的value栏中所示的表达的出现顺序进行编号而得到的。换言之,该数值相当于与发现第1文本信息(或者第3文本信息)所示的一个以上的话语文中的该一个以上的命名实体的先后顺序相应的数值。
另外,在替换源(source)是存在于候选(candidate)中的单词或者单词串等表达的情况下,将与如下位次相应的数值作为与上下文相应的数值进行附加,所述位次是基于与由该表达表示的设施中的服务有关的评价值的位次。此外,该评价值是表示对该设施所提供的料理、氛围、料理的价格等该设施所提供的服务的评价的值。该评价值可以根据互联网上的评价、评论数、排名、访问数等来决定,也可以通过在知识库12中提取包含“r_rating”的行而根据行数来决定。在图3所示的例子中,对于“the_sparkling_service”,属性(slot)为“r_rating”中的内容(value)是“40”,对于“gentle_deep_water”,属性(slot)为“r_rating”中的内容(value)是“32”。因此,作为评价,“the_sparkling_service”比“gentle_deep_water”高,所以编号为1、2。即,可以将替换源(source)“the_sparkling_service”、“gentle_deep_water”的替换目标(destination)设为“cand_1”以及“cand_2”。
此外,上下文词典15不限于图4所示的情况的例子,也可以不进行编号,还可以是替换源(source)中不包含存在于图3所示的候选(candidate)中的单词或者单词串等表达。也就是说,替换源(source)中也可以仅登记有存在于知识库12的内容栏(value栏)中的表达。在该情况下,替换目标(destination)中既可以登记有存在于知识库12的属性栏(slot栏)的表达,也可以登记有对存在于知识库12的属性栏(slot栏)中的表达附加了与上下文相应的数值而得到的结果。
《登记部16》
登记部16例如通过CPU、ASIC或者FPGA等处理器构成,通过CPU等处理器执行计算机所保持的能够由计算机读取的程序来实现。
在本实施方式中,登记部16确认由确定部13确定的成为进行替换处理的对象的命名实体是否作为替换源(source)而与替换目标(destination)的表达一起登记在上下文词典15中。换言之,登记部16确认第1文本信息(或者第3文本信息)所包含的一个以上的命名实体的每一个是否登记在上下文词典15中。
如果第1文本信息(或者第3文本信息)所包含的一个以上的命名实体中有尚未登记于上下文词典15的命名实体,则登记部16将该命名实体和与该命名实体成对的按照上下文的表达登记到上下文词典15中。
《替换执行部17》
替换执行部17例如通过CPU、ASIC或者FPGA等处理器构成,通过CPU等处理器执行计算机所保持的能够由计算机读取的程序来实现。
在本实施方式中,替换执行部17执行将在确定部13中确定的一个以上的命名实体分别按照上下文词典15进行替换的替换处理。更具体而言,替换执行部17将在确定部13中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,并且附加与第1文本信息所示的一个以上的话语文的上下文相应的数值,由此,由第1文本信息生成第2文本信息。在此,与上下文相应的数值是与发现第1文本信息所示的一个以上的话语文中的该一个以上的命名实体的先后顺序相应的数值。而且,替换执行部17进一步将在确定部13中确定的一个以上的命名实体中的表示解决特定任务的目标物候选的设施名称替换成基于预定规则抽象出的表达即抽象化表达,并且将与如下位次相应的数值作为与上下文相应的数值进行附加,所述位次是基于与由该设施名称所示的设施中的服务有关的评价值的位次。而且,替换执行部17将生成的第2文本信息输出给存储装置1。
此外,有时上下文词典15的替换源(source)中仅登记有存在于知识库12的内容栏(value栏)中的表达、替换目标(destination)中仅登记有存在于知识库12的属性栏(slot栏)中的表达。在该情况下,替换执行部17只要进行通过将在确定部13中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达从而从第1文本信息生成第2文本信息的替换处理即可。另外,有时在上下文词典15的替换目标(destination)中也登记有对存在于知识库12的属性栏(slot栏)中的表达附加了与上下文相应的数值而得到的结果。在该情况下,替换执行部17只要通过将在确定部13中确定的一个以上的命名实体分别按照上下文词典15替换成抽象化表达并且附加与第1文本信息所示的一个以上的话语文的上下文相应的数值从而由第1文本信息生成第2文本信息即可。
另外,替换执行部17不限于进行将第1文本信息所包含的一个以上的命名实体分别替换成抽象化表达的替换处理的情况。替换执行部17也可以进行将第3文本信息所包含的一个以上的命名实体分别替换成抽象化表达的替换处理。例如,设为上下文词典15的替换源(source)中仅登记有存在于知识库12的内容栏(value栏)的表达、替换目标(destination)中仅登记有存在于知识库12的属性栏(slot栏)的表达。在该情况下,替换执行部17同样进行如下替换处理即可:将在确定部13中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第3文本信息生成第4文本信息。而且,替换执行部17将生成的第4文本信息输出给存储装置5。此外,替换执行部17也同样能够适用于进行根据上下文词典15的内容附加与上下文相应的数值的处理从而由第3文本信息生成第4文本信息的情况。
<预处理部>
预处理部可以对在替换处理部14中生成的第2文本信息及/或第4文本信息进行将所包含的表达的形式标准化的标准化处理。另外,预处理部也可以对在替换处理部14中生成的第2文本信息及/或第4文本信息进行二元语法处理,所述二元语法处理是以相邻的两个表达作为一个块单位进行切分的处理。
此外,预处理部例如通过CPU、ASIC或者FPGA等处理器构成,通过CPU等处理器执行计算机所保持的能够由计算机读取的程序来实现。
[信息处理装置10的工作]
接着,说明如上所述构成的信息处理装置10所进行的信息处理。
图5是表示实施方式涉及的信息处理装置10的工作的概要的流程图。
首先,信息处理装置10执行取得学习用数据集的取得处理(S1)。更具体而言,信息处理装置10从存储有表示作为学习用数据集的一个以上的话语文的第1文本信息的存储装置1中取得第1文本信息。
接着,信息处理装置10执行确定命名实体的确定处理(S2)。更具体而言,信息处理装置10确定在步骤S1中取得的第1文本信息所包含的一个以上的命名实体。
接着,信息处理装置10执行将在步骤S2中确定的命名实体替换成抽象化表达的替换处理(S3)。更具体而言,信息处理装置10将在步骤S2中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由第1文本信息生成第2文本信息。此外,在步骤S3中,信息处理装置10也可以将在步骤S2中确定的一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,并且附加与第1文本信息所示的一个以上的话语文的上下文相应的数值,由此,由第1文本信息生成第2文本信息。再者,在步骤S3中,信息处理装置10也可以将在步骤S2中确定的一个以上的命名实体中的表示解决特定任务的目标物候选的设施名称替换成基于预定规则抽象出的表达即抽象化表达,并且将与如下位次相应的数值作为与上下文相应的数值进行附加,所述位次是基于与设施名称所示的设施中的服务有关的评价值的位次。
接着,信息处理装置10执行学习处理(S4)。更具体而言,信息处理装置10使用在步骤S3中生成的第2文本信息作为教师数据来使对话系统的模型进行学习。
此外,对于测试用数据集,步骤S1~步骤S3的处理也是同样的。在该情况下,信息处理装置10将在如步骤S3那样的处理中生成的第4文本信息作为测试用数据,使学习完的模型进行解决特定任务的处理即可。
接着,说明信息处理装置10所进行的信息处理的详情。
图6A是表示实施方式涉及的信息处理装置10所进行的工作的详情的流程图。图6B是表示图6A所示的步骤S103的处理的另一方式的流程图。在图6A中,示出在上下文词典15的替换源(source)中不包含存在于图3所示的候选(candidate)的表达的情况下的工作的详情。另一方面,在图6B中,除了图6A的情况之外,示出在上下文词典15的替换源(source)中包含存在于图3所示的候选(candidate)的表达的情况下的工作。
首先,如图6A所示,信息处理装置10取得数据集(S101)。该数据集可以是学习用数据集也可以是测试用数据集。在数据集是学习用数据集的情况下,信息处理装置10从存储装置1取得学习用数据集。另一方面,在数据集是测试用数据集的情况下,信息处理装置10从存储装置5取得测试用数据集。
接着,信息处理装置10从通过步骤S101取得的数据集中取得一段对话(S102)。
接着,信息处理装置10将上下文词典15初始化(S103)。更具体而言,信息处理装置10将存储于上下文词典15的表达对清除,使上下文词典15为空。
接着,信息处理装置10从通过步骤S102取得的一段对话中取得一个话语(S104)。
接着,信息处理装置10确认通过步骤S104取得的一个话语中的各命名实体是否存在于知识库12(S105)。更具体而言,信息处理装置10参照知识库12,确认在步骤S104中取得的一个话语中所包含的一个以上的命名实体是否存在于知识库12。
在步骤S105中,信息处理装置10在通过步骤S104取得的一个话语中所包含的一个以上的命名实体中只要有一个存在于知识库12的情况下(S105:是),前进至步骤S106。此外,在步骤S105中,信息处理装置10在通过步骤S104取得的一个话语中的所有命名实体都不存在于知识库12的情况下(S105:否),返回至步骤S104,从通过步骤S102取得的一段对话中取得下一个话语。
接着,信息处理装置10确认通过步骤S104取得的一个话语中所包含的一个以上的命名实体中的、存在于知识库12的命名实体是否尚未登记在上下文词典15中(S106)。
在步骤S106中,信息处理装置10在存在于知识库12的该命名实体已全部登记于上下文词典15的情况下(S106:否),前进至步骤S108。另一方面,在步骤S106中,信息处理装置10在存在于知识库12的该命名实体中有尚未登记于上下文词典15的命名实体时(S106:是),前进至步骤S107。
接着,在步骤S107中,信息处理装置10将尚未登记于上下文词典15的命名实体登记到上下文词典15中。更具体而言,如果存在于知识库12的该命名实体中有尚未登记于上下文词典15的命名实体,则信息处理装置10将该命名实体和与该命名实体成对的按照上下文的表达登记到上下文词典15中。更详细而言,如图4所示,信息处理装置10将尚未登记于上下文词典15的命名实体作为替换源(source)、将与该命名实体成对的按照上下文的表达作为替换目标(destination)而登记到上下文词典15中。在此,如上所述,替换目标(destination)的表达是通过将替换源(source)的命名实体基于预定规则上位概念化等所抽象出的表达即抽象化表达。
接着,在步骤S108中,信息处理装置10执行如下替换处理:将通过步骤S104取得的一个话语中所包含的一个以上的命名实体中的存在于知识库12的命名实体按照上下文词典15进行替换。更具体而言,信息处理装置10执行将通过步骤S104取得的一个话语中所包含的该命名实体按照上下文词典15替换成抽象化表达并且附加与上下文相应的数值的替换处理。在此,如上所述,与上下文相应的数值是与发现该一个话语中的一个以上的命名实体的先后顺序相应的数值。
接着,信息处理装置10确认在步骤S108中执行了替换处理的一个话语是否是通过步骤S102取得的一段对话数据的最后一个(S109)。
在步骤S109中,信息处理装置10当在步骤S108中执行了替换处理的一个话语是通过步骤S102取得的一段对话数据的最后一个的情况下(S109:是),前进至步骤S110。此外,在步骤S109中,信息处理装置10当在步骤S108中执行了替换处理的一个话语不是通过步骤S102取得的一段对话数据的最后一个的情况下(S109:否),返回至步骤S104,从通过步骤S102取得的一段对话中取得下一个话语。
接着,在步骤S110中,信息处理装置10确认通过步骤S102取得的一段对话数据是否是通过步骤S101取得的数据集的最后一段。
在步骤S110中,信息处理装置10在通过步骤S102取得的一段对话数据是通过步骤S101取得的数据集的最后一段的情况下(S110:是),前进至步骤S111。此外,在步骤S110中,信息处理装置10在通过步骤S102取得的一段对话数据不是通过步骤S101取得的数据集的最后一段的情况下(S110:否),返回至步骤S102,从通过步骤S101取得的数据集中取得下一段对话数据。
在步骤S111中,信息处理装置10输出进行了变换处理的数据集(S111)。在数据集是学习用数据集的情况下,信息处理装置10使存储装置1存储进行了变换处理的学习用数据集。另一方面,在数据集是测试用数据集的情况下,信息处理装置10使存储装置5存储进行了变换处理的测试用数据集。
接下来,使用图6B,说明上下文词典15的替换源(source)中包含存在于图3所示的候选(candidate)的表达的情况下的工作。在图6B中,与图6A相比,处理的不同之处在于步骤S103的处理替换成了步骤S103A。
具体而言,在步骤S103A中,首先,信息处理装置10将存储于上下文词典15的表达对清除,使上下文词典15为空(S1031)。
接着,信息处理装置10确认通过步骤S102取得的一段对话中是否有知识库12所包含的候选名称(S1032)。更具体而言,信息处理装置10参照知识库12,确认在步骤S102中取得的一段对话中是否有存在于知识库12的候选(candidate)的命名实体。在此,将存在于知识库12的候选(candidate)中的命名实体称为候选名称。另外,信息处理装置10例如在通过步骤S102取得的一段对话中,对知识库12设定检索条件并执行检索,由此,能够确认是否有存在于知识库12的候选(candidate)中的命名实体。
在步骤S1032中,信息处理装置10在通过步骤S102取得的一段对话中有知识库12所包含的候选名称的情况下(S1032:是),提取该候选名称(S1033)。此外,在步骤S1032中,信息处理装置10在通过步骤S102取得的一段对话中没有知识库12所包含的候选名称的情况下(S1032:否),前进至图6A的步骤S104,继续进行处理。
接着,信息处理装置10对通过步骤S1033提取到的该候选名称进行排序(赋予位次)(S1034)。例如,信息处理装置10根据与该候选名称所示的设施中提供的服务有关的评价值来对该候选名称进行排序。
接着,信息处理装置10将通过步骤S1033提取到的该候选名称登记于上下文词典15(S1035)。更具体而言,信息处理装置10向上下文词典15的替换源(source)登记通过步骤S1033提取到的该候选名称,向替换目标(destination)登记对“cand”附加了数值的表达。关于数值,登记通过步骤S1034决定的位次。
如此,信息处理装置10能够在步骤S103A中,将存在于图3所示的候选(candidate)的表达登记到上下文词典15的替换源(source)中。
接下来,作为实施例,说明对数据集中的一段对话执行替换处理的具体的技术方案。在实施例1~4中,列举上下文词典15的替换源(source)中不包含存在于知识库12的候选(candidate)中的表达的情况为例进行说明。在实施例5~7中,列举上下文词典15的替换源(source)中仅包含存在于知识库12的候选(candidate)中的表达的情况为例进行说明。
(实施例1)
在实施例1中,设本实施方式的对话系统是作为任务导向型对话系统的餐厅预约系统来进行说明。换言之,餐厅预约系统是想要解决的特定任务为餐厅预约的对话系统的一例。
图7是表示实施例1涉及的替换处理被执行前的一段对话的一例的图。
图8是表示实施例1涉及的上下文词典15的一例的图。图9是表示实施例1涉及的替换处理被执行后的一段对话的一例的图。
此外,图7所示的一段对话可以是从存储装置1取得的学习用数据集所包含的对话,也可以是从存储装置5取得的测试用数据集所包含的对话。在图7以及图9中,“U:”表示是用户的话语,“S:”表示是对话系统的话语。在图7所示的一段对话中,用户在就与餐厅有关的条件进行会话。对话系统在到取得所有属性(slot)为止进行用于向用户询问条件的会话。另外,对话系统在成功取得所有属性(slot)的时刻,进行应用调用(api_call),例如进行向对话系统所管理的餐厅DB的访问。
信息处理装置10参照图3所示的知识库12,确认表示图7所示的一段对话的文本信息中所包含的多个命名实体是否存在于知识库12。在图7所示的一段对话中,确认出存在于知识库12的“business”、“cheap”、“paris”、“french”以及“british”等关于餐厅预约的命名实体。
因此,如图8所示,信息处理装置10将这些命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述命名实体对应的抽象化表达“atmosphere_1”、“price_1”、“location_1”、“cuisine_1”以及“cuisine_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对与上述命名实体对应的、知识库12的属性栏(slot栏)的表达附加了与出现顺序相应的数值而得到的。
而且,信息处理装置10通过按照图8所示的上下文词典15对图7所示的一段对话文执行替换处理,能够获得表示如图9所示的一段对话的文本信息。在图9中,命名实体“business”、“cheap”、“paris”、“french”以及“british”替换成了抽象化表达“atmosphere_1”、“price_1”、“location_1”、“cuisine_1”以及“cuisine_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与餐厅预约有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由于能够使用这样的教师数据来使餐厅预约系统的模型进行学习,因此能够使通过学习生成的餐厅预约系统的模型的精度提高。
另外,由于能够使用这样的测试用数据集,因此能够使通过学习生成的餐厅预约系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例2)
在实施例2中,设本实施方式的对话系统是作为任务导向型对话系统的酒店预约系统来进行说明。换言之,酒店预约系统是想要解决的特定任务为酒店预约的对话系统的一例。在本实施例中以与实施例1不同的部分为中心进行说明。
图10是表示实施例2涉及的替换处理被执行前的一段对话的一例的图。图11是表示实施例2涉及的上下文词典15的一例的图。图12是表示实施例2涉及的替换处理被执行后的一段对话的一例的图。
信息处理装置10参照知识库12,确认表示图10所示的一段对话的文本信息中所包含的多个命名实体是否存在于知识库12。在图10所示的一段对话中,确认出存在于知识库12的“vacation”、“two”、“london”、“expensive”以及“cheap”等关于酒店预约的命名实体。
因此,如图11所示,信息处理装置10将这些命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述命名实体对应的抽象化表达“atmosphere_1”、“number_1”、“location_1”、“price_1”以及“price_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对与上述命名实体对应的、知识库12的属性栏(slot栏)的表达附加了与出现顺序相应的数值而得到的。
而且,信息处理装置10通过按照图11所示的上下文词典15对图10所示的一段对话文执行替换处理,能够获得表示如图12所示的一段对话的文本信息。在图12中,命名实体“vacation”、“two”、“london”、“expensive”以及“cheap”替换成了抽象化表达“atmosphere_1”、“number_1”、“location_1”、“price_1”以及“price_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与酒店预约有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由此,能够使通过学习生成的酒店预约系统的模型的精度提高。另外,能够使通过学习生成的酒店预约系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例3)
在实施例3中,设本实施方式的对话系统是作为任务导向型对话系统的汉堡订购系统来进行说明。换言之,汉堡订购系统是想要解决的特定任务为汉堡订购的对话系统的一例。在本实施例中以与实施例1等不同的部分为中心进行说明。
图13是表示实施例3涉及的替换处理被执行前的一段对话的一例的图。图14是表示实施例3涉及的上下文词典15的一例的图。图15是表示实施例3涉及的替换处理被执行后的一段对话的一例的图。
信息处理装置10参照知识库12,确认表示图13所示的一段对话的文本信息中所包含的多个命名实体是否存在于知识库12。在图13中,示出了在一段对话中确认出存在于知识库12的“chicken”、“onion”、“mustard”、“wheat”以及“cheese”等关于汉堡订购的命名实体的例子。
因此,如图14所示,信息处理装置10将这些命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述命名实体对应的抽象化表达“main_1”、“vagetable_1”、“sauce_1”、“bun_1”以及“bun_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对与上述命名实体对应的、知识库12的属性栏(slot栏)的表达附加了与出现顺序相应的数值而得到的。
而且,信息处理装置10通过按照图14所示的上下文词典15对图13所示的一段对话文执行替换处理,能够获得表示如图15所示的一段对话的文本信息。在图15中,命名实体“chicken”、“onion”、“mustard”、“wheat”以及“cheese”替换成了抽象化表达“main_1”、“vagetable_1”、“sauce_1”、“bun_1”以及“bun_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与汉堡订购有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由此,能够使通过学习生成的汉堡订购系统的模型的精度提高。另外,能够使通过学习生成的汉堡订购系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例4)
在实施例4中,设本实施方式的对话系统是作为任务导向型对话系统的租赁房屋检索系统来进行说明。换言之,租赁房屋检索系统是想要解决的特定任务为租赁房屋的检索的对话系统的一例。在本实施例中以与实施例1等不同的部分为中心进行说明。
图16是表示实施例4涉及的替换处理被执行前的一段对话的一例的图。图17是表示实施例4涉及的上下文词典15的一例的图。图18是表示实施例4涉及的替换处理被执行后的一段对话的一例的图。
信息处理装置10参照知识库12,确认表示图16所示的一段对话的文本信息中所包含的多个命名实体是否存在于知识库12。在图16中,示出了在一段对话中确认出存在于知识库12的“three”、“new”、“cheap”、“setagaya”以及“shinjuku”等关于租赁房屋的检索的命名实体的例子。
因此,如图17所示,信息处理装置10将这些命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述命名实体对应的抽象化表达“number_1”、“age_1”、“price_1”、“location_1”以及“location_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对与上述命名实体对应的、知识库12的属性栏(slot栏)的表达附加了与出现顺序相应的数值而得到的。
而且,信息处理装置10通过按照图17所示的上下文词典15对图16所示的一段对话文执行替换处理,能够获得表示如图18所示的一段对话的文本信息。在图18中,命名实体“three”、“new”、“cheap”、“setagaya”以及“shinjuku”替换成了抽象化表达“number_1”、“age_1”、“price_1”、“location_1”以及“location_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与租赁房屋的检索有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由此,能够使通过学习生成的租赁房屋检索系统的模型的精度提高。另外,能够使通过学习生成的租赁房屋检索系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例5)
在实施例5中,设本实施方式的对话系统是作为任务导向型对话系统的餐厅预约系统来进行说明。
图19是表示实施例5涉及的替换处理被执行前的一段对话的一例的图。图20是表示实施例5涉及的知识库12的一部分的图。图21是表示实施例5涉及的上下文词典15的一例的图。图22是表示实施例5涉及的替换处理被执行后的一段对话的一例的图。
此外,图19所示的一段对话可以是从存储装置1取得的学习用数据集所包含的对话,也可以是从存储装置5取得的测试用数据集所包含的对话。在图19以及图22中,“U:”表示是用户的话语,“S:”表示是对话系统的话语。在图19所示的一段对话中,对话系统在进行将成为候选的餐厅按评价值从高到低的顺序建议给用户的会话。另外,对话系统在到用户采纳为止进行连续对成为候选的餐厅的建议的会话。
信息处理装置10参照图20所示的知识库12,确认表示图19所示的一段对话的文本信息中是否有知识库12的候选名称。在此,所谓知识库12的候选名称,是表示解决餐厅预约这一特定任务的目标物候选的设施名称,是表示餐厅名的命名实体。知识库12的候选名称在图3所示的知识库12中相当于存在于候选(candidate)的命名实体。当参照图20所示的知识库12时,会在图19所示的一段对话中确认出“the_sparkling_service”、“gentle_deep_water”等表示餐厅名的命名实体。
因此,如图21所示,信息处理装置10将这些表示餐厅名的命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述表示餐厅名的命名实体对应的抽象化表达“cand_1”以及“cand_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对上述表示餐厅名的命名实体附加了与对应的评价值从高到低的顺序相应的数值而得到的。
在此,在图20所示的知识库12中,与“the_sparkling_service”对应的属性(slot)“r_rating”中存储有值即内容(value)“40”。另一方面,与“gentle_deep_water”对应的属性(slot)“r_rating”中存储有值即内容(value)“32”。因此,“the_sparkling_service”的评价值高于“gentle_deep_water”的评价值。由此,登记于上下文词典15的与“the_sparkling_service”对应的抽象化表达成为“cand_1”,登记于上下文词典15的与“gentle_deep_water”对应的抽象化表达成为“cand_2”。
而且,信息处理装置10通过按照图21所示的上下文词典15对图19所示的一段对话文执行替换处理,能够获得表示如图22所示的一段对话的文本信息。在图22中,命名实体“the_sparkling_service”以及“gentle_deep_water”替换成了抽象化表达“cand_1”以及“cand_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与餐厅预约有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由于能够使用这样的教师数据来使餐厅预约系统的模型进行学习,因此能够使通过学习生成的餐厅预约系统的模型的精度提高。
另外,由于能够使用这样的测试用数据集,因此能够使通过学习生成的餐厅预约系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例6)
在实施例6中,设本实施方式的对话系统是作为任务导向型对话系统的酒店预约系统来进行说明。在本实施例中以与实施例5不同的部分为中心进行说明。
图23是表示实施例6涉及的替换处理被执行前的一段对话的一例的图。图24是表示实施例6涉及的知识库12的一部分的图。图25是表示实施例6涉及的上下文词典15的一例的图。图26是表示实施例5涉及的替换处理被执行后的一段对话的一例的图。
信息处理装置10参照图24所示的知识库12,确认表示图23所示的一段对话的文本信息中是否有知识库12的候选名称。在此,所谓知识库12的候选名称,是表示解决酒店预约这一特定任务的目标物候选的设施名称,是表示酒店名的命名实体。当参照图24所示的知识库12时,会在图23所示的一段对话中确认出“green_dog_garden”以及“deep_wolf_hill”等表示酒店名的命名实体。
因此,如图25所示,信息处理装置10将这些表示酒店名的命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述表示酒店名的命名实体对应的抽象化表达“cand_1”以及“cand_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对上述表示酒店名的命名实体附加了与对应的评价值从高到低的顺序相应的数值而得到的。
在此,在图24所示的知识库12中,与“green_dog_garden”对应的“r_rating”中存储有值“55”,与“deep_wolf_hill”对应的“r_rating”中存储有值“34”。因此,“green_dog_garden”的评价值高于“deep_wolf_hill”的评价值。由此,“cand_1”作为与“green_dog_garden”对应的抽象化表达、“cand_2”作为与“deep_wolf_hill”对应的抽象化表达而登记于上下文词典15。
而且,信息处理装置10通过按照图25所示的上下文词典15对图23所示的一段对话文执行替换处理,能够获得表示如图26所示的一段对话的文本信息。在图26中,命名实体“green_dog_garden”以及“deep_wolf_hill”替换成了抽象化表达“cand_1”以及“cand_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与酒店预约有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由此,能够使通过学习生成的酒店预约系统的模型的精度提高。另外,能够使通过学习生成的酒店预约系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
(实施例7)
在实施例7中,设本实施方式的对话系统是作为任务导向型对话系统的租赁房屋检索系统来进行说明。在本实施例中以与实施例5等不同的部分为中心进行说明。
图27是表示实施例7涉及的替换处理被执行前的一段对话的一例的图。图28是表示实施例7涉及的知识库12的一部分的图。图29是表示实施例7涉及的上下文词典15的一例的图。图30是表示实施例7涉及的替换处理被执行后的一段对话的一例的图。
信息处理装置10参照图28所示的知识库12,确认表示图27所示的一段对话的文本信息中是否有知识库12的候选名称。在此,所谓知识库12的候选名称,是表示解决租赁房屋的检索这一特定任务的目标物候选的设施名称,是表示租赁房屋所在的建筑物名的命名实体。当参照图28所示的知识库12时,会在图27所示的一段对话中确认出“grand_union_forest”以及“water_colorful_tree”等表示租赁房屋所在的建筑物名的命名实体。
因此,如图29所示,信息处理装置10将这些表示建筑物名的命名实体登记于上下文词典15的替换源(source)。另外,信息处理装置10将与上述表示建筑物名的命名实体对应的抽象化表达“cand_1”以及“cand_2”登记于上下文词典15的替换目标(destination)。这些抽象化表达是对上述表示建筑物的命名实体附加了与对应的评价值从高到低的顺序相应的数值而得到的。
在此,在图28所示的知识库12中,与“grand_union_forest”对应的“r_distance”中存储有值“0.8”,与“water_colorful_tree”对应的“r_distance”中存储有值“1.2”。因此,“grand_union_forest”所示的租赁房屋所在的建筑物比“water_colorful_tree”所示的租赁房屋所在的建筑物近,所以前者的评价值较高。由此,“cand_1”作为与“grand_union_forest”对应的抽象化表达、“cand_2”作为与“water_colorful_tree”对应的抽象化表达而登记于上下文词典15。
而且,信息处理装置10通过按照图25所示的上下文词典15对图27所示的一段对话文执行替换处理,能够获得表示如图30所示的一段对话的文本信息。在图30中,命名实体“grand_union_forest”以及“water_colorful_tree”替换成了抽象化表达“cand_1”以及“cand_2”。
根据本实施例,能够使用表示像这样执行了替换处理的与租赁房屋的检索有关的一段对话的文本信息作为教师数据或者测试用数据集。也就是说,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据或者测试用数据。
由此,能够使通过学习生成的租赁房屋检索系统的模型的精度提高。另外,能够使通过学习生成的租赁房屋检索系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的响应内容的推定、输出等处理。
[效果等]
如上所述,根据本实施方式,能够使用基于预定规则将话语文所包含的命名实体替换成吸收了命名实体的变化的抽象化表达而得到的教师数据来使对话系统的模型进行学习。由此,能够实现能使通过学习生成的对话系统的模型精度提高的信息处理方法以及信息处理装置。
此外,当话语文所包含的命名实体中有若进行抽象化则会变为同一概念的命名实体时,虽然能够将属于相同概念的不同的实体在不同的对话间视为相同,但是在一个对话中无法区别。其结果,有时会抑制通过学习生成的对话系统的模型的精度。
于是,也可以对基于预定规则替换出的抽象化表达附加与上下文相应的数值。即,根据本实施方式,除了将话语文所包含的命名实体替换成抽象化表达之外,还可以附加与上下文相应的数值。由此,能够使用属于相同概念的抽象化表达中的不同的实体在一个对话中能够区别并且在不同的对话间视为相同的表达的教师数据,因此能够进一步使通过学习生成的对话系统的模型的精度提高。
另外,根据本实施方式,也可以在对将话语文所包含的命名实体替换成了抽象化表达的教师数据进一步进行作为预处理的二元语法处理或者标准化处理后,使对话系统的模型进行学习。由此,能够使通过学习生成的对话系统的模型的精度进一步提高。
另外,同样地,根据本实施方式,也可以使用基于预定规则将话语文所包含的命名实体替换成吸收了命名实体的变化的抽象化表达而得到的测试用数据集。由此,能够使通过学习生成的对话系统的模型高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的对话系统一侧应该进行的响应内容的推定、输出等处理。
另外,根据本实施方式,也可以在对将话语文所包含的命名实体替换成了抽象化表达的测试用数据进一步进行作为预处理的二元语法处理或者标准化处理后,再使通过学习生成的对话系统的模型进行处理。由此,能够使通过学习生成的对话系统的模型更高精度地进行对话语的对话行为或者对话状态的推定、以及对相对于用户的话语的对话系统一侧应该进行的响应内容的推定、输出等处理。
(实验结果)
对在使由本公开的信息处理方法以及信息处理装置使用替换处理得到的学习用数据集所学习出的对话系统的模型进行推定对话系统一侧应该输出的响应内容的处理的情况下的有效性进行了验证。以下对该实验结果进行说明。
<实验条件>
在本实验中,对餐厅预约系统等对话系统的模型使用了由非专利文献1所公开的End-to-End Memory Networks。另外,设定学习率为0.01、迭代次数(epoch)为200、hop数为2、Embedding Dim.为32,并将除此之外的参数设为非专利文献1中所记载的值进行了学习。另外,在知识库12中,通过学习,对于成为候选的餐厅,存储有料理、地点、价格段、预约人数、氛围、限制对应、住址以及电话号码。
作为测试用数据集,准备了各自包含1000个数据的Test1用数据集和Test2用数据集这两种。Test1用数据集和Test2用数据集中包含有用户的话语以及对话系统针对该话语所能够选择的多个话语。而且,将根据对话系统的模型而针对用户的话语选择了对话系统应该选择的话语的情况评价为正确结果。
在此,例如假设如图7所示的一段对话那样,一段对话由6个话语构成,则Test1用数据集和Test2用数据集中包含有除了最后的第6个话语之外的5个话语,并包含有应该成为第6个话语的话语作为选择项。在对话系统选择了图7所示的一段对话的第6个话语的情况下作为正确结果来评价性能。更具体而言,在Test1用数据集和Test2用数据集所包含的1000个数据中,将对话系统的模型针对用户的话语而选择了正确结果的话语的比例作为性能进行评价。
此外,Test1用数据集和Test2用数据集对于料理和地点而成为不同的种类。另外,Test2用数据集中包含有未知词。另外,在本实验中,使用Test1用数据集进行了学习。
<实验结果>
图31~图33是表示本公开的替换处理的效果的图。图31~图33中所示的“Original”是比较例,示出了由不进行本公开的替换处理学习出的模型得到的实验结果。
《实验结果1》
在图31中,示出在进行了与相对于实施例1所示的一段对话的任务同样的任务的情况下的实验结果1。在实验结果1中,进行了如下任务:用户就与餐厅有关的条件进行会话,对话系统在到取得所有属性(slot)为止进行用于向用户询问条件的会话。另外,在对话系统中进行了如下任务:在成功取得所有属性(slot)的时刻,进行应用调用,例如进行向对话系统所管理的餐厅DB的访问。
在此,图31所示的“+replacement”示出在使用进行了将命名实体替换成抽象化表达并附加与对话中的出现顺序相应的数值的替换处理后的Test1用数据集以及Test2用数据集的情况下的性能。图31所示的“+replacement,bi-gram,removing candidate”是进一步进行了二元语法处理作为预处理的结果。而且,示出在使用将能够选择的多个话语中的正确结果的话语文和相关性低的话语文删除从而减少要选择的话语文后的Test1用数据集以及Test2用数据集的情况下的性能。
如图31所示,可知“+replacement”示出比“Original”高的性能。另外,可知对于包含未知词的Test2用数据集,也示出了与不包含未知词的Test1用数据集同等的高性能。根据这些结果可知,通过进行本公开的替换处理,能够使通过学习生成的对话系统的模型高精度地进行相对于用户的话语的响应内容的推定处理。
另外,如图31所示,可知“+replacement,bi-gram,removing candidate”对于Test1用数据集以及Test2用数据集都示出了比“+replacement”更高的性能。根据该结果可知,通过在本公开的替换处理中进一步进行预处理,能够使通过学习生成的对话系统的模型更高精度地进行相对于用户的话语的响应内容的推定处理。
《实验结果2》
在图32中,示出在进行了与相对于实施例5所示的一段对话的任务同样的任务的情况下的实验结果2。在实验结果2中,对话系统进行如下任务:进行将成为候选的餐厅按评价值从高到低的顺序建议给用户的会话。另外,对话系统进行如下任务:在到用户采纳为止进行连续对成为候选的餐厅的建议的会话。
在此,图32所示的“+replacement”示出在使用进行了将表示餐厅名的命名实体替换成抽象化表达并附加与和该命名实体对应的评价值从高到低的顺序相应的数值的替换处理后的Test1用数据集以及Test2用数据集的情况下的性能。图32所示的“+replacement,normalize”示出在使用进一步进行了标准化处理作为预处理后的Test1用数据集以及Test2用数据集的情况下的性能。
如图32所示,可知“+replacement”示出比“Original”高的性能,可知对于包含未知词的Test2用数据集,示出了与不包含未知词的Test1用数据集同等或更高的高性能。另外,可知“+replacement,normalize”示出比“+replacement”进一步更高的性能。根据这些结果可知,通过进行本公开的替换处理等,能够使通过学习生成的对话系统的模型高精度地进行相对于用户的话语的响应内容的推定处理。
《实验结果3》
在图33中,示出在进行了如下任务的情况下的实验结果3:对话系统进行关于用户所采纳的餐厅而将电话号码和/或地址等信息提供给用户的会话。此外,图33所示的“+replacement”以及“+replacement,normalize”如在图32中说明的那样,因此省略说明。
在图33中,与图32同样地,可知“+replacement”示出比“Original”高的性能,对于包含未知词的Test2用数据集,也示出了与不包含未知词的Test1用数据集同等的高性能。另外,可知“+replacement,normalize”示出比“+replacement”高的性能。根据这些结果也可知,通过进行本公开的替换处理,能够使通过学习生成的对话系统的模型高精度地进行相对于用户的话语的响应内容的推定处理。
以上,对实施方式涉及的信息处理装置以及信息处理方法等进行了说明,但本公开不限定于该实施方式。
另外,上述实施方式涉及的信息处理装置所包含的各处理部典型地实现为作为集成电路的LSI。它们可以各别地单片化,或者包括一部分或全部地单片化。
另外,集成电路化不限于LSI,也可以通过专用电路或通用处理器实现。可以利用能够在LSI制造后编程的FPGA(Field Programmable Gate Array:现场可编程门阵列)、或者能够重构LSI内部的电路单元的连接或设定的可重构处理器。
另外,本公开也可以实现为通过信息处理装置执行的信息处理方法。
另外,在上述各实施方式中,各构成要素既可以用专用的硬件构成,也可以通过执行适于各构成要素的软件程序来实现。各构成要素也可以通过CPU或者处理器等程序执行部将记录于硬盘或者半导体存储器等记录介质中的软件程序读出并执行来实现。
另外,框图中的功能模块的分割为一例,也可以将多个功能模块作为一个功能模块来实现,或将一个功能模块分割为多个,或将一部分功能移至其他功能模块。另外,也可以为,单个的硬件或者软件并行或者分时地处理具有类似功能的多个功能模块的功能。
另外,执行流程图中的各步骤的顺序是为了具体说明本公开而例示的,也可以是除上述以外的顺序。另外,上述步骤的一部分也可以与其他步骤同时(并行)执行。
以上,基于实施方式说明了一个或者多个技术方案涉及的信息处理装置,但本公开不限定于该实施方式。只要不脱离本公开的宗旨,将本领域技术人员想到的各种变形应用于本实施方式而得到的方式、和将不同的实施方式中的构成要素组合而构建的方式也可以包含在一个或者多个技术方案的范围内。
Claims (6)
1.一种信息处理方法,包括:
取得步骤,从存储有第1文本信息的存储装置取得所述第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文;
确定步骤,确定在所述取得步骤中取得的所述第1文本信息所包含的一个以上的命名实体;
替换步骤,将在所述确定步骤中确定的所述一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由所述第1文本信息生成第2文本信息;以及
学习步骤,使用在所述替换步骤中生成的所述第2文本信息作为教师数据来使对话系统的模型进行学习,
在所述替换步骤中,将在所述确定步骤中确定的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,并且附加与所述第1文本信息所示的一个以上的话语文的上下文相应的数值,由此,由所述第1文本信息生成第2文本信息,
在所述替换步骤中,将在所述确定步骤中确定的所述一个以上的命名实体中的、表示解决特定任务的目标物候选的设施名称替换成基于所述预定规则抽象出的表达即抽象化表达,并且将与如下位次相应的数值作为与所述上下文相应的数值进行附加,所述位次是基于与所述设施名称所示的设施中的服务有关的评价值的位次,
所述信息处理方法还包括处理步骤,在所述处理步骤中,使用在所述学习步骤中学习出的所述模型进行解决特定任务的处理,
在所述取得步骤中,从存储有第3文本信息的存储装置取得所述第3文本信息,所述第3文本信息表示作为测试用数据集的一个以上的话语文,
在所述确定步骤中,确定在所述取得步骤中取得的所述第3文本信息所包含的一个以上的命名实体,
在所述替换步骤中,将在所述确定步骤中确定的所述第3文本信息所包含的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,由此,由所述第3文本信息生成第4文本信息,
在所述处理步骤中,使用在所述替换步骤中生成的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理,
所述信息处理方法还包括预处理步骤,在所述预处理步骤中,作为预处理,对在所述替换步骤中生成的所述第2文本信息以及所述第4文本信息进行将所包含的表达的形式标准化的标准化处理,
在所述学习步骤中,使用在所述预处理步骤中进行了所述标准化处理的所述第2文本信息作为教师数据来使所述模型进行学习,
在所述处理步骤中,进一步使用在所述预处理步骤中进行了所述标准化处理的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
2.根据权利要求1所述的信息处理方法,
与所述上下文相应的数值是与发现所述第1文本信息所示的一个以上的话语文中的该一个以上的命名实体的先后顺序相应的数值。
3.根据权利要求1所述的信息处理方法,
所述信息处理方法还包括预处理步骤,在所述预处理步骤中,作为预处理,对在所述替换步骤中生成的所述第2文本信息以及所述第4文本信息进行二元语法处理,所述二元语法处理是以相邻的两个表达作为一个块单位进行切分的处理,
在所述学习步骤中,使用在所述预处理步骤中进行了所述二元语法处理的所述第2文本信息作为教师数据来使所述模型进行学习,
在所述处理步骤中,进一步使用在所述预处理步骤中进行了所述二元语法处理的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
4.根据权利要求1或3所述的信息处理方法,
所述信息处理方法还包括输出步骤,在所述输出步骤中,将在所述处理步骤中进行了解决所述特定任务的处理后的结果所包含的一个以上的抽象化表达、即基于所述预定规则替换出的一个以上的抽象化表达替换成原来的命名实体进行输出。
5.一种信息处理装置,具备:
取得部,其从存储有第1文本信息的存储装置取得所述第1文本信息,所述第1文本信息表示作为学习用数据集的一个以上的话语文;
确定部,其确定在所述取得部中取得的所述第1文本信息所包含的一个以上的命名实体;
替换处理部,其将在所述确定部中确定的所述一个以上的命名实体分别替换成基于预定规则抽象出的表达即抽象化表达,由此,由所述第1文本信息生成第2文本信息;以及
学习处理部,其使用在所述替换处理部中生成的所述第2文本信息作为教师数据来使对话系统的模型进行学习,
在所述替换处理部中,将在所述确定部中确定的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,并且附加与所述第1文本信息所示的一个以上的话语文的上下文相应的数值,由此,由所述第1文本信息生成第2文本信息,
在所述替换处理部中,将在所述确定部中确定的所述一个以上的命名实体中的、表示解决特定任务的目标物候选的设施名称替换成基于所述预定规则抽象出的表达即抽象化表达,并且将与如下位次相应的数值作为与所述上下文相应的数值进行附加,所述位次是基于与所述设施名称所示的设施中的服务有关的评价值的位次,
所述信息处理装置还具备处理部,在所述处理部中,使用在所述学习处理部中学习出的所述模型进行解决特定任务的处理,
在所述取得部中,从存储有第3文本信息的存储装置取得所述第3文本信息,所述第3文本信息表示作为测试用数据集的一个以上的话语文,
在所述确定部中,确定在所述取得部中取得的所述第3文本信息所包含的一个以上的命名实体,
在所述替换处理部中,将在所述确定部中确定的所述第3文本信息所包含的所述一个以上的命名实体分别替换成基于所述预定规则抽象出的表达即抽象化表达,由此,由所述第3文本信息生成第4文本信息,
在所述处理部中,使用在所述替换处理部中生成的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理,
所述信息处理装置还具备预处理部,在所述预处理部中,作为预处理,对在所述替换处理部中生成的所述第2文本信息以及所述第4文本信息进行将所包含的表达的形式标准化的标准化处理,
在所述学习处理部中,使用在所述预处理部中进行了所述标准化处理的所述第2文本信息作为教师数据来使所述模型进行学习,
在所述处理部中,进一步使用在所述预处理部中进行了所述标准化处理的所述第4文本信息作为测试用数据集,进行解决所述特定任务的处理。
6.一种计算机可读取记录介质,记录有程序,该程序使计算机执行权利要求1所述的信息处理方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762578740P | 2017-10-30 | 2017-10-30 | |
US62/578740 | 2017-10-30 | ||
JP2018087391A JP7133784B2 (ja) | 2017-10-30 | 2018-04-27 | 情報処理方法、情報処理装置およびプログラム |
JP2018-087391 | 2018-04-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109726269A CN109726269A (zh) | 2019-05-07 |
CN109726269B true CN109726269B (zh) | 2024-04-16 |
Family
ID=66243920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811234895.XA Active CN109726269B (zh) | 2017-10-30 | 2018-10-23 | 信息处理方法、信息处理装置以及程序 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10860800B2 (zh) |
CN (1) | CN109726269B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704482A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 方法、装置以及程序 |
US10860800B2 (en) * | 2017-10-30 | 2020-12-08 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method, information processing apparatus, and program for solving a specific task using a model of a dialogue system |
US11613008B2 (en) * | 2019-01-14 | 2023-03-28 | International Business Machines Corporation | Automating a process using robotic process automation code |
US10796104B1 (en) * | 2019-07-03 | 2020-10-06 | Clinc, Inc. | Systems and methods for constructing an artificially diverse corpus of training data samples for training a contextually-biased model for a machine learning-based dialogue system |
CN110704586A (zh) * | 2019-09-30 | 2020-01-17 | 支付宝(杭州)信息技术有限公司 | 一种信息处理方法及系统 |
CN111177310B (zh) * | 2019-12-06 | 2023-08-18 | 广西电网有限责任公司 | 电力服务机器人智能场景会话方法及装置 |
CN111428130B (zh) * | 2020-03-06 | 2023-04-18 | 云知声智能科技股份有限公司 | 一种知识蒸馏过程中增强文本数据的方法及装置 |
CN111460825A (zh) * | 2020-03-31 | 2020-07-28 | 科大讯飞(苏州)科技有限公司 | 一种数据增强方法、装置、设备及存储介质 |
CN112364649B (zh) * | 2020-09-08 | 2022-07-19 | 深圳平安医疗健康科技服务有限公司 | 命名实体的识别方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003088080A1 (en) * | 2002-04-05 | 2003-10-23 | At & T Corp. | Method and system for detecting and extracting named entities from spontaneous communications |
CN102663129A (zh) * | 2012-04-25 | 2012-09-12 | 中国科学院计算技术研究所 | 医疗领域深度问答方法及医学检索系统 |
CN104169909A (zh) * | 2012-06-25 | 2014-11-26 | 株式会社东芝 | 上下文解析装置及上下文解析方法 |
JP2016133919A (ja) * | 2015-01-16 | 2016-07-25 | 日本電信電話株式会社 | 質問応答方法、装置、及びプログラム |
CN106951512A (zh) * | 2017-03-17 | 2017-07-14 | 深圳市唯特视科技有限公司 | 一种基于混合编码网络的端到端对话控制方法 |
CN107103810A (zh) * | 2016-02-19 | 2017-08-29 | 李佰聪 | 情境式编程教学方法 |
CN107209759A (zh) * | 2015-01-23 | 2017-09-26 | 国立研究开发法人情报通信研究机构 | 注解辅助装置及用于其的计算机程序 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3653224B2 (ja) | 2000-12-28 | 2005-05-25 | 憲三 岩間 | ロボット、単語学習装置およびその方法 |
US7702500B2 (en) * | 2004-11-24 | 2010-04-20 | Blaedow Karen R | Method and apparatus for determining the meaning of natural language |
JP5656353B2 (ja) * | 2007-11-07 | 2015-01-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | マルチリンガル・テキスト・リソースのアクセスを制御するための方法および装置 |
US20140163951A1 (en) * | 2012-12-07 | 2014-06-12 | Xerox Corporation | Hybrid adaptation of named entity recognition |
JP5726953B2 (ja) | 2013-06-17 | 2015-06-03 | 日本電信電話株式会社 | 対話行為付与モデル学習装置、対話行為付与装置、方法、及びプログラム |
KR101482430B1 (ko) * | 2013-08-13 | 2015-01-15 | 포항공과대학교 산학협력단 | 전치사 교정 방법 및 이를 수행하는 장치 |
RU2665239C2 (ru) * | 2014-01-15 | 2018-08-28 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое извлечение именованных сущностей из текста |
US9286892B2 (en) * | 2014-04-01 | 2016-03-15 | Google Inc. | Language modeling in speech recognition |
US10157350B2 (en) * | 2015-03-26 | 2018-12-18 | Tata Consultancy Services Limited | Context based conversation system |
US9672206B2 (en) * | 2015-06-01 | 2017-06-06 | Information Extraction Systems, Inc. | Apparatus, system and method for application-specific and customizable semantic similarity measurement |
US10765956B2 (en) * | 2016-01-07 | 2020-09-08 | Machine Zone Inc. | Named entity recognition on chat data |
WO2017210634A1 (en) * | 2016-06-03 | 2017-12-07 | Maluuba Inc. | Iterative alternating neural attention for machine reading |
US10860800B2 (en) * | 2017-10-30 | 2020-12-08 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method, information processing apparatus, and program for solving a specific task using a model of a dialogue system |
US10515155B2 (en) * | 2018-02-09 | 2019-12-24 | Digital Genius Limited | Conversational agent |
US10496382B2 (en) * | 2018-02-22 | 2019-12-03 | Midea Group Co., Ltd. | Machine generation of context-free grammar for intent deduction |
US11288456B2 (en) * | 2018-12-11 | 2022-03-29 | American Express Travel Related Services Company, Inc. | Identifying data of interest using machine learning |
-
2018
- 2018-09-18 US US16/133,803 patent/US10860800B2/en active Active
- 2018-10-23 CN CN201811234895.XA patent/CN109726269B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003088080A1 (en) * | 2002-04-05 | 2003-10-23 | At & T Corp. | Method and system for detecting and extracting named entities from spontaneous communications |
CN102663129A (zh) * | 2012-04-25 | 2012-09-12 | 中国科学院计算技术研究所 | 医疗领域深度问答方法及医学检索系统 |
CN104169909A (zh) * | 2012-06-25 | 2014-11-26 | 株式会社东芝 | 上下文解析装置及上下文解析方法 |
JP2016133919A (ja) * | 2015-01-16 | 2016-07-25 | 日本電信電話株式会社 | 質問応答方法、装置、及びプログラム |
CN107209759A (zh) * | 2015-01-23 | 2017-09-26 | 国立研究开发法人情报通信研究机构 | 注解辅助装置及用于其的计算机程序 |
CN107103810A (zh) * | 2016-02-19 | 2017-08-29 | 李佰聪 | 情境式编程教学方法 |
CN106951512A (zh) * | 2017-03-17 | 2017-07-14 | 深圳市唯特视科技有限公司 | 一种基于混合编码网络的端到端对话控制方法 |
Non-Patent Citations (1)
Title |
---|
面向对象程序设计课程定位的探索和实践;段世红;姚琳;何杰;万亚东;齐悦;;计算机教育;20190510(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
US10860800B2 (en) | 2020-12-08 |
US20190129932A1 (en) | 2019-05-02 |
CN109726269A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109726269B (zh) | 信息处理方法、信息处理装置以及程序 | |
CN110502738A (zh) | 中文命名实体识别方法、装置、设备和查询系统 | |
US9436681B1 (en) | Natural language translation techniques | |
US20140351228A1 (en) | Dialog system, redundant message removal method and redundant message removal program | |
CN112825249B (zh) | 语音处理方法和设备 | |
CN107239450B (zh) | 基于交互上下文处理自然语言方法 | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN111508497B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN113051923B (zh) | 数据验证方法、装置、计算机设备和存储介质 | |
CN111831902A (zh) | 推荐理由筛选方法、装置、电子设备 | |
JP7133784B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
KR20170122755A (ko) | 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템 | |
CN113157959A (zh) | 基于多模态主题补充的跨模态检索方法、装置及系统 | |
CN114661872A (zh) | 一种面向初学者的api自适应推荐方法与系统 | |
KR100895940B1 (ko) | 문법 저작에서의 세그먼테이션 모호성의 자동 해결 | |
CN114282513A (zh) | 文本语义相似度的匹配方法、系统、智能终端及存储介质 | |
CN112395880B (zh) | 结构化三元组的纠错方法、装置、计算机设备及存储介质 | |
CN111813916B (zh) | 一种智能问答方法、装置、计算机设备和介质 | |
Kim et al. | Compact lexicon selection with spectral methods | |
JP2014232145A (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
JP5980142B2 (ja) | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム | |
CN115658845A (zh) | 一种适用于开源软件供应链的智能问答方法及装置 | |
CN111626059B (zh) | 一种信息处理方法及装置 | |
CN114115878A (zh) | 一种工作流节点推荐方法及装置 | |
CN107203512B (zh) | 用于从用户的自然语言输入中提取关键元素的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |