CN107590123A - 车载中地点上下文指代消解方法及装置 - Google Patents
车载中地点上下文指代消解方法及装置 Download PDFInfo
- Publication number
- CN107590123A CN107590123A CN201710667531.XA CN201710667531A CN107590123A CN 107590123 A CN107590123 A CN 107590123A CN 201710667531 A CN201710667531 A CN 201710667531A CN 107590123 A CN107590123 A CN 107590123A
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- information
- sentence
- sentence information
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Navigation (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种车载中地点上下文指代消解方法及装置,涉及自然语言技术领域,主要目的在于提高车载中地点上下文指代消解的准确性。本发明的方法包括:从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。本发明用于车载中地点上下文指代消解。
Description
技术领域
本发明涉及自然语言技术领域,尤其涉及一种车载中地点上下文指代消解方法及装置。
背景技术
为了简化语句,人们在交流沟通时会使用大量的指代类的词汇,例如:第一、第二、最远、最近等词汇。而出于语言习惯,人们在与车载系统进行人机交互时也会使用大量用于指代地点的指代类词汇。因此,对于语句信息中指代类词汇的解析和识别,已经成为车载系统中指代消解技术的重要部分。在现有技术中,通常使用基于语言学的指代消解技术对语句信息中出现的指代类词汇进行解析和替换,以便车载系统能够进行后续的指令分析和反馈。
目前,在进行车载中地点上下文指代消解时,常采用基于语言学的指代消解技术来解析语句信息中地点的指代类词汇。发明人在实现本发明的过程中,发现现有技术存在以下问题,在实际应用中,由于现有基于指代消解技术的解析方式主要是根据语言学特征对语句信息中的指代类词汇进行字面上的匹配和代替,当同一个语句信息的具体应用场景出现变化时,指代消解的结果可能仍与变化之前的相同,而事实上用户所表达的含义可能是不同的。因此,现有技术在对语句信息进行车载中地点上下文指代消解时,消解结果可能存在误差,影响车载中地点上下文指代消解的准确性。
发明内容
鉴于上述问题,本发明提供一种车载中地点上下文指代消解方法及装置,主要目的在于减少指代消解结果中的误差,提高车载中地点上下文指代消解的准确性。
为解决上述技术问题,第一方面,本发明提供了一种车载中地点上下文指代消解方法,该方法包括:
从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;
根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;
利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
可选的,所述根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇包括:
根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
可选的,所述根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
可选的,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
确定所述第一语句信息中第一词汇对应的实体类型;
根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述实体类型的第二词汇;和/或
解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述语法特征的第二词汇;和/或
当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
根据所述列表选项策略及所述顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
根据所述时间信息和/或位置信息,在排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
可选的,在从第一语句信息中解析出第一语句信息中的第一词汇之前,所述方法还包括:
利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
可选的,所述从第一语句信息中解析出第一语句信息中的第一词汇包括:
根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
可选的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
解析第二语句信息的语句含义;
从所述第二词汇对应的属性信息中获取对应所述语句含义的数据内容;
输出对应所述语句含义的数据内容。
可选的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
第二方面,本发明还提供了一种车载中地点上下文指代消解装置,该装置包括:
解析单元,用于从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;
查询单元,用于根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述解析单元解析出的第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;
替换单元,用于利用所述查询单元查询到的第二词汇替换所述第一词汇,以便生成第二语句信息。
可选的,所述查询单元具体用于,根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
可选的,所述查询单元包括:
获取模块,用于获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
查询模块,用于根据所述获取模块获取的时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
可选的,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述查询模块包括:
确定子模块,用于确定所述第一语句信息中第一词汇对应的实体类型;
查询子模块,用于根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述确定子模块确定的实体类型的第二词汇;和/或
解析子模块,用于解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
查询子模块,还用于根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述解析子模块解析出的语法特征的第二词汇;和/或
识别子模块,用于当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
排序子模块,用于根据所述列表选项策略及所述识别子模块识别的顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
查询子模块,还用于根据所述时间信息和/或位置信息,在所述排序子模块排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
可选的,所述装置还包括:
构建单元,用于利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
可选的,所述解析单元具体用于,根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
可选的,所述装置还包括:
所述解析单元,还用于解析第二语句信息的语句含义;
获取单元,用于从所述第二词汇对应的属性信息中获取对应所述解析单元解析出的语句含义的数据内容;
输出单元,用于输出所述获取单元获取的对应所述语句含义的数据内容。
可选的,所述装置还包括:
添加单元,用于将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
为了实现上述目的,根据本发明的第三方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的车载中地点上下文指代消解方法。
为了实现上述目的,根据本发明的第四方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的车载中地点上下文指代消解方法。
借由上述技术方案,本发明提供的车载中地点上下文指代消解方法及装置,对于现有技术在利用基于语言学的指代消解技术对语句信息进行车载中地点上下文指代消解时,消解结果可能存在误差的问题,本发明在从第一语句信息中解析出第一语句信息中的第一词汇后,通过所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,并根据所述第二词汇替换所述第一词汇,从而生成第二语句信息,实现了对语句中的指代类词汇的消解,相比于现有技术,本发明结合了语句信息的场景信息在实体数据库中查询对应所述第一词汇的第二词汇,从而确保了当语句信息对应的具体应用场景发生变化时,其中第一词汇所指代的含义能够与之进行相应的变化,进而匹配和替换对应的第二词汇,从而解决了当场景发生变化时,现有技术中第一词汇所指代的含义未随之变化所导致指代消解的结果存在误差的问题,提高了车载系统中针对地点上下文指代消解的准确性。此外,通过在实体数据库中查询对应第一词汇的第二词汇,能够在确保指代消解过程中,不仅能从字面上进行指代类词汇的消解和替换,并且能够根据实体数据库中存储的属性信息将第二词汇与其属性信息进行关联和匹配,从而为后续更好的对第二语句信息解析奠定了基础。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种车载中地点上下文指代消解方法流程图;
图2示出了本发明实施例提供的另一种车载中地点上下文指代消解方法流程图;
图3示出了本发明实施例提供的一种车载中地点上下文指代消解装置的组成框图;
图4示出了本发明实施例提供的另一种车载中地点上下文指代消解装置的组成框图;
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了提高车载中地点上下文指代消解的准确性,本发明实施例提供了一种车载中地点上下文指代消解方法,应用于客户端,如图1所示,该方法包括:
101、从第一语句信息中解析出第一语句信息中的第一词汇。
在使用车载系统时,用户会与之发生交互行为,而车载系统在接收到用户发出的语句信息后,会根据该语句生成对应的指令信息。其中,所述用户下达的语句即为本发明实施例中所述的第一语句信息。由于在用户在于车载系统进行交互时,基于人们的语言习惯,通常在第一语句信息中会包含指代类的词汇,具体的可以为指代地点实体的指代类词汇,即为本发明实施例所述的第一词汇。因此,在车载系统接收到用户发出的第一语句信息后,需要将该第一语句信息中的第一词汇解析出来。
在从第一语句信息中解析出第一词汇时,所选择的解析方式,可以根据需要,选取不同的现有技术来进行,例如,可以利用语言学的解析技术,从第一语句信息中解析出该语句中的主要部分,然后根据解析出的主要部分进行对比,筛选出该第一语句信息中的具有指代含义的第一词汇。当然,具体的解析方式还可以选择其他的解析方式,譬如语义标注算法等,在此不做限定,可根据需要自行选取。需要说明的是,所选择的解析方式要保证能够从所述第一语句信息中解析出的具有指代地点实体含义的第一词汇。
102、根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇。
在日常生活中,人们在进行沟通和交流时是基于词汇进行的,在这其中就包括能够表示具体实体的实体类词汇,如汽车、酒店、学校一类的词汇。由于人们在交流时为了简化语言,会使用指代类词汇对语句中的部分实体类词汇进行指代。对此,这类指代类词汇就与实体类词汇存在了一种对应关系,其中,在实体类词汇中有一部分是指代地点的地点实体词汇,即本发明实施例中所述的第二词汇。当然,根据不同的语言环境以及语言对话中的不同语句,指代类词汇与实体类词汇的指代关系也并非一一对应的,且存在的对应关系也并非一成不变的。因此,根据不同的语言对话的情景及不同的实际情况,同一个指代类词汇所对应的实体类词汇也会发生相应的变化,即第一词汇所对应的第二词汇也是需要根据实时情况来进行分析的。
同时,在本发明实施例中,所述实体数据库中存储了不同的地点实体词汇,以及地点实体词汇对应的属性信息,其中所述属性信息中可以包含地点实体词汇对应的名称、序号、类型以及关联信息等不同的信息,以便在进行地点实体查询时,能够根据对应的属性信息查询所需的第二词汇。
因此,在本步骤中,需要根据第一语句信息所对应的场景信息来确定所述第一词汇具体指代的是何种地点实体,然后根据该地点实体在实体数据库中查询对应的第二词汇。具体的,可以首先获取所述场景信息,然后对解析后的场景信息进行分析,结合步骤101中解析出的第一词汇,在实体数据库中查询满足所述第一词汇所指代的地点实体的第二词汇。
例如,当接收到第一语句信息为“最近的一家店”时,根据步骤101所述的方法,可以从中解析出指代了地点实体的第一词汇“一家店”。然后根据本步骤所述的方法,针对该第一语句信息可以解析出对应的场景信息为“最近”。根据该“最近”确定所述第一词汇“一家店”是基于当前位置所确定的最近距离内的“一家店”,而并非基于其他位置。随后,可以根据导航系统获取对应的位置场景信息,从而确定场景信息为当前用户所在的地理位置的最近距离,然后基于这个条件,在实体数据库中查询满足“最近的”条件的第一词汇“一家店”。当结合上下文确定所述第一词汇“一家店”实际上指代的是酒店时,则根据所述第一词汇的类型信息在实体数据库中查询满足位置场景信息,即距离用户当前地理位置最近的条件。同时当满足上述条件的实体词汇为“北京王府井希尔顿酒店”时,则确定对应所述第一词汇“一家店”的第二词汇为“北京王府井希尔顿酒店”。
103、利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
根据步骤102中查询到的第二词汇来替换对应的第一词汇,以完成对所述第一语句中包含指代含义的指代词汇的消解,得到完整含义的第二语句。
具体的,以步骤102所述的示例举例:当确定了所述第一语句信息“最近的一家店”中第一词汇“一家店”在实体数据库中所对应的第二词汇为酒店“北京王府井希尔顿酒店”时,则将所述第二词汇“北京王府井希尔顿酒店”替换第一词汇“一家店”,得到第二语句信息“最近的北京王府井希尔顿酒店”,其中,在利用“北京王府井希尔顿酒店”替换“一家店”时,还会将该酒店在所述实体数据库中的属性信息进行匹配,因此,当生成所述第二语句信息时,不仅在字面上替换了原有的“一家店”同时,还会附带有希尔顿酒店对应的属性信息中的地址,电话等相关数据。
此外,还可以将上述第二语句信息中的部分信息与场景信息进行关联,具体的可以将“最近的”与“距离用户当前地理位置最近”进行关联,从而确保当根据所述第二语句信息进行后续的智能识别和导航时,能够根据关联的信息确定需要导航路线。进一步的,还可以将所述第二词汇“北京王府井希尔顿酒店”的属性信息中的部分信息,如电话、地址等信息一并反馈给用户,具体的反馈信息的形式、反馈信息的种类及反馈信息的数量可以根据需要选择自行选择,在此不做限定。
本发明实施例提供的车载中地点上下文指代消解方法,对于现有技术在利用基于语言学的指代消解技术对语句信息进行车载中地点上下文指代消解时,消解结果可能存在误差的问题。本发明通过结合场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,从而确保了当语句信息对应的具体应用场景发生变化时,其中第一词汇所指代的含义能够与之进行相应的变化,进而匹配和替换对应的第二词汇,从而解决了当场景发生变化时,现有技术中第一词汇所指代的含义未随之变化所导致指代消解的结果存在误差的问题,提高了车载系统中针对地点上下文指代消解的准确性。此外,通过在实体数据库中查询对应第一词汇的第二词汇,能够在确保指代消解过程中,不仅能从字面上进行指代类词汇的消解和替换,并且能够根据实体数据库中存储的属性信息将第二词汇与其属性信息进行关联和匹配,从而为后续更好的对第二语句信息解析奠定了基础。
进一步的,作为对图1所示实施例的细化及扩展,本发明实施例还提供了另一种车载中地点上下文指代消解方法,如图2所示,其具体步骤包括:
201、利用第二词汇及所述第二词汇对应的属性信息构建实体数据库。
在本发明实施中所述的指代类词汇、实体类词汇、地点实体词汇、第一语句信息、第二语句信息、第一词汇以及第二词汇等技术特征的描述与前述实施例中对应的描述完全相同,在此不再一一赘述。。
因此,根据第二词汇与第一词汇之间的对应关系,在本发明实施例中对含有指代含义的第一词汇进行消解和替换的过程之前,需要首先建立实体数据库,其中该数据库中存储了不同的第二词汇及第二词汇对应的属性信息。因此,本步骤所述的实体数据库中的第二词汇及其属性信息能够为在进行本发明实施例所述的指代消解的过程中的第二词汇的确定和查询奠定基础。
202、从第一语句信息中解析出第一语句信息中的第一词汇。
具体的,在从所述第一语句中解析第一词汇时,可以根据语义标注算法来标注出第一词汇,同时根据该算法可以确定所述第一词汇对应的语义角色,其中,语义角色可以用于表征所述第一词汇在所述第一语句信息中代表的语义。
例如,当所述第一语句信息为“导航至第一家”时,根据本步骤所述的方法,可以计算出该语句信息中实际包含的几个不同语义的部分,分别是“导航”、“至”、“第一家”。然后根据语义标注算法的算法规则,可以确定所述“第一家”在该第一语句信息中的具有指代含义的指代类词汇,即本发明实施例所述的第一词汇。
因此,根据语义标注算法可以根据语句中不同部分的语义角色,更为准确的从第一语句中解析出第一词汇,从而提高了车载中地点上下文指代消解的整体准确率。
203、根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇。
根据本步骤所述的方法,在结合所所述场景信息在实体数据库中查询对应第一词汇的第二词汇时,查询的原则是基于特征构造策略进行的。具体的,所述特征构造策略是用于确定所述第一词汇所对应的第二词汇。由于本发明实施例中所述的第一词汇与第二词汇之间的对应关系并不是固定不变的,同时对应关系也不是一一对应的。例如,当所述第一语句信息为“导航回家”时,则其中的第一词汇则为“家”,而一般来说,一个人的家都是唯一的,一般不存在一个人有多个家的情况,因此,基于这种情况,在实际使用中,第一词汇“家”所对应的第二词汇“XX小区,XX单元”时,对应关系是唯一的。而当第一语句信息为“附近的店”时,其中的第一词汇“店”所对应的无论是酒店、商店还是旅店,其对应关系都是一对多的。
因此,在实体数据库中查询中哪一个实体词汇才是实际对应第一词汇的第二词汇时,需要使用一定的规则来进行查询,具体的,在本发明实施例中可以根据特征构造策略来进行。因此,本步骤所述的方法可以为:根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
进一步的,在结合所述场景信息及特征构造策略在实体数据库中查询时,其中的场景信息可以包括:时间信息与位置信息中一种或多种。所述时间信息可以为结合第一语句信息的上下文或其语句信息本身的语境中的时间场景,还可以是导航系统或车载系统在接收所述第一语句信息时的实时时间场景。同时,所述位置信息可以为结合第一语句信息的上下文或其语句信息本身的语境中的位置场景,还可以是导航系统或车载系统在接收所述第一语句信息时的实时位置场景。具体的,所述位置信息及时间信息的确定方式可以根据具体的应用环境来确定,在此不做限定。
由此,在根据场景信息及特征构造策略在实体数据库中查询对应第一词汇的第二词汇时,具体的,可以首先获取所述第一语句信息对应的场景信息,其中,可以包括时间信息与位置信息中的任意一种或全部,然后根据所述时间信息、位置信息,以及特征构造策略,在实体数据库中查询对应第一语句信息中第一词汇的第二词汇。
此外,本发明实施例中所述的特征构造策略,具体的可以包括实体类型策略、词法特征策略及列表选项策略中的一种或多种。基于特征构造策略中的多种具体执行策略,本发明所述的方法具体可以如下:
第一方面,基于所述实体类型策略,首先可以确定第一词汇对应的实体类型,具体的所述第一词汇的实体类型可以根据第一语句信息的上下文语境及第一语句信息的语境来确定;然后,结合场景信息中的时间信息和/或位置信息,以及所述实体类型策略,在实体数据库中查询对应所述实体类型的第二词汇。由此,通过实体类型来查询对应的第二词汇,可以使查找的结果更为准确,进而提高了车载中地点上下文指代消解过程中整体的准确性。
第二方面,基于所述词法特征策略,首先解析第一语句信息中第一词汇在第一语句信息中的语法特征;然后结合场景时间信息和/或位置信息,以及语法特征策略,在实体数据库中查询符合语法特征的第二词汇,能够使查询到第二词汇更为准确,从而可以使第二词汇的查找结果更加贴近用户的需要,进一步的提高了本步骤中查找的第二词汇的准确性。
第三方面,基于列表选项策略,当所述第一语句信息中第一词汇含有顺序含义时,首先,识别第一词汇对应的顺序含义,如第一、第二、最远、最近等含有顺序含义的第一词汇;然后,根据列表选项策略及第一词汇的顺序含义,将在实体数据库中查询到的与第一词汇存在对应关系的多个第二词汇按照所述顺序含义进行排序;最后,结合场景信息中的时间信息和/或位置信息,在排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。通过列表选项策略,可以当第一词汇具有顺序含义时,能够识别出顺序含义,并根据该含义查找最符合条件的第二词汇,进而避免因查询结果不够准确而进行多次查询导致效率较低的问题,提高了查询效率和准确率。
需要说明的是,本步骤中所述的特征构造策略的几个方面所对应的几种执行方式,可以根据需要进行组合使用,也可以分开使用,在此并不做具体的限定,但是选择的形式要能够满足当前的实际需要来进行选取。
例如,当第一语句信息为“去第一家”时,则根据第一语句信息的上下文确定该语句的场景信息,其中上文为“附近1公里内都有什么酒店”,则根据该上文,可以确定所述第一词汇“第一家”的场景信息为用户地理位置附近,从而确定所述“第一家”实际上指代的“距用户地理位置1公里内位置排序为第一的酒店”。因此,根据本步骤所述的具体执行方式,可以根据实体类型策略,确定第一词汇“第一家”指代的实体类型为酒店。同时,基于词法特征,可以确定“第一家”对应的为宾语,具体的含义为行进至第一家,从而确定“第一家”所对应的是一个地址。此外,由于该第一词汇“第一家”带有顺序性含义,因此还需要根据列表选项策略,将满足酒店类的地址的地点实体词汇,根据距离进行排序,由于“第一家”所代表的顺序含义为第一,则在按照顺序排列的酒店地址的地点实体词汇中,确定第一个酒店地址对应的地点实体词汇,从而根据查询结果,确定该地点实体词汇为第二词汇。
204、利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
根据步骤203中查询到的第二词汇,可以利用该第二词汇替换第一语句信息中的第一词汇,以完成对语句信息中的指代消解,本步骤中所述的替换方式,以及生成的第二语句信息的具体方式皆与前述实施例的步骤103中所述完全相同,在此不再一一赘述。
205、解析第二语句信息的语句含义。
在步骤204生成了所述第二语句信息后,车载系统可以根据该第二信息进行语句含义的解析,以便进行后续步骤的响应。其中本步骤中所述的解析方式可以根据现有技术中的自然语言的语义分析技术进行处理,在此不做限定,可根据需要进行选取。
206、从所述第二词汇对应的属性信息中获取对应所述语句含义的数据内容。
根据前述步骤201中的方法,在构建所述实体数据库时,不同的地点实体词汇及对应的属性信息都保存在该实体数据库中,其中很多的属性信息都是用户在使用车载系统中需要的,如酒店的电话、位置等信息。因此,在本步骤中,当解析出第二语句的含义时,可以根据该语句对应的含义来识别用户下达的指令具体为何。然后根据用户的需要,从属性信息中确定是否存在所需的数据,如果其中存在用户所需的数据,则从属性信息中获取对应的数据。
例如,当第一语句信息为“导航至第一家”时,通过步骤201-205所述的方法,解析出第二语句信息为“导航至北京王府井希尔顿酒店”时,根据解析可以确定第二语句信息的含义为“根据当前位置,确定到北京王府井希尔顿酒店位置的路线信息”,由于在实体数据库中,北京王府井希尔顿酒店的属性信息中包括该酒店的位置信息,因此,基于第二语句信息的语句含义,从属性信息中获取该酒店的位置,以便完成从用户当前地理位置到北京王府井希尔顿酒店位置的路径规划。
通过解析第二语句信息的语句含义,并根据该语句含义从第二词汇的属性信息中提取对应所述语句含义的数据,可以得到用户所表达的具体的指令含义,以便后续在根据该语句含义进行执行时,提高响应速度。
207、输出对应所述语句含义的数据内容。
根据步骤206中获取到的属性信息,可以将结合了属性信息的语句反馈至用户。
进一步的,还可设定一个接收用户指令以确定是否执行后续其他行为的步骤,以及当用户确定车载系统所输出的数据内容并不是用户想要的数据内容时,或者所述数据内容并不准确时,可以根据用户的反馈指令,对所述第二语句信息对应的语句含义进行再一次的解析。
208、将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
需要说明的是,本步骤所述的方法可以在步骤205之前执行,也可以在步骤208之后执行,具体的执行顺序在此并不做限定,可根据需要进行选择。
当步骤204之后,所述第二词汇已经成功的完成对第一词汇的替换,因此,在本步骤中可以将替换成功的第二词汇在本次指代消解过程中的相关信息存储在实体数据库中,并与第二词汇关联,作为该第二词汇的具体使用场景,以便后续再次进行指代消解时作为查询对应第一词汇的第二词汇时的查询参考。具体的,存储的信息可以包括第二词汇、第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种,具体的存储和关联的信息的种类和数量在此不做限定,可根据需要进行确定。由此,通过将第二词汇相关的第一语句信息、场景信息等信息在实体数据库中进行存储和关联,可以在再次使用实体数据库内的地点实体词汇进行相应的查询时,查询结果更为准确,从而提高了车载中地点上下文指代消解过程中,消解结果的准确性。
进一步的,作为对上述图1所示方法的实现,本发明实施例还提供了一种车载中地点上下文指代消解装置,用于对上述图1所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:解析单元31、查询单元32与替换单元33,其中
解析单元31,可以用于从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇。
查询单元32,可以用于根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述解析单元31解析出的第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息。
替换单元33,可以用于利用所述查询单元32查询到的第二词汇替换所述第一词汇,以便生成第二语句信息。
进一步的,作为对上述图2所示方法的实现,本发明实施例还提供了一种车载中地点上下文指代消解装置,用于对上述图2所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图4所示,该装置包括:解析单元41、查询单元42与替换单元43,其中
解析单元41,可以用于从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇。
查询单元42,可以用于根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述解析单元41解析出的第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息。
替换单元43,可以用于利用所述查询单元42查询到的第二词汇替换所述第一词汇,以便生成第二语句信息。
进一步的,所述查询单元42包括:
获取模块421,可以用于获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息。
查询模块422,可以用于根据所述获取模块421获取的时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
进一步的,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种。
所述查询模块422包括:
确定子模块4221,可以用于确定所述第一语句信息中第一词汇对应的实体类型。
查询子模块4222,可以用于根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述确定子模块4222确定的实体类型的第二词汇。和/或
解析子模块4223,可以用于解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征。
查询子模块4222,还可以用于根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述解析子模块4223解析出的语法特征的第二词汇。和/或
识别子模块4224,可以用于当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义。
排序子模块4225,可以用于根据所述列表选项策略及所述识别子模块4224识别的顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序。
查询子模块4222,还可以用于根据所述时间信息和/或位置信息,在所述排序子模块4225排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
进一步的,所述装置还包括:
构建单元44,可以用于利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库,以便查询单元42在本单元构建的实体数据库内进行查询操作。
进一步的,所述解析单元41具体可以用于,根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
进一步的,所述装置还包括:
所述解析单元41,还可以用于解析第二语句信息的语句含义。
获取单元45,可以用于从所述第二词汇对应的属性信息中获取对应所述解析单元41解析出的语句含义的数据内容。
输出单元46,可以用于输出所述获取单元45获取的对应所述语句含义的数据内容。
进一步的,所述装置还包括:
添加单元47,可以用于将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述构建单元44构建的实体数据库中,以便对所述实体数据库进行更新。
借由上述技术方案,本发明实施例提供一种车载中地点上下文指代消解方法及装置。对于现有技术在利用基于语言学的指代消解技术对语句信息进行车载中地点上下文指代消解时,消解结果可能存在误差的问题。本发明通过结合场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,从而确保了当语句信息对应的具体应用场景发生变化时,第一词汇所指代的含义能够与之进行相应的变化,进而匹配和替换对应的第二词汇,从而解决了当场景发生变化时,现有技术中第一词汇所指代的含义未随之变化所导致指代消解的结果存在误差的问题,提高了车载系统中针对地点上下文指代消解的准确性。此外,通过在实体数据库中查询对应第一词汇的第二词汇,能够在确保指代消解过程中,不仅能从字面上进行指代类词汇的消解和替换,并且能够根据实体数据库中存储的属性信息将第二词汇与其属性信息进行关联和匹配,从而为后续对第二语句信息的更好解析奠定了基础。另外,通过第二词汇及其属性信息来构建实体数据库,能够为指代消解的过程中的第二词汇的确定和查询奠定基础。同时,根据语义标注算法可以根据语句中不分部分的语义角色,准确的从第一语句中解析出第一词汇,从而提高了车载中地点上下文指代消解的整体准确率。进一步的,在实体数据库查询对应第一词汇的第二词汇时,通过结合场景信息中的位置信息和/或时间信息、以及特征构造策略中的实体类型策略、词法特征策略、列表选项策略中的一种或多种来查询对应第一词汇的词儿词汇,能够进一步的提高查询结果的准确率,从而提高了车载中地点上下文指代消解过程中的整体准确率。并且,通过解析第二语句信息的语句含义,并根据该语句含义从第二词汇的属性信息中提取对应所述语句含义的数据,可以得到用户所表达的具体的指令含义,以便后续在根据该语句含义进行执行时,提高响应速度。此外,通过将第二词汇相关的第一语句信息、场景信息等信息在实体数据库中进行存储和关联,可以在再次使用实体数据库内的地点实体词汇进行相应的查询时,查询结果更为准确,从而提高了车载中地点上下文指代消解过程中,指代消解的准确性。
所述的车载中地点上下文指代消解装置包括处理器和存储器,上述解析单元、查询单元与替换单元等作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高车载中地点上下文指代消解过程的准确性。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述车载中地点上下文指代消解方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述车载中地点上下文指代消解方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
进一步的,所述根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇包括:
根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
进一步的,所述根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
进一步的,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
确定所述第一语句信息中第一词汇对应的实体类型;
根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述实体类型的第二词汇;和/或
解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述语法特征的第二词汇;和/或
当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
根据所述列表选项策略及所述顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
根据所述时间信息和/或位置信息,在排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
进一步的,在从第一语句信息中解析出第一语句信息中的第一词汇之前,所述方法还包括:
利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
进一步的,所述从第一语句信息中解析出第一语句信息中的第一词汇包括:
根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
进一步的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
解析第二语句信息的语句含义;
从所述第二词汇对应的属性信息中获取对应所述语句含义的数据内容;
输出对应所述语句含义的数据内容。
进一步的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
本发明实施例中的设备可以是服务器、PC、PAD、手机等。
本发明实施例还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
进一步的,所述根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇包括:
根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
进一步的,所述根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
进一步的,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
确定所述第一语句信息中第一词汇对应的实体类型;
根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述实体类型的第二词汇;和/或
解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述语法特征的第二词汇;和/或
当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
根据所述列表选项策略及所述顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
根据所述时间信息和/或位置信息,在排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
进一步的,在从第一语句信息中解析出第一语句信息中的第一词汇之前,所述方法还包括:
利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
进一步的,所述从第一语句信息中解析出第一语句信息中的第一词汇包括:
根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
进一步的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
解析第二语句信息的语句含义;
从所述第二词汇对应的属性信息中获取对应所述语句含义的数据内容;
输出对应所述语句含义的数据内容。
进一步的,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
进一步的,本发明实施例还公开了:
A8、根据权利要求A7所述的方法,其特征在于,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
B10、根据权利要求B9所述的装置,其特征在于,
所述查询单元具体用于,根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
B11、根据权利要求B10所述的装置,其特征在于,所述查询单元包括:
获取模块,用于获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
查询模块,用于根据所述获取模块获取的时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
B12、根据权利要求B11所述的装置,其特征在于,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述查询模块包括:
确定子模块,用于确定所述第一语句信息中第一词汇对应的实体类型;
查询子模块,用于根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述确定子模块确定的实体类型的第二词汇;和/或
解析子模块,用于解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
查询子模块,还用于根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述解析子模块解析出的语法特征的第二词汇;和/或
识别子模块,用于当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
排序子模块,用于根据所述列表选项策略及所述识别子模块识别的顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
查询子模块,还用于根据所述时间信息和/或位置信息,在所述排序子模块排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
B13、根据权利要求B9所述的装置,其特征在于,所述装置还包括:
构建单元,用于利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
B14、根据权利要求B9所述的装置,其特征在于,
所述解析单元具体用于,根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
B15、根据权利要求B9-B14中任一项所述的装置,其特征在于,所述装置还包括:
所述解析单元,还用于解析第二语句信息的语句含义;
获取单元,用于从所述第二词汇对应的属性信息中获取对应所述解析单元解析出的语句含义的数据内容;
输出单元,用于输出所述获取单元获取的对应所述语句含义的数据内容。
B16、根据权利要求B15所述的装置,其特征在于,所述装置还包括:
添加单元,用于将所述第二词汇、所述第一语句信息、以及所述第一语句信息对应的场景信息中的一种或多种进行关联,并添加到所述实体数据库中,以便对所述实体数据库进行更新。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种车载中地点上下文指代消解方法,其特征在于,包括:
从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;
根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;
利用所述第二词汇替换所述第一词汇,以便生成第二语句信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述第一词汇的第二词汇包括:
根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇,所述特征构造策略用于确定所述第一词汇所对应的第二词汇。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一语句信息对应的场景信息及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
获取所述第一语句信息对应的场景信息,所述场景信息包括时间信息与位置信息;
根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇。
4.根据权利要求3所述的方法,其特征在于,所述特征构造策略包括实体类型策略、词法特征策略及列表选项策略中的一种或多种;
所述根据所述时间信息和/或位置信息,以及特征构造策略,在所述实体数据库中查询对应所述第一语句信息中第一词汇的第二词汇包括:
确定所述第一语句信息中第一词汇对应的实体类型;
根据所述时间信息和/或位置信息,以及所述实体类型策略,在所述实体数据库中查询对应所述实体类型的第二词汇;和/或
解析所述第一语句信息中第一词汇在所述第一语句信息中的语法特征;
根据所述时间信息和/或位置信息,以及所述语法特征策略,在所述实体数据库中查询符合所述语法特征的第二词汇;和/或
当所述第一语句信息中第一词汇含有顺序含义时,识别所述第一词汇对应的顺序含义;
根据所述列表选项策略及所述顺序含义,将在所述实体数据库中查询到的多个第二词汇按照所述顺序含义进行排序;
根据所述时间信息和/或位置信息,在排序后得到的第二词汇序列中查询对应所述顺序含义的第二词汇。
5.根据权利要求1所述的方法,其特征在于,在从第一语句信息中解析出第一语句信息中的第一词汇之前,所述方法还包括:
利用所述第二词汇及所述第二词汇对应的属性信息构建实体数据库。
6.根据权利要求1所述的方法,其特征在于,所述从第一语句信息中解析出第一语句信息中的第一词汇包括:
根据语义标注算法标注所述第一语句信息中的第一词汇及所述第一词汇对应的语义角色,所述语义角色用于表征所述第一词汇在所述第一语句信息中代表的语义。
7.根据权利要求1-6中任一项所述的方法,其特征在于,在所述利用所述第二词汇替换所述第一词汇之后,所述方法还包括:
解析第二语句信息的语句含义;
从所述第二词汇对应的属性信息中获取对应所述语句含义的数据内容;
输出对应所述语句含义的数据内容。
8.一种车载中地点上下文指代消解装置,其特征在于,包括:
解析单元,用于从第一语句信息中解析出第一语句信息中的第一词汇,所述第一词汇为用于指代地点实体的指代类词汇;
查询单元,用于根据所述第一语句信息对应的场景信息,在实体数据库中查询对应所述解析单元解析出的第一词汇的第二词汇,其中,所述场景信息是根据所述第一语句信息的上下文内容确定的,所述第二词汇为与第一词汇存在对应关系的地点实体词汇,所述实体数据库中存储了第二词汇及所述第二词汇对应的属性信息;
替换单元,用于利用所述查询单元查询到的第二词汇替换所述第一词汇,以便生成第二语句信息。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求8中任意一项所述的车载中地点上下文指代消解方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时权利要求1至权利要求8中任意一项所述的车载中地点上下文指代消解方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710667531.XA CN107590123B (zh) | 2017-08-07 | 2017-08-07 | 车载中地点上下文指代消解方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710667531.XA CN107590123B (zh) | 2017-08-07 | 2017-08-07 | 车载中地点上下文指代消解方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107590123A true CN107590123A (zh) | 2018-01-16 |
CN107590123B CN107590123B (zh) | 2022-07-05 |
Family
ID=61042068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710667531.XA Active CN107590123B (zh) | 2017-08-07 | 2017-08-07 | 车载中地点上下文指代消解方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107590123B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595423A (zh) * | 2018-04-16 | 2018-09-28 | 苏州英特雷真智能科技有限公司 | 一种基于属性区间变化的动态本体结构的语义分析方法 |
CN109977405A (zh) * | 2019-03-26 | 2019-07-05 | 北京博瑞彤芸文化传播股份有限公司 | 一种智能语义匹配方法 |
CN110119509A (zh) * | 2019-05-10 | 2019-08-13 | 福建工程学院 | 一种基于语义分析的备忘录事件智能提醒方法 |
CN110968678A (zh) * | 2018-09-28 | 2020-04-07 | 科沃斯商用机器人有限公司 | 文本指代消解的方法、设备及介质 |
CN111858860A (zh) * | 2019-04-19 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 搜索信息处理方法及系统、服务器、计算机可读介质 |
CN112035609A (zh) * | 2020-08-20 | 2020-12-04 | 出门问问信息科技有限公司 | 一种智能对话方法、装置以及计算机可读存储介质 |
CN112148847A (zh) * | 2020-08-27 | 2020-12-29 | 出门问问(苏州)信息科技有限公司 | 一种语音信息的处理方法及装置 |
CN112163072A (zh) * | 2020-09-30 | 2021-01-01 | 北京金堤征信服务有限公司 | 基于多数据源的数据处理方法以及装置 |
WO2021116858A1 (en) * | 2019-12-10 | 2021-06-17 | International Business Machines Corporation | Anaphora resolution |
CN115328321A (zh) * | 2022-10-14 | 2022-11-11 | 深圳市人马互动科技有限公司 | 基于身份转换的人机交互方法及相关产品 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150405A (zh) * | 2013-03-29 | 2013-06-12 | 苏州大学 | 一种分类模型建模方法、中文跨文本指代消解方法和系统 |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN103853738A (zh) * | 2012-11-29 | 2014-06-11 | 中国科学院计算机网络信息中心 | 一种网页信息相关地域的识别方法 |
CN104462053A (zh) * | 2013-09-22 | 2015-03-25 | 江苏金鸽网络科技有限公司 | 一种文本内的基于语义特征的人称代词指代消解方法 |
US20150149429A1 (en) * | 2013-11-27 | 2015-05-28 | Microsoft Corporation | Contextual information lookup and navigation |
CN105070288A (zh) * | 2015-07-02 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 车载语音指令识别方法和装置 |
CN105589844A (zh) * | 2015-12-18 | 2016-05-18 | 北京中科汇联科技股份有限公司 | 一种用于多轮问答系统中缺失语义补充的方法 |
CN106980613A (zh) * | 2016-01-15 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种搜索导航方法及设备 |
-
2017
- 2017-08-07 CN CN201710667531.XA patent/CN107590123B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853738A (zh) * | 2012-11-29 | 2014-06-11 | 中国科学院计算机网络信息中心 | 一种网页信息相关地域的识别方法 |
CN103150405A (zh) * | 2013-03-29 | 2013-06-12 | 苏州大学 | 一种分类模型建模方法、中文跨文本指代消解方法和系统 |
CN104462053A (zh) * | 2013-09-22 | 2015-03-25 | 江苏金鸽网络科技有限公司 | 一种文本内的基于语义特征的人称代词指代消解方法 |
US20150149429A1 (en) * | 2013-11-27 | 2015-05-28 | Microsoft Corporation | Contextual information lookup and navigation |
CN103678281A (zh) * | 2013-12-31 | 2014-03-26 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105070288A (zh) * | 2015-07-02 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 车载语音指令识别方法和装置 |
CN105589844A (zh) * | 2015-12-18 | 2016-05-18 | 北京中科汇联科技股份有限公司 | 一种用于多轮问答系统中缺失语义补充的方法 |
CN106980613A (zh) * | 2016-01-15 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种搜索导航方法及设备 |
Non-Patent Citations (1)
Title |
---|
他山之石头: "如何实现按距离排序、范围查找", 《HTTPS://BLOG.CSDN.NET/GHSAU/ARTICLE/DETAILS/50591932》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595423A (zh) * | 2018-04-16 | 2018-09-28 | 苏州英特雷真智能科技有限公司 | 一种基于属性区间变化的动态本体结构的语义分析方法 |
CN110968678A (zh) * | 2018-09-28 | 2020-04-07 | 科沃斯商用机器人有限公司 | 文本指代消解的方法、设备及介质 |
CN110968678B (zh) * | 2018-09-28 | 2024-02-20 | 科沃斯商用机器人有限公司 | 文本指代消解的方法、设备及介质 |
CN109977405A (zh) * | 2019-03-26 | 2019-07-05 | 北京博瑞彤芸文化传播股份有限公司 | 一种智能语义匹配方法 |
CN111858860A (zh) * | 2019-04-19 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 搜索信息处理方法及系统、服务器、计算机可读介质 |
CN111858860B (zh) * | 2019-04-19 | 2023-08-29 | 百度在线网络技术(北京)有限公司 | 搜索信息处理方法及系统、服务器、计算机可读介质 |
CN110119509A (zh) * | 2019-05-10 | 2019-08-13 | 福建工程学院 | 一种基于语义分析的备忘录事件智能提醒方法 |
WO2021116858A1 (en) * | 2019-12-10 | 2021-06-17 | International Business Machines Corporation | Anaphora resolution |
US11151321B2 (en) | 2019-12-10 | 2021-10-19 | International Business Machines Corporation | Anaphora resolution |
GB2605120A (en) * | 2019-12-10 | 2022-09-21 | Ibm | Anaphora resolution |
GB2605120B (en) * | 2019-12-10 | 2023-08-23 | Ibm | Anaphora resolution |
CN112035609A (zh) * | 2020-08-20 | 2020-12-04 | 出门问问信息科技有限公司 | 一种智能对话方法、装置以及计算机可读存储介质 |
CN112035609B (zh) * | 2020-08-20 | 2024-04-05 | 出门问问创新科技有限公司 | 一种智能对话方法、装置以及计算机可读存储介质 |
CN112148847A (zh) * | 2020-08-27 | 2020-12-29 | 出门问问(苏州)信息科技有限公司 | 一种语音信息的处理方法及装置 |
CN112148847B (zh) * | 2020-08-27 | 2024-03-12 | 出门问问创新科技有限公司 | 一种语音信息的处理方法及装置 |
CN112163072A (zh) * | 2020-09-30 | 2021-01-01 | 北京金堤征信服务有限公司 | 基于多数据源的数据处理方法以及装置 |
CN112163072B (zh) * | 2020-09-30 | 2024-05-24 | 北京金堤征信服务有限公司 | 基于多数据源的数据处理方法以及装置 |
CN115328321A (zh) * | 2022-10-14 | 2022-11-11 | 深圳市人马互动科技有限公司 | 基于身份转换的人机交互方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN107590123B (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107590123A (zh) | 车载中地点上下文指代消解方法及装置 | |
US20180233143A1 (en) | Dialogue system, a dialogue method and a method of adapting a dialogue system | |
CN107038207A (zh) | 一种数据查询方法、数据处理方法及装置 | |
CN102141990A (zh) | 一种搜索方法和装置 | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
CN104424342A (zh) | 关键字匹配方法及其装置、服务器和系统 | |
CN111813900B (zh) | 多轮对话处理方法、装置、电子设备及存储介质 | |
CN110609904A (zh) | 图数据库数据处理方法、装置、电子设备及存储介质 | |
CN108920543A (zh) | 查询和交互的方法及装置、计算机装置、存储介质 | |
CN108664582A (zh) | 企业关系的查询方法、装置、计算机设备及存储介质 | |
CN112115276A (zh) | 基于知识图谱的智能客服方法、装置、设备及存储介质 | |
CN109325055A (zh) | 业务关联数据表的筛选及核对方法、装置、电子设备 | |
US11537448B1 (en) | Adapting application programming interfaces with schema mappings | |
CN111625638B (zh) | 一种问句处理方法、装置、设备及可读存储介质 | |
CN114860916A (zh) | 知识检索方法及装置 | |
CN105446802A (zh) | 一种基于转化率的操作执行方法及装置 | |
CN111522840A (zh) | 标签的配置方法、装置、设备及计算机可读存储介质 | |
CN106940715A (zh) | 一种基于索引表的查询的方法及设备 | |
CN110263108B (zh) | 一种基于道路网的关键词Skyline模糊查询方法及系统 | |
CN105389340B (zh) | 一种信息测试方法及装置 | |
Papangelis et al. | Spoken dialogue for information navigation | |
Maqbool et al. | Zero-label anaphora resolution for off-script user queries in goal-oriented dialog systems | |
CN116502603A (zh) | 编码方法、设备、系统及存储介质 | |
CN106886546B (zh) | 一种数据网站的构建方法和设备 | |
CN109241102A (zh) | 数据处理方法及装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 3011, Room 3, Building 27, 25 North Third Ring West Road, Haidian District, Beijing Applicant after: Public Question (Beijing) Information Technology Co., Ltd. Address before: 100000 Beijing Haidian District Shangzhuang Zhenzhuang Road No. 115 Courtyard Level 522 Applicant before: Intelligent information technology (Beijing) Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |