CN113435205A - 语义解析方法及装置 - Google Patents

语义解析方法及装置 Download PDF

Info

Publication number
CN113435205A
CN113435205A CN202110476311.5A CN202110476311A CN113435205A CN 113435205 A CN113435205 A CN 113435205A CN 202110476311 A CN202110476311 A CN 202110476311A CN 113435205 A CN113435205 A CN 113435205A
Authority
CN
China
Prior art keywords
recognition result
target
entity
intention
vertical domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110476311.5A
Other languages
English (en)
Inventor
许德智
代文
刘岩
刘惠文
陈帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd, Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202110476311.5A priority Critical patent/CN113435205A/zh
Publication of CN113435205A publication Critical patent/CN113435205A/zh
Priority to US17/519,515 priority patent/US20220350972A1/en
Priority to EP21210108.3A priority patent/EP4083848A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本公开是关于一种语义解析方法及装置。涉及智能语音交互技术,解决了识别效率低下影响智能语音问答准确率的问题。该方法包括:首先获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,而所述第一实体识别结果对应于至少一个垂域,故第一意图识别结果是个涵盖多种具体实体识别结果的上位粗粒度结果。然后根据所述第一意图识别结果,确定所述第一实体识别结果对应的至少一个垂域中的一个垂域作为所述目标语句对应的目标垂域,并将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果,再根据所述第二实体识别结果,解析所述目标语句的意图。本公开提供的技术方案适用于智能语音场景,实现了高效的语义识别方案。

Description

语义解析方法及装置
技术领域
本公开涉及智能语音交互技术,尤其涉及一种语义解析方法及装置。
背景技术
语义解析是指把自然语言自动转化为一种机器可以理解并执行的表达形式。语义解析技术可以应用在很多场景当中,比如搜索、客服等。在智能语音交互场景中,通过语义解析技术可以将用户询问(query)转换为结构化查询语句,从而从知识库当中获取答案。
语义解析的结果可以为很多下游的任务提供服务,方便下游任务理解用户的问题,如搜索、客服、问答等。以智能问答系统为例,用户提出一个问题query,当query发送到问答系统后,算法会对query进行解析,并得到结构化的查询语句,从知识图谱中获取答案并返回给用户。
由于应用场景多变,接收到的用户语句也较为复杂,涉及多种不同领域,语义解析系统常存在数据管理困难、解析效率和准确度较低的问题。
发明内容
为克服相关技术中存在的问题,本公开提供一种语义解析方法及装置,通过先在较上位层面进行粗粒度识别后精确解析的处理方式实现了高效灵活的智能语音方案。
根据本公开实施例的第一方面,提供一种语义解析方法,包括:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
可选的,所述获取目标语句的第一识别结果的步骤之前,还包括:
创建至少一个第一槽位和与所述至少一个第一槽位对应的第一意图;
对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系,每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位,所述第一槽位的总数小于等于所述第二槽位的总数;
将所述目标垂域关联至所述第一意图。
可选的,该方法还包括:
根据所述第一槽位和所述第一意图,生成训练样本,所述训练样本包含所述目标垂域的正样本和负样本;
使用所述训练样本,训练第一识别模型。
可选的,所述获取目标语句的第一识别结果的步骤包括:
将所述目标语句输入所述第一识别模型,获取所述第一识别结果。
可选的,该方法还包括:
收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
可选的,所述第一实体识别结果包含至少一个第一槽位的实体识别结果,所述将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果的步骤包括:
获取所述目标垂域下各个所述第二槽位与所述第一槽位的对应关系;
根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
可选的,所述根据所述第二实体识别结果,解析所述目标语句的意图的步骤包括:
根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
可选的,所述根据所述第二实体识别结果,解析所述目标语句的意图的步骤之后,还包括:
根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
根据本公开实施例的第二方面,提供一种语义解析装置,包括:
第一解析模块,用于获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
垂域确定模块,用于根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
实体识别模块,用于将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
意图解析模块,用于根据所述第二实体识别结果,解析所述目标语句的意图。
可选的,所述装置还包括:
第一创建模块,用于创建至少一个第一槽位与所述至少一个第一槽位对应的第一意图;
关联模块,用于对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系,每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位,所述第一槽位的总数小于等于所述第二槽位数量,
将所述目标垂域关联至所述第一意图。
可选的,所述装置还包括:
训练样本采集模块,用于根据所述第一槽位和所述第一意图,生成包含训练样本,所述训练样本包含所述目标垂域的正样本和负样本;
神经网络训练模块,用于使用所述训练样本,训练第一识别模型。
可选的,所述第一解析模块包括:
模型识别子模块,用于将所述目标语句输入所述第一识别模型,获取所述第一识别结果。
可选的,所述训练样本采集模块,还用于收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
可选的,所述第一实体识别结果包含至少一个第一槽位的实体识别结果,所述实体识别模块包括:
对应关系确定子模块,用于获取所述目标垂域下各个第二槽位与第一槽位的对应关系;
实体精细识别子模块,用于根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
可选的,所述意图解析模块包括:
语句意图解析子单元,用于根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
可选的,所述装置还包括:
查询语句输出模块,用于根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
根据本公开实施例的第三方面,提供一种语义解析装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
根据本公开实施例的第一方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种语义解析方法,所述方法包括:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
本公开的实施例提供的技术方案可以包括以下有益效果:首先获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,而所述第一实体识别结果对应于至少一个垂域,故第一意图识别结果是个涵盖多种具体实体识别结果的上位粗粒度结果。然后根据所述第一意图识别结果,确定所述第一实体识别结果对应的至少一个垂域中的一个垂域作为所述目标语句对应的目标垂域,并将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果,再根据所述第二实体识别结果,解析所述目标语句的意图。通过更粗粒度的第一识别结果,使数据更为简洁,数据的管理和利用更高效,解决了识别效率低下影响智能语音问答准确率的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语义解析方法的流程图。
图2是根据一示例性实施例示出的又一种语义解析方法的流程图。
图3是根据一示例性实施例示出的又一种语义解析方法的流程图。
图4是根据一示例性实施例示出的又一种语义解析方法的流程图。
图5是根据一示例性实施例示出的第一识别模型原理示意图。
图6是根据一示例性实施例示出的又一种语义解析方法的流程图。
图7是根据一示例性实施例示出的一种语义解析装置的框图。
图8是根据一示例性实施例示出的又一种语义解析装置的框图。
图9是根据一示例性实施例示出的又一种语义解析装置的框图。
图10是根据一示例性实施例示出的第一解析模块701的框图。
图11是根据一示例性实施例示出的实体识别模块703的框图。
图12是根据一示例性实施例示出的意图解析模块704的框图。
图13是根据一示例性实施例示出的又一种语义解析装置的框图。
图14是根据一示例性实施例示出的一种装置的框图。
图15是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了满足用户日益增长的需求,智能问答系统往往需要涵盖各类不同的垂域,比如古诗、作文、菜谱等。每个垂域都有自己特有的槽位,并需要进行槽位梳理、样本标注、模型训练的重复工作,这会消耗比较大的人力和时间成本。此外,有些垂域标注样本的获取比较困难,而语义解析模型的训练又比较依赖标注样本,这会使得模型的训练效果大打折扣,继而影响语义解析和智能问答的准确率。
对于语义解析,发明人有如下理解。意图识别和槽位填充是语义解析当中的两个核心任务。通过意图识别和槽位填充,能够将自然语言转化为结构化的表达形式。意图识别与槽位填充的主要目的是从自然语言中判断出明确的意图(Intention)以及该意图下对应的槽位(Slots),比如古诗垂域的意图有:古诗的内容、古诗的朝代、诗句的上下句、古诗的释义等,槽位包括:古诗名、诗句、作者、朝代等。用户的问题可以被解析成为一个意图以及对应的一个或多个槽位,槽位信息可以为空,也可以有一项或者多项。解析出的意图和槽位信息可以直接传递给下游模块,使得下游模块能根据应用场景更好的理解用户的问题。因此,意图识别和槽位填充的准确率直接决定了系统响应于用户自然语句所给出的答案的准确率。
比如“绝句杜甫怎么背”这一query,具体古诗相关的意图,query中包含多个古诗相关的槽位。意图识别与槽位填充将该query解析成结构化的意图和槽位信息,从而得到用户的意图是想要知道绝句的内容,包含的槽位信息有:诗名-绝句、作者-杜甫。通过解析出的意图和槽位信息生成结构化查询语句:“SELECT*FROM poem WHERE name=绝句AND作者=杜甫”,从而获取到满足用户需求的答案。
发明人发现,在使用语义解析功能的智能问答系统的过程中,为了满足用户日益增长的需求,智能问答系统往往需要涵盖各类不同的垂域,比如古诗、作文、菜谱等。每个垂域都有自己特有的槽位,并需要进行槽位梳理、样本标注、模型训练的重复工作,这会消耗比较大的人力和时间成本。此外,有些垂域标注样本的获取比较困难,而语义解析模型的训练又比较依赖标注样本,这会使得模型的训练效果大打折扣,继而影响语义解析和智能问答的准确率。
为了解决上述问题,本公开的实施例提供了一种语义解析方法及装置。通过更粗粒度的模糊识别快速确定可能命中的垂域,再进一步分析得到精度较高的最终结果,解决了数据结构复杂影响语义识别效率和准确率的问题。
本公开的一示例性实施例提供了一种语义解析方法,通过该方法进行语义解析的流程如图1所示,包括:
步骤101、获取目标语句的第一识别结果。
本实施例中,首先对目标语句进行较粗粒度层面的识别,以获取第一识别结果。
所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域。
所述第一实体识别结果包括至少一个第一槽位及对应的槽位信息。各个垂域的第二槽位关联的实体库均可关联第一槽位。
可进行模糊识别,第一识别结果即为模糊识别结果。
本步骤可通过神经网络执行。通过训练神经网络,得到第一识别模型,然后将所述目标语句输入所述第一识别模型,以获取所述第一识别结果。
步骤102、根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域。
本步骤中,根据所述第一意图识别结果以进行垂域识别,在可能涉及的至少一个垂域中选择与第一意图识别结果匹配的垂域,作为目标语句对应的目标垂域。
目标垂域包含至少一个第二槽位。
步骤103、将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果。
本实施例中,在第一槽位与第二槽位间存在映射关系。一个第一槽位可关联至不同垂域的多个不同第二槽位,每个第二槽位关联至一个第一槽位。
本步骤中,根据第一槽位与第二槽位的关联关系,对第一实体识别结果进行转化。将第一实体识别结果涉及的第一槽位映射至目标垂域中关联的第二槽位,将第一槽位的槽位信息赋予第二槽位。
步骤104、根据所述第二实体识别结果,解析所述目标语句的意图。
本步骤中,可以根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
可选的,在目标垂域下,结合关键字,确定更为准确的所述目标语句的意图,即目标垂域下的一个具体的意图。
至此,就完整的解析得到了对目标语句的第二实体识别结果和意图,为下游服务任务提供了基础。
本公开的一示例性实施例提供了一种语义解析方法,通过该方法可利用解析得到的第二实体识别结果和目标垂域下的意图触发下游服务,流程如图2所示。
步骤201至步骤204与图1中的步骤101至步骤104相同,在此不再赘述。
在完整的解析得到了对目标语句的第二实体识别结果和意图后,即可利用语义解析结果,启动下游服务。
步骤205、根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
本公开的一示例性实施例还提供了一种语义解析方法,构建了一个在较粗的粒度水平上解析语义的通用系统,将多个不同垂域映射到该通用系统中。这样,就能够通过通用系统进行第一级的语义解析得到粗粒度的第一识别结果,然后再对第一识别结果进行向目标垂域的映射,以获取目标垂域下的较细粒度的最终识别结果。
使用该方法构建通用系统的流程如图3所示,包括:
步骤301、创建至少一个第一槽位和与所述至少一个第一槽位对应的第一意图。
本步骤中,基于各垂域中部分第二槽位的共性,创建至少一个第一槽位,以使得多个不同垂域下不同的第二槽位可映射到一个第一槽位上,对多垂域进行整合管理,以在第一槽位和第一意图这样的一个较为粗粒度的体系中进行语义解析识别。
步骤302、对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系。
本步骤中,通过映射,将目标垂域的每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位。
可选的,可将包含目标垂域的多个垂域进行向第一槽位体系的映射。这样,多个第二槽位关联的普通实体就通过槽位映射,整合成了一个第一槽位对应的实体集合。一个垂域包含的多个意图,也通过这样的映射进行了整合,变成了一个指向该垂域的第一意图。
所述第一槽位的总数小于等于任一垂域下的第二槽位数量。
针对新加入垂域一般需要重新定义槽位体系、标注数据、训练模型,会导致更新周期长、数据标注成本高以及不同垂域之间存在一些边界模糊等问题。将不同垂域融合到通用系统,利用融合后的数据进行模型训练,使得训练样本更为容易获得(已有的垂域和关联的实体库均可通过映射变成通用系统的训练样本)。
可选的,可结合概念图谱获取跨垂域的粗粒度的实体集合,使得不同垂域的实体具有统一的表示形式,如“作文”与“古诗”都是文学作品的一种形式,可以统一映射到workType 这一第一槽位;“李白”等都是人,可以统一映射到person这一第一槽位。并将每个垂域的意图进行整合得到粗粒度的模糊意图。
在预测用户意图时,不再预测到具体的意图,而是预测该意图所属的垂域,从而得到更粗粒度的分类结果。如菜谱垂域中菜谱做法、准备时间、处理方式等多个较细粒度的具体意图统一用recipe这一模糊意图表示。这使得模型需要输出的意图类别减少,降低了模型的复杂度,同时也将不同类别数据(包括同一垂域下的不同类别的数据及不同垂域下的数据)之间的相互影响降到最低。当增加一个新的垂域时,只需要额外添加一个分类,只需要添加该垂域特有的槽位,对于已经存在的该垂域能利用的第一槽位,可以直接复用该第一槽位,有效的缓解了冷启动带来的影响。并且这种粗粒度的数据表示方法也有效缓解了样本中可能存在的数据不平衡的问题。
表1为一种基于概念图谱的多垂域向第一槽位映射后得到的第一槽位与实体之间映射关系的示例。
表1
Figure RE-GDA0003202200120000091
以古诗、菜谱、作文三个垂域为例。细粒度标注体系中,每个垂域都包含多个细粒度的意图。诗垂域可能包括:诗句的上下句、释义、诗歌作者、诗歌朝代等多种意图;菜谱垂域可能包括:烹饪时长、做法、菜系、需要的原材料等意图;作文垂域可能包括:按标签查作文和按名称查作文等意图。在本公开使用的粗粒度的通用系统中,将各垂域的具体意图用其所属的垂域代替,即在垂域范围内对多个可选的意图进行上位概括/合并,得到古诗、菜谱、作文三个分类后的模糊意图。对槽位而言,细粒度的标注体系中,每个垂域的槽位都是独立的,但是垂域之间却存在交集,导致两个分属不同垂域但属性相同或类似的槽位具有不同的标注/名称。古诗垂域中的槽位包括诗名(poem)、诗句(verse)、作者(poet)、朝代(dynasty)、古诗标签(poemTag)、诗词类型(poemType)等,作文垂域中的槽位包括作文题目(composition)、作文标签(compositionTag)、作文类型 (compositionType)、年级(grade)等,菜谱中的槽位包括菜名(name)、菜系(style) 等。在本实施例提供的粗粒度的通用系统中,将这些槽位作为第二槽位,采用槽位的上位概念“第一槽位”对这些第二槽位进行整合,将所有垂域的第二槽位统一处理。比如“李白的诗有哪些”,“李白”在古诗垂域对应的第二槽位是作者,即poet=“李白”,而在其它垂域对应的第二槽位不是作者。但是所有的这类实体/第二槽位都有人物(person)这个上位词,因此本实施例中采用更上层的概念,将这一类第二槽位定义为第一槽位person。由此各个垂域的槽位间不会相互影响,并且属性相同或相近的槽位可以相互引用,扩充了标注数据的条目数量。
表2为使用细粒度的第二槽位和粗粒度的第一槽位的意图分类数量和槽位数量的对比。在使用第一槽位的情况下,需要分类的意图个数大幅度降低,直接从20个降低到3个。槽位的数量也有明显的降低,因为采用了更上层的概念,部分第二槽位被合并为第一槽位,槽位数量从17个降低到了10个。不仅降低了数据标注的难度,而且有效降低了模型的复杂度。
表2
意图数量 槽位数量
细粒度的第二槽位体系 20 17
粗粒度的第一槽位体系 3 10
步骤303、将所述目标垂域关联至所述第一意图。
本步骤中,将目标垂域关联到第一意图。
可选的,将映射到同一通用系统的多个垂域关联到第一意图。
可选的,定义多个第一意图,每个第一意图可指向一个或多个垂域。在确定第一意图后,即可根据其指向的垂域确定目标垂域。
本公开的一示例性实施例还提供了一种语义解析方法。基于深度学习的任务往往需要大量的数据支持,数据问题一直都是限制模型效果的重要因素。当添加新的垂域时,由于积累较少、多样性差、人工标注工作较大等原因,新添加的垂域的数据往往很难满足模型的训练,导致模型的训练受到极大的限制。
本实施例提供的方法,能够以基于第一槽位分类的数据为训练样本,训练得到进行模糊识别的模型,具体流程如图4所示,包括:
步骤401、根据所述第一槽位,生成训练样本。
所述训练样本包含目标垂域的正样本和负样本。
例如,准备1w条正样本和1w条负样本,按照粗粒度的模糊意图和第一槽位对训练样本进行数据标注。其中,正样本是指属于目标垂域的样本,正样本中包含多个不同的类别;负样本是指不属于目标垂域的样本。
模型的训练需要大量的标注数据以获得训练样本。前期数据可以通过人工基于粗粒度的第一槽位对数据进行标注。可选的,将数据的意图标注为query所属的垂域;命名实体的标注方式采用BIO的标注方式,B表示实体开头字符,I表示实体其他部分,O表示非实体字符。如“李白的静夜思”这一query,在通用系统中其意图为古诗,槽位标注为 B-personI-person O B-content I-conten I-content,由此便可以得到一条完整的标注数据。
对于负样本,意图全部标注为空(null),使数据的分布更接近真实数据的分布,保证模型不会召回与目标垂域不相关的query。而负样本仍然可以按照粗粒度的通用系统中的第一槽位进行标注,从而最大程度的利用数据,得到更多的标注数据作为训练样本,提高模型精度。
基于概念图谱的跨垂域槽位标注得到的训练样本数据结构更加简单,且不同垂域的标注数据可以共享使用并且不会造成歧义。这种方式有效降低了不同垂域间数据交叉的影响,模型也可以更好的拟合这些粗粒度的标注数据,准确率更高。
步骤402、使用所述训练样本,训练第一识别模型。
本步骤中,使用训练样本,可以基于双向长短期记忆(LSTM)网络训练模糊意图识别和第一槽位抽取的第一识别模型。
对于按照粗粒度的第一槽位标注的数据,该网络已经可以很好的拟合数据。网络包括输入层、双向LSTM、注意力(attention)层、输出层。例如,输入层通过向量映射(Embedding) 将输入字符转化为向量,向量维度为128。双向LSTM可以更好的捕捉上下文信息,其隐藏层向量维度设置可以为256。attention机制可以让模型更加关注query中的某些关键词,提高模型对query的解析能力。输出层包含两部分,一个是输出意图类型(即模糊识别意图),另一个结合CRF输出命名实体识别结果(即粗粒度的第一实体识别结果)。联合训练能将两个任务有机的结合起来,模糊识别中的意图识别与命名实体识别可以共享语义信息,在训练过程中意图识别与命名实体识别相互影响,相互促进,共同为模型提供梯度信息,更好的挖掘意图和实体之前的关系。例如,训练过程中,设置max_seq_length=32,batch_size=32,learning_rate=5e-4,模型结构如图5所示。
也可采用基于微调的多层双向Transformer编码器(Bert)网络。
为了进一步提高第一识别模型对不同垂域query的解析能力,本实施例中可以利用深度学习模型的泛化能力,收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
可选的,不断收集现有第一识别模型召回的query,然后按照前文中的方式得到粗粒度通用系统下的标注数据,并去掉训练样本中已经含有的query,由此便可以通过少量的标注数据获取大量第一识别模型解析的数据,有效解决了训练样本数据难以获取的问题。通过召回获取的新数据和初始准备的已有训练样本两部分数据来训练迭代模型,不仅可以提高模型的解析能力,还能不断积累业务相关的数据。
本公开的一示例性实施例还提供了一种语义解析方法,基于本公开提供的粗粒度的通用系统获取第一识别结果后,根据第一识别结果得到目标垂域下第二实体识别结果的流程如图6所示,包括:
步骤601、获取所述目标垂域下各个第二槽位与第一槽位的对应关系。
表3
Figure RE-GDA0003202200120000121
Figure RE-GDA0003202200120000131
本步骤中,按照表3中预定义好的映射规则,将粗粒度的第一识别结果,映射为细粒度的目标垂域下的可选的意图和第二槽位的信息。
第一识别模型得到的输出是一种相对粗粒度的第一识别结果,无法直接提供给下游任务进行进一步的处理,因此需要对第一识别结果进行进一步的解析。
这里会结合意图识别的第一意图识别结果和命名实体识别的第一实体识别结果两部分的输出,解析后将其映射为与目标垂域相适配的细粒度的意图和第二槽位的实体识别结果。
本步骤中,根据第一槽位与第二槽位的关联关系,确定了第一槽位在目标垂域下对应的第二槽位。
步骤602、根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
在确定了第二槽位后,即可将第一槽位的实体信息映射到第二槽位中。
以表3为例,首先获取模型的输出结果,比如“李白关于秋天的诗”,模糊意图的输出为“古诗”,第一实体识别结果为:person=“李白”、tag=“秋天”、workType=“古诗”,其中person、tag、workType为第一槽位的标签。然后根据模糊意图确定目标垂域为“古诗”后,结合表3中的映射关系,将第一实体识别结果映射到“古诗”垂域下的第二槽位中,person会被映射为第二槽位poet,tag会被映射为第二槽位poemTag,从而将粗粒度的第一槽位映射为细粒度的第二槽位。然后,再通过细粒度的第二槽位来确定具体的意图。在“古诗”垂域下,结合细粒度的第二槽位及用户query中的某些关键字,可以确定“李白关于秋天的诗”这个query对应的真实意图,该意图表示用户希望按照某个标签获取某个作者写的古诗,至此便得到了可以供下游任务使用的解析结果。在智能问答系统中,会根据这个意图和第二槽位的实体信息生成查询语句,输出最后的答案。
由此,便实现了将粗粒度的模型结果转换为细粒度的意图和槽位信息,并直接提供给下游任务。该转化过程的转换准确率极高,模型解析正确的情况下,可以准确的根据粗粒度的结果解析出用户的具体意图和真实的槽位信息。因此整个系统的准确率只取决于模型的准确率,几乎不会因为后续的解析而出现损失。
本公开的一示例性实施例还提供了一种语义解析装置,其结构如图7所示,包括:
第一解析模块701,用于获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
垂域确定模块702,用于根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
实体识别模块703,用于将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
意图解析模块704,用于根据所述第二实体识别结果,解析所述目标语句的意图。
可选的,所述装置的结构如图8所示,还包括:
第一创建模块705,用于创建至少一个第一槽位与所述至少一个第一槽位对应的第一意图;
关联模块706,用于对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系,每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位,所述第一槽位的总数小于等于所述第二槽位数量,
将所述目标垂域关联至所述第一意图。
可选的,所述装置的结构如图9所示,还包括:
训练样本采集模块707,用于根据所述第一槽位,生成包含训练样本,所述训练样本包含所述目标垂域的正样本和负样本;
神经网络训练模块708,用于使用所述训练样本,训练第一识别模型。
可选的,所述第一解析模块701的结构如图10所示,包括:
模型识别子模块1001,用于将所述目标语句输入所述第一识别模型,获取所述第一识别结果。
可选的,所述训练样本采集模块707,还用于收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
可选的,所述第一实体识别结果包含至少一个第一槽位的实体识别结果,所述实体识别模块703的结构如图11所示,包括:
对应关系确定子模块1101,用于获取所述目标垂域下各个第二槽位与第一槽位的对应关系;
实体精细识别子模块1102,用于根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
可选的,所述意图解析模块704的结构如图12所示,包括:
语句意图解析子单元1201,用于根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
可选的,所述装置的结构如图13所示,还包括:
查询语句输出模块709,用于根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
上述装置的各功能模块可集成于智能设备中,也可集成于服务器等远程处理平台,也可将其中的部分功能模块集成于智能设备、部分功能模块集成于远程处理平台。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图14是根据一示例性实施例示出的一种用于语义解析的装置1400的框图。例如,装置1400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图14,装置1400可以包括以下一个或多个组件:处理组件1402,存储器1404,电力组件1406,多媒体组件1408,音频组件1410,输入/输出(I/O)的接口1412,传感器组件1414,以及通信组件1416。
处理组件1402通常控制装置1400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1402可以包括一个或多个处理器1420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1402可以包括一个或多个模块,便于处理组件1402和其他组件之间的交互。例如,处理组件1402可以包括多媒体模块,以方便多媒体组件1408和处理组件1402之间的交互。
存储器1404被配置为存储各种类型的数据以支持在设备1400的操作。这些数据的示例包括用于在装置1400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1406为装置1400的各种组件提供电力。电力组件1406可以包括电源管理系统,一个或多个电源,及其他与为装置1400生成、管理和分配电力相关联的组件。
多媒体组件1408包括在所述装置1400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1408包括一个前置摄像头和/或后置摄像头。当设备1400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1410被配置为输出和/或输入音频信号。例如,音频组件1410包括一个麦克风(MIC),当装置1400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1404 或经由通信组件1416发送。在一些实施例中,音频组件1410还包括一个扬声器,用于输出音频信号。
I/O接口1412为处理组件1402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1414包括一个或多个传感器,用于为装置1400提供各个方面的状态评估。例如,传感器组件1414可以检测到设备1400的打开/关闭状态,组件的相对定位,例如所述组件为装置1400的显示器和小键盘,传感器组件1414还可以检测装置1400或装置 1400一个组件的位置改变,用户与装置1400接触的存在或不存在,装置1400方位或加速/减速和装置1400的温度变化。传感器组件1414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1414还可以包括光传感器,如 CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1414 还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1416被配置为便于装置1400和其他设备之间有线或无线方式的通信。装置 1400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA) 技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1404,上述指令可由装置1400的处理器1420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种语义解析方法,所述方法包括:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
图15是根据一示例性实施例示出的一种用于语义解析的装置1500的框图。例如,装置1500可以被提供为一服务器。参照图15,装置1500包括处理组件1522,其进一步包括一个或多个处理器,以及由存储器1532所代表的存储器资源,用于存储可由处理组件1522的执行的指令,例如应用程序。存储器1532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1522被配置为执行指令,以执行上述方法。
装置1500还可以包括一个电源组件1526被配置为执行装置1500的电源管理,一个有线或无线网络接口1550被配置为将装置1500连接到网络,和一个输入输出(I/O)接口1558。装置1500可以操作基于存储在存储器1532的操作系统,例如Windows ServerTM, MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开提供了一种语义解析方法及装置,首先获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,而所述第一实体识别结果对应于至少一个垂域,故第一意图识别结果是个涵盖多种具体实体识别结果的上位粗粒度结果。然后根据所述第一意图识别结果,确定所述第一实体识别结果对应的至少一个垂域中的一个垂域作为所述目标语句对应的目标垂域,并将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果,再根据所述第二实体识别结果,解析所述目标语句的意图。通过更粗粒度的模糊识别,使数据更为简洁,数据的管理和利用更高效,解决了识别效率低下影响智能语音问答准确率的问题。
本公开提供的技术方案具有更好的泛化性,针对中长尾query有更强的召回能力,且不用人工补充模板,丰富了训练样本,进而提升了第一识别模型的识别准确度。
由于数据简化,不同垂域之间的影响被降到最低,垂域间的数据可以实现互通共享,降低了数据标注的成本,使得跨垂域的语义解析第一识别模型更容易训练。而对于粗粒度的第一识别结果转换为细粒度的目标垂域下的具体的意图及第二实体识别结果的准确率极高,保证了通过第一识别模型得到的结果不会对系统的准确率造成影响。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (18)

1.一种语义解析方法,其特征在于,包括:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
2.根据权利要求1所述的语义解析方法,其特征在于,所述获取目标语句的第一识别结果的步骤之前,还包括:
创建至少一个第一槽位和与所述至少一个第一槽位对应的第一意图;
对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系,每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位,所述第一槽位的总数小于等于所述第二槽位的总数;
将所述目标垂域关联至所述第一意图。
3.根据权利要求2所述的语义解析方法,其特征在于,该方法还包括:
根据所述第一槽位和所述第一意图,生成训练样本,所述训练样本包含所述目标垂域的正样本和负样本;
使用所述训练样本,训练第一识别模型。
4.根据权利要求3所述的语义解析方法,其特征在于,所述获取目标语句的第一识别结果的步骤包括:
将所述目标语句输入所述第一识别模型,获取所述第一识别结果。
5.根据权利要求4所述的语义解析方法,其特征在于,该方法还包括:
收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
6.根据权利要求2所述的语义解析方法,其特征在于,所述第一实体识别结果包含至少一个第一槽位的实体识别结果,所述将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果的步骤包括:
获取所述目标垂域下各个所述第二槽位与所述第一槽位的对应关系;
根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
7.根据权利要求1所述的语义解析方法,其特征在于,所述根据所述第二实体识别结果,解析所述目标语句的意图的步骤包括:
根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
8.根据权利要求1所述的语义解析方法,其特征在于,所述根据所述第二实体识别结果,解析所述目标语句的意图的步骤之后,还包括:
根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
9.一种语义解析装置,其特征在于,包括:
第一解析模块,用于获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
垂域确定模块,用于根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
实体识别模块,用于将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
意图解析模块,用于根据所述第二实体识别结果,解析所述目标语句的意图。
10.根据权利要求9所述的语义解析装置,其特征在于,所述装置还包括:
第一创建模块,用于创建至少一个第一槽位与所述至少一个第一槽位对应的第一意图;
关联模块,用于对所述目标垂域进行向所述第一槽位的映射,建立所述目标垂域下第二槽位与所述第一槽位的关联关系,每个第二槽位对应一个第一槽位,每个第一槽位对应至少一个第二槽位,所述第一槽位的总数小于等于所述第二槽位数量,
将所述目标垂域关联至所述第一意图。
11.根据权利要求10所述的语义解析装置,其特征在于,所述装置还包括:
训练样本采集模块,用于根据所述第一槽位和所述第一意图,生成包含训练样本,所述训练样本包含所述目标垂域的正样本和负样本;
神经网络训练模块,用于使用所述训练样本,训练第一识别模型。
12.根据权利要求11所述的语义解析装置,其特征在于,所述第一解析模块包括:
模型识别子模块,用于将所述目标语句输入所述第一识别模型,获取所述第一识别结果。
13.根据权利要求12所述的语义解析装置,其特征在于,
所述训练样本采集模块,还用于收集所述第一识别模型的识别结果,将所述识别结果加入所述训练样本。
14.根据权利要求10所述的语义解析装置,其特征在于,所述第一实体识别结果包含至少一个第一槽位的实体识别结果,所述实体识别模块包括:
对应关系确定子模块,用于获取所述目标垂域下各个第二槽位与第一槽位的对应关系;
实体精细识别子模块,用于根据所述第一槽位的实体识别结果,确定对应的所述第二槽位的实体识别结果,生成所述目标垂域下的第二实体识别结果。
15.根据权利要求10所述的语义解析装置,其特征在于,所述意图解析模块包括:
语句意图解析子单元,用于根据所述第二实体识别结果和所述目标语句的关键字,解析所述目标语句的意图。
16.根据权利要求9所述的语义解析装置,其特征在于,所述装置还包括:
查询语句输出模块,用于根据所述目标垂域下的第二实体识别结果和所述目标语句的意图,生成并输出所述目标语句的查询语句。
17.一种语义解析装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
18.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种语义解析方法,所述方法包括:
获取目标语句的第一识别结果,所述第一识别结果包括第一意图识别结果和第一实体识别结果,所述第一实体识别结果对应于多个垂域;
根据所述第一意图识别结果,确定所述第一实体识别结果对应的多个垂域中的一个垂域作为所述目标语句对应的目标垂域;
将所述第一实体识别结果转化为所述目标垂域下的第二实体识别结果;
根据所述第二实体识别结果,解析所述目标语句的意图。
CN202110476311.5A 2021-04-29 2021-04-29 语义解析方法及装置 Pending CN113435205A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110476311.5A CN113435205A (zh) 2021-04-29 2021-04-29 语义解析方法及装置
US17/519,515 US20220350972A1 (en) 2021-04-29 2021-11-04 Method, electronic device and storage medium for semantic parsing
EP21210108.3A EP4083848A1 (en) 2021-04-29 2021-11-24 Method, electronic device and storage medium for semantic

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110476311.5A CN113435205A (zh) 2021-04-29 2021-04-29 语义解析方法及装置

Publications (1)

Publication Number Publication Date
CN113435205A true CN113435205A (zh) 2021-09-24

Family

ID=77752916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110476311.5A Pending CN113435205A (zh) 2021-04-29 2021-04-29 语义解析方法及装置

Country Status (3)

Country Link
US (1) US20220350972A1 (zh)
EP (1) EP4083848A1 (zh)
CN (1) CN113435205A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113918701A (zh) * 2021-10-20 2022-01-11 北京亿信华辰软件有限责任公司 看板展示方法及装置
CN117540750A (zh) * 2023-12-25 2024-02-09 卓世科技(海南)有限公司 基于知识图谱的智能客服语义分析方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6311150B1 (en) * 1999-09-03 2001-10-30 International Business Machines Corporation Method and system for hierarchical natural language understanding
US10418032B1 (en) * 2015-04-10 2019-09-17 Soundhound, Inc. System and methods for a virtual assistant to manage and use context in a natural language dialog
US10262062B2 (en) * 2015-12-21 2019-04-16 Adobe Inc. Natural language system question classifier, semantic representations, and logical form templates
WO2017112813A1 (en) * 2015-12-22 2017-06-29 Sri International Multi-lingual virtual personal assistant
US10304444B2 (en) * 2016-03-23 2019-05-28 Amazon Technologies, Inc. Fine-grained natural language understanding
US10600406B1 (en) * 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US11861674B1 (en) * 2019-10-18 2024-01-02 Meta Platforms Technologies, Llc Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems
US20220188567A1 (en) * 2020-12-11 2022-06-16 International Business Machines Corporation Generation of training data from redacted information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113918701A (zh) * 2021-10-20 2022-01-11 北京亿信华辰软件有限责任公司 看板展示方法及装置
CN113918701B (zh) * 2021-10-20 2022-04-15 北京亿信华辰软件有限责任公司 看板展示方法及装置
CN117540750A (zh) * 2023-12-25 2024-02-09 卓世科技(海南)有限公司 基于知识图谱的智能客服语义分析方法
CN117540750B (zh) * 2023-12-25 2024-03-22 卓世科技(海南)有限公司 基于知识图谱的智能客服语义分析方法

Also Published As

Publication number Publication date
EP4083848A1 (en) 2022-11-02
US20220350972A1 (en) 2022-11-03

Similar Documents

Publication Publication Date Title
US20170154104A1 (en) Real-time recommendation of reference documents
WO2017092122A1 (zh) 相似性确定方法、装置及终端
CN109144285B (zh) 一种输入方法和装置
CN108345625B (zh) 一种信息挖掘方法和装置、一种用于信息挖掘的装置
CN113435205A (zh) 语义解析方法及装置
CN113705210A (zh) 一种文章大纲生成方法、装置和用于生成文章大纲的装置
CN110674246A (zh) 问答模型训练方法、自动问答方法及装置
CN113987128A (zh) 相关文章搜索方法、装置、电子设备和存储介质
CN113849723A (zh) 搜索方法及搜索装置
CN112000840B (zh) 一种业务对象的展示方法和装置
CN110781689B (zh) 信息处理方法、装置及存储介质
CN111831132A (zh) 一种信息推荐方法、装置和电子设备
CN113420531B (zh) 一种代码文本的转换方法、装置及存储介质
CN107291259B (zh) 一种信息显示方法、装置和用于信息显示的装置
CN108345590B (zh) 一种翻译方法、装置、电子设备以及存储介质
CN110362686B (zh) 一种词库的生成方法、装置、终端设备和服务器
CN114255414A (zh) 一种视频标记方法、装置及电子设备
CN112988822A (zh) 数据查询方法、装置、设备、可读存储介质以及产品
CN113128181A (zh) 一种信息处理方法及装置
CN112052395A (zh) 一种数据处理方法及装置
CN108073566B (zh) 分词方法和装置、用于分词的装置
CN112651221A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN108241438B (zh) 一种输入方法、装置和用于输入的装置
CN107102747B (zh) 一种信息输入方法、装置和用于信息输入的装置
CN110765338A (zh) 一种数据处理方法、装置和用于数据处理的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination