CN106570002B - 自然语言处理方法和装置 - Google Patents

自然语言处理方法和装置 Download PDF

Info

Publication number
CN106570002B
CN106570002B CN201610976540.2A CN201610976540A CN106570002B CN 106570002 B CN106570002 B CN 106570002B CN 201610976540 A CN201610976540 A CN 201610976540A CN 106570002 B CN106570002 B CN 106570002B
Authority
CN
China
Prior art keywords
natural language
user
provider
session
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610976540.2A
Other languages
English (en)
Other versions
CN106570002A (zh
Inventor
刘锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201610976540.2A priority Critical patent/CN106570002B/zh
Publication of CN106570002A publication Critical patent/CN106570002A/zh
Application granted granted Critical
Publication of CN106570002B publication Critical patent/CN106570002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明的实施方式提供了自然语言处理方法和装置,在获取针对指定业务的自然语言语料后;接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。这样,得到的标签是专家级标签,标签的准确性较高。进一步的,相同业务或类似业务的不同业务提供者所添加的标签可以共享。这样,相当于实现了基于众包方式的带有标签的样本的采集。那么后续得到的语言模型可以由多个业务提供者共享,不仅可以为提供标签的业务提供者的用户提供服务,也可以为未提供标签的业务提供者的用户服务。故此,本发明实施例由于标签的准确性高,自然语言处理的准确性高,和标签资源的有效利用,能够进一步提高用户的应用体验。

Description

自然语言处理方法和装置
技术领域
本发明的实施方式涉及多媒体信息处理领域,更具体地,本发明的实施方式涉及自然语言处理方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
自然语言是指通过自然进化产生的人类之间用户交流的语言。自然语言处理是人工智能和语言学的交叉学科。在自然语言处理领域,主要研究如何建立能够表示自然语言的模型,以及通过建立合适的计算框架实现这样的模型,然后基于该模型再进一步优化得到能够实际应用的产品。
目前,自然语言处理在智能检索、问答系统、机器翻译、人机交互等应用领域都有着重要应用。现在的语言模型多是通过机器学习方法训练得到。通常训练时可以采用有标签的样本进行训练。
发明内容
出于由不了解实际需求的人员通过人工打标签的方式得到有标签的样本的原因,例如,如果实现一个航空服务的问答系统,现有技术中打标签的工作人员通常为提供航空服务之外的人员,其所添加的标签往往与实际需求有差异。而且,打标签的人员通常是相对比较固定的人员。故此,现有技术中,为了得到有标签的样本,不仅耗费了人力资源和处理资源,得到的标签的准确性也有限。基于这样的标签形成的语言模型也需要进一步优化和改善。而由固定的人员打标签,人员数量受到限制,打标签的处理效率较低。而且,业务提供者都有自己单独的一套处理自然语言的系统,这就导致现有技术中有标签的样本都是私有化的,不同业务提供者不能共享。所以,有标签的样本只能为有限的用户服务,导致有标签的样本的利用率低。
因此在现有技术中,由于得到的标签准确性低,导致自然语言处理的准确性受到限制,有标签的样本的私有化,导致有标签的样本的利用率低,这是非常令人烦恼的过程。
为此,非常需要一种改进的自然语言处理方法和装置,以提高标签的准确性,从而提高自然语言处理的准确性,使用户获得更好的应用体验。
在本上下文中,本发明的实施方式期望提供一种自然语言处理方法和装置。
在本发明实施方式的第一方面中,提供了一种自然语言处理方法,包括:
获取针对指定业务的自然语言语料;
接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
在本发明实施方式的第二方面中,提供了一种自然语言处理装置,包括:
语料获取模块,用于获取针对指定业务的自然语言语料;
标签接收模块,用于接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
在本发明实施方式的第三方面中,提供了一种自然语言处理设备,例如,可以包括存储器和处理器,其中,处理器可以用于读取存储器中的程序,执行下列过程:
获取针对指定业务的自然语言语料;
接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
在本发明实施方式的第四方面中,提供了一种程序产品,其包括程序代码,当所述程序产品运行时,所述程序代码用于执行以下过程:
获取针对指定业务的自然语言语料;
接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
在本发明实施方式的第五方面中,提供了一种自然语言处理方法,包括:
接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
根据得到的全局语义意图,应答所述用户。
在本发明实施方式的第六方面中,提供了一种自然语言处理装置,包括:
待处理自然语言接收模块,用于接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析模块,用于分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
应答模块,用于根据得到的全局语义意图,应答所述用户。
在本发明实施方式的第七方面中,提供了一种自然语言处理设备,例如,可以包括存储器和处理器,其中,处理器可以用于读取存储器中的程序,执行下列过程:
接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
根据得到的全局语义意图,应答所述用户。
在本发明实施方式的第八方面中,提供了一种程序产品,其包括程序代码,当所述程序产品运行时,所述程序代码用于执行以下过程:
接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
根据得到的全局语义意图,应答所述用户。
根据本发明实施方式的自然语言处理方法和装置,在获取针对指定业务的自然语言语料后;接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。这样,得到的标签是专家级标签,标签的准确性较高。进而,在获得准确性较高的标签的前提下,在后续处理操作中实现自然语言处理时,能够提高自然语言处理的准确性。进一步的,相同业务的不同业务提供者所添加的标签可以共享。这样,相当于实现了基于众包方式的带有标签的样本的采集。那么后续得到的语言模型可以由多个业务提供者共享,不仅可以为提供标签的业务提供者的用户提供服务,也可以为未提供标签的业务提供者的用户服务。所以,本发明实施例提供的自然语言处理方法,所添加的标签能够实现较高利用率。故此,本发明实施例由于标签的准确性高,自然语言处理的准确性高,和标签资源的有效利用,能够进一步提高用户的应用体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的应用场景示意图之一;
图2示意性地示出了根据本发明实施方式的应用场景示意图之二;
图3示意性地示出了根据本发明实施方式的应用场景示意图之三;
图4示意性地示出了根据本发明的一实施例的自然语言处理方法的流程示意图;
图5示意性地示出了根据本发明的另一实施例的自然语言处理方法的流程示意图;
图6示意性地示出了根据本发明的又一实施例的自然语言处理方法的流程示意图;
图7示意性地示出了根据本发明的再一实施例的自然语言处理方法的流程示意图;
图8示意性地示出了根据本发明的一实施例的自然语言处理装置的结构示意图;
图9示意性地示出了根据本发明的另一实施例的自然语言处理装置的结构示意图;
图10示意性地示出了根据本发明再一实施例的自然语言处理装置的结构示意图;
图11示意性地示出了根据本发明一实施例的自然语言处理的程序产品的结构示意图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种自然语言处理方法和装置。
在本文中,需要理解的是,所涉及的术语:
1、自然语言语料:需要添加标签的自然语言。
2、全局标签,用于表示自然语言全局语义意图的标签,例如,自然语言为“今天天气如何”,则其全局标签可以为“问天气”。
3、关键标签,用于表示自然语言的局部关键信息的标签,继续上面的例子,“今天天气如何”中的“今天”表示所问天气的时间,所述局部关键信息“今天”可以与关键标签“时间”对应。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,出于由不了解实际需求的人员通过人工打标签的方式得到有标签的样本的原因,例如,如果实现一个航空服务的问答系统,现有技术中打标签的工作人员通常为提供航空服务之外的人员,其所添加的标签往往与实际需求有差异。而且,打标签的人员通常是相对比较固定的人员。故此,现有技术中,为了得到有标签的样本,不仅耗费了人力资源和处理资源,得到的标签的准确性也有限。基于这样的标签形成的语言模型也需要进一步优化和改善。而由固定的人员打标签,人员数量受到限制,打标签的处理效率较低。而且,业务提供者都有自己单独的一套处理自然语言的系统,这就导致现有技术中有标签的样本都是私有化的,不同业务提供者不能共享。所以,有标签的样本只能为有限的用户服务,导致有标签的样本的利用率低。简言之,由于得到的标签准确性低,导致自然语言处理的准确性受到限制,有标签的样本的私有化,导致有标签的样本的利用率低,这是非常令人烦恼的过程。
本发明实施例中,在获取针对指定业务的自然语言语料后;接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。这样,由指定业务的提供者来对自然语言语料添加标签,得到的标签是专家级标签,标签的准确性较高。进而,在获得准确性较高的标签的前提下,在后续处理操作中实现自然语言处理时,能够提高自然语言处理的准确性。进一步的,相同业务的不同业务提供者所添加的标签可以共享。这样,相当于实现了基于众包方式的带有标签的样本的采集。那么后续得到的语言模型可以由多个业务提供者共享,不仅可以为提供标签的业务提供者的用户提供服务,也可以为未提供标签的业务提供者的用户服务。所以,本发明实施例提供的自然语言处理方法,所添加的标签能够实现较高利用率。故此,本发明实施例由于标签的准确性高,自然语言处理的准确性高,和标签资源的有效利用,能够进一步提高用户的应用体验。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1其为本发明实施例提供的自然语言处理方法的应用场景示意图之一。该场景例如可以包括指定业务的提供者10、该提供者的业务提供者终端11和服务器12。其中,业务提供者终端11中可配置有各种业务提供者客户端,如可以执行添加标签功能的客户服务系统配置客户端等。业务提供者终端11中的业务提供者客户端或服务器12可以获取针对指定业务的自然语言语料;接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。其中,第一提供者可以通过业务提供者终端11或业务提供者终端11中的业务提供者客户端添加标签,甚至可以通过服务器12的信息交互设备添加标签。
也就是说,本发明实施例提供的自然语言处理方法既可以由网络侧的服务器实施,也可以由安装于业务提供者终端中的业务提供者客户端,或业务提供者终端实施;也可以部分由服务器实施,部分由业务提供者客户端或业务提供者终端实施,对此不作任何限定。
其中,业务提供者终端11和服务器12可通过通信网络进行通信连接,该网络可以为局域网、广域网等。业务提供者终端11可以为手机、平板电脑、笔记本电脑、个人计算机等,服务器12可以为任何能够支持相应的自然语言处理的服务器设备。
其次,参考图2其为本发明实施例提供的自然语言处理方法的应用场景示意图之二。该场景例如可以包括指定业务的用户20、该用户的用户终端21和服务器12。其中,用户终端21中可配置有用户客户端,如用于咨询的客服客户端等。用户20可以通过用户终端21中的用户客户端向用户客户端或服务器12输入待处理自然语言,用户终端21中的客户端或服务器12接收指定业务的至少一个提供者的用户输入的待处理自然语言;分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;根据得到的全局语义意图,应答所述用户。
也就是说,本发明实施例提供的自然语言处理方法既可以由网络侧的服务器实施,也可以由安装于用户终端中的用户客户端,或用户终端实施;也可以部分由服务器实施,部分由用户客户端或用户终端实施,对此不作任何限定。
其中,用户终端21和服务器12可通过通信网络进行通信连接,该网络可以为局域网、广域网等。用户终端21可以为手机、平板电脑、笔记本电脑、个人计算机等,服务器12可以为任何能够支持相应的自然语言处理的服务器设备。
再次,参考图3其为本发明实施例提供的自然语言处理方法的应用场景示意图之三。该场景例如可以指定业务的提供者10、该提供者的业务提供者终端11、服务器12,以及指定业务的用户20,该用户的用户终端21。其中,业务提供者终端11可配置有各种业务提供者客户端等;用户终端21中可配置有用户客户端,如用于咨询的客服客户端等。
具体实施时,可以由服务器12获取针对指定业务的自然语言语料并发送给业务提供者终端11或业务提供者终端11中的业务提供者客户端显示,也可以由业务提供者10通过业务提供者终端11或业务提供者终端11中的业务提供者客户端输入自然语言语料并显示;业务提供者10可以通过业务提供者终端11或业务提供者终端11中的业务提供者客户端对显示的自然语言语料添加标签,并发送给服务器12由服务器12接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。由服务器对添加标签的自然语言语料进行处理。其中,服务器可以接收一个或多个指定业务的提供者发送来的添加了标签的自然语言语料并统一处理。
而针对指定业务的用户20,该用户20可以通过用户终端21、或者用户终端21中的用户客户端、向服务器12发送待处理自然语言。服务器12接收指定业务的至少一个提供者的用户输入的待处理自然语言;并分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;然后,根据得到的全局语义意图,应答所述用户。其中,第一提供者添加的标签,可以为指定业务的其它提供者所用。即,输入待处理自然语言的用户可以是第一提供者的用户也可以是第二提供者的用户。而该第二提供者可以执行过添加标签的操作,也可以没有执行过。
需要说明的是,除图3所示的应用场景外,业务提供者也可以通过服务器添加标签,而对自然语言语料的获取和标签的接收也可以由服务器之外的其它设备执行。对于待处理自然语言的分析处理,可以由服务器之外的其它设备例如用户终端、甚至用户终端中的用户客户端来执行。也就是说,本发明实施例提供的自然语言处理方法可以根据实际需求确定各步骤的执行主体,均适用于本发明实施例,对此不作任何限定。
其中,业务提供者终端11和服务器12可通过通信网络进行通信连接,该网络可以为局域网、广域网等。
同理,用户终端21和服务器12可通过通信网络进行通信连接,该网络可以为局域网、广域网等。
业务提供者终端11和用户终端21可以分别为手机、平板电脑、笔记本电脑、个人计算机等中的其中一种;服务器12可以为任何能够支持相应的自然语言处理的服务器设备。
示例性方法
下面结合图1-3的应用场景,参考图4-7来描述根据本发明示例性实施方式的用于自然语言处理的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
实施例一
如图4所示,其为本发明实施例提供的自然语言处理方法的流程示意图,该方法包括以下步骤:
步骤401:获取针对指定业务的自然语言语料。
其中,在一个实施例中,为了确保自然语言语料的质量,步骤401可包括以下两种实施方式:
方式一:接收所述第一提供者输入的自然语言语料。第一提供者输入的自然语言语料是第一提供者根据自身用户的语言习惯总结归纳出的自然语言语料。因此,这样得到的自然语言语料更能与实际的应用需求贴合,自然语言语料的质量更高。
方式二:接收所述第一提供者的客服系统反馈的由所述指定业务的用户输入的自然语言语料。与方式一同理,方式二获得的自然语言语料是用户输入的自然语言语料,符合用户的表达习惯,是贴合实际情况的自然语言语料。故此,得到的自然语言语料的质量较高。为后续处理提供了一个良好的基础数据保障。
具体实施时,方式一和方式二可以结合使用,即自然语言语料的获取方式即可以包括方式一也可以包括方式二,本发明实施例对此不作限定。
当然,还可以从网络上其它渠道获取自然语言语料,例如通过网络爬虫,从网络上获取满足指定规则的信息。例如含有“天气”这一关键词的信息,实施时,可以根据实际需要配置指定规则,本发明实施例对此不作限定。
步骤402:接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
此外,本发明实施例中,针对指定业务,可以由该指定业务的不同提供者对自己收集的自然语言语料添加标注。这样,针对同一业务,其涵盖的自然语言语料将会比较全面。例如,问天气的方式可以有多种,不同提供者可以根据自己用户的表达习惯得到用于问天气的自然语言语料,那么得到的自然语言语料接近于全面包括所有用于问天气的自然语言表达方式。这样,任何问天气的自然语言都将被添加过标签,对应任何问天气的自然语言后续将都能够准确处理。故此,本申请实施例相当于对于指定业务的添加标签任务,以众包的方式交由专家处理。相对于现有技术,得到的标签更加准确。以众包的方式,使得添加标签的处理效率也较高。
其中,在一个实施例中,所述指定业务的第一提供者针对所述自然语言语料所添加的标签,用于解析所述指定业务的第二提供者的用户输入的待处理自然语言。这样,添加的标签可以多个业务提供者共享。所以,本发明实施例提供的自然语言处理方法,所添加的标签能够实现较高利用率。
其中,在一个实施例中,所述标签为所述第一提供者从内置标签集合中选择的标签或者所述第一提供者输入的自定义标签。也就是说,针对指定业务可以预先配置一些内置标签,以便于第一提供者添加标签时使用。内置标签也便于引导同一业务的不同提供者将属于同一标签的自然语言语料归类。此外,由于实际情况可能是复杂的,不同业务会有不同的需求。亦或者随着时间的发展,人们的语言表达习惯发生改变或者产生了新概念的词汇。故此,本发明实施例提供了自定义标签的功能。这样,可以满足不同业务的不同提供者的业务需求。由业务提供者根据自身的经验来自定义标签,自定义标签表达的含义将与实际需求贴合,能够满足实际的语义意图。简言之,内置标签可以有助于将不同表述方式的语义进行聚类,而自定义标签使得本申请实施例提供的方案能够有更好的可扩展性。
其中,在一个实施例中,还可以使用机器学习的方法,将所述指定业务的多个提供者输入的自定义标签进行归类。例如,当自定义标签足够多时,可以通过聚类分析方法将相似的自定义标签进行分类。每类自定义标签可以对应一个内置标签,从而实现对内置标签的完善。当然,对于每个类别的自定义标签可以从该类别中选择一个自定义标签作为该类别的代表标签。然后,每个类别的代表标签可以作为内置标签,从而实现对内置标签的不断完善。其中,聚类分析的方法可以根据现有技术实现这里不做详述。
其中,在一个实施例中,针对所述自然语言语料所添加的标签可包括:用于表示所述自然语言语料的全局语义意图的全局标签;以及,针对所述自然语言语料的局部关键信息所添加的关键标签,其中,所述关键标签对应于针对所述全局语义意图做出响应时不可缺少的要素。例如,全局语义意图为“问天气”时,如果要返回天气情况给用户,那么,就需要知道用户问哪个地方、哪个时间的天气。例如问北京,明天的天气。所以关键标签可以包括“地点”和“时间”,作为“问天气”这一全局语义意图下的要素。这样,可以根据要素来确定返回何种结果给用户,能够使得返回的结果更加准确。故此,本发明实施例通过全局标签和关键标签,能够将同一类自然语言划分出层次逻辑清晰的结构,便于后期自然语言处理时根据不同全局语义意图执行相应的操作。
其中,在一个实施例中,可以将已添加标签的自然语言语料、已添加标签的自然语言语料的全局标签和关键标签统称为训练样本。为了有效利用训练样本,本发明实施例中还包括:根据已添加标签的自然语言语料、已添加标签的自然语言语料的全局标签和关键标签,通过机器学习方法训练自然语言解析模型,该自然语言解析模型用于分析输入给所述自然语言解析模型的待处理自然语言的全局语义意图并解析该待处理自然语言中包含的要素,其中,所述待处理自然语言为所述第一提供者的用户和/或所述指定业务的第二提供者的用户输入的自然语言。也就是说针对指定业务的训练样本都可以用于训练自然语言解析模型。一般来说,在使用训练样本对自然语言解析模型进行训练之前,会预先设置一个原始自然语言解析模型,如果在步骤401(即获取针对指定业务的自然语言语料)之前,已经获取到针对指定业务的训练样本,则可以根据该训练样本训练自然语言解析模型。那么步骤402获取到的训练样本,将继续用于训练自然语言解析模型以实现对自然语言解析模型的进一步优化。如果在步骤401之前,没有获得过训练样本,则步骤402获取到的训练样本也将用于对原始自然语言解析模型进行训练。也就是说若第一提供者是指定业务的第一个添加标签的提供者,那么第一提供者所提供的训练样本用于对原始自然语言解析模型进行训练。若第一提供者不是指定业务的第一个添加标签的提供者,那么第一提供者提供的训练样本,可以用于继续训练以优化自然语言解析模型。当然,也可以不设置原始自然语言解析模型,这种情况下,若第一提供者是指定业务的第一个添加标签的提供者,则自然语言解析模型可以根据该第一提供者的训练样本得到。具体实施时,可以根据现有技术中训练样本优化模型的方法,优化自然语言解析模型,本发明实施例对此不作限定。
其中,自然语言解析模型可以为不同的业务提供者所用。同一业务的不同提供者,无论这个提供者有没有添加过标签,都可以使用该自然语言解析模型。这样,就达到了以众包的方式解析自然语言的目的。具体的内容将在后续实施例中说明,这里暂不详述。
其中,在一个实施例中,无论是上述原始自然语言解析模型、还是之前已经经过样本训练的自然语言解析模型,对于当前的还没有用于训练的自然语言语料而言,都是初始自然语言解析模型,本发明实施例中,为了提高添加标签的自动化程度,还可以通过该初始自然语言解析模型自动的识别局部关键信息及对应的标签。具体的,所述方法还包括:
步骤A1:通过初始自然语言解析模型解析所述自然语言语料中的局部关键信息及对应的关键标签并输出。
步骤A2:确定接收到对选定的局部关键信息及对应的关键标签的修改指令。
也就是说,为了避免自然语言解析模型的解析错误,本发明实施例中,通过自然语言解析模型解析局部关键信息及对应的关键标签后通过显示出来,以便于第一提供者校验解析的结果是否准确。如果不准确,则第一提供者可以发送修改指令对其进行修改。当然,如果解析结果准确,也可以显示出来,在接收到表示解析的局部关键信息及对应的关键标签正确的确认信息时,对应存储所述自然语言语料及其全局标签和关键标签;此外,允许第一提供者对当前的局部关键信息以及对应的关键标签进行修改,有助于业务提供者根据实际需要对自然语言语料的局部关键信息以及关键标签进行动态修改。
其中,在一个实施例中,训练得到的自然语言解析模型能够确定每个全局语义意图及其要素集合的对应关系。本发明实施例中,为了提高自动化程度,本发明实施例中,还可以利用初始自然语言解析模型来识别和判断自然语言语料中是否缺少要素。具体的,所述方法还包括:通过初始自然语言解析模型分析所述待处理自然语言语料对应的全局语义意图以及所述自然语言语料包含的要素,根据所述全局语义意图对应的要素集合,确定所述自然语言语料是否缺少要素。
在一种可能的实施方式中,在缺少要素时,可以发出所述自然语言语料缺少要素的提示。也就是说,可以通过自然语言解析自动的分析自然语言语料中是否缺少要素,如果缺少则可以提示给第一提供者,以便于第一提供者进行后续的处理。
其中,提示的内容可以包括缺少哪些要素,在有些情况下,业务提供者输入的自然语言预料已经包含了全局语义意图的要素集合中的所有要素,但是解析模型可能发生误判,判断缺少了某一个或者某几个要素,这种情况下,允许业务提供者对判断结果进行纠正、即业务提供者可以在当前的自然语言预料中进行选择,选择其中一部分作为被解析模型判断缺少的要素对应的局部关键信息。具体实施时,则可以接收第一提供者对所述自然语言语料的第一部分的选定操作,并将选定的所述自然语言语料的第一部分与缺少的要素建立对应关系。例如,若缺少的要素有多个时,则可以接收对所述自然语言语料的局部关键信息的选定操作以及对缺少的要素的选定操作,并将选定的局部关键信息与选定的要素建立对应关系。这样,便实现了对解析结果的纠正。
其中,在一个实施例中,若自然语言语料缺少要素时,需要说明的是此处缺少要素的情况可以分为以下三种:
1、初始自然语言解析模型确定自然语言语料缺少要素;
2、没有用初始自然语言解析模型自动分析是否缺少要素,而是由第一提供者确定自然语言语料缺少要素;
3、先由初始自然语言解析模型确定自然语言语料缺少要素,但是是否缺少要素的分析结果存在错误,然后由第一提供者对该错误修正后,仍发现缺少要素;
在确定缺少要素时,所述方法还包括以下步骤:
步骤B1:接收用于添加针对所述自然语言语料的会话内容的添加请求,其中,所述会话内容用于请求用户输入缺少的要素。
具体实施时,可以提供用于添加标签的操作界面。业务提供者添加标签后,可以根据自身的经验判断自然语言语料中是否缺少要素。例如,自然语言语料为“天气如何”,其全局语义意图为“问天气”,显然缺少要素“时间”和“地点”。所以,这时候业务提供者可以通过操作界面触发添加请求,以便于输入自定义的会话内容。
由业务提供者输入自定义的会话内容,可以方便业务提供者根据自身的业务特点和需求,通过会话内容向用户展示自身的风格与特点。这样,同一业务的不同业务提供者,可以有不同的会话风格,从而满足不同业务提供者的功能性需求,提高不同业务提供者的应用体验。
步骤B2:输出用于输入会话内容的操作界面。
其中,可以输出给内置的显示装置显示,也可以输出给其它设备。
步骤B3:接收所述第一提供者通过所述操作界面输入的会话内容。
例如,自然语言语料缺少要素时,第一提供者可以通过点击用于添加会话内容的按钮来发送添加请求。然后第一提供者在操作界面中输入自定义的会话内容。例如,继续上面的例子,输入的会话内容可以为“请问需要查询哪个地点和时间的天气?”。这样,对于业务提供者而言,便可以通过会话内容,引导用户输入缺少的要素,以便于为用户准确反馈其期望的结果。
其中,在一个实施例中,和用户会话需要耗费处理资源。为了节约处理资源,本申请实施例中,还可以接收通过所述会话内容与同一用户进行会话的最高会话次数的配置请求;根据所述配置请求配置最高会话次数。这样,当会话次数达到最高会话次数时,则可以结束会话。例如,最高会话次数假设为N次。若会话内容为请求用户输入所询问的天气的时间和地点,如果用户输入N次信息,始终没有输入需要的地点和/或时间(也即缺少的要素未全部反馈),那么继续为这样的用户处理是没有意义的。因为采用同样的方式会话,会导致会话进入死循环。故此,通过配置最高会话次数结束会话从而避免会话进入死循环,以便于节约处理资源。
其中,在一个实施例中,结束会话时,为了能够进一步引导用户进行后续操作,从而提高用户的应用体验,本申请实施例中还可以接收在会话次数达到最高会话次数时、针对所述全局语义意图的用于结束会话的会话结束内容的配置请求;根据所述配置请求,配置结束会话时的会话结束内容。例如,会话结束内容可以包括提醒用户重新输入待处理自然语言并建议本次输入的自然语言应该包括哪些要素。例如,会话结束内容可以为“不好意思,没有明白您在说什么,如果您仍想了解天气,需要重新提问,并告诉我时间和地点”。或者,会话结束内容包括后续操作的链接,例如通过其它方式让用户获取期望的结果的链接。
其中,在一个实施例中,为便于为用户反馈期望的结果,本发明实施例中,还可以接收配置所述自然语言语料的全局语义意图对应的响应操作的配置指令;根据所述配置指令中携带的响应操作进行相应配置。例如,若自然语言的全局语义意图为“问天气”,且包括所需的各要素即“地点”和“时间”,那么可以配置响应操作为调用天气查询模块去查询对应的天气,并发送给用户。这样,业务提供者可以根据自身的需求来确定对各类全局语义意图的响应操作。能够提高业务提供者的应用体验。
综上所述,针对指定业务,其业务提供者,可以输入自然语言语料,并对该自然语言语料添加标签。然后,业务提供者,可以根据自己的业务逻辑,设置遇到不同自然语言语料时的处理方式。例如添加会话内容用于提示用户添加缺少的要素。例如设置最高会话次数,避免会话进入死循环。再例如,配置全局语义意图对应的响应操作。这样,本发明实施例提供的自然语言处理方法能够兼容不同的业务,可扩展性强。
实施例二
为便于进一步理解实施例一提供的自然语言处理方法,这里以一具体实施例进行说明。
假设,第一航空公司,通过自己的客户端(可称为第一客户端),输入了针对票务查询业务的自然语言语料,并对其添加了全局标签和关键标签。之后,通过第一客户端将已添加了标签的自然语言语料及标签,发送给服务器。服务器根据这些信息生成了自然语言解析模型。此时,第二航空公司需要和第一航空公司一样,建立自己的业务处理逻辑。
假设第二航空公司的客户端称为第二客户端,则针对第二航空公司可执行的操作,如图5所示,可包括如下步骤:
步骤501:第二客户端接收第二航空公司输入的针对票务查询业务的自然语言语料。
步骤502:第二客户端显示针对票务查询业务的内置标签。
其中,在一个实施例中,服务器中可以涵盖多种行业的多种业务。那么,具体实施时,各企业可以在服务器上进行注册,并指定自己涵盖的业务类型。其中,各业务类型可以有各自的内置标签。那么在企业使用客户端时,可以根据该企业的业务类型确定对应的内置标签。具体实施时,确定显示内置标签的方法以及确定显示何种内置标签可以根据实际需求设定,本发明实施例对此不作限定。
步骤503:第二客户端接收第二航空公司针对所述自然语言语料的全局语义意图从内置标签中选择的全局标签。
步骤504:第二客户端接收第二航空公司针对所述自然语言语料的局部关键信息从内置标签中选择的关键标签,并发送给服务器。
第二客户端还可以根据第二航空公司的操作,确定被选择的关键标签和其对应的局部关键信息,并把被选择的关键标签和相应的局部关键信息对应的发送给服务器。此外,在服务器已经维护有上述局部关键信息的情况下,第二客户端还可以根据第二航空公司的操作,确定被选择的关键标签以及局部关键信息的对应关系,并把被选择的关键标签和该对应关系发送给服务器。
当然,具体实施时,也可以由自然语言解析模型解析第二航空公司输入的自然语言语料,并得出该自然语言语料的全局语义意图对应的全局标签,以及局部关键信息对应的关键标签。
步骤505:服务器通过自然语言解析模型确定第二客户端发送的全局标签对应的要素集合,并根据所述自然语言语料包含的要素,确定所述自然语言语料是否缺少要素;若是,则执行步骤507,若否,则执行步骤506。
步骤506:服务器将所述自然语言语料及其对应的全局标签和关键标签视为用于更新自然语言解析模型的训练样本并存储。
其中,在一个实施例中,可以当存储的训练样本到达预设样本数量时,开始更新自然语言解析模型。也可以每间隔预设时长,获取该预设时长内存储的训练样本,用于更新自然语言解析模型。
步骤507:服务器发出所述自然语言语料缺少要素的提示给第二客户端显示。
步骤508:第二客户端接收用于添加针对所述待处理自然语言的会话内容的添加请求,其中,所述会话内容用于请求用户输入缺少的要素。
步骤509:第二客户端输出用于输入会话内容的操作界面。
步骤510:第二客户端接收所述第二航空公司通过所述操作界面输入的会话内容并发送给服务器。
步骤511:服务器根据接收的会话内容进行相应配置。
步骤512:第二客户端接收通过所述会话内容与同一用户进行会话的最高会话次数的配置请求,并发送给服务器。
步骤513:服务器根据所述配置请求配置最高会话次数。
步骤514:第二客户端接收在会话次数达到最高会话次数时、针对所述全局语义意图的用于结束会话的会话结束内容的配置请求,并发送给服务器。
步骤515:服务器根据所述配置请求,配置结束会话时的会话结束内容。
步骤516:第二客户端接收配置所述自然语言语料的全局语义意图对应的响应操作的配置指令,并发送给服务器。
步骤517:服务器根据所述配置指令中携带的响应操作进行相应配置。
综上所述,本发明实施例中,业务提供者可以根据自己的需求输入自然语言语料,并对其添加标签。故此,本发明实施例,得到的标签是专家级的标签。此外,本发明实施例中,业务提供者能按照自己的业务逻辑,进行相应配置。例如,自然语言语料缺少要素时可以添加会话逻辑,以便于请求用户输入缺少的要素。再例如通过最高会话次数能够避免陷入会话死循环等。进而提高业务提供者的应用体验。
实施例三
如图6所示,为本发明实施例提供的另一种自然语言处理方法的流程示意图。具体的,该方法包括以下步骤:
步骤601:接收指定业务的至少一个提供者的用户输入的待处理自然语言。
步骤602:分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图。
步骤603:根据得到的全局语义意图,应答所述用户。
其中,在一个实施例中,步骤601中的所述提供者为第二提供者,分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,具体包括:根据预置的自然语言解析模型分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,其中,所述自然语言解析模型为根据所述指定业务的第一提供者标注的自然语言语料得到的。
也就是说,自然语言解析模型是第一提供者提供的标注的自然语言语料建立,而该模型可用于处理第二提供者使用。这样,由于第二提供者不同于第一提供者,相当于实现了以众包的方式分析待处理自然语言。
其中,在一个实施例中,为了能够为用户反馈其期望的结果,所述方法还包括:
步骤D1:根据所述自然语言解析模型分析所述待处理自然语言,得到所述待处理自然语言的全局语义意图的要素集合。
步骤D2:根据所述自然语言解析模型解析所述待处理自然语言中包括的所述要素集合中的要素。
这样,便得到待处理自然语言的全局语义意图,与其包含的要素。那么步骤603中根据得到的全局语义意图,应答所述用户,可具体包括:
若确定所述待处理自然语言中缺少所述要素集合中的要素,则向所述用户发送预置的会话内容,所述会话内容用于请求所述用户输入缺少的要素。
这样,在用户输入的待处理自然语言缺少要素时,不能较好的反馈给用户其期望的结果时,本发明实施例能够通过会话内容提示用户输入缺少的要素。以便于引导用户给出缺少的要素,并继而能够为用户反馈期望的结果。例如,若用户输入的待处理自然语言为“播放音乐”,但是播放何种音乐并没有说明。如果能够给用户反馈更好的结果,需要知道更多的信息。例如需要播放什么类型的音乐或者播放哪位歌手的哪首歌曲。
其中,在一个实施例中,为了能够提供用户的应用体验,给予用户期望的结果,本发明实施例中还包括以下步骤:
步骤E1:接收所述用户针对所述会话内容输入的应答信息。
步骤E2:根据所述自然语言解析模型解析所述应答信息,根据解析结果确定是否包含缺少的要素。
步骤E3:若包含所有缺少的要素,则根据所述用户对应的提供者预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作响应所述用户;若包含部分缺少的要素或者不包含缺少的要素,则返回执行向所述用户发送预置的会话内容的步骤。
需要说明的是,步骤603中的应答所述用户包括了缺少要素时的应答方式,可不缺少要素时的应答方式。这里,不缺少要素时的应答方式即为预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作。例如,用户输入的自然语言为“天气如何”,但是缺少要素,即“时间”和“地点”,故此,采用会话内容提醒用户输入这两个要素的具体内容。这是一种缺少要素的应答方式。如果用户输入的自然语言为“北京明天天气如何”,那么,这种自然语言不缺少要素。将直接为用户反馈北京明天的天气,这是不缺少要素时的应答方式。
本发明实施例中,能够进一步分析用户是否补充了缺少的要素,进而给出相应的应答。让用户有一种和自然人交互的感觉,能够提高用户的应用体验。
其中,在一个实施例中,为了避免与用户的会话进入死循环,在通过会话内容与用户会话,和/或,分析用户输入的应答信息的过程中,所述方法还包括:
步骤F1:计算通过会话内容与所述用户进行会话的会话次数是否达到预置最高会话次数。
步骤F2:若是,则将预置的用于结束会话的会话结束内容发送给所述用户,并结束会话。
这样,如果达到预置最高会话次数,用户仍为给全缺少的要素,则说明再继续以同样的方式应答用户是没有意义的。所以,可以通过结束会话,避免会话进入死循环,节约与用户会话所耗费的处理资源。在结束会话时,还可以发送预置的会话结束内容给所述用户。该预置的会话结束内容,是由业务提供者自定义的,可用于帮助用户了解已结束会话,或者,给出其它方式解决用户问题的链接。
综上所述,本发明实施例中,实现了以众包的方式处理不同业务提供者的自然语言。能够有效利用不同提供者的已标注的自然语言语料。并且,在确定用户输入的自然语言缺少要素时,能够反馈给用户,引导用户输入缺少的要素。此外,还能够通过结束会话的机制,结束不必要的会话,从而节约处理资源。
实施例四
在实施例三的基础上,以处理航空服务的用户输入的自然语言为例,对本发明实施例中的自然语言处理方法做进一步说明。如图7所示,为该方法的流程示意图,包括以下步骤:
步骤701:接收第一航空公司的用户输入的待处理自然语言。
步骤702:根据预置的自然语言解析模型分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,及该全局语义意图的要素集合,其中,所述自然语言解析模型为根据第二航空公司标注的自然语言语料得到的。
步骤703:根据所述自然语言解析模型解析所述待处理自然语言中包括的所述要素集合中的要素。
其中,步骤702和步骤703的执行顺序不受限。
步骤704:判断所述待处理自然语言中是否缺少所述要素集合中的要素,若是,执行步骤705,若否,则执行步骤711。
步骤705:向所述用户发送预置的会话内容,所述会话内容用于请求所述用户输入缺少的要素,并将会话次数加1。
步骤706:接收所述用户针对所述会话内容输入的应答信息。
步骤707:根据所述自然语言解析模型解析所述应答信息,根据解析结果确定是否包含缺少的要素,若是,则获取缺少的要素并执行步骤710,若否,则执行步骤708。
步骤708:判断会话次数是否达到预置最高会话次数,若是,则执行步骤709;若否,则返回执行步骤705。
步骤709:将预置的用于结束会话的会话结束内容发送给所述用户,并结束会话。
步骤710:确定是否获取了所有缺少的要素;若否,则返回执行步骤708,若是,则执行步骤711。
步骤711:根据所述用户对应的提供者预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作响应所述用户。
例如,用户如果要购买机票,则需要给出出发地、目的地和时间三要素。若用户输入的待处理自然语言为“购买机票”,则缺少这三要素。则可以将会话内容“请告诉我出发地、目的地以及出发时间才能反馈机票信息”发送给用户。如果用户输入了这三要素,则为用户展示可以购买的机票信息。如果用户在预置最高会话次数内,没有给全这三要素的信息,则结束会话。
综上所述,本发明实施例提供的自然语言处理方法,能够以众包的方式处理自然语言。并且,在确定用户输入的自然语言缺少要素时,能够反馈给用户,引导用户输入缺少的要素。此外,还能够通过结束会话的机制,结束不必要的会话,从而节约处理资源。
示例性设备
在介绍了本发明示例性实施方式的方法之后,接下来,参考图8-10对本发明示例性实施方式的自然语言处理装置进行说明。
如图8所示,为本发明实施例提供的自然语言处理装置的结构示意图,包括:
语料获取模块801,用于获取针对指定业务的自然语言语料;
标签接收模块802,用于接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
其中,在一个实施例中,针对所述自然语言语料所添加的标签包括:用于表示所述自然语言语料的全局语义意图的全局标签;以及,针对所述自然语言语料的局部关键信息所添加的关键标签,其中,所述关键标签对应于针对所述全局语义意图做出响应时不可缺少的要素。
其中,在一个实施例中,每个全局语义意图对应一个要素集合,若所述自然语言语料缺少其对应的全局语义意图的要素集合中的要素,所述装置还包括:
添加请求接收模块803,用于接收用于添加针对所述自然语言语料的会话内容的添加请求,其中,所述会话内容用于请求用户输入缺少的要素;
操作界面输入模块804,用于输出用于输入会话内容的操作界面;
会话内容接收模块805,用于接收所述第一提供者通过所述操作界面输入的会话内容。
其中,在一个实施例中,所述指定业务的第一提供者针对所述自然语言语料所添加的标签,用于解析所述指定业务的第二提供者的用户输入的待处理自然语言。
其中,在一个实施例中,所述装置还包括:
第一配置请求接收模块806,用于接收通过所述会话内容与同一用户进行会话的最高会话次数的配置请求;
会话次数配置模块807,用于根据所述配置请求配置最高会话次数。
其中,在一个实施例中,所述装置还包括:
第二配置请求接收模块808,用于接收在会话次数达到最高会话次数时、针对所述全局语义意图的用于结束会话的会话结束内容的配置请求;
会话结束内容配置模块809,用于根据所述配置请求,配置结束会话时的会话结束内容。
其中,在一个实施例中,所述装置还包括:
模型训练模块810,用于根据已添加标签的自然语言语料、已添加标签的自然语言语料的全局标签和关键标签,通过机器学习方法训练自然语言解析模型,该自然语言解析模型用于分析输入给所述自然语言解析模型的待处理自然语言的全局语义意图并解析该待处理自然语言中包含的要素,其中,所述待处理自然语言为所述第一提供者的用户和/或所述指定业务的第二提供者的用户输入的自然语言。
其中,在一个实施例中,所述装置还包括:
输出模块811,用于通过初始自然语言解析模型解析所述自然语言语料中的局部关键信息及对应的关键标签并输出;
修改指令接收模块812,用于确定接收到对选定的局部关键信息及对应的关键标签的修改指令。
其中,在一个实施例中,所述装置还包括:
要素检测模块813,用于通过初始自然语言解析模型分析所述待处理自然语言语料对应的全局语义意图以及所述自然语言语料包含的要素,根据所述全局语义意图对应的要素集合,确定所述自然语言语料是否缺少要素;
缺少要素提示模块814,用于在缺少要素时,发出所述自然语言语料缺少要素的提示。
其中,在一个实施例中,所述装置还包括:
对应关系修改模块815,由于接收对所述自然语言语料的第一部分的选定操作,并将选定的所述自然语言语料的第一部分与缺少的要素建立对应关系。
其中,在一个实施例中,语料获取模块801,具体包括:
第一语料获取单元816,用于接收所述第一提供者输入的自然语言语料;和/或,
第二语料获取单元817,用于接收所述第一提供者的客服系统反馈的由所述指定业务的用户输入的自然语言语料。
其中,在一个实施例中,所述装置还包括:
响应操作配置指令接收模块818,接收配置所述自然语言语料的全局语义意图对应的响应操作的配置指令;
响应操作配置模块819,根据所述配置指令中携带的响应操作进行相应配置。
其中,在一个实施例中,所述标签为所述第一提供者从内置标签集合中选择的标签或者所述第一提供者输入的自定义标签。
其中,在一个实施例中,所述装置还包括:
分类模块820,用于使用机器学习的方法,将所述指定业务的多个提供者输入的自定义标签进行归类。
另外,如图9所示,为本发明实施例提供的自然语言处理装置的另一结构示意图,包括:
待处理自然语言接收模块901,用于接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析模块902,用于分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
应答模块903,用于根据得到的全局语义意图,应答所述用户。
其中,在一个实施例中,所述提供者为第二提供者,分析模块902,具体用于:
根据预置的自然语言解析模型分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,其中,所述自然语言解析模型为根据所述指定业务的第一提供者标注的自然语言语料得到的。
其中,在一个实施例中,所述装置还包括:
要素集合确定模块904,用于根据所述自然语言解析模型分析所述待处理自然语言,得到所述待处理自然语言的全局语义意图的要素集合;
自然语言要素检测模块905,用于根据所述自然语言解析模型解析所述待处理自然语言中包括的所述要素集合中的要素;
应答模块903,具体用于:
若确定所述待处理自然语言中缺少所述要素集合中的要素,则向所述用户发送预置的会话内容,所述会话内容用于请求所述用户输入缺少的要素。
其中,在一个实施例中,所述装置还包括:
应答信息接收模块906,用于接收所述用户针对所述会话内容输入的应答信息;
应答信息解析模块907,用于根据所述自然语言解析模型解析所述应答信息,根据解析结果确定是否包含缺少的要素;
第一响应模块908,用于若包含所有缺少的要素,则根据所述用户对应的提供者预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作响应所述用户;
第二响应模块909,用于若包含部分缺少的要素或者不包含缺少的要素,则触发应答模块903执行向所述用户发送预置的会话内容的步骤。
其中,在一个实施例中,所述装置还包括:
计算模块910,用于计算通过会话内容与所述用户进行会话的会话次数是否达到预置最高会话次数;
会话结束模块911,用于若达到预置最高会话次数,则将预置的用于结束会话的会话结束内容发送给所述用户,并结束会话。
在介绍了本发明示例性实施方式的方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的自然语言处理装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的自然语言处理装置可以包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的自然语言处理方法中的各种步骤。例如,所述处理单元可以执行如图4中所示的步骤401,获取针对指定业务的自然语言语料;步骤402,接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
和/或,所述处理单元可以执行如图6中所示的步骤601,接收指定业务的至少一个提供者的用户输入的待处理自然语言;步骤602,分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;步骤603,根据得到的全局语义意图,应答所述用户。
下面参照图10来描述根据本发明的这种实施方式的自然语言处理装置100。图10显示的自然语言处理装置仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,自然语言处理装置10可以以通用计算设备的形式表现,例如其可以为服务器设备。自然语言处理装置100的组件可以包括但不限于:上述至少一个处理单元101、上述至少一个存储单元102、连接不同系统组件(包括存储单元102和处理单元101)的总线103。
总线103表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元102可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1021和/或高速缓存存储器1022,还可以进一步包括只读存储器(ROM)1023。
存储单元102还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025,这样的程序模块1024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
自然语言处理装置100也可以与一个或多个外部设备104(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与该自然语言处理装置100交互的设备通信,和/或与使得该自然语言处理装置100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口105进行。并且,自然语言处理装置100还可以通过网络适配器106与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器106通过总线103与自然语言处理装置100的其它模块通信。应当明白,尽管图中未示出,可以结合自然语言处理装置100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
示例性程序产品
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在服务器设备上运行时,所述程序代码用于使所述服务器设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的方法中的步骤,例如,所述服务器设备可以执行如图4中所示的步骤401,获取针对指定业务的自然语言语料;步骤402,接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签。
和/或,所述服务器设备可以执行如图6中所示的步骤601,接收指定业务的至少一个提供者的用户输入的待处理自然语言;步骤602,分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;步骤603,根据得到的全局语义意图,应答所述用户。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图11所示,描述了根据本发明的实施方式的用于自然语言处理的程序产品110,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在服务器设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (36)

1.一种自然语言处理方法,包括:
获取针对指定业务的自然语言语料;
接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签;其中,相同业务的不同提供者共享所添加的标签;
其中针对所述自然语言语料所添加的标签包括:用于表示所述自然语言语料的全局语义意图的全局标签;以及,针对所述自然语言语料的局部关键信息所添加的关键标签,其中,所述关键标签对应于针对所述全局语义意图做出响应时不可缺少的要素,
其中,相同业务的不同提供者共享所添加的标签包括:利用所述指定业务的第一提供者针对所述自然语言语料所添加的标签,解析所述指定业务的第二提供者的用户输入的待处理自然语言。
2.根据权利要求1所述的方法,每个全局语义意图对应一个要素集合,若所述自然语言语料缺少其对应的全局语义意图的要素集合中的要素,所述方法还包括:
接收用于添加针对所述自然语言语料的会话内容的添加请求,其中,所述会话内容用于请求用户输入缺少的要素;
输出用于输入会话内容的操作界面;
接收所述第一提供者通过所述操作界面输入的会话内容。
3.根据权利要求2所述的方法,所述方法还包括:
接收通过所述会话内容与同一用户进行会话的最高会话次数的配置请求;
根据所述配置请求配置最高会话次数。
4.根据权利要求3所述的方法,所述方法还包括:
接收在会话次数达到最高会话次数时、针对所述全局语义意图的用于结束会话的会话结束内容的配置请求;
根据所述配置请求,配置结束会话时的会话结束内容。
5.根据权利要求1-4中任一所述的方法,所述方法还包括:
根据已添加标签的自然语言语料、已添加标签的自然语言语料的全局标签和关键标签,通过机器学习方法训练自然语言解析模型,该自然语言解析模型用于分析输入给所述自然语言解析模型的待处理自然语言的全局语义意图并解析该待处理自然语言中包含的要素,其中,所述待处理自然语言为所述第一提供者的用户和/或所述指定业务的第二提供者的用户输入的自然语言。
6.根据权利要求1所述的方法,所述方法还包括:
通过初始自然语言解析模型解析所述自然语言语料中的局部关键信息及对应的关键标签并输出;
确定接收到对选定的局部关键信息及对应的关键标签的修改指令。
7.根据权利要求2所述的方法,所述方法还包括:通过初始自然语言解析模型分析所述待处理自然语言语料对应的全局语义意图以及所述自然语言语料包含的要素,根据所述全局语义意图对应的要素集合,确定所述自然语言语料是否缺少要素;
所述方法还包括:在缺少要素时,发出所述自然语言语料缺少要素的提示。
8.根据权利要求7所述的方法,所述方法还包括:
接收第一提供者对所述自然语言语料的第一部分的选定操作,并将选定的所述自然语言语料的第一部分与缺少的要素建立对应关系。
9.根据权利要求1所述的方法,获取针对指定业务的自然语言语料,具体包括:
接收所述第一提供者输入的自然语言语料;和/或,
接收所述第一提供者的客服系统反馈的由所述指定业务的用户输入的自然语言语料。
10.根据权利要求1所述的方法,所述方法还包括:
接收配置所述自然语言语料的全局语义意图对应的响应操作的配置指令;
根据所述配置指令中携带的响应操作进行相应配置。
11.根据权利要求1所述的方法,所述标签为所述第一提供者从内置标签集合中选择的标签或者所述第一提供者输入的自定义标签。
12.根据权利要求11所述的方法,所述方法还包括:
使用机器学习的方法,将所述指定业务的多个提供者输入的自定义标签进行归类。
13.一种自然语言处理方法,包括:
接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
根据得到的全局语义意图,应答所述用户;
所述提供者为第二提供者,分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,具体包括:
根据预置的自然语言解析模型分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,其中,所述自然语言解析模型为根据所述指定业务的第一提供者标注的自然语言语料得到的,相同业务的不同提供者共享为自然语言语料所添加的标签。
14.根据权利要求13所述的方法,所述方法还包括:
根据所述自然语言解析模型分析所述待处理自然语言,得到所述待处理自然语言的全局语义意图的要素集合;
根据所述自然语言解析模型解析所述待处理自然语言中包括的所述要素集合中的要素;
根据得到的全局语义意图,应答所述用户,具体包括:
若确定所述待处理自然语言中缺少所述要素集合中的要素,则向所述用户发送预置的会话内容,所述会话内容用于请求所述用户输入缺少的要素。
15.根据权利要求14所述的方法,所述方法还包括:
接收所述用户针对所述会话内容输入的应答信息;
根据所述自然语言解析模型解析所述应答信息,根据解析结果确定是否包含缺少的要素;
若包含所有缺少的要素,则根据所述用户对应的提供者预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作响应所述用户;
若包含部分缺少的要素或者不包含缺少的要素,则返回执行向所述用户发送预置的会话内容的步骤。
16.根据权利要求14或15所述的方法,所述方法还包括:
计算通过会话内容与所述用户进行会话的会话次数是否达到预置最高会话次数;
若是,则将预置的用于结束会话的会话结束内容发送给所述用户,并结束会话。
17.一种自然语言处理装置,包括:
语料获取模块,用于获取针对指定业务的自然语言语料;
标签接收模块,用于接收所述指定业务的第一提供者针对所述自然语言语料所添加的标签;其中,相同业务的不同提供者共享所添加的标签;
其中针对所述自然语言语料所添加的标签包括:用于表示所述自然语言语料的全局语义意图的全局标签;以及,针对所述自然语言语料的局部关键信息所添加的关键标签,其中,所述关键标签对应于针对所述全局语义意图做出响应时不可缺少的要素,
其中,相同业务的不同提供者共享所添加的标签包括:利用所述指定业务的第一提供者针对所述自然语言语料所添加的标签,解析所述指定业务的第二提供者的用户输入的待处理自然语言。
18.根据权利要求17所述的装置,每个全局语义意图对应一个要素集合,若所述自然语言语料缺少其对应的全局语义意图的要素集合中的要素,所述装置还包括:
添加请求接收模块,用于接收用于添加针对所述自然语言语料的会话内容的添加请求,其中,所述会话内容用于请求用户输入缺少的要素;
操作界面输入模块,用于输出用于输入会话内容的操作界面;
会话内容接收模块,用于接收所述第一提供者通过所述操作界面输入的会话内容。
19.根据权利要求18所述的装置,所述装置还包括:
第一配置请求接收模块,用于接收通过所述会话内容与同一用户进行会话的最高会话次数的配置请求;
会话次数配置模块,用于根据所述配置请求配置最高会话次数。
20.根据权利要求19所述的装置,所述装置还包括:
第二配置请求接收模块,用于接收在会话次数达到最高会话次数时、针对所述全局语义意图的用于结束会话的会话结束内容的配置请求;
会话结束内容配置模块,用于根据所述配置请求,配置结束会话时的会话结束内容。
21.根据权利要求17-20中任一所述的装置,所述装置还包括:
模型训练模块,用于根据已添加标签的自然语言语料、已添加标签的自然语言语料的全局标签和关键标签,通过机器学习方法训练自然语言解析模型,该自然语言解析模型用于分析输入给所述自然语言解析模型的待处理自然语言的全局语义意图并解析该待处理自然语言中包含的要素,其中,所述待处理自然语言为所述第一提供者的用户和/或所述指定业务的第二提供者的用户输入的自然语言。
22.根据权利要求17所述的装置,所述装置还包括:
输出模块,用于通过初始自然语言解析模型解析所述自然语言语料中的局部关键信息及对应的关键标签并输出;
修改指令接收模块,用于确定接收到对选定的局部关键信息及对应的关键标签的修改指令。
23.根据权利要求17所述的装置,所述装置还包括:
要素检测模块,用于通过初始自然语言解析模型分析所述待处理自然语言语料对应的全局语义意图以及所述自然语言语料包含的要素,根据所述全局语义意图对应的要素集合,确定所述自然语言语料是否缺少要素;
缺少要素提示模块,用于在缺少要素时,发出所述自然语言语料缺少要素的提示。
24.根据权利要求22所述的装置,所述装置还包括:
对应关系修改模块,用于接收第一提供者对所述自然语言语料的第一部分的选定操作,并将选定的所述自然语言语料的第一部分与缺少的要素建立对应关系。
25.根据权利要求17所述的装置,语料获取模块,具体包括:
第一语料获取单元,用于接收所述第一提供者输入的自然语言语料;和/或,
第二语料获取单元,用于接收所述第一提供者的客服系统反馈的由所述指定业务的用户输入的自然语言语料。
26.根据权利要求17所述的装置,所述装置还包括:
响应操作配置指令接收模块,用于接收配置所述自然语言语料的全局语义意图对应的响应操作的配置指令;
响应操作配置模块,用于根据所述配置指令中携带的响应操作进行相应配置。
27.根据权利要求17所述的装置,所述标签为所述第一提供者从内置标签集合中选择的标签或者所述第一提供者输入的自定义标签。
28.根据权利要求27所述的装置,所述装置还包括:
分类模块,用于使用机器学习的方法,将所述指定业务的多个提供者输入的自定义标签进行归类。
29.一种自然语言处理装置,包括:
待处理自然语言接收模块,用于接收指定业务的至少一个提供者的用户输入的待处理自然语言;
分析模块,用于分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图;
应答模块,用于根据得到的全局语义意图,应答所述用户;
所述提供者为第二提供者,分析模块具体用于:
根据预置的自然语言解析模型分析所述待处理自然语言,得到与所述待处理自然语言匹配的全局语义意图,其中,所述自然语言解析模型为根据所述指定业务的第一提供者标注的自然语言语料得到的。
30.根据权利要求29所述的装置,所述装置还包括:
要素集合确定模块,用于根据所述自然语言解析模型分析所述待处理自然语言,得到所述待处理自然语言的全局语义意图的要素集合;
自然语言要素检测模块,用于根据所述自然语言解析模型解析所述待处理自然语言中包括的所述要素集合中的要素;
应答模块,具体用于:
若确定所述待处理自然语言中缺少所述要素集合中的要素,则向所述用户发送预置的会话内容,所述会话内容用于请求所述用户输入缺少的要素。
31.根据权利要求30所述的装置,所述装置还包括:
应答信息接收模块,用于接收所述用户针对所述会话内容输入的应答信息;
应答信息解析模块,用于根据所述自然语言解析模型解析所述应答信息,根据解析结果确定是否包含缺少的要素;
第一响应模块,用于若包含所有缺少的要素,则根据所述用户对应的提供者预先配置的针对所述待处理自然语言的全局语义意图对应的响应操作响应所述用户;
第二响应模块,用于若包含部分缺少的要素或者不包含缺少的要素,则触发应答模块执行向所述用户发送预置的会话内容的步骤。
32.根据权利要求30或31所述的装置,所述装置还包括:
计算模块,用于计算通过会话内容与所述用户进行会话的会话次数是否达到预置最高会话次数;
会话结束模块,用于若达到预置最高会话次数,则将预置的用于结束会话的会话结束内容发送给所述用户,并结束会话。
33.一种自然语言处理装置,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行权利要求1-12任一所述方法的步骤。
34.一种计算机可读存储介质,其包括程序代码,当所述程序代码在服务器设备上运行时,所述程序代码用于使所述服务器设备执行权利要求1-13任一所述方法的步骤。
35.一种自然语言处理装置,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行权利要求13-16任一所述方法的步骤。
36.一种计算机可读存储介质,其包括程序代码,当所述程序代码在服务器设备上运行时,所述程序代码用于使所述服务器设备执行权利要求13-16任一所述方法的步骤。
CN201610976540.2A 2016-11-07 2016-11-07 自然语言处理方法和装置 Active CN106570002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610976540.2A CN106570002B (zh) 2016-11-07 2016-11-07 自然语言处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610976540.2A CN106570002B (zh) 2016-11-07 2016-11-07 自然语言处理方法和装置

Publications (2)

Publication Number Publication Date
CN106570002A CN106570002A (zh) 2017-04-19
CN106570002B true CN106570002B (zh) 2021-09-14

Family

ID=58541616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610976540.2A Active CN106570002B (zh) 2016-11-07 2016-11-07 自然语言处理方法和装置

Country Status (1)

Country Link
CN (1) CN106570002B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110798506B (zh) * 2019-09-27 2023-03-10 华为技术有限公司 执行命令的方法、装置及设备
CN112906401A (zh) * 2021-03-29 2021-06-04 山东浪潮通软信息科技有限公司 一种多语数据录入与存储的方法、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702944A (zh) * 2007-03-15 2010-05-05 发明机器公司 用于识别自然语言文件中的整体-部分关系的语义处理器
CN101872349A (zh) * 2009-04-23 2010-10-27 国际商业机器公司 处理自然语言问题的方法和装置
CN102662923A (zh) * 2012-04-23 2012-09-12 天津大学 一种基于机器学习的本体实例学习方法
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105808200A (zh) * 2010-01-18 2016-07-27 苹果公司 智能自动化助理
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9037529B2 (en) * 2011-06-15 2015-05-19 Ceresis, Llc Method for generating visual mapping of knowledge information from parsing of text inputs for subjects and predicates
CN103473297A (zh) * 2013-09-05 2013-12-25 北京邮电大学 一种基于智能移动终端的多媒体问答系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702944A (zh) * 2007-03-15 2010-05-05 发明机器公司 用于识别自然语言文件中的整体-部分关系的语义处理器
CN101872349A (zh) * 2009-04-23 2010-10-27 国际商业机器公司 处理自然语言问题的方法和装置
CN105808200A (zh) * 2010-01-18 2016-07-27 苹果公司 智能自动化助理
CN102662923A (zh) * 2012-04-23 2012-09-12 天津大学 一种基于机器学习的本体实例学习方法
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法

Also Published As

Publication number Publication date
CN106570002A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
US11249730B2 (en) System and method for converting actions based on determined personas
US10725827B2 (en) Artificial intelligence based virtual automated assistance
US10635392B2 (en) Method and system for providing interface controls based on voice commands
US8352908B2 (en) Multi-modal conversion tool for form-type applications
US20170337261A1 (en) Decision Making and Planning/Prediction System for Human Intention Resolution
EP3513324B1 (en) Computerized natural language query intent dispatching
US10360906B2 (en) Computer proxy messaging bot
CN115485690A (zh) 用于处置聊天机器人的不平衡训练数据的分批技术
WO2017218271A1 (en) Computer messaging bot creation
CN110088751B (zh) 与交互式对话服务界面整合的搜索结果
US20190065624A1 (en) Method and device for obtaining answer, and computer device
JP7293643B2 (ja) 構造化文書の内容をチャットベースのインタラクションに翻訳するための半自動化された方法及びシステム、プログラム
US8768930B2 (en) Product classification in procurement systems
US10706085B2 (en) Method and system for exposing virtual assistant services across multiple platforms
CN106570002B (zh) 自然语言处理方法和装置
CN109344374B (zh) 基于大数据的报表生成方法及装置、电子设备、存储介质
CN115905490B (zh) 人机交互对话方法、装置以及设备
CN110309450A (zh) 一种用户行为引导的方法和装置
CN113032586B (zh) 对文本中的时间信息进行提取的方法、装置及电子设备
US20230004435A1 (en) Self-service platform integration
CN113419711A (zh) 页面引导方法、装置、电子设备及存储介质
CN116701564A (zh) 文本输入方法、装置、存储介质和电子设备
Ouyang et al. AIGC Empowering Telecom Sector White Paper
CN114912464A (zh) 机器人的控制方法、装置、电子设备及存储介质
CN116795960A (zh) 一种用于政务动态更新的多轮对话方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant