CN111401034A - 文本的语义分析方法、语义分析装置及终端 - Google Patents

文本的语义分析方法、语义分析装置及终端 Download PDF

Info

Publication number
CN111401034A
CN111401034A CN201811622833.6A CN201811622833A CN111401034A CN 111401034 A CN111401034 A CN 111401034A CN 201811622833 A CN201811622833 A CN 201811622833A CN 111401034 A CN111401034 A CN 111401034A
Authority
CN
China
Prior art keywords
field
target text
intention
word
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811622833.6A
Other languages
English (en)
Other versions
CN111401034B (zh
Inventor
熊友军
廖洪涛
庄思捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubtech Robotics Corp
Original Assignee
Ubtech Robotics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubtech Robotics Corp filed Critical Ubtech Robotics Corp
Priority to CN201811622833.6A priority Critical patent/CN111401034B/zh
Publication of CN111401034A publication Critical patent/CN111401034A/zh
Application granted granted Critical
Publication of CN111401034B publication Critical patent/CN111401034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明适用于自然语言处理技术领域,提供了一种文本的语义分析方法、语义分析装置及终端。其中,所述语义分析方法包括:获取目标文本的候选领域;从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。本发明可以获得自然语言文本对应的意图领域和意图实体,能够实现计算机对自然语言文本的语义理解。

Description

文本的语义分析方法、语义分析装置及终端
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种文本的语义分析方法、语义分析装置、终端及计算机可读存储介质。
背景技术
自然语言处理(Natural Language Processing,NLP)是计算机与人工智能领域中的一个重要的研究方向。
随着人工智能的发展,自然语言处理已经成为一种应用赋能技术,鉴于自然语言本身具有复杂性的特点,因此自然语言处理的实现也十分复杂,面对不规则的自然语言输入,计算机如何理解其语义成了问题。
发明内容
有鉴于此,本发明提供了一种文本的语义分析方法、语义分析装置、终端及计算机可读存储介质,以解决现有技术中计算机难以分析和理解自然语言输入的语义的问题。
本发明实施例的第一方面提供了一种文本的语义分析方法,所述语义分析方法包括:
获取目标文本的候选领域;
从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
本发明实施例的第二方面提供了一种文本的语义分析装置,所述语义分析装置包括:
候选领域获取单元,用于获取目标文本的候选领域;
依存句法分析单元,用于从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
意图领域选取单元,用于基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
语义输出单元,用于从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
本发明实施例的第三方面提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如任一项所述文本的语义分析方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如任一项所述文本的语义分析方法的步骤。
本发明与现有技术相比存在的有益效果是:
本发明通过获取目标文本的候选领域,从预设的领域字典中选取与该候选领域对应的领域字典,并利用选取的领域字典对目标文本进行领域内的依存句法分析,通过领域内的依存句法分析可以明确目标文本的各词汇之间的依存关系,找到关键的词汇来确定目标文本的意图领域;进而从该意图领域内的依存句法分析结果中进行实体词槽的抽取,来得到用于表示目标文本的目的意图的实体词汇,计算机可以基于目标文本的实体词槽和意图领域快速确定目标文本的语义。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的文本的语义分析方法的实现流程图;
图2是本发明实施例提供的图1所示实施例中步骤101的实现流程图;
图3是本发明实施例提供的文本的语义分析装置的结构示意图;
图4是本发明实施例提供的终端的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
参见图1,其示出了本发明实施例提供的文本的语义分析方法的实现流程图,详述如下:
在步骤101中、获取目标文本的候选领域。
在本发明实施例中,目标文本可以表示用户输入的自然语言文本,例如用户输入的一个提问对应的文本;或者,目标文本还可以是对用户的语音进行音频转文字处理后得到的文本。
在本发明实施例中,候选领域可以表示目标文本的可能的意图领域,在一种实现方式中,目标文本的候选领域可以根据预设的规则来确定,该规则可以与目标文本的来源相关,对于不同的终端用户发送的语义分析请求,可以预先对不同的终端用户指定不同的候选领域,比如,终端用户A为音频类应用,为其指定的候选领域可以包括音乐领域、故事领域等。
在本发明实施例中,意图领域是指目标文本的意图词对应的领域,示例性的,目标文本为“我要听歌”,其对应的意图领域为音乐领域;目标文本为“我要听故事”,其对应的意图领域为故事领域。
可选的,如图2所示,本发明实施例提供的图1所示实施例中步骤101的实现流程图可以包括:
步骤1011、获取所述目标文本的核心词。
在本发明实施例中,核心词是指文本的核心词汇或者根词汇,也即文本的其它词汇均直接或间接的依存于该词汇。核心词通常可以是谓语,例如,目标文本为“我要听歌”,其中,“听”为核心词,“我”、“要”、“歌”均直接或间接的依存于“听”。
步骤1012、判断所述核心词是否为意图词。
在本发明实施例中,意图词是指对应意图领域的词汇,意图词可以预先进行配置,例如可以配置词汇“听”为意图词,其对应的意图领域可以包括音乐领域、故事领域等。
在一种实现方式中,可以建立意图词词库,通过将核心词与意图词词库进行匹配,判断其是否为意图词。
步骤1013、若所述核心词为意图词,则将与该意图词对应的领域作为所述候选领域。
步骤1014、若所述核心词不为意图词,则将预设的与所述目标文本的身份属性对应的领域作为所述候选领域。
在本发明实施例中,若判定目标文本的核心词为意图词,则可以将预先配置的与该意图词对应的领域作为目标文本的候选领域;若判定目标文本的核心词不为意图词,则可以将预设的与目标文本的身份属性对应的领域作为候选领域,例如,目标文本为“我要唱歌”,其身份属性为终端用户A(也即该目标文本来源于终端用户A),其中,核心词为“唱”,而“唱”不是预先配置的意图词,那么,可以将预先为终端用户A配置的领域作为该目标文本的候选领域。
在一种实现方式中,若目标文本的核心词为意图词,该意图词对应一个领域集合M,目标文本的身份属性对应另一个领域集合N;那么,如果M为N的子集,则确定M为候选领域;如果M包括的某个领域未被N包括,那可以将M与N进行合并,作为目标文本的候选领域。
可选的,上述步骤1011可以包括:
对目标文本进行词性标注;
根据词性标注的结果进行依存句法分析,得到与所述目标文本对应的文本依存树,其中,所述文本依存树的树根为所述目标文本的核心词。
词性(Part-of-speech)是词汇基本的语法属性,通常也称为词类。词性标注就是在给定句子中判定每个词的语法范畴,确定其词性并加以标注的过程。具体可以通过基于统计模型的词性标注方法实现词性标注。
在本发明实施例中,根据目标文本的词性标注结果,可以进行依存句法分析,通过依存句法分析指出目标文本中各词汇之间在句法上的搭配关系,从而得到与所述目标文本对应的文本依存树,其中,所述文本依存树的树根即为目标文本的核心词。
在步骤102中、从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
在本发明实施例中,可以根据候选领域选取与其对应的领域字典,利用领域字典对目标文本进行领域内的依存句法分析。
示例性的,目标文本的候选领域包括音乐领域和故事领域,则加载音乐领域的领域字典对目标文本进行音乐领域的依存句法分析、以及加载故事领域的领域字典对目标文本进行音乐领域的依存句法分析。
在本发明实施例中,候选领域对应的领域字典可以包括对目标文本进行词性标注的规则、以及进行依存句法分析的规则,通过为不同领域建立不同的词性标注规则和依存句法分析规则,可以提高词性标注和依存句法分析的准确性。
在步骤103中、基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
在本发明实施例中,目标文本在各候选领域内的依存句法分析结果为一颗句法依存树,根据句法依存规则可以找到其中用于指示目标文本的意图领域的词汇,根据该词汇可以确定目标文本的意图领域。
可选的,上述步骤103可以包括:
步骤1031、基于所述目标文本的领域内的依存句法分析结果进行领域判断词的查找。
在本发明实施例中,领域判断词可以为在句法分析结果中依存或间接依存于核心词的动宾关系的词或者定中关系的词。
步骤1032、若查找到所述领域判断词,则将与所述领域判断词匹配的候选领域作为所述目标文本的意图领域。
在本发明实施例中,可以将与句法分析结果中的领域判断词匹配的候选领域作为目标文本的意图领域,从而实现了目标文本的意图领域的确定。
在步骤104中、从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
在本发明实施例中,在确定目标文本的意图领域之后,可以根据目标文本在其意图领域的依存句法分析结果抽取实体词槽。在这里,词槽表示一个意图领域下的查询条件,例如天气意图里的时间和地点,订票意图里的日期和终点等;实体词槽表示具体的查询结果,例如天气意图里的12月25日、城市A。
在本发明实施例中,通过实体词槽的抽取,可以得到目标文本在其意图领域具体对应的意图实体,该意图实体可以包括关系属性、情感属性等等,也即表示了目标文本的具体的语义指向。
在本发明实施例中,意图领域的标识用于指示该意图领域,可以为该意图领域的名称,可以为预先指定的该意图领域的唯一性标识号,以方便计算机定位该意图领域的资源位置,根据该意图领域和抽取的实体词槽,计算机可以直观的理解目标文本的语义,确定目标文本的意图。
在一个可选实施例中,上述步骤1011之后还可以包括:
若所述核心词为意图词,则将与该意图词对应的领域作为所述候选领域。并将选取的候选领域标记为第一候选领域;
若所述核心词不为意图词,则将预设的与所述目标文本的身份属性对应的领域作为所述候选领域,并将选取的候选领域标记为第二候选领域。
在本发明实施例中,通过对根据不同规则选取的候选领域进行标记,可以分别对其进行不同的后续处理。
可选的,在上述步骤1031之后还可以包括:
若未查找到所述领域判断词,则从所述目标文本在所述第一候选领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述第一候选领域的标识作为所述目标文本的第二语义分析结果进行输出。
在本发明实施例中,由于未查找到领域判断词,故目标文本的意图领域未确定,此时可以将第一候选领域对应的标识,以及目标文本在第一候选领域的依存句法分析结果中抽取的实体词槽作为第二语义分析结果,该第二语义分析结果可以作为次选的语义分析结果进行输出。也即在无法确认目标文本的意图领域的情形下,可以根据第一候选领域进行依存句法分析和实体词槽抽取,并得到语义分析结果。
由上可知,本发明通过获取目标文本的候选领域,从预设的领域字典中选取与该候选领域对应的领域字典,并利用选取的领域字典对目标文本进行领域内的依存句法分析,通过领域内的依存句法分析可以明确目标文本的各词汇之间的依存关系,找到关键的词汇来确定目标文本的意图领域;进而从该意图领域内的依存句法分析结果中进行实体词槽的抽取,来得到用于表示目标文本的目的意图的实体词汇,计算机可以基于目标文本的实体词槽和意图领域快速确定目标文本的语义。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图3示出了本发明实施例提供的文本的语义分析装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
如图3所示,文本的语义分析装置3包括:候选领域获取单元31,依存句法分析单元32,意图领域选取单元33和语义输出单元34。
候选领域获取单元31,用于获取目标文本的候选领域;
依存句法分析单元32,用于从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
意图领域选取单元33,用于基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
语义输出单元34,用于从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
可选的,文本的语义分析装置还包括:
领域判断词查找单元,用于基于所述目标文本的领域内的依存句法分析结果进行领域判断词的查找;
意图领域选取单元33具体用于,若查找到所述领域判断词,则将与所述领域判断词匹配的候选领域作为所述目标文本的意图领域。
可选的,文本的语义分析装置3还包括:
核心词获取单元,用于获取所述目标文本的核心词;
意图词判断单元,用于判断所述核心词是否为意图词;
候选领域获取单元31具体用于,若所述核心词为意图词,则将与该意图词对应的领域作为所述候选领域,以及,若所述核心词不为意图词,则将预设的与所述目标文本的身份属性对应的领域作为所述候选领域。
可选的,文本的语义分析装置3还包括:
词性标注单元,用于对目标文本进行词性标注;
核心词获取单元具体用于,根据词性标注的结果进行依存句法分析,得到与所述目标文本对应的文本依存树,其中,所述文本依存树的树根为所述目标文本的核心词。
可选的,文本的语义分析装置3还包括:
领域标记单元,用于若所述核心词为意图词,则将选取的候选领域标记为第一候选领域;以及,若所述核心词不为意图词,则将选取的候选领域标记为第二候选领域。
可选的,语义输出单元34还用于,若未查找到所述领域判断词,则从所述目标文本在所述第一候选领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述第一候选领域的标识作为所述目标文本的第二语义分析结果进行输出。
由上可知,本发明通过获取目标文本的候选领域,从预设的领域字典中选取与该候选领域对应的领域字典,并利用选取的领域字典对目标文本进行领域内的依存句法分析,通过领域内的依存句法分析可以明确目标文本的各词汇之间的依存关系,找到关键的词汇来确定目标文本的意图领域;进而从该意图领域内的依存句法分析结果中进行实体词槽的抽取,来得到用于表示目标文本的目的意图的实体词汇,计算机可以基于目标文本的实体词槽和意图领域快速确定目标文本的语义。
图4是本发明一实施例提供的终端的示意图。如图4所示,该实施例的终端4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个文本的语义分析方法实施例中的步骤,例如图1所示的步骤101至步骤103。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图3所示单元31至33的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端4中的执行过程。例如,所述计算机程序42可以被分割成候选领域获取单元,依存句法分析单元,意图领域选取单元和语义输出单元,各单元具体功能如下:
候选领域获取单元,用于获取目标文本的候选领域;
依存句法分析单元,用于从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
意图领域选取单元,用于基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
语义输出单元,用于从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
所述终端4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端4的示例,并不构成对终端4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端4的内部存储单元,例如终端4的硬盘或内存。所述存储器41也可以是所述终端4的外部存储设备,例如所述终端4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文本的语义分析方法,其特征在于,所述语义分析方法包括:
获取目标文本的候选领域;
从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
2.根据权利要求1所述的文本的语义分析方法,其特征在于,所述基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域包括:
基于所述目标文本的领域内的依存句法分析结果进行领域判断词的查找;
若查找到所述领域判断词,则将与所述领域判断词匹配的候选领域作为所述目标文本的意图领域。
3.根据权利要求2所述的文本的语义分析方法,其特征在于,所述获取目标文本的候选领域包括:
获取所述目标文本的核心词;
判断所述核心词是否为意图词;
若所述核心词为意图词,则将与该意图词对应的领域作为所述候选领域;
若所述核心词不为意图词,则将预设的与所述目标文本的身份属性对应的领域作为所述候选领域。
4.根据权利要求3所述的文本的语义分析方法,其特征在于,所述获取所述目标文本的核心词包括:
对目标文本进行词性标注;
根据词性标注的结果进行依存句法分析,得到与所述目标文本对应的文本依存树,其中,所述文本依存树的树根为所述目标文本的核心词。
5.根据权利要求3所述的文本的语义分析方法,其特征在于,所述语义分析方法还包括:
若所述核心词为意图词,则将选取的候选领域标记为第一候选领域;
若所述核心词不为意图词,则将选取的候选领域标记为第二候选领域。
6.根据权利要求5所述的文本的语义分析方法,其特征在于,在所述基于所述目标文本的领域内的依存句法分析结果进行领域判断词的查找之后还包括:
若未查找到所述领域判断词,则从所述目标文本在所述第一候选领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述第一候选领域的标识作为所述目标文本的第二语义分析结果进行输出。
7.一种文本的语义分析装置,其特征在于,所述语义分析装置包括:
候选领域获取单元,用于获取目标文本的候选领域;
依存句法分析单元,用于从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;
意图领域选取单元,用于基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;
语义输出单元,用于从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。
8.根据权利要求7所述的文本的语义分析装置,其特征在于,所述语义分析装置还包括:
领域判断词查找单元,用于基于所述目标文本的领域内的依存句法分析结果进行领域判断词的查找;
所述意图领域选取单元具体用于,若查找到所述领域判断词,则将与所述领域判断词匹配的候选领域作为所述目标文本的意图领域。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至6中任一项所述文本的语义分析方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至6中任一项所述文本的语义分析方法的步骤。
CN201811622833.6A 2018-12-28 2018-12-28 文本的语义分析方法、语义分析装置及终端 Active CN111401034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811622833.6A CN111401034B (zh) 2018-12-28 2018-12-28 文本的语义分析方法、语义分析装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811622833.6A CN111401034B (zh) 2018-12-28 2018-12-28 文本的语义分析方法、语义分析装置及终端

Publications (2)

Publication Number Publication Date
CN111401034A true CN111401034A (zh) 2020-07-10
CN111401034B CN111401034B (zh) 2023-10-10

Family

ID=71430105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811622833.6A Active CN111401034B (zh) 2018-12-28 2018-12-28 文本的语义分析方法、语义分析装置及终端

Country Status (1)

Country Link
CN (1) CN111401034B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084770A (zh) * 2020-09-14 2020-12-15 深圳前海微众银行股份有限公司 词槽填充方法、设备及可读存储介质
CN112579444A (zh) * 2020-12-10 2021-03-30 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN114444469A (zh) * 2022-01-11 2022-05-06 国家电网有限公司客户服务中心 基于95598客户服务数据资源的处理装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302796A (zh) * 2015-11-23 2016-02-03 浪潮软件股份有限公司 一种基于依存树的语义分析方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
US20180018589A1 (en) * 2016-07-12 2018-01-18 International Business Machines Corporation Generating training data for machine learning
CN108287858A (zh) * 2017-03-02 2018-07-17 腾讯科技(深圳)有限公司 自然语言的语义提取方法及装置
CN108549662A (zh) * 2018-03-16 2018-09-18 北京云知声信息技术有限公司 多轮会话中语义解析结果的补充消解方法及装置
US20180373692A1 (en) * 2017-06-21 2018-12-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for parsing query based on artificial intelligence and computer device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302796A (zh) * 2015-11-23 2016-02-03 浪潮软件股份有限公司 一种基于依存树的语义分析方法
US20180018589A1 (en) * 2016-07-12 2018-01-18 International Business Machines Corporation Generating training data for machine learning
CN108287858A (zh) * 2017-03-02 2018-07-17 腾讯科技(深圳)有限公司 自然语言的语义提取方法及装置
US20180373692A1 (en) * 2017-06-21 2018-12-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for parsing query based on artificial intelligence and computer device
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN108549662A (zh) * 2018-03-16 2018-09-18 北京云知声信息技术有限公司 多轮会话中语义解析结果的补充消解方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084770A (zh) * 2020-09-14 2020-12-15 深圳前海微众银行股份有限公司 词槽填充方法、设备及可读存储介质
CN112579444A (zh) * 2020-12-10 2021-03-30 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN112579444B (zh) * 2020-12-10 2024-05-07 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN114444469A (zh) * 2022-01-11 2022-05-06 国家电网有限公司客户服务中心 基于95598客户服务数据资源的处理装置

Also Published As

Publication number Publication date
CN111401034B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
TWI636452B (zh) 語音識別方法及系統
CN110222045B (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
US9971967B2 (en) Generating a superset of question/answer action paths based on dynamically generated type sets
WO2019169858A1 (zh) 一种基于搜索引擎技术的数据分析方法及系统
CN111859968A (zh) 一种文本结构化方法、文本结构化装置及终端设备
CN111401034B (zh) 文本的语义分析方法、语义分析装置及终端
CN112883165B (zh) 一种基于语义理解的智能全文检索方法及系统
CN109582954A (zh) 用于输出信息的方法和装置
CN115795061B (zh) 一种基于词向量和依存句法的知识图谱构建方法及系统
CN116842951A (zh) 命名实体识别方法、装置、电子设备及存储介质
CN113590811A (zh) 文本摘要生成方法、装置、电子设备及存储介质
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN111126073B (zh) 语义检索方法和装置
CN115859999A (zh) 意图识别方法、装置、电子设备及存储介质
CN111401069A (zh) 会话文本的意图识别方法、意图识别装置及终端
CN110705285A (zh) 一种政务文本主题词库构建方法、装置、服务器及可读存储介质
CN112069267A (zh) 一种数据处理方法和装置
CN115757469A (zh) 用于文本到sql任务的数据生成方法、电子设备和存储介质
CN114842982A (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN115114420A (zh) 一种知识图谱问答方法、终端设备及存储介质
CN114021004A (zh) 一种理科相似题推荐方法、装置、设备及可读存储介质
CN111967248A (zh) 拼音识别方法、装置、终端设备及计算机可读存储介质
CN114417869A (zh) 实体识别方法、装置、电子设备及计算机可读存储介质
CN110688472A (zh) 一种自动筛选问题答案的方法、终端设备及存储介质
CN115437620B (zh) 一种自然语言编程方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant