CN111563385A - 语义处理方法、装置、电子设备和介质 - Google Patents

语义处理方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN111563385A
CN111563385A CN202010367760.1A CN202010367760A CN111563385A CN 111563385 A CN111563385 A CN 111563385A CN 202010367760 A CN202010367760 A CN 202010367760A CN 111563385 A CN111563385 A CN 111563385A
Authority
CN
China
Prior art keywords
semantic
rule
target
text
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010367760.1A
Other languages
English (en)
Other versions
CN111563385B (zh
Inventor
田孟
余淼
姜文斌
冯欣伟
周环宇
袁鹏程
宋勋超
吴学谦
时鸿剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010367760.1A priority Critical patent/CN111563385B/zh
Publication of CN111563385A publication Critical patent/CN111563385A/zh
Priority to EP21164545.2A priority patent/EP3832484A3/en
Priority to US17/212,511 priority patent/US20210209309A1/en
Priority to JP2021051248A priority patent/JP7386827B2/ja
Priority to KR1020210055591A priority patent/KR20210056961A/ko
Application granted granted Critical
Publication of CN111563385B publication Critical patent/CN111563385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了语义处理方法、装置、电子设备和介质,涉及知识图谱技术领域。具体实现方案为:确定与待解析文本匹配的目标语义元素规则,且采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果;采用与目标语义元素规则关联的目标结构化规则,根据语义元素解析结果生成语义树;基于语义树,对待解析文本进行语义理解。本申请实施例有效提高了对待解析文本中复杂问题的解析效率和准确度。

Description

语义处理方法、装置、电子设备和介质
技术领域
本申请涉及数据处理领域,具体涉及知识图谱技术领域,尤其涉及一种语义处理方法、装置、电子设备和介质。
背景技术
自然语言处理研究的是人与计算机之间用自然语言进行有效通信,正确理解自然语言的语义信息,使得人们可以用自己最习惯的语言来使用计算机,而无需再花大量的时间和精力去学习不很自然和习惯的各种计算机语言,从而也可通过自然语言处理技术进一步了解人类的语言能力和智能的机制。
但是,实现自然语言语义的准确理解是十分困难的,在对自然语言语义理解的过程中,存在自然语言语义解析准确度低的问题,极大的降低了处理效率。
发明内容
提供了一种用于语义处理的方法、装置、电子设备以及介质。
根据第一方面,提供了一种语义处理的方法,包括:
确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果;
采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树;
基于所述语义树,对所述待解析文本进行语义理解。
根据第二方面,提供了一种语义处理的装置,包括:
规则确定模块,用于确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果;
语义树生成模块,用于采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树;
语义理解模块,用于基于所述语义树,对所述待解析文本进行语义理解。
根据第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所提供的语义处理方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机本申请任意实施例所提供的语义处理方法。
根据本申请的技术提高了语义处理的准确度和效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的一种语义处理方法的流程示意图;
图2是根据本申请实施例提供的另一种语义处理方法的流程示意图;
图3是根据本申请实施例提供的一种目标结构化规则的树型结构示意图;
图4是根据本申请实施例提供的一种语义树的结构示意图;
图5是根据本申请实施例提供的另一种语义树的结构示意图;
图6根据本申请实施例提供的一种语义处理装置的结构示意图;
图7是用来实现本申请实施例的语义处理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请实施例提供的一种语义处理方法的流程示意图,本申请实施例可适用于根据构建的语音树,对待解析文本进行语义理解的情况。该方法可由一种语义处理装置来执行,该装置可采用硬件和/或软件的方式来实现,可配置于电子设备中。该方法具体包括如下:
S110、确定与待解析文本匹配的目标语义元素规则,且采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果。
在本申请实施例中,待解析文本是由用户进行在线搜索或者行业问答时输入的自然语言,可以通过语音或者文字等形式进行输入;语义元素规则是基于语义元素的语法制定的元素提取规则,可以预先生成也可以支持用户进行自定义。例如,可以基于语义元素的语法规则和用户的个性化需求,生成语义元素规则。语义元素规则可以存在多个,即存在多个候选语义元素规则,而与待解析文本匹配的候选语义元素规则即目标语义元素规则。
在确定与待解析文本匹配的目标语义元素规则过程中,若出现不存在与待解析文本匹配的目标语义元素规则,则可以提示用户语音输入语义元素规则中的关键词,由系统根据用户输入的关键词自动生成语义元素规则,并存储在规则数据库中,作为一个新的候选语义元素规则;或者,根据待解析文本,给用户推荐与待解析文本匹配度较大的候选语义元素规则,并让用户对该候选语义元素规则进行自适应修改,以得到一个新的候选语义元素规则;将确定出的新的候选语义元素规则存储在规则数据库中,并将该候选语义元素规则作为与该待解析文本匹配的目标语义元素规则;通过对语义元素规则的增添修改,以达到对规则数据库中语义元素规则的有效更新,提高规则数据库中语义元素规则的实用性。当然若不存在与待解析文本匹配的目标语义元素规则也可以拒绝响应用户,结束操作。
S120、采用与目标语义元素规则关联的目标结构化规则,根据语义元素解析结果生成语义树。
由于传统解析方式对自然语言进行解析时,仅是根据解析出的语义元素构建语义树,实现对自然语言的理解,传统的方式对于简单的问题能够得到较好的处理;但是,尤其是对于复杂问题,仅是根据语义元素简单构建出的语义树,难以正确解析该复杂问题,导致解析效率较低。
本申请实施例中是根据目标结构化规则,将待解析文本中的问题转换成树型结构,再将语义元素解析结果中的语义元素按照目标结构化规则填入到树型结构中,生成语义树,有效增强了语义树的通用性。
在规则数据库中,需要预先建立各个语义元素规则与结构化规则之间的关联性,以保证根据确定出的目标语义元素规则,能够快速准确的查找关联的目标结构化规则;其中,结构化规则可以预先生成,也可以支持用户根据需求进行自定义,可以实现结构化规则最大的适用度,从而有效提高构建的语义树的精准度。
S130、基于语义树,对待解析文本进行语义理解。
在本申请实施例中,语义树是基于目标结构化和语义元素生成的,能够对待解析文本中出现的复杂问题进行准确有效的理解,解决了仅根据语义元素解析复杂问题,导致解析效率和准确度较低的问题。能够实现在不同场景问答中,根据语义树生成答案查询语句,用于对待解析文本中的问题进行快速查询。
本实施例的技术方案,通过确定与待解析文本匹配的目标语义元素规则,采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果;并采用与目标语义元素规则关联的目标结构化规则,根据语义元素解析结果生成语义树,基于语义树,对待解析文本进行语义理解。本实施例根据目标结构化规则和语义元素生成语义树,有效提高对待解析文本中复杂问题的解析效率和准确度。
本申请实施例还提供了语义处理方法一个优选实施方式,能够根据语义元素的目标结构化规则,快捷简单的生成语义树。图2是根据本申请实施例提供的另一种语义处理方法的流程示意图。具体包括如下:
S210、确定与待解析文本匹配的目标语义元素规则,且采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果。
在本申请实施例中,需要从规则数据库中存储的所有候选语义元素规则中,确定与待解析文本匹配的目标语义元素规则;为了保证确定出的与待解析文本匹配的目标语义元素规则的准确性,可以通过预设的自定义规则,实现对目标语义元素规则的有效确定。
可选的,基于槽位字典,从候选语义元素规则中选择与待解析文本匹配的目标语义元素规则,且采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果。
在本申请实施例中,槽位字典能够提供候选词性的候选词语,可以由用户根据需求进行自定义添加;其中,槽位类型也可以根据用户需求添加,每个槽位中的内容也可以动态添加;例如,张三的老婆,采用槽位字典,确定张三的词性为subject(主语),将首个词语词性是subject的作为候选语义规则,其他的滤除,以此类推,得到匹配成功的目标语义元素规则。基于预先设置槽位字典,可以有效提高选择与待解析文本匹配的目标语义元素规则的准确度,从而提高从较为复杂的待解析文本中解析出的语义元素的有效性。
可选的,语义元素解析结果包括待解析文本中的至少一类别语义元素,以及该类别中元素顺序。对于较为复杂的待解析文本,解析出来的语义元素也许会有多个类别,通过对各个类别下的语义元素进行顺序排列,能够有效确定出待解析文本的语义结构,从而降低解析文本在解析过程中的复杂度。
S220、按照目标结构化规则中的类别标识和类别标识下的元素顺序标识,将语义元素解析结果中的语义元素添加到目标结构化规则中。
在本申请实施例中,目标结构化规则中的类别标识可以为subject、predicate和comp_words;其中,subject为待解析文本的主语;predicate为待解析文本的谓语;comp_words为待解析文本中的比较词。具体的,目标结构化规则中的类别标识不限于上述三种类别,并且支持用户扩展。类别标识下的元素顺序标识用于准确反映出该语义元素在待解析文本中的出现的顺序。
S230、根据包括语义元素的目标结构化规则,生成语义树。
在本申请实施例中,目标结构化规则中的语义元素的顺序与待解析文本中该语义元素出现的顺序是一致的;根据目标结构化规则中的类别标识和类别标识下的元素顺序标识,为待解析文本构建语义树,能够有效提高语义树的构建效率和适用性。
S240、基于语义树,对待解析文本进行语义理解。
可选的,S240包括:根据语义树中的语义规则函数和语义元素,对待解析文本进行语义理解。
在本申请实施例中,语义规则函数可以通过用户自定义得到,能够满足不同场景需求;例如,对于比较类问题,一般情况下,数值越大,排序越靠前,但是有的场景下数值越大,排序越靠后,例如PV(Page View,页面浏览量)排名数值越大,排名则越靠后。根据采用预置的语义规则函数,结合语义函数,对解析文本进行语义理解,能够快速准确的识别出待解析文本中的语义内容,从而可以根据识别结果生成搜索结果或者答案语句,并将搜索结果或答案语句反馈至用户。
可选的,语义树中非叶子节点为预设的语义规则函数,叶子节点为语义规则函数的参数,且非叶子节点的子节点为其他非叶子节点或叶子节点。
在本申请实施例中,非叶子节点代表的语义规则函数可以进行自定义设置;且语义规则函数是具有嵌套功能的,因此,针对复杂的任意待解析文本,本实施例中的语义树能够实现快速精准的解析。
可选的,还包括:根据用户交互信息,生成用户自定义的如下至少一项:语义元素规则、结构化规则和语义规则函数。
在本申请实施例中,用户可以通过不同需求对语义元素规则、结构化规则或者语义规则函数进行自定义设置,例如,可以通过可视化界面对语义元素规则、结构化规则或者语义规则函数进行自定义;能够快速的对解析规则中的信息进行修改,具有较强的可解释性和可干预性。
以如下示例对本申请实施例中构建语义树以及确定解析结果的过程进行说明:
示例1
在对待解析文本“张三比李四身高高多少?”进行语义理解过程中,首先获取该待解析文本关联的槽位字典。
其中,关联的槽位字典可以包括属于subject、predicate和comp_words词性的候选词语。具体的,属于subject词性的候选词语有{张三,李四,王五,赵六},属于predicate词性的候选词语有{体重,身高,年龄},属于comp_words词性的候选词语有{大多少,小多少,高多少,低多少、胖多少、瘦多少}。
基于关联的槽位字典,确定与待解析文本匹配的目标语义元素规则为[subject]比[subject][predicate][comp_words]。
采用目标语义元素规则对待解析文本进行解析,得到待解析文本中属于subject词性的词语有[张三,李四],属于predicate词性的词语有[身高],属于comp_words词性的词语有[高多少],即得到语义元素解析结果。
获取与目标语义元素规则关联的目标结构化规则:subtraction(get_o_by_sp(D1:subject,predicate),get_o_by_sp(D2:subject,pr e-dicate));其中,D1:subject是指解析结果中属于subject词性的第一个词语,D2:subject是指解析结果中属于subject词性的第二个词语,predicate为解析结果中属于predicate的词语。
图3为目标结构化规则的树型结构展示示意图,图4为待解析文本的语义树。结合图3和图4,将语义元素解析结果中词语添加到目标结构化规则中,即将图3所示树型结构中D1:subject替换为张三,将D2:subject替换为李四,将predicate替换为身高,得到待解析文本的语义树。
其中,目标语义元素规则还关联有如下两个语义规则函数:
subtraction(x1,x2),用于计算x1和x2的差值;
get_o_by_sp(subject,predicate),用于通过主语谓语获取宾语。
参考图4,根据待解析文本的语义树和语义规则函数,对待解析文本进行理解。
示例2
在对待解析文本“孩子年龄是35岁演员的明星中谁的老婆是张三的朋友?”进行语义理解过程中,首先获取该待解析文本关联的槽位字典。
其中,关联的槽位字典可以包括属于predicate、object(宾语)和category(类别)词性的候选词语。具体的,属于predicate词性的候选词语有{孩子,老婆,朋友,爸爸,妈妈,体重,身高,年龄},属于object词性的候选词语有{35岁,180cm,70kg,张三},属于category词性的候选词语有{演员,明星,教师,医生}。
基于关联的槽位字典,确定与待解析文本匹配的目标语义元素规则为[predicate][predicate]是[object][category]的[category]中谁的[predicate]是[object]的[predicate]。
采用目标语义元素规则,对待解析文本进行解析,得到待解析文本中属于predicate词性的词语有[孩子,年龄,老婆,朋友],属于object词性的词语有[35岁,张三],属于category词性的词语有[演员,明星],即得到语义元素解析结果。
获取与目标语义元素规则关联的目标结构化规则:filter(filter(filter(all,type,D2:category,is_equal),D1:predicate,filter(filter(all,type,D1:category,is_equal),D2:predicate,D1:object,is_equal),is_in),D3:predicate,get_o_by_sp(D2:object,D4:predicate),is_in);其中,is_equal(x1,x2),用于判定x1是否与x2相等,返回值为是或否;is_in(x1,cand_list),用于判定x1是否在集合cand_list中,返回值为是或否;all是指所有集合,type是指所有类别,D1:predicate、D2:predicate、D3:predicate和D4:predicate分别是指解析结果中属于predicate词性的第一、第二、第三和第四个词语,D1:category和D2:category分别是指解析结果中属于category词性的第一和第二个词语,D1:object和D2:object分别是指解析结果中属于object词性的第一和第二个词语。
参考图5,将语义元素解析结果中词语添加到目标结构化规则中,即将目标结构化规则中D2:category替换为明星,D1:predicate替换为孩子,D1:category替换为演员,D2:predicate替换为年龄,D1:object替换为35岁,D3:predicate替换为老婆,D2:object替换为张三,D4:predicate替换为朋友,得到待解析文本的语义树。
其中,目标语义元素规则还关联有如下一个语义规则函数:
filter(cand_list,property,value,func),用于根据属性筛选出符合要求的子集;其中,cand_list是指待过滤的集合,property是指过滤属性,value是指过滤属性值,func是值任意以property和value为参数,返回值为是或否的函数。
参考图5,根据待解析文本的语义树和语义规则函数,对待解析文本进行理解。
本实施例能够根据目标结构化规则中的类别标识和类别标识下的元素顺序标识,为待解析文本构建语义树,能够有效提高语义树的构建效率和适用性。
图6根据本申请实施例提供的一种语义处理装置的结构示意图,本实施例可适用于根据构建的语音树,对待解析文本进行语义理解的情况,该装置配置于电子设备中,可实现本申请任意实施例所述的语义处理方法。语义处理装置600具体包括如下:
规则确定模块610,用于确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果;
语义树生成模块620,用于采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树;
语义理解模块630,用于基于所述语义树,对所述待解析文本进行语义理解。
可选的,语义元素解析结果包括所述待解析文本中的至少一类别语义元素,以及该类别中元素顺序。
可选的,语义树生成模块620,具体用于:
按照所述目标结构化规则中的类别标识和所述类别标识下的元素顺序标识,将所述语义元素解析结果中的语义元素添加到所述目标结构化规则中;
根据包括语义元素的目标结构化规则,生成语义树。
可选的,语义树中非叶子节点为预设的语义规则函数,叶子节点为所述语义规则函数的参数,且所述非叶子节点的子节点为其他非叶子节点或叶子节点。
可选的,规则确定模块610,具体用于:
基于槽位字典,从候选语义元素规则中选择与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果。
可选的,语义理解模块630,具体用于:
根据所述语义树中的语义规则函数和语义元素,对所述待解析文本进行语义理解。
可选的,所述装置还包括:
用户自定义生成模块,用于根据用户交互信息,生成用户自定义的如下至少一项:所述语义元素规则、所述结构化规则和所述语义规则函数。
本实施例的技术方案,能够根据目标结构化规则和语义元素生成语义树,有效提高对待解析文本中复杂问题的解析效率和准确度。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的语义处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、电子设备、刀片式电子设备、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为电子设备阵列、一组刀片式电子设备、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的语义处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的语义处理方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的语义处理方法对应的程序指令/模块。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例中的语义处理方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语义处理的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至语义处理的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
语义处理方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与语义处理的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据电子设备)、或者包括中间件部件的计算系统(例如,应用电子设备)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算机系统可以包括客户端和电子设备。客户端和电子设备一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-电子设备关系的计算机程序来产生客户端和电子设备的关系。
根据本申请实施例的技术方案,能够根据目标结构化规则和语义元素生成语义树,有效提高对待解析文本中复杂问题的解析效率和准确度。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种语义处理方法,其特征在于,包括:
确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果;
采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树;
基于所述语义树,对所述待解析文本进行语义理解。
2.根据权利要求1所述的方法,其特征在于,所述语义元素解析结果包括所述待解析文本中的至少一类别语义元素,以及该类别中元素顺序。
3.根据权利要求2所述的方法,其特征在于,采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树,包括:
按照所述目标结构化规则中的类别标识和所述类别标识下的元素顺序标识,将所述语义元素解析结果中的语义元素添加到所述目标结构化规则中;
根据包括语义元素的目标结构化规则,生成语义树。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述语义树中非叶子节点为预设的语义规则函数,叶子节点为所述语义规则函数的参数,且所述非叶子节点的子节点为其他非叶子节点或叶子节点。
5.根据权利要求1-3中任一项所述的方法,其特征在于,确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果,包括:
基于槽位字典,从候选语义元素规则中选择与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果。
6.根据权利要求4所述的方法,其特征在于,基于所述语义树,对所述待解析文本进行语义理解,包括:
根据所述语义树中的语义规则函数和语义元素,对所述待解析文本进行语义理解。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据用户交互信息,生成用户自定义的如下至少一项:所述语义元素规则、所述结构化规则和所述语义规则函数。
8.一种语义处理装置,其特征在于,包括:
规则确定模块,用于确定与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果;
语义树生成模块,用于采用与所述目标语义元素规则关联的目标结构化规则,根据所述语义元素解析结果生成语义树;
语义理解模块,用于基于所述语义树,对所述待解析文本进行语义理解。
9.根据权利要求8所述的装置,其特征在于,所述语义元素解析结果包括所述待解析文本中的至少一类别语义元素,以及该类别中元素顺序。
10.根据权利要求9所述的装置,其特征在于,所述语义树生成模块,具体用于:
按照所述目标结构化规则中的类别标识和所述类别标识下的元素顺序标识,将所述语义元素解析结果中的语义元素添加到所述目标结构化规则中;
根据包括语义元素的目标结构化规则,生成语义树。
11.根据权利要求8-10中任一项所述的装置,其特征在于,所述语义树中非叶子节点为预设的语义规则函数,叶子节点为所述语义规则函数的参数,且所述非叶子节点的子节点为其他非叶子节点或叶子节点。
12.根据权利要求8-10中任一项所述的装置,其特征在于,所述规则确定模块,具体用于:
基于槽位字典,从候选语义元素规则中选择与待解析文本匹配的目标语义元素规则,且采用所述目标语义元素规则对所述待解析文本进行解析得到语义元素解析结果。
13.根据权利要求11所述的装置,其特征在于,所述语义理解模块,具体用于:
根据所述语义树中的语义规则函数和语义元素,对所述待解析文本进行语义理解。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
用户自定义生成模块,根据用户交互信息,生成用户自定义的如下至少一项:所述语义元素规则、所述结构化规则和所述语义规则函数。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN202010367760.1A 2020-04-30 2020-04-30 语义处理方法、装置、电子设备和介质 Active CN111563385B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010367760.1A CN111563385B (zh) 2020-04-30 2020-04-30 语义处理方法、装置、电子设备和介质
EP21164545.2A EP3832484A3 (en) 2020-04-30 2021-03-24 Semantics processing method, semantics processing apparatus, electronic device, and medium
US17/212,511 US20210209309A1 (en) 2020-04-30 2021-03-25 Semantics processing method, electronic device, and medium
JP2021051248A JP7386827B2 (ja) 2020-04-30 2021-03-25 セマンティック処理方法、装置、電子機器及び媒体
KR1020210055591A KR20210056961A (ko) 2020-04-30 2021-04-29 의미 처리 방법, 장치, 전자 기기 및 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010367760.1A CN111563385B (zh) 2020-04-30 2020-04-30 语义处理方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN111563385A true CN111563385A (zh) 2020-08-21
CN111563385B CN111563385B (zh) 2023-12-26

Family

ID=72071906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010367760.1A Active CN111563385B (zh) 2020-04-30 2020-04-30 语义处理方法、装置、电子设备和介质

Country Status (5)

Country Link
US (1) US20210209309A1 (zh)
EP (1) EP3832484A3 (zh)
JP (1) JP7386827B2 (zh)
KR (1) KR20210056961A (zh)
CN (1) CN111563385B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287663A (zh) * 2020-11-25 2021-01-29 平安数字信息科技(深圳)有限公司 一种文本解析方法、设备、终端及存储介质
CN112579444A (zh) * 2020-12-10 2021-03-30 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN113051333A (zh) * 2021-04-21 2021-06-29 中国平安财产保险股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN114489440A (zh) * 2022-01-20 2022-05-13 安徽淘云科技股份有限公司 一种展示方法及其相关设备
CN114707045A (zh) * 2022-03-23 2022-07-05 江苏悉宁科技有限公司 一种基于大数据的舆情监测方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460117A (zh) * 2022-08-01 2022-12-09 青岛海尔科技有限公司 设备测试方法和装置、存储介质及电子装置
CN116029279B (zh) * 2023-03-28 2023-07-07 深圳前海环融联易信息科技服务有限公司 基于多模态模型的中登附件解析方法、装置、设备及介质
CN116882494B (zh) * 2023-09-07 2023-11-28 山东山大鸥玛软件股份有限公司 面向专业文本的无监督知识图构建方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110004464A1 (en) * 2009-07-02 2011-01-06 International Business Machines Corporation Method and system for smart mark-up of natural language business rules
CN106155999A (zh) * 2015-04-09 2016-11-23 科大讯飞股份有限公司 自然语言语义理解方法及系统
CN110727839A (zh) * 2018-06-29 2020-01-24 微软技术许可有限责任公司 自然语言查询的语义解析
US20200097549A1 (en) * 2018-09-26 2020-03-26 Asustek Computer Inc. Semantic processing method, electronic device, and non-transitory computer readable recording medium

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63221476A (ja) * 1987-03-11 1988-09-14 Fujitsu Ltd 自然言語処理方法
US7302383B2 (en) * 2002-09-12 2007-11-27 Luis Calixto Valles Apparatus and methods for developing conversational applications
JP4451435B2 (ja) * 2006-12-06 2010-04-14 本田技研工業株式会社 言語理解装置、言語理解方法、及び、コンピュータプログラム
US8880537B2 (en) * 2009-10-19 2014-11-04 Gil Fuchs System and method for use of semantic understanding in storage, searching and providing of data or other content information
US20160203130A1 (en) * 2013-08-30 2016-07-14 Unsilo A/S Method and system for identifying and evaluating semantic patterns in written language
RU2584457C1 (ru) * 2015-02-03 2016-05-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке
JP7103763B2 (ja) * 2017-07-20 2022-07-20 株式会社日立製作所 情報処理システムおよび情報処理方法
US11636270B2 (en) 2020-01-29 2023-04-25 Adobe Inc. Methods and systems for generating a semantic computation graph for understanding and grounding referring expressions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110004464A1 (en) * 2009-07-02 2011-01-06 International Business Machines Corporation Method and system for smart mark-up of natural language business rules
CN106155999A (zh) * 2015-04-09 2016-11-23 科大讯飞股份有限公司 自然语言语义理解方法及系统
CN110727839A (zh) * 2018-06-29 2020-01-24 微软技术许可有限责任公司 自然语言查询的语义解析
US20200097549A1 (en) * 2018-09-26 2020-03-26 Asustek Computer Inc. Semantic processing method, electronic device, and non-transitory computer readable recording medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287663A (zh) * 2020-11-25 2021-01-29 平安数字信息科技(深圳)有限公司 一种文本解析方法、设备、终端及存储介质
CN112579444A (zh) * 2020-12-10 2021-03-30 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN112579444B (zh) * 2020-12-10 2024-05-07 华南理工大学 基于文本认知的自动分析建模方法、系统、装置及介质
CN113051333A (zh) * 2021-04-21 2021-06-29 中国平安财产保险股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN113051333B (zh) * 2021-04-21 2023-10-13 中国平安财产保险股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN114489440A (zh) * 2022-01-20 2022-05-13 安徽淘云科技股份有限公司 一种展示方法及其相关设备
CN114707045A (zh) * 2022-03-23 2022-07-05 江苏悉宁科技有限公司 一种基于大数据的舆情监测方法及系统
CN114707045B (zh) * 2022-03-23 2023-09-26 江苏悉宁科技有限公司 一种基于大数据的舆情监测方法及系统

Also Published As

Publication number Publication date
US20210209309A1 (en) 2021-07-08
EP3832484A2 (en) 2021-06-09
KR20210056961A (ko) 2021-05-20
JP2021103569A (ja) 2021-07-15
CN111563385B (zh) 2023-12-26
EP3832484A3 (en) 2021-10-06
JP7386827B2 (ja) 2023-11-27

Similar Documents

Publication Publication Date Title
JP7223785B2 (ja) 時系列ナレッジグラフ生成方法、装置、デバイス及び媒体
CN111563385A (zh) 语义处理方法、装置、电子设备和介质
CN111221984B (zh) 多模态内容处理方法、装置、设备及存储介质
CN111460083B (zh) 文档标题树的构建方法、装置、电子设备及存储介质
CN111522967B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN111967262A (zh) 实体标签的确定方法和装置
CN111488740B (zh) 一种因果关系的判别方法、装置、电子设备及存储介质
CN112528001B (zh) 一种信息查询方法、装置及电子设备
CN112559552B (zh) 数据对生成方法、装置、电子设备及存储介质
CN111966781B (zh) 数据查询的交互方法及装置、电子设备和存储介质
CN111291184B (zh) 表情的推荐方法、装置、设备及存储介质
CN111666751A (zh) 训练文本扩充方法、装置、设备以及存储介质
CN111666372B (zh) 解析查询词query的方法、装置、电子设备和可读存储介质
CN111400456B (zh) 资讯推荐方法及装置
CN113516491B (zh) 推广信息展示方法、装置、电子设备及存储介质
CN111090991A (zh) 场景纠错方法、装置、电子设备和存储介质
CN111241242B (zh) 目标内容的确定方法、装置、设备及计算机可读存储介质
CN111984774A (zh) 搜索方法、装置、设备以及存储介质
CN112000330A (zh) 建模参数的配置方法、装置、设备和计算机存储介质
CN114444462A (zh) 模型训练方法及人机交互方法、装置
CN112329429B (zh) 文本相似度学习方法、装置、设备以及存储介质
CN111523019B (zh) 用于输出信息的方法、装置、设备以及存储介质
CN111125445A (zh) 社区主题生成方法、装置、电子设备及存储介质
CN111832313B (zh) 文本中情感搭配集合的生成方法、装置、设备和介质
CN112015989A (zh) 用于推送信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant