CN111563386B - 一种基于人工智能的语义处理方法及系统 - Google Patents

一种基于人工智能的语义处理方法及系统 Download PDF

Info

Publication number
CN111563386B
CN111563386B CN202010671740.3A CN202010671740A CN111563386B CN 111563386 B CN111563386 B CN 111563386B CN 202010671740 A CN202010671740 A CN 202010671740A CN 111563386 B CN111563386 B CN 111563386B
Authority
CN
China
Prior art keywords
information
semantic
keyword
feature
input information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010671740.3A
Other languages
English (en)
Other versions
CN111563386A (zh
Inventor
郭琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Titanium Magnesium Network Technology Co.,Ltd.
Original Assignee
Beijing Missfresh Ecommerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Missfresh Ecommerce Co Ltd filed Critical Beijing Missfresh Ecommerce Co Ltd
Priority to CN202010671740.3A priority Critical patent/CN111563386B/zh
Publication of CN111563386A publication Critical patent/CN111563386A/zh
Application granted granted Critical
Publication of CN111563386B publication Critical patent/CN111563386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种基于人工智能的语义处理方法及系统,包括:获取输入信息;将输入信息的语义置信度与置信度阈值比对;当小于置信度阈值时,判断输入信息不包含语义文本;当大于置信度阈值时,判断输入信息包含语义文本,提取输入信息的关键词信息;将关键词信息与语义特征库中的语义特征信息匹配;当关键词信息与语义特征信息匹配成功时,获取对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;当关键词信息与语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。

Description

一种基于人工智能的语义处理方法及系统
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于人工智能的语义处理方法及系统。
背景技术
人工智能(Artificial Intelligence,缩写为AI)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能;通常人工智能是指通过普通计算机程序来呈现人类智能的技术。
目前,对于输入信息的语义处理,依旧采用机械式的对输入信息进行逐字逐词的语义解析,获取语义信息;当输入信息中不包含语义文本时,仍然对输入信息进行语义解析,使得对于输入信息的语义处理比较机械笨拙。
针对上述缺陷,急需将人工智能应用于输入信息的语义处理;因此,提出一种基于人工智能的语义处理方法及系统。
发明内容
为解决上述技术问题,本发明提供一种基于人工智能的语义处理方法及系统,用以实现基于人工智能对输入信息的语义解析处理。
本发明实施例中提供了一种基于人工智能的语义处理方法,其特征在于,所述方法,包括:
获取输入信息;
将所述输入信息的语义置信度与置信度阈值进行比对;
当所述输入信息的语义置信度小于所述置信度阈值时,判断所述输入信息不包含语义文本;
当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并提取所述输入信息的关键词信息;将所述关键词信息与语义特征库中的语义特征信息进行匹配;
当所述关键词信息与所述语义特征库中的语义特征信息匹配成功时,获取与所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息。
在一个实施例中,所述语义特征库中存储有所述语义特征信息和与所述语义特征信息相对应的所述语义模板。
在一个实施例中,步骤:将所述输入信息的语义置信度与置信度阈值进行比对;具体包括:获取所述输入信息的所述语义置信度;包括:
获取所述输入信息中所包含的多个语句;
获取所述语句中的词组信息;
根据所述词组信息,获取所述词组信息的置信度;
根据所述词组信息在所述语句中的分布信息和所述词组信息的置信度,获取所述语句的置信度信息;
对所述输入信息中多个语句对应的多个所述语句的置信度信息进行求均值处理,获取所述输入信息的所述语义置信度。
在一个实施例中,步骤:当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并提取所述输入信息的关键词信息;将所述关键词信息与语义特征库中的语义特征信息进行匹配;具体包括:
当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本;
将所述输入信息中的停用词删除;
对所述输入信息进行分词处理,获取所述输入信息的多个词项;
将多个所述词项中的词性为名词或动词的所述词项设置为预选关键词;
根据所述预选关键词在所述输入信息中出现的次数和出现的位置,获取所述预选关键词的权重值信息;
将所述预选关键词中权重值信息大于预定权重值信息的预选关键词作为所述关键词信息;
将所述关键词信息与语义特征库中的语义特征信息进行匹配。
在一个实施例中,步骤:当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;具体包括:
所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,将所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的关键词向匹配失败集合传输;
提取所述匹配失败集合中的所述关键词的特征信息;
获取所述关键词的特征信息的语义置信度,并将所述关键词的特征信息的语义置信度与所述置信度阈值进行比对,当所述关键词的特征信息的语义置信度大于所述置信度阈值时,判断所述关键词信息的特征信息包含语义文本,并对所述关键词的特征信息包含语义文本的所述关键词进行标定,向所述匹配成功集合传输;
当所述关键词的特征信息的语义置信度小于所述置信度阈值时,判断所述关键词的特征信息不包含语义文本,将在所述关键词中第一次提取的特征信息删除,重复对删除第一次提取的特征信息的所述关键词的特征信息进行提取;
提取所述匹配成功集合中标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词;
根据所述输入信息的语句结构,对标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词进行重构处理,获取处理后的关键词信息;
将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配成功时,获取与处理后的所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息。
在一个实施例中,步骤:将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;之后,还包括:
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配失败时,对处理后的所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的信息删除,获取处理后的所述关键词信息中删除与所述语义特征信息不匹配的信息的匹配信息;
根据所述匹配信息,获取所述语义特征库中与所述匹配信息匹配的所述语义特征信息;
并根据与所述匹配信息匹配的所述语义特征信息,获取所述语义特征信息对应的多个所述语义模板;
通过多个所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的多个所述语义信息;
获取所述输入信息的语句连接信息和中心词信息;
根据所述输入信息的所述语句连接信息和所述中心词信息,对多个所述语义信息进行分析,将与所述输入信息的所述语句连接信息和所述中心词信息拟合度最高的语义信息作为所述输入信息的所述语义信息。
在一个实施例中,步骤:获取所述输入信息的语句连接信息和中心词信息;具体包括:
获取所述输入信息的语句连接信息;
所述语句连接信息,包括递进连接关系、因果连接关系、条件连接关系、转折连接关系以及承接连接关系;
获取所述输入信息中的词汇信息;
根据所述词汇信息对应的词汇领域,对所述词汇信息进行分类,将所述词汇信息分别存储于所述词汇信息对应的词汇领域数据库中;
获取存储所述词汇信息最多的所述词汇领域数据库;
将存储所述词汇信息最多的所述词汇领域数据库中的所述词汇信息与所述词汇领域数据库对应的词汇领域信息作为所述输入信息的中心词信息;
所述词汇领域数据库,包括气象词汇数据子库、医学词汇数据子库、天文词汇数据子库、机械词汇数据子库以及经济词汇数据子库。
一种基于人工智能的语义处理系统,所述系统,包括:获取模块、置信度比对模块和语义特征匹配模块;其中,
所述获取模块,用于获取输入信息;
所述置信度比对模块,用于获取所述输入信息的语义置信度,并将所述输入信息的语义置信度与置信度阈值进行比对;当所述输入信息的语义置信度小于所述置信度阈值时,判断所述输入信息不包含语义文本;当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并将所述输入信息向所述语义特征匹配模块传输;
所述语义特征匹配模块,用于提取所述输入信息的关键词信息,将所述关键词信息与语义特征库中的语义特征信息进行匹配;当所述关键词信息与所述语义特征库中的语义特征信息匹配成功时,获取与所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
所述语义特征匹配模块,还用于当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息。
在一个实施例中,所述系统,还包括无线通信模块;
所述无线通信模块,用于将所述语义特征匹配模块获取的所述输入信息的所述语义信息向用户的电子设备传输;
所述无线通信模块,包括稳压芯片U1、无线通信芯片U2、电源接口U3、电阻R1、电阻R2、电阻R3、电容C1和电容C2;
所述稳压芯片U1的“Vout”端通过所述电阻R3接地;所述稳压芯片U1的“NC”端通过所述电容C1接地;所述稳压芯片U1的“GND”端接地;所述稳压芯片U1的“Vin”端与5V的直流电源连接;所述电源接口U3的“1”端口与所述电容C2连接接地;所述电源接口U3的“2”端口接地;所述无线通信芯片U2的“GND”端接地;所述无线通信芯片U2的“VCC”端与“CH_PD”端并联,通过所述电阻R1与所述电容C1连接;所述无线通信芯片U2的“VCC”端通过所述电阻R2与4.2V的直流电源连接。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明所提供一种基于人工智能的语义处理方法的结构示意图;
图2为本发明所提供一种基于人工智能的语义处理系统的结构示意图;
图3为本发明所提供一种基于人工智能的语义处理系统的无线通信模块的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种基于人工智能的语义处理方法,如图1所示,方法,包括:
获取输入信息;
将输入信息的语义置信度与置信度阈值进行比对;
当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;
当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并提取输入信息的关键词信息;将关键词信息与语义特征库中的语义特征信息进行匹配;
当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;
当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。
上述方法的工作原理在于:获取输入信息;并将输入信息的语义置信度与置信度阈值进行比对;当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并提取输入信息的关键词信息;将关键词信息与语义特征库中的语义特征信息进行匹配;当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。
上述方法的有益效果在于:获取输入信息,并将输入信息的语义置信度与置信度阈值进行比对,实现了对输入信息是否包含语义文本的判断;当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并提取输入信息的关键词信息;将关键词信息与语义特征库中的语义特征信息进行匹配,实现了对是否可以通过关键词信息实现对语义模板获取的判断;当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,实现对输入信息的语义信息获取;当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,实现对相应的语义模板的获取;通过语义模板对输入信息进行语义解析处理,进而实现对输入信息的语义信息的获取;与传统技术相比,上述方法通过将输入信息的语义置信度与置信度阈值进行比对,实现了对输入信息是否包含语义文本的判断,从而避免了对不包含语义文本的输入信息的语义解析处理;并且根据输入信息的关键词信息或处理后的关键词信息,获取相应的语义模板对输入信息进行语义解析处理,解决了以往机械式的对输入信息进行逐字逐词的语义解析的缺陷,进一步实现了将人工智能应用于语义处理中,同时也有效地提高了对输入信息进行语义处理,获取的语义信息的准确性。
在一个实施例中,语义特征库中存储有语义特征信息和与语义特征信息相对应的语义模板。上述技术方案中通过将关键词信息与语义特征库中的语义特征信息进行匹配,实现了对与关键词信息相匹配的语义特征信息对应的语义模板的获取,并通过获取的语义模板对输入信息进行语义解析处理,从而实现了对输入信息的语义信息获取。
在一个实施例中,步骤:将输入信息的语义置信度与置信度阈值进行比对;具体包括:获取输入信息的语义置信度;包括:
获取输入信息中所包含的多个语句;
获取语句中的词组信息;
根据词组信息,获取词组信息的置信度;
根据词组信息在语句中的分布信息和词组信息的置信度,获取语句的置信度信息;
对输入信息中多个语句对应的多个语句的置信度信息进行求均值处理,获取输入信息的语义置信度。上述技术方案中通过对输入信息中所包含的多个语句中的词组信息的置信度和词组信息在语句中的分布信息,实现了对语句的置信度信息的获取;并对输入信息中多个语句对应的多个语句的置信度信息进行求均值处理,从而实现了对输入信息的语义置信度的获取。
在一个实施例中,步骤:当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并提取输入信息的关键词信息;将关键词信息与语义特征库中的语义特征信息进行匹配;具体包括:
当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本;
将输入信息中的停用词删除;
对输入信息进行分词处理,获取输入信息的多个词项;
将多个词项中的词性为名词或动词的词项设置为预选关键词;
根据预选关键词在输入信息中出现的次数和出现的位置,获取预选关键词的权重值信息;
将预选关键词中权重值信息大于预定权重值信息的预选关键词作为关键词信息;
将关键词信息与语义特征库中的语义特征信息进行匹配。上述技术方案中将输入信息中的停用词删除,并对输入信息进行分词处理,获取输入信息的多个词项;将多个词项中的词性为名词或动词的词项设置为预选关键词;根据预选关键词在输入信息中出现的次数和出现的位置,获取预选关键词的权重值信息;将预选关键词中权重值信息大于预定权重值信息的预选关键词作为关键词信息;从而实现了对输入信息中关键词信息的获取。
停用词是在处理自然语言数据或文本之前或之后会自动过滤掉的某些字或词。
在一个实施例中,步骤:当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;具体包括:
关键词信息与语义特征库中的语义特征信息匹配失败时,将关键词信息中与语义特征库中的语义特征信息不匹配的关键词向匹配失败集合传输;
提取匹配失败集合中的关键词的特征信息;
获取关键词的特征信息的语义置信度,并将关键词的特征信息的语义置信度与置信度阈值进行比对,当关键词的特征信息的语义置信度大于置信度阈值时,判断关键词信息的特征信息包含语义文本,并对关键词的特征信息包含语义文本的关键词进行标定,向匹配成功集合传输;
当关键词的特征信息的语义置信度小于置信度阈值时,判断关键词的特征信息不包含语义文本,将在关键词中第一次提取的特征信息删除,重复对删除第一次提取的特征信息的关键词的特征信息进行提取;
提取匹配成功集合中标定的关键词的特征信息和关键词信息中与语义特征库中的语义特征信息匹配的关键词;
根据输入信息的语句结构,对标定的关键词的特征信息和关键词信息中与语义特征库中的语义特征信息匹配的关键词进行重构处理,获取处理后的关键词信息;
将处理后的关键词信息与语义特征库中的语义特征信息进行匹配;
当处理后的关键词信息与语义特征库中的语义特征信息匹配成功时,获取与处理后的关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。上述技术方案中在关键词信息与语义特征库中的语义特征信息匹配失败时,将关键词信息中与语义特征库中的语义特征信息不匹配的关键词向匹配失败集合传输;并对匹配失败集合中的关键词的特征信息进行提取;获取关键词的特征信息的语义置信度,并将关键词的特征信息的语义置信度与置信度阈值进行比对,当关键词的特征信息的语义置信度大于置信度阈值时,判断关键词信息的特征信息包含语义文本,并对关键词的特征信息包含语义文本的关键词进行标定,向匹配成功集合传输;提取匹配成功集合中标定的关键词的特征信息和关键词信息中与语义特征库中的语义特征信息匹配的关键词;根据输入信息的语句结构,对标定的关键词的特征信息和关键词信息中与语义特征库中的语义特征信息匹配的关键词进行重构处理,获取处理后的关键词信息;将处理后的关键词信息与语义特征库中的语义特征信息进行匹配;当处理后的关键词信息与语义特征库中的语义特征信息匹配成功时,获取与处理后的关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;上述技术方案中通过关键词信息与语义特征库中的语义特征信息匹配失败时,通过提取关键词信息中与语义特征库中的语义特征信息不匹配的关键词的特征信息,并对特征信息的语义置信度验证,判断特征信息包含语义文本后,对该特征信息对应的关键词进行标定;并根据输入信息的语句结构,对标定的关键词的特征信息和关键词信息中与语义特征库中的语义特征信息匹配的关键词进行重构处理,从而实现了对处理后的关键词信息的获取;并将处理后的关键词信息与语义特征库中的语义特征信息进行匹配,匹配成功后,获取与处理后的关键词信息相匹配的语义特征信息对应的语义模板,并通过该语义模板对输入信息进行语义解析处理,从而实现对输入信息的语义信息获取。
并且通过上述方案当关键词的特征信息的语义置信度小于置信度阈值时,判断关键词的特征信息不包含语义文本,将在关键词中第一次提取的特征信息删除,重复上述步骤,对删除第一次提取的特征信息的关键词的特征信息进行再次提取,直到获取包含语义文本的特征信息,进一步实现对输入信息的语义信息的获取。
在一个实施例中,步骤:将处理后的关键词信息与语义特征库中的语义特征信息进行匹配;之后,还包括:
当处理后的关键词信息与语义特征库中的语义特征信息匹配失败时,对处理后的关键词信息中与语义特征库中的语义特征信息不匹配的信息删除,获取处理后的关键词信息中删除与语义特征信息不匹配的信息的匹配信息;
根据匹配信息,获取语义特征库中与匹配信息匹配的语义特征信息;
并根据与匹配信息匹配的语义特征信息,获取语义特征信息对应的多个语义模板;
通过多个语义模板对输入信息进行语义解析处理,获取输入信息的多个语义信息;
获取输入信息的语句连接信息和中心词信息;
根据输入信息的语句连接信息和中心词信息,对多个语义信息进行分析,将与输入信息的语句连接信息和中心词信息拟合度最高的语义信息作为输入信息的语义信息。上述技术方案中在处理后的关键词信息与语义特征库中的语义特征信息匹配失败时,将处理后的关键词信息中与语义特征库中的语义特征信息不匹配的信息删除,实现对匹配信息的获取;并且根据匹配信息,获取语义特征库中与匹配信息匹配的语义特征信息对应的多个语义模板;通过多个语义模板对输入信息进行语义解析处理,获取输入信息的多个语义信息;并根据输入信息的语句连接信息和中心词信息,对多个语义信息进行分析,获取与输入信息的语句连接信息和中心词信息拟合度最高的语义信息,作为输入信息的语义信息;上述方案中仅通过输入信息中少量的匹配信息,获取与语义特征库中语义特征信息相对应的多个语义模板,从而实现对多个语义信息的获取;并且输入信息的语句连接信息和中心词信息,对多个语义信息进行分析,进而实现了对输入信息的语义信息的确定。
在一个实施例中,步骤:获取输入信息的语句连接信息和中心词信息;具体包括:
获取输入信息的语句连接信息;
语句连接信息,包括递进连接关系、因果连接关系、条件连接关系、转折连接关系以及承接连接关系;
获取输入信息中的词汇信息;
根据词汇信息对应的词汇领域,对词汇信息进行分类,将词汇信息分别存储于词汇信息对应的词汇领域数据库中;
获取存储词汇信息最多的词汇领域数据库;
将存储词汇信息最多的词汇领域数据库中的词汇信息与词汇领域数据库对应的词汇领域信息作为输入信息的中心词信息;
词汇领域数据库,包括气象词汇数据子库、医学词汇数据子库、天文词汇数据子库、机械词汇数据子库以及经济词汇数据子库。上述技术方案中通过对输入信息分析,实现了对输入信息的语句连接信息的获取;通过对输入信息中的词汇信息按照相对应的词汇领域进行分类,将词汇信息分别存储于词汇信息对应的词汇领域数据库中;并将存储词汇信息最多的词汇领域数据库中的词汇信息与词汇领域数据库对应的词汇领域信息作为输入信息的中心词信息,从而实现了对输入信息的中心词信息的获取。
一种基于人工智能的语义处理系统,如图2所示,系统,包括:获取模块21、置信度比对模块22和语义特征匹配模块23;其中,
获取模块21,用于获取输入信息;
置信度比对模块22,用于获取输入信息的语义置信度,并将输入信息的语义置信度与置信度阈值进行比对;当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并将输入信息向语义特征匹配模块23传输;
语义特征匹配模块23,用于提取输入信息的关键词信息,将关键词信息与语义特征库中的语义特征信息进行匹配;当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;
语义特征匹配模块23,还用于当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。
上述系统的工作原理在于:获取模块21,获取输入信息;置信度比对模块22通过获取模21块获取的输入信息,获取输入信息的语义置信度,并将输入信息的语义置信度与置信度阈值进行比对;当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并将输入信息向语义特征匹配模块23传输;语义特征匹配模块23根据置信度比对模块22传输的输入信息,提取输入信息的关键词信息,将关键词信息与语义特征库中的语义特征信息进行匹配;当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息;当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的语义模板;通过语义模板对输入信息进行语义解析处理,获取输入信息的语义信息。
上述系统的有益效果在于:获取模块,实现对输入信息的获取;并通过置信度比对模块,将输入信息的语义置信度与置信度阈值进行比对,实现了对输入信息是否包含语义文本的判断;当输入信息的语义置信度小于置信度阈值时,判断输入信息不包含语义文本;当输入信息的语义置信度大于置信度阈值时,判断输入信息包含语义文本,并通过语义特征匹配模块提取输入信息的关键词信息,将关键词信息与语义特征库中的语义特征信息进行匹配,实现了对是否可以通过关键词信息实现对语义模板获取的判断;当关键词信息与语义特征库中的语义特征信息匹配成功时,获取与关键词信息相匹配的语义特征信息对应的语义模板,并通过语义模板对输入信息进行语义解析处理,实现对输入信息的语义信息获取;当关键词信息与语义特征库中的语义特征信息匹配失败时,对关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,实现对相应的语义模板的获取;通过语义模板对输入信息进行语义解析处理,进而实现对输入信息的语义信息的获取;与传统技术相比,上述系统通过置信度比对模块将输入信息的语义置信度与置信度阈值进行比对,实现了对输入信息是否包含语义文本的判断,从而避免了对不包含语义文本的输入信息的语义解析处理;并且通过语义特征匹配模块根据输入信息的关键词信息或处理后的关键词信息,获取相应的语义模板对输入信息进行语义解析处理,解决了以往机械式的对输入信息进行逐字逐词的语义解析的缺陷,进一步实现了将人工智能应用于语义处理中,同时也有效地提高了对输入信息进行语义处理,获取的语义信息的准确性。
在一个实施例中,系统,还包括无线通信模块;
无线通信模块,用于将语义特征匹配模块获取的输入信息的语义信息向用户的电子设备传输;
无线通信模块,如图3所示,包括稳压芯片U1(稳压芯片的型号为AMS1117-3.3)、无线通信芯片U2、电源接口U3、电阻R1、电阻R2、电阻R3、电容C1和电容C2;
稳压芯片U1的“Vout”端通过电阻R3接地;稳压芯片U1的“NC”端通过电容C1接地;稳压芯片U1的“GND”端接地;稳压芯片U1的“Vin”端与5V的直流电源连接;电源接口U3的“1”端口与电容C2连接接地;电源接口U3的“2”端口接地;无线通信芯片U2的“GND”端接地;无线通信芯片U2的“VCC”端与“CH_PD”端并联,通过电阻R1与电容C1连接;无线通信芯片U2的“VCC”端通过电阻R2与4.2V的直流电源连接。上述技术方案中通过无线通信模块,实现了将语义特征匹配模块获取的输入信息的语义信息向用户的电子设备传输,进一步实现了用户通过电子设备对语义信息的获取;并且通过上述器件实现了无线通信模块的功能。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于人工智能的语义处理方法,其特征在于,所述方法,包括:
获取输入信息;
将所述输入信息的语义置信度与置信度阈值进行比对;
当所述输入信息的语义置信度小于所述置信度阈值时,判断所述输入信息不包含语义文本;
当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并提取所述输入信息的关键词信息;将所述关键词信息与语义特征库中的语义特征信息进行匹配;
当所述关键词信息与所述语义特征库中的语义特征信息匹配成功时,获取与所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;具体包括:
所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,将所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的关键词向匹配失败集合传输;
提取所述匹配失败集合中的所述关键词的特征信息;
获取所述关键词的特征信息的语义置信度,并将所述关键词的特征信息的语义置信度与所述置信度阈值进行比对,当所述关键词的特征信息的语义置信度大于所述置信度阈值时,判断所述关键词信息的特征信息包含语义文本,并对所述关键词的特征信息包含语义文本的所述关键词进行标定,向所述匹配成功集合传输;
当所述关键词的特征信息的语义置信度小于所述置信度阈值时,判断所述关键词的特征信息不包含语义文本,将在所述关键词中第一次提取的特征信息删除,重复对删除第一次提取的特征信息的所述关键词的特征信息进行提取;
提取所述匹配成功集合中标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词;
根据所述输入信息的语句结构,对标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词进行重构处理,获取处理后的关键词信息;
将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配成功时,获取与处理后的所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
步骤:将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;之后,还包括:
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配失败时,对处理后的所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的信息删除,获取处理后的所述关键词信息中删除与所述语义特征信息不匹配的信息的匹配信息;
根据所述匹配信息,获取所述语义特征库中与所述匹配信息匹配的所述语义特征信息;
并根据与所述匹配信息匹配的所述语义特征信息,获取所述语义特征信息对应的多个所述语义模板;
通过多个所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的多个所述语义信息;
获取所述输入信息的语句连接信息和中心词信息;
根据所述输入信息的所述语句连接信息和所述中心词信息,对多个所述语义信息进行分析,将与所述输入信息的所述语句连接信息和所述中心词信息拟合度最高的语义信息作为所述输入信息的所述语义信息。
2.如权利要求1所述的方法,其特征在于,
所述语义特征库中存储有所述语义特征信息和与所述语义特征信息相对应的所述语义模板。
3.如权利要求1所述的方法,其特征在于,步骤:将所述输入信息的语义置信度与置信度阈值进行比对;具体包括:获取所述输入信息的所述语义置信度;包括:
获取所述输入信息中所包含的多个语句;
获取所述语句中的词组信息;
根据所述词组信息,获取所述词组信息的置信度;
根据所述词组信息在所述语句中的分布信息和所述词组信息的置信度,获取所述语句的置信度信息;
对所述输入信息中多个语句对应的多个所述语句的置信度信息进行求均值处理,获取所述输入信息的所述语义置信度。
4.如权利要求1所述的方法,其特征在于,步骤:当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并提取所述输入信息的关键词信息;将所述关键词信息与语义特征库中的语义特征信息进行匹配;具体包括:
当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本;
将所述输入信息中的停用词删除;
对所述输入信息进行分词处理,获取所述输入信息的多个词项;
将多个所述词项中的词性为名词或动词的所述词项设置为预选关键词;
根据所述预选关键词在所述输入信息中出现的次数和出现的位置,获取所述预选关键词的权重值信息;
将所述预选关键词中权重值信息大于预定权重值信息的预选关键词作为所述关键词信息;
将所述关键词信息与语义特征库中的语义特征信息进行匹配。
5.如权利要求1所述的方法,其特征在于,步骤:获取所述输入信息的语句连接信息和中心词信息;具体包括:
获取所述输入信息的语句连接信息;
所述语句连接信息,包括递进连接关系、因果连接关系、条件连接关系、转折连接关系以及承接连接关系;
获取所述输入信息中的词汇信息;
根据所述词汇信息对应的词汇领域,对所述词汇信息进行分类,将所述词汇信息分别存储于所述词汇信息对应的词汇领域数据库中;
获取存储所述词汇信息最多的所述词汇领域数据库;
将存储所述词汇信息最多的所述词汇领域数据库中的所述词汇信息与所述词汇领域数据库对应的词汇领域信息作为所述输入信息的中心词信息;
所述词汇领域数据库,包括气象词汇数据子库、医学词汇数据子库、天文词汇数据子库、机械词汇数据子库以及经济词汇数据子库。
6.一种基于人工智能的语义处理系统,其特征在于,所述系统,包括:获取模块、置信度比对模块和语义特征匹配模块;其中,
所述获取模块,用于获取输入信息;
所述置信度比对模块,用于获取所述输入信息的语义置信度,并将所述输入信息的语义置信度与置信度阈值进行比对;当所述输入信息的语义置信度小于所述置信度阈值时,判断所述输入信息不包含语义文本;当所述输入信息的语义置信度大于所述置信度阈值时,判断所述输入信息包含所述语义文本,并将所述输入信息向所述语义特征匹配模块传输;
所述语义特征匹配模块,用于提取所述输入信息的关键词信息,将所述关键词信息与语义特征库中的语义特征信息进行匹配;当所述关键词信息与所述语义特征库中的语义特征信息匹配成功时,获取与所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
所述语义特征匹配模块,还用于当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
当所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,对所述关键词信息进行处理,获取处理后的关键词信息;根据处理后的关键词信息,获取相应的所述语义模板;通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;具体包括:
所述关键词信息与所述语义特征库中的语义特征信息匹配失败时,将所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的关键词向匹配失败集合传输;
提取所述匹配失败集合中的所述关键词的特征信息;
获取所述关键词的特征信息的语义置信度,并将所述关键词的特征信息的语义置信度与所述置信度阈值进行比对,当所述关键词的特征信息的语义置信度大于所述置信度阈值时,判断所述关键词信息的特征信息包含语义文本,并对所述关键词的特征信息包含语义文本的所述关键词进行标定,向所述匹配成功集合传输;
当所述关键词的特征信息的语义置信度小于所述置信度阈值时,判断所述关键词的特征信息不包含语义文本,将在所述关键词中第一次提取的特征信息删除,重复对删除第一次提取的特征信息的所述关键词的特征信息进行提取;
提取所述匹配成功集合中标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词;
根据所述输入信息的语句结构,对标定的所述关键词的特征信息和所述关键词信息中与所述语义特征库中的所述语义特征信息匹配的关键词进行重构处理,获取处理后的关键词信息;
将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配成功时,获取与处理后的所述关键词信息相匹配的所述语义特征信息对应的语义模板,并通过所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的语义信息;
步骤:将处理后的所述关键词信息与所述语义特征库中的所述语义特征信息进行匹配;之后,还包括:
当处理后的所述关键词信息与所述语义特征库中的所述语义特征信息匹配失败时,对处理后的所述关键词信息中与所述语义特征库中的所述语义特征信息不匹配的信息删除,获取处理后的所述关键词信息中删除与所述语义特征信息不匹配的信息的匹配信息;
根据所述匹配信息,获取所述语义特征库中与所述匹配信息匹配的所述语义特征信息;
并根据与所述匹配信息匹配的所述语义特征信息,获取所述语义特征信息对应的多个所述语义模板;
通过多个所述语义模板对所述输入信息进行语义解析处理,获取所述输入信息的多个所述语义信息;
获取所述输入信息的语句连接信息和中心词信息;
根据所述输入信息的所述语句连接信息和所述中心词信息,对多个所述语义信息进行分析,将与所述输入信息的所述语句连接信息和所述中心词信息拟合度最高的语义信息作为所述输入信息的所述语义信息。
7.如权利要求6所述的系统,其特征在于,
所述系统,还包括无线通信模块;
所述无线通信模块,用于将所述语义特征匹配模块获取的所述输入信息的所述语义信息向用户的电子设备传输;
所述无线通信模块,包括稳压芯片U1、无线通信芯片U2、电源接口U3、电阻R1、电阻R2、电阻R3、电容C1和电容C2;
所述稳压芯片U1的“Vout”端通过所述电阻R3接地;所述稳压芯片U1的“NC”端通过所述电容C1接地;所述稳压芯片U1的“GND”端接地;所述稳压芯片U1的“Vin”端与5V的直流电源连接;所述电源接口U3的“1”端口与所述电容C2连接接地;所述电源接口U3的“2”端口接地;所述无线通信芯片U2的“GND”端接地;所述无线通信芯片U2的“VCC”端与“CH_PD”端并联,通过所述电阻R1与所述电容C1连接;所述无线通信芯片U2的“VCC”端通过所述电阻R2与4.2V的直流电源连接。
CN202010671740.3A 2020-07-14 2020-07-14 一种基于人工智能的语义处理方法及系统 Active CN111563386B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010671740.3A CN111563386B (zh) 2020-07-14 2020-07-14 一种基于人工智能的语义处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010671740.3A CN111563386B (zh) 2020-07-14 2020-07-14 一种基于人工智能的语义处理方法及系统

Publications (2)

Publication Number Publication Date
CN111563386A CN111563386A (zh) 2020-08-21
CN111563386B true CN111563386B (zh) 2020-11-24

Family

ID=72068893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010671740.3A Active CN111563386B (zh) 2020-07-14 2020-07-14 一种基于人工智能的语义处理方法及系统

Country Status (1)

Country Link
CN (1) CN111563386B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154853A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation English-language translation of exact interpretations of keyword queries

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021115A (zh) * 2014-06-13 2014-09-03 北京理工大学 基于神经网络的中文比较句识别方法及装置
CN106528694B (zh) * 2016-10-31 2019-12-06 百度在线网络技术(北京)有限公司 基于人工智能的语义判定处理方法和装置
CN110085221A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音情感交互方法、计算机设备和计算机可读存储介质
CN109147765B (zh) * 2018-11-16 2021-09-03 安徽听见科技有限公司 音频质量综合评测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154853A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation English-language translation of exact interpretations of keyword queries

Also Published As

Publication number Publication date
CN111563386A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
CN107315737B (zh) 一种语义逻辑处理方法及系统
WO2021042503A1 (zh) 信息分类抽取方法、装置、计算机设备和存储介质
CN113011533A (zh) 文本分类方法、装置、计算机设备和存储介质
CN109815333B (zh) 信息获取方法、装置、计算机设备和存储介质
US7957968B2 (en) Automatic grammar generation using distributedly collected knowledge
CN110765759B (zh) 意图识别方法及装置
CN110347787B (zh) 一种基于ai辅助面试场景的面试方法、装置及终端设备
CN111444330A (zh) 提取短文本关键词的方法、装置、设备及存储介质
Neunerdt et al. Part-of-speech tagging for social media texts
WO2020233386A1 (zh) 基于aiml的智能问答方法、装置、计算机设备及存储介质
CN111061882A (zh) 一种知识图谱构建方法
CN114528919A (zh) 自然语言处理方法、装置及计算机设备
Roark et al. Reranking for sentence boundary detection in conversational speech
CN110717045A (zh) 一种基于信访信件概况的信件要素自动提取方法
CN111444704A (zh) 基于深度神经网络的网络安全关键词抽取方法
CN114266256A (zh) 一种领域新词的提取方法及系统
Argamon-Engelson et al. A memory-based approach to learning shallow natural language patterns
CN111563386B (zh) 一种基于人工智能的语义处理方法及系统
CN112380848A (zh) 文本生成方法、装置、设备及存储介质
CN113076749A (zh) 一种文本识别方法和系统
CN109241521B (zh) 一种基于引用关系的科技文献高关注度句子提取方法
CN109325237B (zh) 用于机器翻译的完整句识别方法与系统
CN110705285A (zh) 一种政务文本主题词库构建方法、装置、服务器及可读存储介质
Iosif et al. Speech understanding for spoken dialogue systems: From corpus harvesting to grammar rule induction
CN114239555A (zh) 一种关键词提取模型的训练方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211125

Address after: Room 084, No. 1-309, 3rd floor, commercial building, No. 9 Wangjing street, Chaoyang District, Beijing 100102

Patentee after: Beijing Daily Youxian Technology Co.,Ltd.

Address before: 100102 room 801, 08 / F, building 7, yard 34, Chuangyuan Road, Chaoyang District, Beijing

Patentee before: BEIJING MISSFRESH E-COMMERCE Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231113

Address after: C1-331 Zheshang Pedestrian Street, Urban Rural Integration Demonstration Zone, Hebi City, Henan Province, 458000

Patentee after: Hebi Shiyu Qiluo E-commerce Co.,Ltd.

Address before: Room 084, No. 1-309, 3rd floor, commercial building, No. 9 Wangjing street, Chaoyang District, Beijing 100102

Patentee before: Beijing Daily Youxian Technology Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240104

Address after: Room 110, Building 2, No. 787 Manufacturing Bureau Road, Huangpu District, Shanghai, 200000

Patentee after: Shanghai Titanium Magnesium Network Technology Co.,Ltd.

Address before: C1-331 Zheshang Pedestrian Street, Urban Rural Integration Demonstration Zone, Hebi City, Henan Province, 458000

Patentee before: Hebi Shiyu Qiluo E-commerce Co.,Ltd.