CN115422944A - 语义识别方法、装置、设备及存储介质 - Google Patents

语义识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115422944A
CN115422944A CN202211065489.1A CN202211065489A CN115422944A CN 115422944 A CN115422944 A CN 115422944A CN 202211065489 A CN202211065489 A CN 202211065489A CN 115422944 A CN115422944 A CN 115422944A
Authority
CN
China
Prior art keywords
text
scene
recognized
recognition
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211065489.1A
Other languages
English (en)
Inventor
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Renma Interactive Technology Co Ltd
Original Assignee
Shenzhen Renma Interactive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Renma Interactive Technology Co Ltd filed Critical Shenzhen Renma Interactive Technology Co Ltd
Priority to CN202211065489.1A priority Critical patent/CN115422944A/zh
Publication of CN115422944A publication Critical patent/CN115422944A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种语义识别方法、装置、设备及存储介质,该方法包括:获取待识别文本,确定待识别文本的意图信息;基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;基于目标场景语句样本和训练好的语义识别模型进行识别处理,得到待识别文本的预测结果,目标场景语句样本语义识别模型包括多个场景识别模型。该技术方案由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,并根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高。

Description

语义识别方法、装置、设备及存储介质
技术领域
本发明一般涉及人工智能技术领域,具体涉及一种语义识别方法、装置、设备及存储介质。
背景技术
随着人工智能算法技术的不断发展,语义识别技术作为人工智能的一个分支,已经越来越多地应用到各个不同领域系统中,例如购物网站的客服系统,医疗领域的智能问诊系统等。为了使得系统智能化地理解用户对应语言的含义,进行语义识别显得尤为重要。
目前,相关技术中采用识别模型来实现语义识别,然而该模型往往需要大量的语料进行训练,且训练得到的模型规模较大,在语义识别时较为片面,导致得到语义识别结果准确度低。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种语义识别方法、装置、设备及存储介质。
第一方面,本申请实施例提供了一种语义识别方法,该方法包括:
获取待识别文本,确定所述待识别文本的意图信息;
基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
在其中一个实施例中,基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,包括:
基于所述待识别文本的意图信息,确定所述意图信息的归属位置;
当所述归属位置在所述历史场景语句样本中时,获取训练所述每个场景识别模型时对应的历史场景语句样本;
采用预设的文本相似度算法,确定待识别文本的意图信息与所述历史场景语句样本的文本相似度;
确定文本相似度符合预设规则的历史场景语句样本作为目标场景语句样本。
在其中一个实施例中,在基于所述待识别文本的意图信息,确定所述意图信息的归属位置之后,所述方法还包括:
当所述归属位置不在所述历史场景语句样本中时,将所述待识别文本的意图信息作为目标场景语句样本。
在其中一个实施例中,基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,包括:
将所述目标场景语句样本输入所述训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果;
将所述输出结果作为所述待识别文本的预测结果。
在其中一个实施例中,将所述目标场景语句样本输入所述训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果,包括:
将所述目标场景语句样本输入场景识别模型,通过向量化处理模块得到所述目标场景语句样本的特征向量;
将所述特征向量通过特征提取模块进行特征提取,得到所述目标场景语句样本的属性信息,所述属性信息包括所述目标场景语句样本的词性和语言结构;
基于所述目标场景语句样本的属性信息,通过识别模块进行处理,得到所述待识别文本的输出结果。
在其中一个实施例中,获取待识别文本,确定所述待识别文本的意图信息,包括:
对所述待识别文本进行预处理,得到预处理后的文本;
将所述预处理的文本进行意图分析处理,得到所述待识别文本的意图信息。
在其中一个实施例中,所述语义识别模型中的每个场景识别模型的训练过程包括:
获取历史场景文本数据和与所述历史场景文本数据对应的历史场景识别结果;
将所述历史场景文本数据分为训练集和验证集;
利用所述训练集对待构建的场景识别模型进行训练,得到待验证的场景识别模型;
利用所述验证集中对所述待验证的场景识别模型,按照损失函数最小化对所述待验证的场景识别模型进行优化处理,得到场景识别模型。
第二方面,本申请提供了一种语义识别装置,该装置包括:
获取模块,用于获取待识别文本,确定所述待识别文本的意图信息;
确定模块,用于基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
识别模块,用于基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
第三方面,本申请实施例提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如上述第一方面的语义识别方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于实现如上第一方面的语义识别方法。
本申请实施例中提供的语义识别方法、装置、设备及存储介质,通过获取待识别文本,确定待识别文本的意图信息,并基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,然后基于目标场景语句样本和训练好的语义识别模型进行识别处理,得到待识别文本的预测结果,该语义识别模型包括多个场景识别模型,多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。与现有技术相比,该技术方案一方面,由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,另一方面,由于提供了多个场景识别模型,从而能够根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例提供的语义识别的应用系统的系统架构图;
图2为本申请实施例提供的语义识别方法的流程示意图;
图3为本申请实施例提供的语义识别的结构示意图;
图4为本申请实施例提供的训练场景识别模型方法的流程示意图;
图5为本申请实施例提供的语义识别装置的结构示意图;
图6为本申请另一实施例提供的语义识别装置的结构示意图;
图7为本申请实施例示出的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。为了便于理解,下面对本申请实施例涉及的一些技术术语进行解释:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件主要包括计算机视觉、语音处理技术、自然语言技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎么模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习使人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
可以理解的是,随着人工智能的不断发展,各个领域中都出现了基于文字的智能系统,由于语言的博大精深,机器需要准确理解文字的含义。目前,相关技术中采用识别模型来实现语义识别,然而该模型往往需要大量的语料进行训练,且训练得到的模型规模较大,在语义识别时较为片面,导致得到语义识别结果准确度低。还可以通过专家制定的规则进行语义识别,然而该方案需要大量人工参与,导致语义识别效率较低。
基于上述缺陷,本申请实施例提供了一种语义识别方法、装置、设备及存储介质,与现有技术相比,一方面,由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,另一方面,由于提供了多个场景识别模型,从而能够根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高,很大程度上提高了语义识别效率。
本申请实施例提供的方案涉及人工智能的自然语言处理以及机器学习等技术,具体通过下述实施例进行说明。
图1是本申请实施例提供的一种语义识别方法的实施环境架构图。如图1所示,该实施环境架构包括:终端100和服务器200。
终端100可以是各类AI应用场景中的终端设备。例如,终端100可以是智能电视、智能电视机顶盒等智能家居设备,或者终端100可以是智能手机、平板电脑以及电子书阅读器等移动式便携终端,或者,该终端100可以是智能眼镜、智能手表等智能可穿戴设备,本实施例对此不进行具体限定。
其中,终端100中可安装有基于自然语言处理的AI应用。比如,该AI应用可以是智能搜索、智能问答等应用。
服务器200可以是一台服务器,也可以是由若干台服务器构成的服务器集群,或者服务器200可以包含一个或多个虚拟化平台,或者服务器200可以是一个云计算服务中心。
其中,服务器200可以是为上述终端100中安装的AI应用提供后台服务的服务器设备。
终端100与服务器200之间通过有线或无线网络建立通信连接。可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan AreaNetwork,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。
上述基于自然语言处理的AI应用系统在提供AI应用服务的过程中,可以通过采用预设的文本相似度和语义识别模型对待识别文本进行识别,并根据识别结果提供AI应用服务。其中,上述语义识别模型可以设置在服务器200中,由服务器训练以及应用;或者,上述语义识别模型也可以设置在终端100中,并由服务器200训练及更新。
本申请实施例提供的语义识别方法可以应用于智能家居、车载语音、可穿戴设备、VR、机器人等不同领域场景,也可以分为:事实问答、知识检索、分类问题等场景。
为了便于理解和说明,下面通过图2至图7详细阐述本申请实施例提供的语义识别方法、装置、设备及存储介质。
图2所示为本申请实施例的语义识别方法的流程示意图,该方法可以由计算机设备执行,该计算机设备可以是上述图1所示系统中的服务器200或者终端100,或者,该计算机设备也可以是终端100和服务器200的结合。如图2所示,该方法包括:
S101、获取待识别文本,确定待识别文本的意图信息。
需要说明的是,该待识别文本是指需要进行语义识别的文本。其种类可以是一个,也可以是多个,例如该待识别文本可以是用户的某个语句,也可以是某篇文章的内容,其中,待识别文本中可以包括多个字或者多个词,也可以是由一个或者多个词构成的句子、段落。
本申请实施例中,上述待识别文本可以通过通过云端获取,也可以是通过数据库或区块链获取,还可以是通过外部设备导入获取待待识别文本。
具体地,在获取到待识别文本后,可以对待识别文本进行预处理,例如首先对待识别文本进行分词处理,然后去除重复冗余的信息、多余的符号或字符,从而得到预处理后的文本,然后对预处理后的文本进行意图分析处理,得到待识别文本的意图信息。
示例性地,当获取的待识别文本为“我真的真的想要看电影。”,可以去除对待识别文本进行分词处理得到“我”、“真的”、“真的”、“想要”、“看”、“电影”、“。”,然后去除重复冗余的信息“真的”和“。”,得到预处理后的文本,然后对预处理后的文本进行意图分析处理,得待待识别文本的意图信息可以为:我要看电影。
S102、基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本。
具体的,在获取到待识别文本的意图信息后,基于待识别文本的意图信息,确定意图信息的归属位置;当归属位置在历史场景语句样本中时,获取训练每个场景识别模型时对应的历史场景语句样本;采用预设的文本相似度算法,确定待识别文本的意图信息与历史场景语句样本的文本相似度;确定文本相似度符合预设规则的历史场景语句样本作为目标场景语句样本。当归属位置不在历史场景语句样本中时,将待识别文本的意图信息作为目标场景语句样本。
其中,上述预设规则可以根据实景需求自定义设置,例如可以是文本相似度大于某一预设阈值,也可以是文本相似度的比值大于某一阈值,本实施例对预设规则不做具体限定。
可选的,上述预设的文本相似度算法可以是基于余弦相似度确定的,还可以是采用TF-IDF(Term Frequency-Inverse Document Frequency)模型,还可以是基于语义的相似度的计算,也可以是通过编辑距离计算确定。例如,可以是通过分词处理,将待识别文本根据分词算法分为独立的词集合,并求出两个词集合的并集(词包),然后计算各自词集的词频并把词频向量化,并带入向量计算模型从而可以求出文本相似度。
需要说明的是,上述余弦相似度是通过一个向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异的大小。
S103、基于目标场景语句样本和训练好的语义识别模型进行识别处理,得到待识别文本的预测结果,语义识别模型包括多个场景识别模型,多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
需要说明的是,语义识别模型包括多个场景识别模型,每个场景识别模型对应的语义识别场景不同,训练每个场景识别模型时所采用的历史场景语句样本也不同。每个场景识别模型是通过对历史场景语句样本进行训练,从而学习到具备语义识别能力的网络结构模型。场景识别模型是输入为目标场景语句样本,输出为待识别样本的识别结果,且具有对待识别文本进行语义识别的能力,是能够预测语义的识别结果的神经网络模型。场景识别模型可以包括多层网络结构,不同层的网络结构对输入其的数据进行不同的处理,并将其输出结果传输至下一网络层,直至通过最后一个网络层进行处理,得到输出结果。
其中,上述场景识别模型可以包括:串联相接的输入层、融合层、字嵌入层、卷积层、全连接层、输出层等,每个层对应的功能不同。
可选的,在将目标场景语句样本输入至训练好的场景识别模型之前,还可以对目标场景语句样本进行预处理,例如进行分词处理,以确定命名基础。分词的作用是将一句话中的多个字有效的划分为一个或多个词,具体分词的方式较多,可以基于机械匹配法、特征词库法、约束矩阵法、语法分析法等以确定一个或多个词语。
在对目标场景语句样本进行预处理,得到预处理后的结果后,然后将其输入训练好的场景识别模型中进行识别处理,具体地,可以通过向量化处理模块得到目标场景语句样本的特征向量,然后将特征向量通过特征提取模块进行特征提取,得到目标场景语句样本的属性信息,该属性信息包括目标场景语句样本的词性和语言结构,并基于目标场景语句样本的属性信息,通过识别模块进行处理,得到待识别文本的输出结果。
本申请实施例中,上述向量化处理模块用于将不同的分词进行向量化处理,得到对应的特征向量,然后将特征向量通过特征提取模块进行特征提取,得到目标场景语句样本的属性信息。上述特征提取模块可以把抽象存在的文字转换为数学公式操作的向量,充分描述字符级、词级、句子级甚至句间关系特征。上述识别模块可以包括全连接层和激活函数,能够对特征提取模块输出的目标场景语句样本的属性信息进行分类,从而得到待识别文本的输出结果,该预测结果为待识别文本对应的语义类型,还可以包括语义文本。其中,上述属性信息包括目标场景语句样本的词性和语言结构。
其中,向量化处理模块为将语义空间关系转化为向量空间关系,即将语义文本转化为计算机设备能够进行处理的向量。
具体的,在获取到目标场景语句样本并对其进行预处理得到目标场景语句样本的字或词后,可以将该目标场景语句样本的字或词输入到训练好的场景识别模型中,通过向量化处理模块得到目标场景语句样本的特征向量,然后通过特征提取模块进行特征提取,得到目标场景语句样本的属性信息,并将目标场景语句样本的属性信息通过识别模块中的全连接层进行处理,得到全连接向量,采用激活函数对全连接向量进行处理,得到待识别样本的预测结果集合,预测结果集合包括多个标签种类,将多个预测结果集合中相同标签种类对应的概率值的最大值作为待识别文本的输出结果。可选的,可以将该预测结果集合中的标签种类对应的概率值进行从大到小排序,取其最大值为该待识别文本的标签种类。
具体的,该识别模块可以包括但不限于全连接层和激活函数。全连接层可以包括一层,或者也可以包括多层。全连接层主要是用于对待识别文本的属性信息进行分类的作用。
其中,上述激活函数可以是softmax函数,激活函数的作用是用来加入非线性因素,因为线性模型的表达能力不够,能够把输入的连续实值变换为0和1之间的输出。
本申请实施例中通过采用预设的文本相似度算法能够精准地确定出目标场景语句样本,为后续识别处理提供全面且准确的指导信息,并基于待识别文本的意图信息和训练好的语义识别模型进行识别处理,提高了语义识别的准确性。
进一步地,请参见图3所示,可以获取待识别文本3-1,并确定待识别文本的意图信息3-2,基于待识别文本的意图信息3-2,采用预设的文本相似度算法确定目标场景语句样本3-3,并基于目标场景语句样本3-3和训练好的语义识别模型3-4进行识别处理,该语义识别模型3-4可以包括第一场景识别模型、第二场景识别模型等多个场景识别模型,得到待识别文本的预测结果3-5。
示例性地,获取的待识别文本为“我要看电影”,然后对其进行预处理,去除重复冗余的信息,得到预处理后的文本,并对预处理后的文本进行意图分析处理,得到待识别文本的意图信息可以为:我要看电影。并基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,可以基于待识别文本的意图信息,确定意图信息的归属位置,当归属位置在历史场景语句样本中时,获取训练每个场景识别模型时对应的历史场景语句样本,例如获取的历史场景语句样本为“我想要看电影”,并将其作为目标场景语句样本。然后将目标场景语句样本输入训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果,并将该输出结果作为待识别文本的预测结果。
本申请实施例中提供的语义识别方法,通过获取待识别文本,确定待识别文本的意图信息,并基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,然后基于目标场景语句样本和训练好的语义识别模型进行识别处理,得到待识别文本的预测结果,该语义识别模型包括多个场景识别模型,多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。与现有技术相比,该技术方案一方面,由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,另一方面,由于提供了多个场景识别模型,从而能够根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高。
在其中一个实施例中,上述实施例中确定预测结果时包括预先训练好的语义识别模型中的每个场景识别模型,以下为对场景识别模型的训练过程的训练过程的描述。请参考图4,该方法可以包括:
S301、获取历史场景文本数据和与历史场景文本数据对应的历史场景识别结果。
S302、将历史场景文本数据分为训练集和验证集。
需要说明的是,上述该历史场景文本数据可以是多个,也可以是一个,其中,每个场景文本数据可以包括至少一个字或词,例如该场景文本数据可以包括多个字或词,可以是某个场景中提取的一些常用表达标准句。
具体的,在获取到历史场景文本数据后,可以将历史场景文本数据按照一定比例随机分为训练集和验证集,其中,训练集用于对初始场景识别模型进行训练,以得到训练好的场景识别模型,验证集用于对训练好的场景识别模型进行验证,以验证场景识别模型性能的好坏。
S303、利用训练集对待构建的场景识别模型进行训练,得到待验证的场景识别模型。
S304、利用验证集中对待验证的场景识别模型,按照损失函数最小化对待验证的场景识别模型进行优化处理,得到场景识别模型。
在将历史场景文本数据分为训练集和验证集之后,将训练集输入待构建的场景识别模型中,该待构建的场景识别模型包括多个相连的向量化处理模块、特征提取模块和识别模块,可以先对训练集通过特征向量化处理模块进行处理得到初始词向量,并将初始词向量输入至待构建的场景识别模型中的特征提取模块中,得到对应的结果,并将该结果输入至识别模块中,从而得到历史场景文本数据的输出结果。利用训练集对待构建的向量化处理模块、特征提取模块和识别模块进行训练,得到待验证的向量化处理模块、特征提取模块和识别模块。
计算机设备在训练场景识别模型的过程中,利用验证集中对待验证的向量化处理模块、特征提取模块和识别模块,按照损失函数最小化对待验证的向量化处理模块、特征提取模块和识别模块进行优化处理,得到向量化处理模块、特征提取模块和识别模块,根据该验证集输入待验证的场景识别模型中得到的结果和历史场景识别结果之间的差异,对待构建的场景识别模型中的参数进行更新,以实现对场景识别模型进行训练的目的,其中,上述历史场景识别结果可以是人工对历史场景文本数据进行标注得到的结果,可以包括历史场景文本数据对应的语义识别结果。
可选的,上述对待验证的场景识别模型中的参数进行更新,可以是对待构建的场景识别模型中的权重矩阵以及偏置矩阵等矩阵参数进行更新。其中,上述权重矩阵、偏置矩阵包括但不限于是待验证的场景识别模型中的自注意力层、前馈网络层、全连接层中的矩阵参数。
本申请实施例中,可以使用损失函数计算验证集输入待验证的场景识别模型中得到的结果和标签结果的损失值,从而对待验证的场景识别模型中的参数进行更新。可选的,损失函数可以使用交叉熵损失函数,归一化交叉熵损失函数,
其中,通过损失函数对待验证的场景识别模型中的参数进行更新时,可以是根据损失函数确定待验证的场景识别模型未收敛时,通过调整模型中的参数,以使得待验证的场景识别模型收敛,从而得到场景识别模型。待验证的场景识别模型收敛,可以是指待验证的场景识别模型对验证集的输出结果与训练数据的历史场景识别结果之间的差值小于预设阈值,或者,输出结果与训练数据的历史场景识别结果之间的差值的变化率趋近于某一个较低值。当计算的损失函数较小,或者,与上一轮迭代输出的损失函数之间的差值趋近于0,则认为待验证的场景识别模型收敛。
本实施例中通过训练场景识别模型,能够将目标场景语句样本通过训练好的场景识别模型进行识别处理,从而能够精准地得到待识别文本的预测结果,且无需大量的语料训练模型会节省很多实景,从而提高了语义识别效率,同时也节省了开发成本。
另一方面,图5为本申请实施例提供的一种语义识别装置的结构示意图。该装置可以为终端或服务器内的装置,如图5所示,该装置700包括:
获取模块710,用于获取待识别文本,确定所述待识别文本的意图信息;
确定模块720,用于基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
识别模块730,用于基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
可选的,请参见图6所示,上述确定模块720,包括:
第一确定单元721,用于基于待识别文本的意图信息,确定意图信息的归属位置;
获取单元722,用于当归属位置在历史场景语句样本中时,获取训练每个场景识别模型时对应的历史场景语句样本;
第二确定单元723,用于采用预设的文本相似度算法,确定待识别文本的意图信息与历史场景语句样本的文本相似度;
第三确定单元724,用于确定文本相似度符合预设规则的历史场景语句样本作为目标场景语句样本。
可选的,上述确定模块720,还用于:
当归属位置不在历史场景语句样本中时,将待识别文本的意图信息作为目标场景语句样本。
可选的,上述识别模块730,具体用于:
将目标场景语句样本输入训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果;
将输出结果作为待识别文本的预测结果。
可选的,上述识别模块730,具体用于:
将目标场景语句样本输入场景识别模型,通过向量化处理模块得到目标场景语句样本的特征向量;
将特征向量通过特征提取模块进行特征提取,得到目标场景语句样本的属性信息,属性信息包括目标场景语句样本的词性和语言结构;
基于目标场景语句样本的属性信息,通过识别模块进行处理,得到待识别文本的输出结果。
可选的,上述获取模块710,具体用于:
对待识别文本进行预处理,得到预处理后的文本;
将预处理的文本进行意图分析处理,得到待识别文本的意图信息。
可选的,语义识别模型中的每个场景识别模型的训练过程包括:
获取历史场景文本数据和与历史场景文本数据对应的历史场景识别结果;
将历史场景文本数据分为训练集和验证集;
利用训练集对待构建的场景识别模型进行训练,得到待验证的场景识别模型;
利用验证集中对待验证的场景识别模型,按照损失函数最小化对待验证的场景识别模型进行优化处理,得到场景识别模型。
可以理解的是,本实施例的语义识别装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,在此不再赘述。
综上所述,本申请实施例提供的语义识别装置,一方面,由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,另一方面,由于提供了多个场景识别模型,从而能够根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高。
另一方面,本申请实施例提供的计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如上述的语义识别方法。
下面参考图7,图7为本申请实施例的终端设备的计算机系统的结构示意图。
如图7所示,计算机系统300包括中央处理单元(CPU)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储部分303加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有系统300操作所需的各种程序和数据。CPU 301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
以下部件连接至I/O接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至I/O接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分303从网络上被下载和安装,和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元(CPU)301执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器,包括:获取模块、确定模块和识别模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块还可以被描述为“用于获取待识别文本,确定所述待识别文本的意图信息”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个或者一个以上的处理器用来执行描述于本申请的语义识别方法:
获取待识别文本,确定所述待识别文本的意图信息;
基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
综上所述,本申请实施例中提供的语义识别方法、装置、设备及存储介质,通过获取待识别文本,确定待识别文本的意图信息,并基于待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,然后基于目标场景语句样本和训练好的语义识别模型进行识别处理,得到待识别文本的预测结果,该语义识别模型包括多个场景识别模型,多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。与现有技术相比,该技术方案一方面,由于采用预设的文本相似度算法,能够准确地确定出目标场景语句样本,从而为后续语义识别提供了全面且准确的指导信息,另一方面,由于提供了多个场景识别模型,从而能够根据每个场景识别模型对目标场景语句样本进行识别处理,进而更细粒度地确定出待识别文本的预测结果,使得能够对待识别文本的语义识别的准确度更高。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种语义识别方法,其特征在于,包括:
获取待识别文本,确定所述待识别文本的意图信息;
基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
2.根据权利要求1所述的方法,其特征在于,基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本,包括:
基于所述待识别文本的意图信息,确定所述意图信息的归属位置;
当所述归属位置在所述历史场景语句样本中时,获取训练所述每个场景识别模型时对应的历史场景语句样本;
采用预设的文本相似度算法,确定待识别文本的意图信息与所述历史场景语句样本的文本相似度;
确定文本相似度符合预设规则的历史场景语句样本作为目标场景语句样本。
3.根据权利要求2所述的方法,其特征在于,在基于所述待识别文本的意图信息,确定所述意图信息的归属位置之后,所述方法还包括:
当所述归属位置不在所述历史场景语句样本中时,将所述待识别文本的意图信息作为目标场景语句样本。
4.根据权利要求1所述的方法,其特征在于,基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,包括:
将所述目标场景语句样本输入所述训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果;
将所述输出结果作为所述待识别文本的预测结果。
5.根据权利要求1所述的方法,其特征在于,将所述目标场景语句样本输入所述训练好的语义识别模型中的场景识别模型进行识别处理,得到输出结果,包括:
将所述目标场景语句样本输入场景识别模型,通过向量化处理模块得到所述目标场景语句样本的特征向量;
将所述特征向量通过特征提取模块进行特征提取,得到所述目标场景语句样本的属性信息,所述属性信息包括所述目标场景语句样本的词性和语言结构;
基于所述目标场景语句样本的属性信息,通过识别模块进行处理,得到所述待识别文本的输出结果。
6.根据权利要求1所述的方法,其特征在于,确定所述待识别文本的意图信息,包括:
对所述待识别文本进行预处理,得到预处理后的文本;
将所述预处理的文本进行意图分析处理,得到所述待识别文本的意图信息。
7.根据权利要求1所述的方法,其特征在于,所述语义识别模型中的每个场景识别模型的训练过程包括:
获取历史场景文本数据和与所述历史场景文本数据对应的历史场景识别结果;
将所述历史场景文本数据分为训练集和验证集;
利用所述训练集对待构建的场景识别模型进行训练,得到待验证的场景识别模型;
利用所述验证集中对所述待验证的场景识别模型,按照损失函数最小化对所述待验证的场景识别模型进行优化处理,得到场景识别模型。
8.一种语义识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别文本,确定所述待识别文本的意图信息;
确定模块,用于基于所述待识别文本的意图信息,采用预设的文本相似度算法确定目标场景语句样本;
识别模块,用于基于所述目标场景语句样本和训练好的语义识别模型进行识别处理,得到所述待识别文本的预测结果,所述语义识别模型包括多个场景识别模型,所述多个场景识别模型中每个场景识别模型是基于历史场景语句样本和对应的历史场景识别结果训练得到的。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器熵并可在处理器上运行的计算机程序,所述处理器用于执行所述程序时实现如权利要求1-7任一项所述的语义识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现如权利要求1-7任一项所述的语义识别方法。
CN202211065489.1A 2022-09-01 2022-09-01 语义识别方法、装置、设备及存储介质 Withdrawn CN115422944A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211065489.1A CN115422944A (zh) 2022-09-01 2022-09-01 语义识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211065489.1A CN115422944A (zh) 2022-09-01 2022-09-01 语义识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115422944A true CN115422944A (zh) 2022-12-02

Family

ID=84201544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211065489.1A Withdrawn CN115422944A (zh) 2022-09-01 2022-09-01 语义识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115422944A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150379A (zh) * 2023-04-04 2023-05-23 中国信息通信研究院 短信文本分类方法、装置、电子设备及存储介质
CN116361839A (zh) * 2023-05-26 2023-06-30 四川易景智能终端有限公司 一种基于nlp的涉密屏蔽方法
CN116822522A (zh) * 2023-06-13 2023-09-29 连连银通电子支付有限公司 一种语义分析方法、装置、设备及存储介质
CN116933800A (zh) * 2023-09-12 2023-10-24 深圳须弥云图空间科技有限公司 一种基于模版的生成式意图识别方法及装置
CN117009532A (zh) * 2023-09-21 2023-11-07 腾讯科技(深圳)有限公司 语义类型识别方法、装置、计算机可读介质及电子设备
CN117034031A (zh) * 2023-08-08 2023-11-10 武汉交通职业学院 基于沟通场景的语句生成方法及装置
CN117313723A (zh) * 2023-11-28 2023-12-29 广州云趣信息科技有限公司 一种基于大数据的语义分析方法、系统和存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150379A (zh) * 2023-04-04 2023-05-23 中国信息通信研究院 短信文本分类方法、装置、电子设备及存储介质
CN116361839A (zh) * 2023-05-26 2023-06-30 四川易景智能终端有限公司 一种基于nlp的涉密屏蔽方法
CN116361839B (zh) * 2023-05-26 2023-07-28 四川易景智能终端有限公司 一种基于nlp的涉密屏蔽方法
CN116822522A (zh) * 2023-06-13 2023-09-29 连连银通电子支付有限公司 一种语义分析方法、装置、设备及存储介质
CN116822522B (zh) * 2023-06-13 2024-05-28 连连银通电子支付有限公司 一种语义分析方法、装置、设备及存储介质
CN117034031A (zh) * 2023-08-08 2023-11-10 武汉交通职业学院 基于沟通场景的语句生成方法及装置
CN116933800A (zh) * 2023-09-12 2023-10-24 深圳须弥云图空间科技有限公司 一种基于模版的生成式意图识别方法及装置
CN116933800B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 一种基于模版的生成式意图识别方法及装置
CN117009532A (zh) * 2023-09-21 2023-11-07 腾讯科技(深圳)有限公司 语义类型识别方法、装置、计算机可读介质及电子设备
CN117009532B (zh) * 2023-09-21 2023-12-19 腾讯科技(深圳)有限公司 语义类型识别方法、装置、计算机可读介质及电子设备
CN117313723A (zh) * 2023-11-28 2023-12-29 广州云趣信息科技有限公司 一种基于大数据的语义分析方法、系统和存储介质
CN117313723B (zh) * 2023-11-28 2024-02-20 广州云趣信息科技有限公司 一种基于大数据的语义分析方法、系统和存储介质

Similar Documents

Publication Publication Date Title
CN111444340B (zh) 文本分类方法、装置、设备及存储介质
CN109241524B (zh) 语义解析方法及装置、计算机可读存储介质、电子设备
CN107679039B (zh) 用于确定语句意图的方法和装置
CN115422944A (zh) 语义识别方法、装置、设备及存储介质
CN109145294B (zh) 文本实体识别方法及装置、电子设备、存储介质
CN108694225B (zh) 一种图像搜索方法、特征向量的生成方法、装置及电子设备
CN114298121B (zh) 基于多模态的文本生成方法、模型训练方法和装置
CN112905868B (zh) 事件抽取方法、装置、设备及存储介质
CN110795944A (zh) 推荐内容处理方法及装置、情感属性确定方法及装置
CN112131881B (zh) 信息抽取方法及装置、电子设备、存储介质
CN113761868B (zh) 文本处理方法、装置、电子设备及可读存储介质
CN115759254A (zh) 基于知识增强生成式语言模型的问答方法、系统及介质
CN112307179A (zh) 文本匹配方法、装置、设备及存储介质
CN117217277A (zh) 语言模型的预训练方法、装置、设备、存储介质及产品
CN116680386A (zh) 基于多轮对话的答案预测方法和装置、设备、存储介质
CN115114469B (zh) 一种图片识别方法、装置、设备及存储介质
CN112599211B (zh) 一种医疗实体关系抽取方法及装置
CN117711001A (zh) 图像处理方法、装置、设备和介质
CN117034133A (zh) 一种数据处理方法、装置、设备和介质
CN117151089A (zh) 新词发现方法、装置、设备和介质
CN111723188A (zh) 用于问答系统的基于人工智能的语句显示方法、电子设备
CN115169352A (zh) 命名实体识别方法、装置、设备及存储介质
CN112949313A (zh) 信息处理模型训练方法、装置、设备及存储介质
CN117009532B (zh) 语义类型识别方法、装置、计算机可读介质及电子设备
CN118503411B (zh) 提纲生成方法、模型训练方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20221202