CN117009477A

CN117009477A - 一种语言模型问题回答优化方法及其系统

Info

Publication number: CN117009477A
Application number: CN202310721194.3A
Authority: CN
Inventors: 刘德建; 陈丛亮; 李佳
Original assignee: Fujian Tianqing Online Interactive Technology Co Ltd
Current assignee: Fujian Tianqing Online Interactive Technology Co Ltd
Priority date: 2023-06-19
Filing date: 2023-06-19
Publication date: 2023-11-07

Abstract

本发明涉及一种语言模型问题回答优化方法，方法为：对未训练过的内容进行分词生成文本，再生成文本的词向量，保存在本地词向量库；输入问题，本地词向量库根据输入的问题生成问题词向量；通过词向量余弦算法获取本地词向量库中句子的向量与问题词向量之间的相似度，选取相似度最高的若干个句子；将相似度最高的若干个句子和问题发送给语言模型；语言模型接收若干个句子和问题，经过处理返回正确率最高的答案，能够提高回答语言模型中未训练过的内容的问题的准确性，对于未训练过的内容，只需把未训练过的内容的段落拆分开，只提取出和问题最相关的片段给语言模型，就能回答问题，一定程度上解决字数限制的问题。

Description

一种语言模型问题回答优化方法及其系统

技术领域

本发明涉及计算机领域，特别是一种语言模型问题回答优化方法及其系统。

背景技术

语言模型通过对句子的上下文特征进行数学建模，来回答一个问题:出现的句子是否合理，语言模型是自然语言的基础，广泛应用于机器翻译语音识别、拼写纠错、输入法、手写体识别等。

目前使用语言模型进行提问回答，由于很多语言模型都是训练好的，在使用时候都有字数限制，对于未训练过的内容，语言模型无法很好的回答问题。目前只能通过对语言模型进行额外训练才能解决。

发明内容

为克服现有语言模型有字数限制，并且在回答未训练过的问题时，输出答案准确率低的问题，本发明的目的是提供一种语言模型问题回答优化方法及其系统，能够提高回答语言模型中不存在的内容的问题的准确性，并且解决字数限制的问题。

本发明采用以下方案实现：

一种语言模型问题回答优化方法，所述方法步骤如下：

步骤1：对未训练过的内容进行分词生成文本，再生成文本的词向量，保存在本地词向量库；

步骤2：输入问题，根据输入的问题生成问题词向量；

步骤3：通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度，选取相似度最高的若干个句子；

步骤4：将相似度最高的若干个句子和问题发送给语言模型；

步骤5：语言模型接收若干个句子和问题，经过处理返回正确率最高的答案。

进一步的，步骤1进一步具体为：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库。

进一步的，步骤2进一步具体为：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。

进一步的，步骤3进一步具体为：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

进一步的，步骤4进一步具体为：通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。

一种语言模型问题回答优化系统，所述系统包括词向量生成模块、问题词向量生成模块、相似度计算模块、输入模块、输出模块；

所述词向量生成模块用于对未训练过的内容进行分词生成文本，再生成文本的词向量，保存在本地词向量库；

所述问题词向量生成模块用于输入问题，根据输入的问题生成问题词向量；

所述相似度计算模块用于通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度，选取相似度最高的若干个句子；

所述输入模块用于将相似度最高的若干个句子和问题发送给语言模型；

所述输出模块用于语言模型接收若干个句子和问题，经过处理返回正确率最高的答案。

进一步的，词向量生成模块进一步具体为：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库。

进一步的，问题词向量生成模块进一步具体为：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。

进一步的，相似度计算模块进一步具体为：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

进一步的，输入模块进一步具体为：通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。

本发明的有益效果在于：

本发明提供了一种语言模型问题回答优化方法及其系统，能够提高回答语言模型中不存在的内容的问题的准确性，对于未训练过的内容，只需把未训练过的内容的段落拆分开，只提取出和问题最相关的片段给语言模型，就能回答问题，在一定程度上解决字数限制的问题。

附图说明

图1为本发明方法的流程图；

图2为本发明系统的结构框图。

具体实施方式

下面结合附图对本发明做进一步说明。

请参见图1，一种语言模型问题回答优化方法，所述方法步骤如下：

步骤2：输入问题，根据输入的问题生成问题词向量；

步骤4：将相似度最高的若干个句子和问题发送给语言模型；

下面结合一个具体实施例来对本发明进行进一步说明：

一种语言模型问题回答优化方法，所述方法如下：

步骤1：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库；有如下未训练的内容：

1.“今天，A国宣布对B国加征关税。这一决定引发了全球股市的动荡。”

2.”IPHONE14采用1200万像素主摄：26毫米焦距，f/1.5光圈，传感器位移式光学图像防抖功能，七镜式镜头，100％Focus Pixels芯片采用A156核。”

对于第一句话和问题：

首先将第一句话“今天，A国宣布对B国加征关税。这一决定引发了全球股市的动荡。”转换成词向量v1，设为：

v1＝[0.2,0.3,-0.1,0.5,0.8]；

将第二句话“IPHONE14采用1200万像素主摄：26毫米焦距，f/1.5光圈，传感器位移式光学图像防抖功能，七镜式镜头，100％Focus Pixels芯片采用A156核”转换为词向量v2，设为：

v2＝[0.1,-0.3,0.5,0.6,-0.2]；

步骤2：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。

再将问题“iPhone用到了什么摄像头？”转化成词向量v3，

v3＝[0.9,-0.5,0.2,0.3,0.1]；

步骤3：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

cosine_similarity(v1,v3)＝dot(v1,v3)/(norm(v1)*norm(v3))＝(0.2*0.9+0.3*(-0.5)+(-0.1)*0.2+0.5*0.3+0.8*0.1)/(sqrt(0.2^2+0.3^2+(-0.1)^2+0.5^2+0.8^2)*sqrt(0.9^2+(-0.5)^2+0.2^2+0.3^2+0.1^2))≈0.2；

其中：cosine_similarity(v1,v3)表示计算v1和v3余弦相似度，dot(v1,v3)表示v1和v3两个向量点乘，norm(v1)表示向量v1的长度(模)，norm(v3)表示向量v3的长度(模)，sqrt表示求平方根。

cosine_similarity(v2,v3)＝dot(v2,v3)/(norm(v2)*norm(v3))＝(0.1*0.9+(-0.3)*(-0.5)+0.5*0.2+0.6*0.3+(-0.2)*0.1)/(sqrt(0.1^2+(-0.3)^2+0.5^2+0.6^2+(-0.2)^2)*sqrt(0.9^2+(-0.5)^2+0.2^2+0.3^2+0.1^2))≈0.8；

其中：cosine_similarity(v2,v3)表示计算v2和v3余弦相似度，dot(v2,v3)表示v2和v3两个向量点乘，norm(v2)表示向量v2的长度(模)，norm(v3)表示向量v3的长度(模)，sqrt表示求平方根。

得出第二句相似度更高。

步骤4：相似度最高的句子加上问题一起发给语言模型，通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。

”IPHONE14采用1200万像素主摄：26毫米焦距，f/1.5光圈，传感器位移式光学图像防抖功能，七镜式镜头，100％Focus Pixels芯片采用A156核”+“iPhone用到了什么摄像头？”

两个字符串找模版拼接后发给语言模型，这里最简单的模版就是直接拼接，复杂的可以定义前后辅助词。

步骤5：语言模型接收上面的句子+问题，根据语言模型已经训练好的参数和语言模型的神经网络结构，就能预测输出回答的答案。

这里语言模型是比较强的问题回答模型，只是它可能没有学过新的知识，并且语言模型一次性输入的内容有限制，有的语言模型只能接收2000个字。如果有10000字的内容，我们要从中提取想要的答案(内容)，所以通过本地词向量库先提取出与问题相关的句子或段落，尽可能的把和问题相关的内容压缩到2000个字以内发送给它回答。

参见图2，一种语言模型问题回答优化系统，所述系统包括词向量生成模块、问题词向量生成模块、相似度计算模块、输入模块、输出模块；

词向量生成模块进一步具体为：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库；

问题词向量生成模块进一步具体为：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。答案其实就是一个回答问题句子，句子在本地词向量库中已经转化成词向量了，通过计算向量之间的距离就能够获取相似度近似的若干个句子。

相似度计算模块进一步具体为：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

输入模块进一步具体为：通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。

总之，本发明提供了一种语言模型问题回答优化方法及其系统，能够提高回答语言模型中不存在的内容的问题的准确性，并且一定程度上解决字数限制的问题。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种语言模型问题回答优化方法，其特征在于，所述方法步骤如下：

步骤2：输入问题，本地词向量库根据输入的问题生成问题词向量；

步骤3：通过词向量余弦算法获取本地词向量库中句子的向量与问题词向量之间的相似度，选取相似度最高的若干个句子；

步骤4：将相似度最高的若干个句子和问题发送给语言模型；

2.根据权利要求1所述的一种语言模型问题回答优化方法，其特征在于，步骤1进一步具体为：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库。

3.根据权利要求1所述的一种语言模型问题回答优化方法，其特征在于，步骤2进一步具体为：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。

4.根据权利要求1所述的一种语言模型问题回答优化方法，其特征在于，步骤3进一步具体为：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

5.根据权利要求1所述的一种语言模型问题回答优化方法，其特征在于，步骤4进一步具体为：通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。

6.一种语言模型问题回答优化系统，其特征在于，所述系统包括词向量生成模块、问题词向量生成模块、相似度计算模块、输入模块、输出模块；

7.根据权利要求6所述的一种语言模型问题回答优化系统，其特征在于，词向量生成模块进一步具体为：通过jieba分词工具对未训练过的内容进行分词，通过word2vec库将文本转为词向量，保存在本地词向量库。

8.根据权利要求6所述的一种语言模型问题回答优化系统，其特征在于，问题词向量生成模块进一步具体为：输入问题，在本地词向量库中，将输入的问题转成一个的问题词向量，问题词向量能够匹配到相近距离的句子的向量或段落的向量。

9.根据权利要求6所述的一种语言模型问题回答优化系统，其特征在于，相似度计算模块进一步具体为：通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度，得到一个相似度矩阵，所述相似度矩阵中每个元素表示两个句子之间的相似度得分，从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。

10.根据权利要求6所述的一种语言模型问题回答优化系统，其特征在于，输入模块进一步具体为：通过模版字符串拼接的方式，把问题和若干个句子，提交给语言模型。