CN116955568A - 基于使用手册的问答方法、装置、电子设备及存储介质 - Google Patents
基于使用手册的问答方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116955568A CN116955568A CN202310966950.9A CN202310966950A CN116955568A CN 116955568 A CN116955568 A CN 116955568A CN 202310966950 A CN202310966950 A CN 202310966950A CN 116955568 A CN116955568 A CN 116955568A
- Authority
- CN
- China
- Prior art keywords
- question
- answered
- questions
- target text
- manual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 126
- 239000013598 vector Substances 0.000 claims description 40
- 230000011218 segmentation Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 51
- 238000004590 computer program Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于使用手册的问答方法、装置、电子设备及存储介质,所述基于使用手册的问答方法应用于车辆,包括以下步骤:获取用户输入的待回答问题;从所述使用手册中确定所述待回答问题对应的目标文本;通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。本申请解决了现有技术从车辆的使用手册中查找信息的效率较低的技术问题。
Description
技术领域
本申请涉及汽车技术领域,尤其涉及一种基于使用手册的问答方法、装置、电子设备及存储介质。
背景技术
随着汽车科技的不断升级,汽车功能越来越丰富且复杂,汽车使用手册中包含了车辆的基本信息,功能组件的使用方法,维修保养方法等信息,是用户使用车辆不可或缺的重要工具,目前通常是为用户提供纸质的使用手册,然而,从纸质的使用手册中查找信息需要用户仔细阅读和翻找纸质的使用手册,费时费力,效率较低。
发明内容
本申请的主要目的在于提供一种基于使用手册的问答方法、装置、电子设备及存储介质,旨在解决现有技术从车辆的使用手册中查找信息的效率较低的技术问题。
为实现上述目的,本申请提供一种基于使用手册的问答方法,所述基于使用手册的问答方法应用于车辆,包括以下步骤:
获取用户输入的待回答问题;
从所述使用手册中确定所述待回答问题对应的目标文本;
通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
本申请还提供一种基于使用手册的问答装置,所述基于使用手册的问答装置应用于车辆,包括:
第一获取模块,用于获取用户输入的待回答问题;
确定模块,用于从所述使用手册中确定所述待回答问题对应的目标文本;
生成模块,用于通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
本申请还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述的基于使用手册的问答方法的程序,所述的基于使用手册的问答方法的程序被处理器执行时可实现如上述的基于使用手册的问答方法的步骤。
本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现基于使用手册的问答方法的程序,所述的基于使用手册的问答方法的程序被处理器执行时实现如上述的基于使用手册的问答方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的基于使用手册的问答方法的步骤。
本申请提供了一种基于使用手册的问答方法、装置、电子设备及存储介质,通过获取用户输入的待回答问题,实现了用户提问的获得;进而通过从所述使用手册中确定所述待回答问题对应的目标文本,实现了对用户提问对应的答案所在文本范围的目标文本的确定;进而通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案,实现了利用大规模语言模型理解所述待回答问题以及所述目标文本,并根据所述目标文本的内容自动回答所述待回答问题。这样,一方面,相比于从纸质的使用手册中查找信息的方式,用户只需要进行提问即可获得答案,省时省力,效率得到有效提高;另一方面,大规模语言模型可以在理解用户提问以及目标文本的语义的情况下,根据目标文本自动回答用户提问,这样用户可以按照自己的语言习惯更为自由地提问,而无需为了匹配检索范式记忆并使用固定的但可能不符合用户语言习惯的语句或句式,减少了因待识别问题不匹配检索范式而导致反复多次提问的情况,提高了使用便捷性和回答效率。因此,克服了从纸质的使用手册中查找信息需要用户仔细阅读和翻找纸质的使用手册,费时费力,效率较低的技术缺陷,提高了从车辆的使用手册中查找信息的效率,提升了用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图得到其他的附图。
图1为本申请中采用高频问题问答的方式查询使用手册的场景示意图;
图2为本申请基于使用手册的问答方法的第一实施例的流程示意图;
图3为本申请实施例中语音助手的一种示例的结构示意图;
图4为本申请基于使用手册的问答方法的第二实施例的流程示意图;
图5本申请实施例中基于使用手册的问答装置的结构示意图;
图6为本申请实施例中基于使用手册的问答方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所得到的所有其它实施例,均属于本发明保护的范围。
随着汽车科技的不断升级,汽车功能越来越丰富且复杂,汽车使用手册中包含了车辆的基本信息,功能组件的使用方法,维修保养方法等信息,是用户使用车辆不可或缺的重要工具,目前通常是为用户提供纸质的使用手册,然而,从纸质的使用手册中查找信息需要用户仔细阅读和翻找纸质的使用手册,费时费力,效率较低。
随着车载智能化的发展,搭载语音助手的车辆也越来越多,将语音助手与车辆的使用手册相结合,不仅可以方便驾驶者快速查找需要的信息,且还能交互式地提供解决方案及操作指导,提高驾驶者的使用体验。目前,通过语音助手查询使用手册通常采用高频问题问答(Frequent Asked Question,FAQ)的方式实现,高频问题问答方法的实现,首先需要将使用手册的内容经人工整理成一个问答对,建立一个FAQ库,并且为每个问题分配一个唯一的标识符;进而,在用户提出问题后,系统就可以通过匹配FAQ库中相同或相似的问题,从而检索答案并反馈给用户,例如,参照图1,用户提出的问题为“怎么设置ACC跟车车速?”通过检索匹配到FAQ库中“ACC跟车车速如何设置?”的问题,进而将“ACC跟车车速如何设置?”对应的答案返回给用户。在FAQ方法中,主要的技术关键点在于如何将用户提出的问题与FAQ库中的问题精准的匹配,目前主要是采用神经网络模型将语料转换为特征向量,语料相似度的问题随之转换为易于衡量的向量距离的问题,然而,这种用于提取特征向量的神经网络模型需要大量的标注数据进行训练,训练的具体方法通常是:用两个语义相似的语料经过同一个模型提取特征向量,以缩小两个特征向量距离为目标优化模型参数,同时用两个语义不同的语料经过同一个模型提取特征向量,以扩大两个特征向量距离为目标优化调整模型参数,经过大量的正、负例样本对模型进行训练,使最终的模型提取的特征能够正确的反映两个语料之间的相似程度。由此可以发现,FAQ方法存在以下缺陷:第一,FAQ库的构建及维护成本较高,FAQ库前期需要人工整理标注和构建,后期需要人工持续更新补全知识库的知识条目以及新的用户提问方式,自动化程度低;第二,FAQ方法中的问题的匹配是按照固定的问答范式机械匹配的,例如,一个知识条目为“-问题:前挡风玻璃左下角上是什么?-答案:VIN码。”,FAQ的问答范式只能尝试匹配与“前挡风玻璃左下角是什么?”近似的问题并返回“VIN码”作为答案,如果用户反问“VIN码的位置在哪里?”,该方法就束手无策了,其他的复杂的问答意图还包括数学计算、比较、前提条件、多个问题合并等,也即,FAQ方法只能机械的匹配问题,无法回答复杂问题,不能真正理解语义,智能化程度低;第三,FAQ方法覆盖的知识点较少,由于语言的多样性,FAQ库中的问题很难全面覆盖全部可能的情形,因此通常是处理常用的高频问题,而较难全面覆盖各种提问方式以及使用手册中的全部内容;第三,需要大量人工先验的标注样本进行模型训练。
基于此,本申请提出一种基于使用手册的问答方法,相比于从纸质的使用手册中查找信息的方式,用户只需要进行提问即可获得答案,省时省力,效率得到有效提高。相比于FAQ方法,通过大规模语言模型,第一,可以无需构建和维护知识库,自动化程度高,用户仅需提问,目标文本的匹配以及大规模语言模型回答问题的过程均可自动化实现,无需人工参与;第二,智能化程度高,大规模语言模型可以在理解用户提问以及目标文本的语义的情况下,根据目标文本自动回答用户提问,这样用户可以按照自己的语言习惯更为自由地提问,而无需为了匹配检索范式记忆并使用固定的但可能不符合用户语言习惯的语句或句式;第三,本申请是以使用手册的全部内容为基础进行问答的,覆盖的知识范围更大;第四,大规模语言模型具有很强的零样本或少样本学习能力,也即,可以不提供语言任务的输入-输出样本,或仅提供少量样本,大规模语言模型即可学习用户对于语言任务的需求,输出结果。
实施例一
本申请实施例提供一种基于使用手册的问答方法,在本申请基于使用手册的问答方法的第一实施例中,参照图2,所述基于使用手册的问答方法应用于车辆,包括以下步骤:
步骤S10,获取用户输入的待回答问题;
本实施例方法的执行主体可以是一种基于使用手册的问答装置,也可以是一种基于使用手册的问答终端设备或服务器,本实施例以基于使用手册的问答装置进行举例,该基于使用手册的问答装置可以集成在具有数据处理功能的车载终端、车辆、智能手机、平板电脑、计算机等终端设备上。
在本实施例中,需要说明的是,所述基于使用手册的问答方法应用于车辆,所述使用手册是指车辆的使用手册,所述使用手册中包含了车辆的基本信息、功能组件的使用方法、维修保养方法等信息。
作为一种示例,所述步骤S10包括:通过能够与车辆通信连接的输入设备采集用户通过声音、文字和/或动作等形式提出的提问信息,进而通过声电转换、语音识别、图像识别、语义识别等方式将提问信息转换为以语言进行表示的待回答问题,其中,所述输入设备可以包括麦克风、输入框和传感器等中的至少一个,例如,可以通过车辆上自带的麦克风、车载终端上设置的麦克风或与车辆通信连接的手机上的麦克风采集用户的语音提问信息,可以通过车载终端的显示屏采集用户在显示屏上选择问题、手写问题或打字输入问题等操作信息获得提问信息,还可以通过其他传感器采集用户提问信息,例如摄像头采集用户指某个图标的动作并采集到“这是什么意思”的语音信息,即可获得“这个图标是什么意思”的待回答问题,等。
在一种可实施的方式中,所述基于使用手册的问答装置可以为语音助手,所述语音助手与所述车辆通信连接。其中,所述语音助手至少包括,语音识别模块和任务模块,还可以包括自然语言理解模块、对话管理模块、动作模块、文本生成模块、语音转换模块等中的一个或多个,其中,所述语音识别模块用于获取用户输入的待回答问题,还可以采集用户的其他语音信息,还可以通过前置噪声分离算法预处理,去除环境噪声的影响,还可以通过语音识别算法将语音输入转化为文本,最终转化为计算机能够识别的指令或查询内容等;所述任务模块用于从所述使用手册中确定所述待回答问题对应的目标文本,通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案,所述任务模块还可以响应用户提问执行其他任务,包括动作类任务,例如控制车辆相关功能组件、打开关闭功能、应用程序等,知识类任务,例如询问查询相关知识信息等,闲聊类任务,例如聊天、情感陪伴等,其他还可以包括导航、机票酒店预订等任务;所述自然语言理解模块用于对语音识别到的待回答问题进行语义理解,可以分析和解析出待回答问题中词语的主次关系和情感倾向等;所述对话管理模块用于理解用户意图并为待回答问题分配进行响应的任务模块,还可以记录、维护和更新对话的状态,还可以进行多轮连续对话管理等;所述动作模块用于完成任务模块产生的动作类响应,例如打开车窗、播放歌曲等;所述文本生成模块用于生成文本响应;所述语音转换模块用于将文本生成模块生成的文本转化为自然语音流,进而可以通过与车辆通信连接的扬声器输出,以响应用户提问。示例性地,参照图3,所述语音助手包括ASR(Automatic Speech Recognition,自动语音识别)模块、NLU(NatureLanguage Understanding,自然语言理解)模块、DM(Dialogue Management,对话管理)模块、任务模块、动作模块、文本生成模块和TTS(Text To Speech,从文本到语音)模块,可以通过ASR模块采集用户语音输入的待回答问题,通过NLU模块对语音识别到的待回答问题进行语义理解,所述DM模块根据NLU模块理解的语义,判断用户是否要查询用户手册,若是,则分配到用户手册查询对应的任务模块,执行用户手册查询的任务,进而通过用户手册查询对应的任务模块执行步骤S20至步骤S30,进而通过文本生成模块对任务模块输出的答案进行加工生成响应文本,例如可以添加打招呼、语气词等辅助语句,进而通过所述语音合成模块将所述响应文本转化为自然语音流,从而可以通过与车辆通信连接的扬声器输出所述响应文本对应的语音信息。
步骤S20,从所述使用手册中确定所述待回答问题对应的目标文本;
在本实施例中,需要说明的是,所述目标文本是指所述待回答问题对应的答案所在的文本范围,可以是所述使用手册的全部或部分内容。
作为一种示例,所述步骤S20包括:从所述使用手册中确定所述待回答问题对应的答案所在的文本范围,将所述待回答问题对应的答案所在的文本范围确定为所述待回答问题对应的目标文本。
在一种可实施的方式中,可以先进行关键词定位,定位后进行范围的划分,获得目标文本。所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤可以包括:从所述待回答问题中抽取至少一个关键词;从所述使用手册中模糊检索各所述关键词,并定位检索到的关键词的位置;截取所述关键词前后预设语句范围的使用手册的文本内容作为目标文本,其中,所述关键词可以是除人称代词之外的主语、宾语、名词、实义动词或者动词加名词的复合短语等,所述语句范围可以为预设数量的句子,预设数量的段落等,具体可以根据实际情况进行设置,本实施例对此不加以限制。
可选地,所述使用手册包括至少一个预切分段落,所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤包括:
步骤S21,确定所述待回答问题与各所述预切分段落之间的相关性;
步骤S22,将相关性最大的预切分段落确定为所述待回答问题对应的目标文本。
在本实施例中,需要说明的是,可以预先根据所述使用手册的结构特点预先将所述使用手册切分成多个预切分段落,例如,可以将xml格式的使用手册按照各级标题进行切分,将任意两个相邻标题之间的文本内容作为一个预切分段落。这样切分获得的预切分段落包含了独立且较为完整的信息点,且不会造成信息的切割。通过预先确定答案所在的目标文本,可以筛除掉使用手册中与提问和答案无关的预切分段落,仅将答案所在的目标文本输入模型,可以有效减少模型的计算量,节约计算资源,显著提高模型的处理效率。
作为一种示例,所述步骤S21至步骤S22包括:可以通过基于词频的统计类方法或基于嵌入计算相似度的方法等,确定所述待回答问题与各所述预切分段落之间的相关性,比较各所述相关性的大小,将相关性最大的预切分段落确定为所述待回答问题对应的目标文本。其中,基于嵌入计算相似度的方式可以为计算向量之间的点积、欧式距离、曼哈顿距离,余弦距离等。
可选地,所述确定所述待回答问题与各所述预切分段落之间的相关性的步骤包括:
步骤S211,通过嵌入模型生成所述待回答问题对应的问题向量;
步骤S212,获取各所述预切分段落各自对应的段落向量;
步骤S213,计算所述问题向量与各所述段落向量的点积,基于各所述点积确定所述待回答问题与各所述预切分段落之间的相关性,其中,所述相关性与所述点积负相关。
在本实施例中,需要说明的是,嵌入模型是一种用于将单词或句子表示为高维空间中的向量的技术,在该高维空间中,具有相似含义的向量彼此靠近,因此,通过嵌入模型转换后的向量能够用于测量单词或句子之间的语义相似性。所述嵌入模型可以为Word2Vec(一种用来产生词向量的相关模型)、GloVe(Global Vectors,一种词嵌入模型)、FastText(一种词嵌入模型)、Bert(Bidirectional Encoder Representation from Transformers,一种预训练的语言表征模型)、GPT(Generative Pre-Trained Transformer,一种生成式预训练深度学习模型)等,还可以在预训练模型上进行有监督微调以提高相关性计算的准确度。
作为一种示例,所述步骤S211至步骤S213包括:在获取到待回答问题之后,通过嵌入模型对所述待回答问题进行处理,转换为问题向量,获取各所述预切分段落各自对应的段落向量,计算所述问题向量与各所述段落向量的点积,比较各所述点积的大小,点积越小表示向量越接近,对应文本的相关性则越高,点积越大表示向量距离越远,对应文本的相关性则越低。例如,待回答问题Q对应的问题向量q与预切分段落P1对应的段落向量p1的点积为D1,待回答问题Q对应的问题向量q与预切分段落P2对应的段落向量p2的点积为D2,D1<D2,则说明,预切分段落P1与待回答问题Q之间的相关性高于预切分段落P2与待回答问题Q之间的相关性。
其中,所述段落向量可以在问答过程中实时进行转换,也可以预先将切分后的各所述预切分段落通过嵌入模型处理为对应的段落向量并存储到向量数据库中,在实际问答过程中,则可以直接从向量数据库中获取到各所述预切分段落各自对应的段落向量,而无需实时进行段落向量的转换,有效减少实际问答过程中的计算量和计算资源,提高问答效率。
可选地,所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤之前,包括:
步骤A10,在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
在本实施例中,需要说明的是,在语音助手的实际应用场景中,用户与语音助手常常会进行一轮或多轮对话,在多轮对话的过程中,用户由于语言习惯,可能会出现语句不完整的情况,例如,用户首次提问:“怎么开启自适应巡航?”,语音助手输出答案:“您可在组合仪表显示屏中通过方向盘左侧的功能菜单切换按键选择自适应巡航控制系统,选定后自适应巡航控制系统进入待机状态,自适应巡航控制系统(ACC)状态指示灯点亮,呈白色。”,如果用户想进一步继续询问“如何关闭自适应巡航”,则按照对话习惯,可能会直接提问:“那怎么关闭呢?”,若仅基于“那怎么关闭呢?”的待回答问题,则很大概率无法确定对应的目标文本,也很难生成正确的答案,因此还需要结合历史对话内容进行分析,理解用户实质上是还在继续之前的话题,也即用户提出的完整的待回答问题应该为“那怎么关闭自适应巡航呢?”,这样,就可以更精准地理解用户提问的意图,获得更精准的答案。
其中,所述上一段对话进程是指最近产生的对话进程,在获取到用户输入的待回答问题之后,可以通过时间间隔、语义分析等方式判断上一段对话进程是否结束,若判定上一段对话进程结束,则确定所述待回答问题不属于上一段对话进程;若判定上一段对话进程未结束,则确定所述待回答问题属于上一段对话进程。例如,可以根据接收到的待回答问题的时间戳与对话进程中最近一条语音信息之间的时间间隔是否小于预设时间间隔,判断对话进程是否结束;也可以通过上下文相关模型判断所述待回答问题与上一段对话进程的对话内容是否相关,从而判断对话进程是否结束;也可以通过输出判别语句,例如“请问您还有什么问题吗?”等,根据用户回复的语音信息判断一个对话进程是否结束,例如用户回复“没有了”则判断对话进程结束。也可以通过上下文相关模型判断所述待回答问题与上一段对话进程的对话内容是否相关,若判定所述待回答问题与上一段对话进程相关,则确定所述待回答问题属于上一段对话进程;若判定所述待回答问题与上一段对话进程不相关,则确定所述待回答问题不属于上一段对话进程。
作为一种示例,所述步骤A10包括:在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的全部或部分对话内容作为历史对话内容。
所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤包括:
步骤B10,根据所述历史对话内容和所述待回答问题,从所述使用手册中确定所述待回答问题对应的目标文本。
作为一种示例,所述步骤B10包括:结合所述历史对话内容和所述待回答问题,确定用户提问的实际语义信息,从而从所述使用手册中确定所述实际语义信息对应的答案所在的文本范围,将所述实际语义信息对应的答案所在的文本范围确定为所述待回答问题对应的目标文本。其中,所述实际语义信息可以为根据所述历史对话内容对所述待回答问题进行语义补全后的完整的待回答问题,也可以为由所述历史对话内容中的关键词和所述待回答问题中的关键词组成的词组,具体可以根据实际情况进行确定,本实施例对此不加以限制。
作为一种示例,所述步骤B10还可以包括:确定所述历史对话内容对应的历史目标文本,将所述历史目标文本确定为所述待回答问题对应的目标文本。在确定所述待回答问题属于上一段对话进程的情况下,对话的主题通常不会发生变化,因此可以直接将上一段对话进程中已经确定的历史目标文本确定为当前的待回答问题对应的目标文本,从而可以有效减少从使用手册中确定目标文本的时间,提高问答效率。
步骤S30,通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
在本实施例中,需要说明的是,所述大规模语言模型是指对话式LLM(LargeLanguage Model,大规模语言模型),包括chatGPT(一种大规模语言模型)、LLaMA(LargeLanguage Model Meta AI,一种大规模语言模型)、Alpaca(一种大规模语言模型)、Bloomz(BigScience Large Open-science Open-access Multilingual Language Model,一种大规模语言模型)、chatGLM(chat General Language Model,一种大规模语言模型)等经过指令微调(instruction-tuning)以及基于人类反馈的强化学习(Reinforcement learningbased on Humanfeedbak,RLHF)的大规模语言模型,其中,所述指令微调指用特定的规则或模板微调模型,引导模型习得做特定任务的能力,例如,在做阅读理解任务的时候,给输入加上前缀“请根据给定的上下文回答有关问题”,这样就可以通过自然的语言交互使模型完成指定的语言任务。传统的强化学习指智能体通过试错,并接受来自环境的奖励或者惩罚形式的反馈学习执行特定任务,所述基于人类反馈的强化学习是指把人类的反馈集成进来,从而使语言模型习得人类的语言偏好,以提供更符合人类习惯的回应。传统的机器学习模型在基于文本回答问题时,通常为片段式,即从上下文中抽取一个或多个片段作为问题的答案,模型返回的是片段的首尾位置,这类模型需要大量的标记数据训练,模型的精度不高,容易有缺字,漏字的现象,导致答案不完整,且多个片段拼凑时容易出现语义不流畅的情况。而对话式LLM具有很强的语言理解能力,利用对话式LLM的语义理解能力以及其适用于特定语言任务的能力,可以使其能够理解各式各样的问题,并根据给定的目标文本自动回答用户输入的待回答问题,返回的答案的质量高且语义流畅。
作为一种示例,所述步骤S30包括:将所述目标文本和所述待回答问题输入到大规模语言模型中,通过大规模语言模型理解所述目标文本以及所述待回答问题的语义,从而基于所述目标文本回答所述待回答问题,生成所述待回答问题对应的答案,并输出所述答案。
在本实施例中,通过获取用户输入的待回答问题,实现了用户提问的获得;进而通过从所述使用手册中确定所述待回答问题对应的目标文本,实现了对用户提问对应的答案所在文本范围的目标文本的确定;进而通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案,实现了利用大规模语言模型理解所述待回答问题以及所述目标文本,并根据所述目标文本的内容自动回答所述待回答问题。这样,一方面,相比于从纸质的使用手册中查找信息的方式,用户只需要进行提问即可获得答案,省时省力,效率得到有效提高;另一方面,大规模语言模型可以在理解用户提问以及目标文本的语义的情况下,根据目标文本自动回答用户提问,这样用户可以按照自己的语言习惯更为自由地提问,而无需为了匹配检索范式记忆并使用固定的但可能不符合用户语言习惯的语句或句式,减少了因待识别问题不匹配检索范式而导致反复多次提问的情况,提高了使用便捷性和回答效率。因此,克服了从纸质的使用手册中查找信息需要用户仔细阅读和翻找纸质的使用手册,费时费力,效率较低的技术缺陷,提高了从车辆的使用手册中查找信息的效率,提升了用户体验。
实施例二
进一步地,参照图4,基于本申请上述实施例,在本申请的第二实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案的步骤包括:
步骤S31,获取预设计提示模板;
在本实施例中,需要说明的是,在使用大规模语言模型回答用户输入的待回答问题的过程中,可以通过提示引导大规模语言模型更稳定且更准确地执行特定的任务。例如,在做阅读理解任务的时候,通过“请根据给定的上下文回答有关问题”的提示,就可以通过自然的语言交互使大规模语言模型完成指定的阅读理解任务。其中,提示是基于预设计提示模板生成的,所述预设计提示模板是预先人工设计和调试获得的。
作为一种示例,所述步骤S31包括:获取预先设计好的预设计提示模板。
可选地,所述预设计提示模板包括多轮对话提示模板和单轮对话提示模板,所述获取预设计提示模板的步骤包括:
步骤S311,在确定所述待回答问题属于上一段对话进程的情况下,获取预设计多轮对话提示模板;
步骤S312,在确定所述待回答问题不属于上一段对话进程的情况下,获取预设计单轮对话提示模板。
在本实施例中,需要说明的是,单轮对话是指所述待回答问题所属的对话与之前的对话内容不相关而形成了新的对话进程,在新的对话进程中当前仅包含所述待回答问题所属的对话,因此称为单轮对话;多轮对话是指所述待回答问题所属的对话与之前的对话内容相关,因此属于之前的对话进程,在这段对话进程中包含了多条对话,因此称为多轮对话;预设计提示模板用于关联目标文本和待回答问题并生成目标提示,在单轮对话的情况下,待回答问题通常较为完整,因此仅根据待回答问题和目标文本即可较为精确地生成答案,而在多轮对话的情况下,待回答问题可能出现语句不完整的情况,因此,仅根据待回答问题和目标文本可能会出现错误理解待回答问题的情况,也即,可能还会需要结合历史对话内容或通过语音助手补充提问后获取到的补充内容等补充信息进行语义理解。因此针对单轮对话和多轮对话可以设计不同的预设计提示模板,预设计提示模板的具体设计可以由相关工作人员根据实际情况进行设计和调整,本实施例对此不加以限制。
作为一种示例,所述步骤S311至步骤S312包括:在确定所述待回答问题属于上一段对话进程的情况下,获取预设计多轮对话提示模板;在确定所述待回答问题不属于上一段对话进程的情况下,获取预设计单轮对话提示模板。
步骤S32,根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示;
作为一种示例,所述步骤S32包括:将所述目标文本以及所述待回答问题填入所述预设计提示模板中,通过所述预设计提示模板将所述目标文本和所述待回答问题连接组成目标提示。
在一种可实施的方式中,在确定所述待回答问题属于上一段对话进程的情况下,可以获取补充信息,进而将所述目标文本、所述待回答问题和所述补充信息填入到预设计多轮对话提示模板中,生成多轮对话目标提示,其中,所述补充信息包括历史对话内容以及通过语音助手补充提问后获取到的补充内容等,所述多轮对话目标提示用于引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案。
在一种可实施的方式中,在确定所述待回答问题不属于上一段对话进程的情况下,则可以直接将所述目标文本和所述待回答问题填入到预设计单轮对话提示模板中,生成单轮对话目标提示,其中,所述单轮对话目标提示用于引导大规模语言模型基于所述目标文本生成所述待回答问题对应的答案。
可选地,所述目标提示包括多轮对话目标提示,所述根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示的步骤之前,包括:
步骤C10,在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
在本实施例中,需要说明的是,在所述获取到用户输入的待回答问题的步骤之后,在所述根据所述目标文本、所述待回答问题、所述预设计多轮对话提示模板和所述历史对话内容,生成多轮对话目标提示的步骤之前,均可以通过时间间隔、语义分析等方式判断上一段对话进程是否结束,若判定上一段对话进程结束,则确定所述待回答问题不属于上一段对话进程;若判定上一段对话进程未结束,则确定所述待回答问题属于上一段对话进程。例如,可以根据接收到的待回答问题的时间戳与对话进程中最近一条语音信息之间的时间间隔是否小于预设时间间隔,判断对话进程是否结束;也可以通过上下文相关模型判断所述待回答问题与上一段对话进程的对话内容是否相关,从而判断对话进程是否结束;也可以通过输出判别语句,例如“请问您还有什么问题吗?”等,根据用户回复的语音信息判断一个对话进程是否结束,例如用户回复“没有了”则判断对话进程结束。也可以通过上下文相关模型判断所述待回答问题与上一段对话进程的对话内容是否相关,若判定所述待回答问题与上一段对话进程相关,则确定所述待回答问题属于上一段对话进程;若判定所述待回答问题与上一段对话进程不相关,则确定所述待回答问题不属于上一段对话进程。
作为一种示例,所述步骤C10包括:在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的全部或部分对话内容作为历史对话内容。
在一种可实施的方式中,在所述步骤A10已经执行的情况下,所述步骤C10可以执行,也可以不执行。示例性地,所述基于使用手册的问答方法可以包括以下步骤:获取用户输入的待回答问题;在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;根据所述历史对话内容和所述待回答问题,从所述使用手册中确定所述待回答问题对应的目标文本;获取预设计多轮对话提示模板;根据所述目标文本、所述待回答问题、所述预设计多轮对话提示模板和所述历史对话内容,生成多轮对话目标提示,其中,所述多轮对话目标提示用于引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案;通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
所述根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示的步骤包括:
步骤S321,根据所述目标文本、所述待回答问题、所述预设计多轮对话提示模板和所述历史对话内容,生成多轮对话目标提示,其中,所述多轮对话目标提示用于引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案。
作为一种示例,所述步骤S321包括:将所述目标文本、所述待回答问题以及所述历史对话内容填入所述预设计多轮对话提示模板中,生成多轮对话目标提示,以通过所述多轮对话提示引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案。
步骤S33,通过大规模语言模型,在所述目标提示的指引下,基于所述目标文本生成所述待回答问题对应的答案。
作为一种示例,所述步骤S33包括:将所述目标文本、所述待回答问题以及所述目标提示输入大规模语言模型中,通过所述目标提示引导所述大规模语言模型理解所述目标文本以及所述待回答问题的语义,从而基于所述目标文本回答所述待回答问题,生成所述待回答问题对应的答案,并输出所述答案。
在本实施例中,通过预设计提示模板可以将目标文本和待回答问题进行关联,从而通过组成的目标提示可以引导大规模语言模型更稳定且更准确地执行特定的任务,生成更精准的答案。
实施例三
进一步地,本申请实施例还提供一种基于使用手册的问答装置,参照图5,所述基于使用手册的问答装置应用于车辆,包括:
第一获取模块10,用于获取用户输入的待回答问题;
确定模块20,用于从所述使用手册中确定所述待回答问题对应的目标文本;
生成模块30,用于通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
可选地,所述使用手册包括至少一个预切分段落,所述确定模块20,还用于:
确定所述待回答问题与各所述预切分段落之间的相关性;
将相关性最大的预切分段落确定为所述待回答问题对应的目标文本。
可选地,所述确定模块20,还用于:
通过嵌入模型生成所述待回答问题对应的问题向量;
获取各所述预切分段落各自对应的段落向量;
计算所述问题向量与各所述段落向量的点积,基于各所述点积确定所述待回答问题与各所述预切分段落之间的相关性,其中,所述相关性与所述点积负相关。
可选地,所述从所述使用手册中确定所述待回答问题对应的目标文本的操作之前,所述基于使用手册的问答装置还包括第二获取模块,所述第二获取模块用于:
在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
所述确定模块20,还用于:
根据所述历史对话内容和所述待回答问题,从所述使用手册中确定所述待回答问题对应的目标文本。
可选地,生成模块30,还用于:
获取预设计提示模板;
根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示;
通过大规模语言模型,在所述目标提示的指引下,基于所述目标文本生成所述待回答问题对应的答案。
可选地,生成模块30,还用于:
在确定所述待回答问题属于上一段对话进程的情况下,获取预设计多轮对话提示模板;
在确定所述待回答问题不属于上一段对话进程的情况下,获取预设计单轮对话提示模板。
可选地,所述目标提示包括多轮对话目标提示,所述根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示的操作之前,所述基于使用手册的问答装置还包括第三获取模块,所述第三获取模块用于:
在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
所述生成模块30,还用于:
根据所述目标文本、所述待回答问题、所述预设计多轮对话提示模板和所述历史对话内容,生成多轮对话目标提示,其中,所述多轮对话目标提示用于引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案。
本发明提供的基于使用手册的问答装置,采用上述实施例中的基于使用手册的问答方法,解决了现有技术从车辆的使用手册中查找信息的效率较低的技术问题。与现有技术相比,本发明实施例提供的基于使用手册的问答装置的有益效果与上述实施例提供的基于使用手册的问答方法的有益效果相同,且该基于使用手册的问答装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
进一步地,本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的基于使用手册的问答方法。
下面参考图6,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如蓝牙耳机、移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等的移动终端以及诸如数字TV、台式计算机等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数组。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数组。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例中的基于使用手册的问答方法,解决了现有技术从车辆的使用手册中查找信息的效率较低的技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例提供的基于使用手册的问答方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例五
进一步地,本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的基于使用手册的问答方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取用户输入的待回答问题;从所述使用手册中确定所述待回答问题对应的目标文本;通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的计算机可读存储介质,存储有用于执行上述基于使用手册的问答方法的计算机可读程序指令,解决了现有技术从车辆的使用手册中查找信息的效率较低的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例提供的基于使用手册的问答方法的有益效果相同,在此不做赘述。
实施例六
进一步地,本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的基于使用手册的问答方法的步骤。
本申请提供的计算机程序产品解决了现有技术从车辆的使用手册中查找信息的效率较低的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例提供的基于使用手册的问答方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种基于使用手册的问答方法,其特征在于,所述基于使用手册的问答方法应用于车辆,包括以下步骤:
获取用户输入的待回答问题;
从所述使用手册中确定所述待回答问题对应的目标文本;
通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
2.如权利要求1所述的基于使用手册的问答方法,其特征在于,所述使用手册包括至少一个预切分段落,所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤包括:
确定所述待回答问题与各所述预切分段落之间的相关性;
将相关性最大的预切分段落确定为所述待回答问题对应的目标文本。
3.如权利要求2所述的基于使用手册的问答方法,其特征在于,所述确定所述待回答问题与各所述预切分段落之间的相关性的步骤包括:
通过嵌入模型生成所述待回答问题对应的问题向量;
获取各所述预切分段落各自对应的段落向量;
计算所述问题向量与各所述段落向量的点积,基于各所述点积确定所述待回答问题与各所述预切分段落之间的相关性,其中,所述相关性与所述点积负相关。
4.如权利要求1所述的基于使用手册的问答方法,其特征在于,所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤之前,包括:
在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
所述从所述使用手册中确定所述待回答问题对应的目标文本的步骤包括:
根据所述历史对话内容和所述待回答问题,从所述使用手册中确定所述待回答问题对应的目标文本。
5.如权利要求1所述的基于使用手册的问答方法,其特征在于,所述通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案的步骤包括:
获取预设计提示模板;
根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示;
通过大规模语言模型,在所述目标提示的指引下,基于所述目标文本生成所述待回答问题对应的答案。
6.如权利要求5所述的基于使用手册的问答方法,其特征在于,所述预设计提示模板包括多轮对话提示模板和单轮对话提示模板,所述获取预设计提示模板的步骤包括:
在确定所述待回答问题属于上一段对话进程的情况下,获取预设计多轮对话提示模板;
在确定所述待回答问题不属于上一段对话进程的情况下,获取预设计单轮对话提示模板。
7.如权利要求6所述的基于使用手册的问答方法,其特征在于,所述目标提示包括多轮对话目标提示,所述根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示的步骤之前,包括:
在确定所述待回答问题属于上一段对话进程的情况下,获取所述上一段对话进程的历史对话内容;
所述目标提示包括多轮对话目标提示,所述根据所述目标文本、所述待回答问题和所述预设计提示模板,生成目标提示的步骤包括:
根据所述目标文本、所述待回答问题、所述预设计多轮对话提示模板和所述历史对话内容,生成多轮对话目标提示,其中,所述多轮对话目标提示用于引导大规模语言模型基于所述历史对话内容对所述待回答问题进行语义补全,以及引导大规模语言模型基于所述目标文本生成语义补全后的所述待回答问题对应的答案。
8.一种基于使用手册的问答装置,其特征在于,所述基于使用手册的问答装置应用于车辆,包括:
第一获取模块,用于获取用户输入的待回答问题;
确定模块,用于从所述使用手册中确定所述待回答问题对应的目标文本;
生成模块,用于通过大规模语言模型,基于所述目标文本生成所述待回答问题对应的答案,输出所述答案。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的基于使用手册的问答方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现基于使用手册的问答方法的程序,所述实现基于使用手册的问答方法的程序被处理器执行以实现如权利要求1至7中任一项所述的基于使用手册的问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310966950.9A CN116955568A (zh) | 2023-08-02 | 2023-08-02 | 基于使用手册的问答方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310966950.9A CN116955568A (zh) | 2023-08-02 | 2023-08-02 | 基于使用手册的问答方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116955568A true CN116955568A (zh) | 2023-10-27 |
Family
ID=88452831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310966950.9A Pending CN116955568A (zh) | 2023-08-02 | 2023-08-02 | 基于使用手册的问答方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955568A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633179A (zh) * | 2023-11-30 | 2024-03-01 | 武汉铁路职业技术学院 | 一种铁路行业智能问答助手系统 |
-
2023
- 2023-08-02 CN CN202310966950.9A patent/CN116955568A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633179A (zh) * | 2023-11-30 | 2024-03-01 | 武汉铁路职业技术学院 | 一种铁路行业智能问答助手系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10418032B1 (en) | System and methods for a virtual assistant to manage and use context in a natural language dialog | |
US8788267B2 (en) | Multi-purpose contextual control | |
RU2494476C2 (ru) | Способ и система для предоставления речевого интерфейса | |
US20060155765A1 (en) | Chat information service system | |
US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
KR101322486B1 (ko) | 범용 대화서비스 장치 및 그 방법 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
EP2309492A1 (en) | System and method for activating plurality of functions based on speech input | |
CN116955568A (zh) | 基于使用手册的问答方法、装置、电子设备及存储介质 | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
CN114550713A (zh) | 对话系统、车辆以及对话系统的控制方法 | |
Becker et al. | Natural and intuitive multimodal dialogue for in-car applications: The SAMMIE system | |
CN111324626B (zh) | 基于语音识别的搜索方法、装置、计算机设备及存储介质 | |
CN114201102B (zh) | 信息处理方法、装置及存储介质 | |
WO2021254838A1 (en) | Driving companion comprising a natural language understanding system and method for training the natural language understanding system | |
US20060149545A1 (en) | Method and apparatus of speech template selection for speech recognition | |
Forlines et al. | A comparison between spoken queries and menu-based interfaces for in-car digital music selection | |
JP2015052745A (ja) | 情報処理装置、制御方法、及びプログラム | |
CN114822598A (zh) | 服务器及语音情感识别方法 | |
CN116168704B (zh) | 语音交互的引导方法、装置、设备、介质及车辆 | |
CN117235237B (zh) | 一种文本生成方法及相关装置 | |
KR102185784B1 (ko) | 음향 데이터 탐색 방법 및 장치 | |
KR20240103748A (ko) | 챗봇 서비스 제공 방법 및 챗봇 서비스 제공 시스템 | |
Gunarto | Applications of AI-empowered electric vehicles for voice recognition in Asian and Austronesian languages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |