WO2024041009A1 - 生成问答对的方法、装置、计算机集群和存储介质 - Google Patents

生成问答对的方法、装置、计算机集群和存储介质 Download PDF

Info

Publication number
WO2024041009A1
WO2024041009A1 PCT/CN2023/090345 CN2023090345W WO2024041009A1 WO 2024041009 A1 WO2024041009 A1 WO 2024041009A1 CN 2023090345 W CN2023090345 W CN 2023090345W WO 2024041009 A1 WO2024041009 A1 WO 2024041009A1
Authority
WO
WIPO (PCT)
Prior art keywords
question
answer
answer pair
target
user
Prior art date
Application number
PCT/CN2023/090345
Other languages
English (en)
French (fr)
Inventor
常华亭
段新宇
王喆锋
怀宝兴
Original Assignee
华为云计算技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为云计算技术有限公司 filed Critical 华为云计算技术有限公司
Publication of WO2024041009A1 publication Critical patent/WO2024041009A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本申请提供了一种生成问答对的方法、装置、计算机集群和存储介质,属于文本问答技术领域。该方法包括:获取目标文本,将该目标文本输入问答对生成模型,获得该目标文本包括的至少一个问答对,每个问答对包括答案和问题,展示该至少一个问答对以及该至少一个问答对对应的操作类选项,该操作类选项用于用户对对应的问答对进行修正,获取用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,基于该操作结果对该问答对生成模型进行更新。采用本申请的方案,能够提升获得准确问答对的效率。

Description

生成问答对的方法、装置、计算机集群和存储介质
本申请要求于2022年08月25日提交的申请号为202211028540.1、发明名称为“生成问答对的方法、装置、计算机集群和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及文本问答技术领域,特别涉及一种生成问答对的方法、装置、计算机集群和存储介质。
背景技术
随着网络技术和计算机技术的发展,智能问答系统被广泛使用。在智能问答系统中,通常是通过提前设定的问答对,对问题进行回复,所以如何生成问答对至关重要。
相关技术中,通常是技术人员在大量的文本中,标注问答对,将标注的问答对作为智能问答系统中提前设定的问答对,这样,需要标注大量的问答对,标注效率比较低。
发明内容
本申请提供了一种生成问答对的方法、装置、计算机集群和存储介质,能够通过用户与问答对生成模型交互的方式,提升标注效率。
第一方面,本申请提供了一种生成问答对的方法,该方法包括:获取目标文本,将该目标文本输入问答对生成模型,获得该目标文本包括的至少一个问答对,每个问答对包括答案和问题,展示该至少一个问答对以及该至少一个问答对对应的操作类选项,该操作类选项用于用户对对应的问答对进行修正,获取该用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,基于该操作结果对该问答对生成模型进行更新。
本申请所示的方案中,使用问答对生成模型生成目标文本包括的问答对,并为用户提供操作类选项,使得用户能够对生成的问答对进行修正,使用修正后的问答对更新问答对生成模型,使得问答对生成模型生成的问答对越来越准确,而不需要用户标注大量的问答对,能够提升获得准确问答对的效率。
在一种示例中,每个问答对对应的操作类选项包括答案框选选项,该获取用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,包括:对于该至少一个问答对中的目标问答对,响应于接收到该目标问答对对应的答案框选选项的触发指令,提供框选工具,获取该用户使用该框选工具在该目标文本中框选的内容,将该目标问答对的答案修改为在该目标文本中框选的内容。
本申请所示的方案中,为用户提供答案框选选项,使得在问答对中的答案不准确时,用户能够重新框选出正确的答案。
在一种示例中,每个问答对对应的操作类选项包括问题编辑选项,该获取用户使用该操 作类选项对该至少一个问答对进行操作后的操作结果,包括:对于该至少一个问答对中的目标问答对,响应于接收到该目标问答对中第一问题对应的问题编辑选项的触发指令,获取该用户对该第一问题编辑后的内容,将该用户对该第一问题编辑后的内容,确定为该目标问答对的问题。
本申请所示的方案中,为用户提供问题编辑选项,使得在问答对中的某个问题不准确时,用户能够重新编辑该问题。
在一种示例中,每个问答对对应的操作类选项包括问题添加选项,该获取用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,包括:对于该至少一个问答对中的目标问答对,响应于接收到该目标问答对对应的问题添加选项的触发指令,获取该用户输入的问题,将该用户输入的问题,添加为该目标问答对的问题。
本申请所示的方案中,为用户提供问题添加选项,使得在问答对中的缺少问题时,用户能够输入问题。
在一种示例中,该至少一个问答对包括多个问答对,每个问答对对应的操作类选项包括排序移位选项,该展示该至少一个问答对,包括:按照该多个问答对对于该目标文本的重要性,展示该多个问答对,该获取用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,包括:对于该至少一个问答对中的目标问答对,响应于接收到该目标问答对的排序移位选项的触发指令,获取该目标问答对移动后的排序位置,该基于该操作结果对该问答对生成模型进行更新,包括:按照该多个问答对移动后的排序位置,在该多个问答对中选取问答对,选取的问答对对于该目标文本的重要性高于未选取的问答对对于该目标文本的重要性,基于选取的问答对,对该问答对生成模型进行更新。
本申请所示的方案中,多个问答对按照重要性进行排序,用户可以调整多个问答对的排序位置,使得在更新问答对生成模型时,能够使用重要性比较高的问答对更新问答对生成模型,进而使得问答对生成模型能够准确生成文本中重要的问答对。
在一种示例中,该方法还包括:展示该目标文本对应的新增问答对选项,响应于该新增问答对选项的触发指令,接收该用户输入的答案和问题,将该用户输入的答案和问题,添加为该目标文本对应的问答对。
本申请所示的方案中,还为用户展示新增问答对选项,在生成的问答对中缺少问答对时,使得用户能够补充问答对。
在一种示例中,该方法还包括:使用无标注的文本数据,训练获得基模型,使用开源库中的问答对,训练该基模型,获得初始的该问答对生成模型。
本申请所示的方案中,在没有本领域的大量问答对时,也能够使用无标注的文本数据和开源库获得初始的问答对生成模型。
第二方面,本申请提供了一种生成问答对的装置,该装置包括至少一个模块,该至少一个模块用于实现上述第一方面或第一方面中任一种示例所提供的生成问答对的方法。
在一些实施例中,生成问答对的装置中的模块通过软件实现,生成问答对的装置中的模块是程序模块。在另一些实施例中,生成问答对的装置中的模块通过硬件或固件实现。
第三方面,本申请提供了一种计算设备集群,该计算设备集群包括至少一个计算设备,每个计算设备包括处理器和存储器,该至少一个计算设备的处理器用于执行该至少一个计算设备的存储器中存储的指令,以使得该计算设备集群执行上述第一方面或第一方面中任一种 示例所提供的生成问答对的方法。
第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质包括计算机程序指令,当该计算机程序指令由计算设备集群执行时,该计算设备集群执行上述第一方面或第一方面中任一种示例所提供的生成问答对的方法。
第五方面,本申请提供了一种包含指令的计算机程序产品,当该指令被计算设备集群运行时,使得所述计算设备集群执行上述第一方面或第一方面中任一种示例所提供的生成问答对的方法。
附图说明
图1是本申请一个示例性实施例提供的系统架构的示意图;
图2是本申请一个示例性实施例提供的系统架构的示意图;
图3是本申请一个示例性实施例提供的系统架构的示意图;
图4是本申请一个示例性实施例提供的问答对生成的方法的流程示意图;
图5是本申请一个示例性实施例提供的框选文本的示意图;
图6是本申请一个示例性实施例提供的生成冷启动模型的示意图;
图7是本申请一个示例性实施例提供的问答对生成模块的结构示意图;
图8是本申请一个示例性实施例提供的生成问答对的流程框架示意图;
图9是本申请一个示例性实施例提供的用户操作问答对的逻辑示意图;
图10是本申请一个示例性实施例提供的展示问答对的示意图;
图11是本申请一个示例性实施例提供的生成问答对的装置的结构示意图;
图12是本申请一个示例性实施例提供的计算设备的结构示意图;
图13是本申请一个示例性实施例提供的计算设备集群的结构示意图;
图14是本申请一个示例性实施例提供的计算设备的连接示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
问答对生成是自然语言领域最重要的任务之一,为了获得大量的适用于自身业务领域的问答对,通常是通过人工标注的方式来标注获得问答对,通过人工标注的方式需要耗费大量的人力和财力,并且标注效率比较低。
本申请实施例中,通过交互式,对问答对生成模型生成的问答对进行修正处理和确认处理等,能够获得大量的问答对,提升标注效率。
下面对本申请实施例涉及的一些术语概念做解释说明。
1、问答对,包括答案和问题,一个问答对中答案通常是一个,但是在某些情况下答案也有可能是多个,问题可以是一个或多个。本申请实施例不对一个问答对中包括的答案的数目进行限定。
2、问答对生成,给定一段自然语言描述的文本,生成对应的答案-问题对。其中,“答案”为该段文本中的一段文本,“答案”能够用来作为所生成的“问题”的答案,同时要求生成的“问题”语句通顺,且符合语法。
本申请实施例中提供了系统架构100,参见图1,该系统架构100包括交互模块101和问答对生成模块102,交互模块101与问答对生成模块102之间能够进行通信。交互模块101为用户与问答对生成模块102提供实时交互的桥梁。用户通过交互模块101向问答对生成模块102输入文本,交互模块101可以用于提供交互界面(如图形用户界面(graphical user interface,GUI)),或者用于提供交互接口,问答对生成模块102中部署有问答对生成模型,问答对生成模型用于为目标文本生成问答对。交互模块101还用于向用户展示生成的问答对。用户可以借助交互模块101对问答对生成模块102生成的问答对进行操作,操作包括删除、保存和修正等操作,并将操作后的问答对反馈给问答对生成模块102。问答对生成模块102可以使用操作后的问答对,对问答对生成模型进行更新迭代。交互模块101与问答对生成模块102之间相互独立,对其中一个模块进行更新时不会影响另一个模块。
在一种示例中,系统架构100可以全部部署在终端设备上,终端设备是用户使用的设备。终端设备执行本申请实施例中生成问答对的方法。
在另一种示例中,参见图2,系统架构100中交互模块101部署在终端设备上,终端设备101是用户使用的设备,问答对生成模块102部署在计算设备上,计算设备可以是服务器等。终端设备与计算设备之间通过有线或无线网络连接。终端设备用于用户与计算设备进行交互。例如,终端设备通过交互模块101可以展示问答对,用户可以通过终端设备操作问答对等。计算设备通过问答对生成模块102为文本生成问答对,并且获取用户对问答对进行操作的操作结果。
在再一种示例中,参见图3,系统架构100中交互模块101部署在终端设备上,终端设备101是用户使用的设备,问答对生成模块102部署在公有云上。公有云是云计算模式下利用基础资源向用户提供云服务的实体,公有云也可以认为是一个云环境。公有云包括云数据中心,云数据中心包括云服务提供商拥有的大量基础资源,该大量基础资源包括计算资源、存储资源和网络资源,云数据中心包括的计算资源可以是计算设备集群,计算设备集群包括至少一个计算设备,计算设备可以是服务器等。在用户使用云服务时,用户可以通过交互模块101中的应用程序接口(application program interface,API)或者GUI上传文本至公有云等,公有云中的计算设备集群接收用户上传的文本,确定文本包括的问答对,并且向终端设备发送问答对,获取用户对问答对进行操作的操作结果。
上述终端设备是台式电脑、笔记本电脑、平板电脑或手机等。
下面描述本申请实施例中生成问答对的方法流程。在描述该方法流程之前,首先概述该方法流程。参见图1,用户提供文本,将该文本输入到问答对生成模块102。问答对生成模块102针对用户输入的文本,生成至少一个问答对,将该至少一个问答对通过交互模块101展示给用户。用户在查看该至少一个问答对时,可以基于操作类选项,对问答对进行相应的操作。问答对生成模块102使用至少一个问答对的操作结果更新问答对生成模型。下面结合图4详细描述生成问答对的方法流程,参见步骤401至步骤404。
步骤401,获取目标文本。
在本实施例中,交互模块101提供文档输入接口,用户可以通过该文档输入接口输入文档集,用户在输入的文档集中选取一篇文档,使用框选工具在选取的文档中框选一段未标注的文本,然后触发生成问答对选项,该生成问答对选项用于触发生成问答对。问答对生成模块102获取该段文本,该段文本即为目标文本。例如,图5提供了用户框选文本的示意图, 参见图5,用户在已经上传的文档集中,选择一篇文档在交互模块101提供的页面进行展示,选择的文档为×××部门任命通知.pdf,交互模块101可以根据文档中段落的背景色区分已经标注和未标注的段落,用户可以使用框选工具框选出一段未标注的文本“经销售部部长A批准,自2022年06月01日起,任命B为销售部,第二销售小组组长,任期1年。”,该页面中弹出生成问答对选项,用户可以触发该生成问答对选项,问答对生成模块102获取该段未标注的文本,该段未标注的文本即为目标文本。在图5中还展示有文档的目录,用户可以通过目录快速定位到查看的内容。
另外,对于文档中已标注的段落,用户也可以点击该已标注的段落,或者用户将光标移动至该已标注的段落,页面则会弹出查看问答对选项和生成问答对选项,查看问答对选项用于用户查看上次生成和操作过的问答对,生成问答对选项用于再次生成新的问答对。若用户想要查看该已标注的段落中的问答对,则可以触发查看问答对选项,页面则会显示上次生成的问答对,并且显示操作过的问答对,若用户想要再次生成该已标注的段落中的问答对,则可以触发生成问答对选项,触发再次生成问答对,交互模块101通过页面显示重新生成的问答对。例如,参见图5,文档中包括段落“经销售部部长A批准,自2022年06月01日起,任命C为销售部,第五销售小组组长,任期1年。”该段落为已标注的段落,用户点击该段落,触发弹出查看问答对选项和生成问答对选项。
或者,交互模块101提供文档输入接口,用户可以通过该文档输入接口输入一篇文档,使用框选工具在该文档中框选一段未标注的文本,然后触发生成问答对选项。问答对生成模块102获取该段文本,该段文本即为目标文本。
或者,交互模块101提供文本输入接口,用户可以通过该文本输入接口输入一段文本,进行提交。问答对生成模块102获取该段文本,该段文本即为目标文本。
步骤402,将该目标文本输入问答对生成模型,获得该目标文本包括的至少一个问答对,每个问答对包括答案和问题。
其中,问答对生成模型是神经网络模型,能够最多输出目标数目个问答对。例如,目标数目为10,问答对生成模型最多能够输出10个问答对。在另一种示例中,可以不对问答对生成模型最多输出的问答对的数目进行限定。
在本实施例中,问答对生成模块102获取问答对生成模型,将目标文本输入该问答对生成模型,问答对生成模型输出目标文本包括的至少一个问答对,每个问答对包括一个答案以及一个或多个问题。
在一种示例中,目标文本为未分词的文本,问答对生成模型提供分词功能,问答对生成模型先对目标文本进行分词的预处理后,再生成目标文本包括的至少一个问答对。
在另一种示例中,问答对生成模型未提供分词功能。问答对生成模块102接收到目标文本后,先对目标文本进行分词,再将分词后的目标文本输入问答对生成模型。
在一种示例中,问答对生成模型是基于所应用领域的问答对训练获得。
在另一种示例中,在问答对生成模型所应用领域中开始时并未存在标注的问答对,问答对生成模型在开始时是冷启动模型。问答对生成模型的冷启动模型可以是基于无标注的文本数据和开源库中的问答对训练获得,问答对生成模型的冷启动模型指没有使用所应用领域的问答对训练过的模型,该冷启动模型也可以称为是初始的问答对生成模型。冷启动模型的获取方式为:
参见图6,问答对生成模块102在大规模的无标注的文本数据上进行预训练,获得基模型。为了使得基模型能够进行问答对的生成,获取开源库中的问答对,问答对生成模块102使用开源库中的问答对对基模型再进行训练,获得问答对生成模型的冷启动模型。该冷启动模型具备生成问答对的能力,但是并未使用问答对生成模型所应用领域的问答对进行训练,所以生成的问答对有可能不准确。
在冷启动模型开始应用于问答对生成模型所应用领域时,用户输入该应用领域的文本,冷启动模型能够输出该文本的问答对,用户可以通过交互式操作问答对,将操作后的问答对存储至问答对的语料库中,问答对的语料库中用于存储问答对生成模型应用领域的问答对。使用该语料库中的问答对迭代更新问答对生成模型,使得问答对生成模型能够准确识别文本包括的问答对。即在步骤404之后,问答对生成模块102可以使用操作后的问答对,更新问答对生成模型。
这样,在大规模的无标注语料上预训练的基模型,具有比较强的文本生成能力,再基于开源的问答对对基模型进行训练,能够获得问答对生成模型的冷启动模型,再基于用户在生成的问答对上的交互反馈,能够不断迭代优化问答对生成模型,使得问答对生成模型生成的问答对的准确率越来越高。
需要说明的是,若目标文本是问答对生成模型的冷启动模型第一个标注的文本,则步骤402中问答对生成模型是问答对生成模型的冷启动模型。
可选地,参见图7,问答对生成模块102包括训练模块1021和推理模块1022,训练模块1021用于训练和更新问答对生成模型,推理模块1022用于对应输入问答对生成模块102的文本,向交互模块101输出该文本包括的问答对。训练模块1021训练或更新完成问答对生成模型后,可以将该问答对生成模型提供给推理模块1022,用于推理模块1022输出文本包括的问答对。
步骤403,展示该至少一个问答对以及该至少一个问答对对应的操作类选项。
在本实施例中,问答对生成模块102获得目标文本包括的至少一个问答对后,向交互模块101发送该至少一个问答对,使得交互模块101展示该至少一个问答对。交互模块101接收到该至少一个问答对后,展示该至少一个问答对以及该至少一个问答对对应的操作类选项,操作类选项至少用于用户对问答对进行修正处理。问答对对应的操作类选项可以展示在与问答对对应的位置,本申请实施例对操作类选项的具体位置不进行限定,例如,操作类选项展示在问答对的相邻位置等。
步骤404,获取用户使用该操作类选项对该至少一个问答对进行操作后的操作结果,基于该操作结果对问答对生成模型进行更新。
在本实施例中,用户可以使用操作类选项对该至少一个问答对进行操作,用户在对该至少一个问答对进行操作后,将该操作后的至少一个问答对提交。交互模块101存储该至少一个问答对的操作结果。例如,交互模块101将至少一个问答对的操作结果以及目标文本存储至问答对的语料库,在存储时,目标文本、至少一个问答对的操作结果中问题和答案是以三元组的形式存储至问答对的语料库。
问答对生成模块102可以使用操作后的问答对,更新问答对生成模型。例如,问答对生成模块102可以周期性从问答对的语料库中获取最新添加的多个问答对,更新问答对生成模型。在获得更新后的问答对生成模型后,问答对生成模块102还可以将目标文本输入该问答 对生成模型,问答对生成模型输出再次生成的问答对,通过交互模块101向用户展示再次生成的问答对,用户还可以对再次生成的问答对进行操作等处理。
在本申请实施例中,为了更好理解生成问答对的方法流程,提供了生成问答对的方法流程框架,参见图8。在图8中包括使用问答对生成模型第一次生成目标文本包括的问答对的流程,以及使用更新后的问答对生成模型再次生成目标文本包括的问答对的流程。
在本申请实施例中,目标文本可以是企业文档中的文本,问答对生成模型应用于企业文档领域,使用多个企业文本多次执行图4所示的流程,可以获得企业文档领域大量的问答对。在问答对生成模型应用于其他领域时,使用多个该领域的文本多次执行图4所示的流程,可以获得该领域大量的问答对。
在本申请实施例中,对问答对的操作从三个维度进行说明,三个维度分别为问答对整体的维度、问答对中答案的维度和问答对中问题的维度。图9提供了用户对问答对进行操作的逻辑示意图,参见图9,从总体来说,问答对生成模块102输出目标文本包括的问答对。用户可以通过交互模块101依次框选答案和输入对应的问题直接新增问答对。用户也可以选择目标问答对,判断目标问答对是否准确,若准确,则通过交互模块101触发对目标问答对进行保存,若认为目标问答对完全不准确,则通过交互模块101触发对目标问答对进行删除,若认为目标问答对的答案不准确,则通过交互模块101重新输入答案,若认为目标问答对的问题不准确,则通过交互模块101重新编辑问题或者新增问题。用户还可通过交互模块101对目标文本包括的多个问答对进行排序。最后将有序的问答对存储至问答对的语料库。在图9中,对多个问答对进行排序设置在确定出目标文本包括的多个问答对后进行,在另外一些示例中,可以在对问答对进行操作时直接调整问答对的位置。下面从三个维度分别说明对问答对的操作。
1、问答对整体的维度。
在一种示例中,问答对生成模型生成的问答对中有可能漏掉部分问答对,用户可以新增目标文本包括的问答对,处理方式为:
在展示至少一个问答对时,还展示目标文本对应的新增问答对选项。用户可以触发该新增问答对选项,交互模块101接收到新增问答对选项的触发指令后,为用户提供输入目标文本中答案和问题的窗口,用户可以输入答案和该答案对应的问题。例如,为用户提供答案的框选工具,用户可以使用框选工具在目标文本中框选出答案,并且为用户提供问题添加选项,用户可以触发问题添加选项输入问题。交互模块101显示该答案和问题,并且将用户输入的答案和问题,添加为目标文本包括的问答对。例如,图10提供了问答对的显示示意图,参见图10,目标文本为“经销售部部长A批准,自2022年06月01日起,任命B为销售部,第二销售小组组长,任期1年。…×××…。”用户触发新增问答对选项,输入答案“A”,问题“销售部部长是谁”,另外,用户还可以对应该答案“A”输入另一个问题“销售部的部长叫什么”,“A”和“销售部部长是谁”以及“销售部的部长叫什么”是用户新增的问答对。
在另一种示例中,问答对生成模型输出的问答对准确,用户可以触发保存该问答对,处理方式为:
参见图10,操作类选项包括问答对保存选项,目标文本包括的每个问答对对应有问答对保存选项,若用户认为某个问答对准确,用户可以触发问答对保存选项,交互模块101接收到问答对保存选项的触发指令,记录该问答对准确。例如,将该问答对展示为禁止修改状态, 在禁止修改状态下,用户不再能修改问答对。
在另一种示例中,问答对生成模型输出的问答对有可能完全不正确,或者认为问答对对目标文本没有意义,即问答对的问题和答案均不正确,用户可以触发删除该问答对,处理方式为:
参见图10,操作类选项包括问答对删除选项,目标文本包括的每个问答对对应有问答对删除选项,若用户认为目标问答对完全不正确,用户可以触发目标问答对对应的问答对删除选项,交互模块101接收到问答对删除选项的触发指令,删除目标问答对。
在另一种示例中,问答对生成模型输出的问答对是按照重要性进行排序,重要的问答对展示在前面,不重要的问答对展示在后面,重要的问答对相比不重要的问答对对目标文本更有意义。例如,每个问答对对应有序号,在显示问答对时还显示序号,序号靠前的问答对对目标文本更有意义,序号为组1、组2…依次类推,序号为组1的问答对的重要性高于序号为组2的问答对的重要性。若用户认为问答对的排序有误,用户可以触发修改排序,处理方式为:
参见图10,每个问答对对应的操作类选项包括排序移位选项,排序移位选项包括上移选项和下移选项。对于目标文本中的目标问答对,若用户认为目标问答对的排序应该靠前,则可以触发上移选项,将目标问答对移动至合适的排序位置,交互模块101接收上移选项的触发指令,记录目标问答对移动后的排序位置。若用户认为目标问答对的排序应该靠后,则可以触发下移选项,将目标问答对移动至合适的排序位置,交互模块101接收下移选项的触发指令,记录目标问答对移动后的排序位置。此处在问答对对应有序号的情况下,在用户对目标问答对进行移位后,目标问答对的序号也可以随着改变为移位后的序号。
在文本包括的问答对对应有排序位置时,问答对生成模块102可以获取文本包括的排序位置靠前的问答对更新问答对生成模型,这样,由于排序位置靠前的问答对更能体现文本的意义,所以使用排序位置靠前的问答对更新问答对生成模型,使得问答对生成模型更能识别出对文本具有重要意义的问答对。例如,问答对生成模块102使用文本包括的排序位置靠前的目标数目个问答对更新问答对生成模型,目标数目的取值可以根据实际需要设置,如目标数目等于2等。再例如,问答对生成模块102使用文本包括的排序位置靠前的A%的问答对更新问答对生成模型。A的取值可以根据实际需要设置,如A等于50等。此处是以重要的问答对展示在前面,不重要的问答对展示在后面为例进行说明,在另一种实现,也可以是重要的问答对展示在后面,不重要的问答对展示在前面。
2、问答对中答案的维度。
在一种示例中,问答对生成模块生成的问答对,有可能是答案不准确,用户可以对问答对的答案进行修正。每个问答对对应的操作类选项包括答案修正选项,对于目标问答对,目标问答对对应的答案修正选项用于修正目标问答对的答案。
可选地,答案修正选项可以是答案框选选项,修正处理方式为:
目标问答对的对应位置展示有答案框选选项,用户可以触发答案框选选项,终端则会接收到答案框选选项的触发指令,交互模块101提供框选工具,用户可以通过框选工具,在目标文本中重新框选出答案,交互模块101将目标问答对的答案修改为在该目标文本中框选的内容,将重新框选的内容展示在目标问答对的答案位置。例如,参见图10,目标文本为“经销售部部长A批准,自2022年06月01日起,任命B为销售部,第二销售小组组长,任期 1年。…×××…”。目标问答对中答案为“A”,问题为“谁是第二销售组的组长?”,在目标文本中实际上第二销售小组的组长为“B”,用户使用框选工具,框选“B”为目标问答对的答案。
可选地,答案修正选项可以是答案编辑选项,修正处理方式为:
目标问答对的对应位置展示有答案编辑选项,用户可以触发答案编辑选项,终端则会接收到答案编辑选项的触发指令,目标问答对对应的答案位置为可编辑状态,用户可以输入答案,交互模块101将目标问答对的答案修改为用户输入的内容,将用户输入的内容展示在目标问答对的答案位置。
3、问答对中问题的维度。
在一种示例中,问答对生成模块生成的问答对,有可能是问题不准确。例如,问题的语法不正确等。用户可以对问答对的问题进行编辑。每个问答对对应的操作类选项包括问题编辑选项,对于目标问答对,目标问答对对应的问题编辑选项用于编辑目标问答对的问题。
参见图10,目标问答对中每个问题的对应位置展示有问题编辑选项,对于目标问答对中的第一问题,用户认为第一问题不准确,用户可以触发第一问题对应的问题编辑选项,交互模块101则会接收到问题编辑选项的触发指令,将第一问题所在的位置设置为可编辑状态,用户可以重新编辑第一问题,交互模块101将目标问答对的第一问题修改为用户输入的问题,将用户输入的问题展示在第一问题所在的位置处。
在另一种示例中,在问答对包括多个问题的情况下,问答对中的某个问题有可能不正确,用户可以触发删除该问答对的该问题,处理方式为:
对于目标文本包括的目标问答对,目标问答对包括多个问题,目标问答对包括的每个问题对应有问题删除选项。用户认为目标问答对包括的第二问题不准确,用户可以触发第二问题对应的问题删除选项,交互模块101接收到问题删除选项的触发指令,删除第二问题,在第二问题的显示位置不再显示第二问题。例如,参见图10,答案为“A”时,问题应该是“销售部部长是谁?”,而非“谁是第二销售组的组长?”,此时可以将该问题删除。
在另一种示例中,在一个答案能够对应多个问题时,问答对生成模块生成的问答对中对应的问题缺少。用户可以对问答对的问题进行添加。每个问答对对应的操作类选项包括问题添加选项,对于目标问答对,目标问答对对应的问题添加选项用于添加目标问答对的问题。
参见图10,目标问答对的对应位置展示有问题添加选项,用户可以触发问题添加选项,交互模块101则会接收到问题添加选项的触发指令,目标问答对对应的问题位置新增一个问题位置,用户可以在新增的问题位置输入问题,交互模块101将用户输入的问题添加为目标问答对的问题,将用户输入的问题展示在新增的问题位置。并且,交互模块101在新增的问题的对应位置也显示问题编辑选项和问题删除选项等。在后续用户还可以使用问题编辑选项编辑新增的问题,用户还可以使用问题删除选项删除新增的问题。
在另一种示例中,问答对的问题准确,用户可以触发保存该问答对的问题,处理方式为:
对于目标文本包括的目标问答对,目标问答对包括的每个问题对应有保存选项。用户认为目标问答对包括的第三问题准确,用户可以触发第三问题对应的保存选项,交互模块101接收到保存选项的触发指令,保存第三问题。
上述从三个维度描述问答对在用户对目标文本包括的问答对没有异议后,用户可以触发交互模块101保存操作后的问答对。例如,参见图10,在目标文本包括的问答对的显示界面 中显示有保存至语料库选项,用户可以触发保存至语料库选项,交互模块101接收到保存至语料库选项的触发指令后,将用户操作后的问答对添加至语料库。
本申请实施例中,通过用户与问答对生成模型交互的方式,生成问答对生成模型所应用领域的大量准确问答对,获得该领域大量问答对语料,使得问答对生成模型生成问答对的准确率越来越高。
在本申请实施例中,在问答对生成模型生成问答对的准确率满足要求后,可以将问答对生成模型应用于生成所属领域的问答对,或者可以将问答对生成模型应用于识别文本中重要信息的场景中。
另外,在获得某个领域大量的问答对后,也可以使用大量的问答对训练获得智能问答模型等。
下面描述本申请实施提供的生成问答对的装置。
图11是本申请实施例提供的生成问答对的装置的结构图。该装置可以通过软件、硬件或者两者的结合实现成为装置中的部分或者全部。本申请实施例提供的装置可以实现本申请实施例图3和图7所示的流程,该装置包括:交互模块101和问答对生成模块102,其中:
交互模块101,用于获取目标文本,具体可以用于实现步骤401的交互功能以及执行步骤401包含的隐含步骤;
问答对生成模块102,用于将所述目标文本输入问答对生成模型,获得所述目标文本包括的至少一个问答对,每个问答对包括答案和问题,具体可以用于实现步骤402的问答对生成功能以及执行步骤402包含的隐含步骤;
所述交互模块101,还用于:
展示所述至少一个问答对以及所述至少一个问答对对应的操作类选项,所述操作类选项用于用户对对应的问答对进行修正;
获取用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果,基于所述操作结果对所述问答对生成模型进行更新,具体可以用于实现步骤403和步骤404的交互功能以及执行步骤403和步骤404包含的隐含步骤。
在一种示例中,每个问答对对应的操作类选项包括答案框选选项;
所述交互模块101,还用于:
对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的答案框选选项的触发指令,提供框选工具;
获取所述用户使用所述框选工具在所述目标文本中框选的内容,将所述目标问答对的答案修改为在所述目标文本中框选的内容。
在一种示例中,每个问答对对应的操作类选项包括问题编辑选项;
所述交互模块101,还用于:
对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对中第一问题对应的问题编辑选项的触发指令,获取所述用户对所述第一问题编辑后的内容;
将所述用户对所述第一问题编辑后的内容,确定为所述目标问答对的问题。
在一种示例中,每个问答对对应的操作类选项包括问题添加选项;
所述交互模块101,还用于:
对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的问题添 加选项的触发指令,获取所述用户输入的问题;
将所述用户输入的问题,添加为所述目标问答对的问题。
在一种示例中,所述至少一个问答对包括多个问答对,每个问答对对应的操作类选项包括排序移位选项;
所述交互模块101,还用于:
按照所述多个问答对对于所述目标文本的重要性,展示所述多个问答对;
对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对的排序移位选项的触发指令,获取所述目标问答对移动后的排序位置;
所述问答对生成模块102,还用于:
按照所述多个问答对移动后的排序位置,在所述多个问答对中选取问答对,选取的问答对对于所述目标文本的重要性高于未选取的问答对对于所述目标文本的重要性;
基于选取的问答对,对所述问答对生成模型进行更新。
在一种示例中,所述交互模块101,还用于:
展示所述目标文本对应的新增问答对选项;
响应于所述新增问答对选项的触发指令,接收所述用户输入的答案和问题;
将所述用户输入的答案和问题,添加为所述目标文本对应的问答对。
在一种示例中,所述问答对生成模块102,还用于:
使用无标注的文本数据,训练获得基模型;
使用开源库中的问答对,训练所述基模型,获得初始的所述问答对生成模型。
其中,交互模块101和问答对生成模块102均可以通过软件实现,或者可以通过硬件实现。示例性的,接下来以问答对生成模块102为例,介绍问答对生成模块102的实现方式。类似的,交互模块101的实现方式可以参考问答对生成模块102的实现方式。
模块作为软件功能单元的一种举例,问答对生成模块102可以包括运行在计算实例上的代码。其中,计算实例可以包括物理主机(计算设备)、虚拟机或容器中的至少一种。进一步地,上述计算实例可以是一台或者多台。例如,问答对生成模块102可以包括运行在多个主机/虚拟机/容器上的代码。需要说明的是,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的区域(region)中,也可以分布在不同的region中。进一步地,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的可用区(availability zone,AZ)中,也可以分布在不同的AZ中,每个AZ包括一个数据中心或多个地理位置相近的数据中心。其中,通常一个region可以包括多个AZ。
同样,用于运行该代码的多个主机/虚拟机/容器可以分布在同一个虚拟私有云(virtual private cloud,VPC)中,也可以分布在多个VPC中。其中,通常一个VPC设置在一个region内,同一region内两个VPC之间,以及不同region的VPC之间跨区通信需在每个VPC内设置通信网关,经通信网关实现VPC之间的互连。
模块作为硬件功能单元的一种举例,问答对生成模块102可以包括至少一个计算设备,如服务器等。或者,问答对生成模块102也可以是利用专用集成电路(application-specific integrated circuit,ASIC)实现或可编程逻辑器件(programmable logic device,PLD)实现的设备等。其中,上述PLD可以是复杂程序逻辑器件(complex programmable logical device,CPLD)、现场可编程门阵列(field-programmable gate array,FPGA)和通用阵列逻辑(generic array logic, GAL)或其任意组合实现。
问答对生成模块102包括的多个计算设备可以分布在相同的region中,也可以分布在不同的region中。问答对生成模块102包括的多个计算设备可以分布在相同的AZ中,也可以分布在不同的AZ中。同样,问答对生成模块102包括的多个计算设备可以分布在同一个VPC中,也可以分布在多个VPC中。其中,所述多个计算设备可以是服务器、ASIC、PLD、CPLD、FPGA和GAL等计算设备的任意组合。
需要说明的是,在其他实施例中,交互模块101可以用于执行生成问答对的方法中的任意步骤,问答对生成模块102可以用于执行生成问答对的方法中的任意步骤。交互模块101和问答对生成模块102负责实现的步骤可根据需要指定,通过交互模块101和问答对生成模块102分别实现生成问答对的方法中不同的步骤来实现生成问答对的装置的全部功能。
还需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时也可以有另外的划分方式。
下面描述本申请实施例提供的计算设备200。
本申请实施例还提供了一种计算设备200。如图12所示,计算设备200包括:总线1102、处理器1104、存储器1106和通信接口1108。处理器1104、存储器1106和通信接口1108之间通过总线1102通信。计算设备200可以是服务器或终端设备。应理解,本申请不限定计算设备200中的处理器和存储器的个数。
总线1102可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线和控制总线等。为便于表示,图12中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。总线1102可包括在计算设备200各个部件(例如,存储器1106、处理器1104和通信接口1108)之间传送信息的通路。
处理器1104可以包括中央处理器(central processing unit,CPU)、图形处理器(graphics processing unit,GPU)、微处理器(micro processor,MP)或者数字信号处理器(digital signal processor,DSP)等处理器中的任意一种或多种。
存储器1106可以包括易失性存储器(volatile memory),例如,随机存取存储器(random access memory,RAM)。存储器1106还可以包括非易失性存储器(non-volatile memory),例如,只读存储器(read-only memory,ROM),快闪存储器,机械硬盘(hard disk drive,HDD)或固态硬盘(solid state drive,SSD)。
存储器1106中存储有可执行的程序代码,处理器1104执行该可执行的程序代码以分别实现前文中交互模块101和问答对生成模块102的功能,从而实现生成问答对的方法。也即,存储器1106上存有用于执行生成问答对的方法的指令。
通信接口1108使用例如但不限于网络接口卡和收发器一类的收发模块,来实现计算设备200与其他设备或通信网络之间的通信。
下面描述本申请实施例提供的计算设备集群。
本申请实施例还提供了一种计算设备集群。该计算设备集群包括至少一个计算设备。该计算设备可以是服务器,例如,该计算设备是中心服务器、边缘服务器,或者是本地数据中心中的本地服务器。在一些实施例中,计算设备也可以是台式机、笔记本电脑或者智能手机等终端设备。
如图13所示,该计算设备集群包括至少一个计算设备200。计算设备集群中的一个或多个计算设备200中的存储器1106中可以存有相同的用于执行生成问答对的方法的指令。
在一些可能的实现方式中,该计算设备集群中的一个或多个计算设备200的存储器1106中也可以分别存有用于执行生成问答对的方法的部分指令。换言之,一个或多个计算设备200的组合可以共同执行用于执行生成问答对的方法的指令。
需要说明的是,计算设备集群中的不同的计算设备200中的存储器1106可以存储不同的指令,分别用于执行前文中生成问答对的装置的部分功能。也即,不同的计算设备200中的存储器1106存储的指令可以实现交互模块101和问答对生成模块102中的一个或多个模块的功能。
在一些可能的实现方式中,计算设备集群中的一个或多个计算设备可以通过网络连接。其中,该网络可以是广域网或局域网等等。图14示出了一种可能的实现方式。如图14所示,两个计算设备(第一计算设备200A和第二计算设备200B)之间通过网络进行连接。具体地,通过各个计算设备中的通信接口与该网络进行连接。在这一类可能的实现方式中,第一计算设备200A中的存储器1106中存有执行问答对生成模块102的功能的指令。同时,第二计算设备200B中的存储器1106中存有执行交互模块101的功能的指令。
图14所示的计算设备集群之间的连接方式可以是考虑到本申请提供的生成问答对的方法中交互模块101与问答对生成模块102之间存在数据传输,且问答对生成模块102占用的空间比较大,因此考虑将执行问答对生成模块102实现的功能交由第一计算设备200A执行,并且考虑到本申请提供的生成问答对的方法有可能与终端设备进行交互,因此考虑将执行交互模块101实现的功能交由第二计算设备200B执行。
应理解,图14中示出的第一计算设备200A的功能也可以由多个计算设备200完成。同样,第二计算设备200B的功能也可以由多个计算设备200完成。
本申请实施例还提供了一种包含指令的计算机程序产品。所述计算机程序产品可以是包含指令的,能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当所述计算机程序产品在至少一个计算设备上运行时,使得至少一个计算设备执行生成问答对的方法。
本申请实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令,所述指令指示计算设备执行生成问答对的方法。
本领域普通技术人员可以意识到,结合本申请中所公开的实施例中描述的各方法步骤和单元,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请中术语“第一”和“第二”等字样用于对作用和功能基本相同的相同项或相似项进行 区分,应理解,“第一”和“第二”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。还应理解,尽管以下描述使用术语“第一”和“第二”等来描述各种元素,但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如,在不脱离各种示例的范围的情况下,第一问题可以被称为第二问题,并且类似地,第二问题可以被称为第一问题。第一问题和第二问题都可以是问题,并且在某些情况下,可以是单独且不同的问题。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的保护范围。

Claims (17)

  1. 一种生成问答对的方法,其特征在于,所述方法包括:
    获取目标文本;
    将所述目标文本输入问答对生成模型,获得所述目标文本包括的至少一个问答对,每个问答对包括答案和问题;
    展示所述至少一个问答对以及所述至少一个问答对对应的操作类选项,所述操作类选项用于用户对对应的问答对进行修正;
    获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果;
    基于所述操作结果对所述问答对生成模型进行更新。
  2. 根据权利要求1所述的方法,其特征在于,每个问答对对应的操作类选项包括答案框选选项;
    所述获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果,包括:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的答案框选选项的触发指令,提供框选工具;
    获取所述用户使用所述框选工具在所述目标文本中框选的内容,将所述目标问答对的答案修改为在所述目标文本中框选的内容。
  3. 根据权利要求1或2所述的方法,其特征在于,每个问答对对应的操作类选项包括问题编辑选项;
    所述获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果,包括:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对中第一问题对应的问题编辑选项的触发指令,获取所述用户对所述第一问题编辑后的内容;
    将所述用户对所述第一问题编辑后的内容,确定为所述目标问答对的问题。
  4. 根据权利要求1至3任一项所述的方法,其特征在于,每个问答对对应的操作类选项包括问题添加选项;
    所述获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果,包括:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的问题添加选项的触发指令,获取所述用户输入的问题;
    将所述用户输入的问题,添加为所述目标问答对的问题。
  5. 根据权利要求1至4任一项所述的方法,其特征在于,所述至少一个问答对包括多个问答对,每个问答对对应的操作类选项包括排序移位选项;
    所述展示所述至少一个问答对,包括:
    按照所述多个问答对对于所述目标文本的重要性,展示所述多个问答对;
    所述获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果,包括:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对的排序移位选项的触发指令,获取所述目标问答对移动后的排序位置;
    所述基于所述操作结果对所述问答对生成模型进行更新,包括:
    按照所述多个问答对移动后的排序位置,在所述多个问答对中选取问答对,选取的问答对对于所述目标文本的重要性高于未选取的问答对对于所述目标文本的重要性;
    基于选取的问答对,对所述问答对生成模型进行更新。
  6. 根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
    展示所述目标文本对应的新增问答对选项;
    响应于所述新增问答对选项的触发指令,接收所述用户输入的答案和问题;
    将所述用户输入的答案和问题,添加为所述目标文本对应的问答对。
  7. 根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
    使用无标注的文本数据,训练获得基模型;
    使用开源库中的问答对,训练所述基模型,获得初始的所述问答对生成模型。
  8. 一种生成问答对的装置,其特征在于,所述装置包括:
    交互模块,用于获取目标文本;
    问答对生成模块,用于将所述目标文本输入问答对生成模型,获得所述目标文本包括的至少一个问答对,每个问答对包括答案和问题;
    所述交互模块,还用于:
    展示所述至少一个问答对以及所述至少一个问答对对应的操作类选项,所述操作类选项用于用户对对应的问答对进行修正;
    获取所述用户使用所述操作类选项对所述至少一个问答对进行操作后的操作结果;
    所述问答对生成模块,还用于基于所述操作结果对所述问答对生成模型进行更新。
  9. 根据权利要求8所述的装置,其特征在于,每个问答对对应的操作类选项包括答案框选选项;
    所述交互模块,还用于:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的答案框选选项的触发指令,提供框选工具;
    获取所述用户使用所述框选工具在所述目标文本中框选的内容,将所述目标问答对的答案修改为在所述目标文本中框选的内容。
  10. 根据权利要求8或9所述的装置,其特征在于,每个问答对对应的操作类选项包括问 题编辑选项;
    所述交互模块,还用于:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对中第一问题对应的问题编辑选项的触发指令,获取所述用户对所述第一问题编辑后的内容;
    将所述用户对所述第一问题编辑后的内容,确定为所述目标问答对的问题。
  11. 根据权利要求8至10任一项所述的装置,其特征在于,每个问答对对应的操作类选项包括问题添加选项;
    所述交互模块,还用于:
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对对应的问题添加选项的触发指令,获取所述用户输入的问题;
    将所述用户输入的问题,添加为所述目标问答对的问题。
  12. 根据权利要求8至11任一项所述的装置,其特征在于,所述至少一个问答对包括多个问答对,每个问答对对应的操作类选项包括排序移位选项;
    所述交互模块,还用于:
    按照所述多个问答对对于所述目标文本的重要性,展示所述多个问答对;
    对于所述至少一个问答对中的目标问答对,响应于接收到所述目标问答对的排序移位选项的触发指令,获取所述目标问答对移动后的排序位置;
    所述问答对生成模块,还用于:
    按照所述多个问答对移动后的排序位置,在所述多个问答对中选取问答对,选取的问答对对于所述目标文本的重要性高于未选取的问答对对于所述目标文本的重要性;
    基于选取的问答对,对所述问答对生成模型进行更新。
  13. 根据权利要求8至12任一项所述的装置,其特征在于,所述交互模块,还用于:
    展示所述目标文本对应的新增问答对选项;
    响应于所述新增问答对选项的触发指令,接收所述用户输入的答案和问题;
    将所述用户输入的答案和问题,添加为所述目标文本对应的问答对。
  14. 根据权利要求8至13任一项所述的装置,其特征在于,所述问答对生成模块,还用于:
    使用无标注的文本数据,训练获得基模型;
    使用开源库中的问答对,训练所述基模型,获得初始的所述问答对生成模型。
  15. 一种计算设备集群,其特征在于,包括至少一个计算设备,每个计算设备包括处理器和存储器;
    所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行如权利要求1至7任一项所述的方法。
  16. 一种计算机可读存储介质,其特征在于,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行如权利要求1至7任一项所述的方法。
  17. 一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备集群运行时,使得所述计算设备集群执行如权利要求的1至7任一项所述的方法。
PCT/CN2023/090345 2022-08-25 2023-04-24 生成问答对的方法、装置、计算机集群和存储介质 WO2024041009A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211028540.1 2022-08-25
CN202211028540.1A CN117687547A (zh) 2022-08-25 2022-08-25 生成问答对的方法、装置、计算机集群和存储介质

Publications (1)

Publication Number Publication Date
WO2024041009A1 true WO2024041009A1 (zh) 2024-02-29

Family

ID=90012321

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2023/090345 WO2024041009A1 (zh) 2022-08-25 2023-04-24 生成问答对的方法、装置、计算机集群和存储介质

Country Status (2)

Country Link
CN (1) CN117687547A (zh)
WO (1) WO2024041009A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178623A1 (en) * 2013-12-23 2015-06-25 International Business Machines Corporation Automatically Generating Test/Training Questions and Answers Through Pattern Based Analysis and Natural Language Processing Techniques on the Given Corpus for Quick Domain Adaptation
CN111966796A (zh) * 2020-07-21 2020-11-20 福建升腾资讯有限公司 问答对提取方法、装置、设备及可读存储介质
CN112632258A (zh) * 2020-12-30 2021-04-09 太平金融科技服务(上海)有限公司 文本数据处理方法、装置、计算机设备和存储介质
CN114328852A (zh) * 2021-08-26 2022-04-12 腾讯科技(深圳)有限公司 一种文本处理的方法、相关装置及设备
CN114706963A (zh) * 2022-03-16 2022-07-05 海信电子科技(武汉)有限公司 问答处理方法及智能设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178623A1 (en) * 2013-12-23 2015-06-25 International Business Machines Corporation Automatically Generating Test/Training Questions and Answers Through Pattern Based Analysis and Natural Language Processing Techniques on the Given Corpus for Quick Domain Adaptation
CN111966796A (zh) * 2020-07-21 2020-11-20 福建升腾资讯有限公司 问答对提取方法、装置、设备及可读存储介质
CN112632258A (zh) * 2020-12-30 2021-04-09 太平金融科技服务(上海)有限公司 文本数据处理方法、装置、计算机设备和存储介质
CN114328852A (zh) * 2021-08-26 2022-04-12 腾讯科技(深圳)有限公司 一种文本处理的方法、相关装置及设备
CN114706963A (zh) * 2022-03-16 2022-07-05 海信电子科技(武汉)有限公司 问答处理方法及智能设备

Also Published As

Publication number Publication date
CN117687547A (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
US11435874B2 (en) Formulas
US20230385033A1 (en) Storing logical units of program code generated using a dynamic programming notebook user interface
US11645052B2 (en) Systems, devices, and methods for software coding
US8161401B2 (en) Intermediate viewer for transferring information elements via a transfer buffer to a plurality of sets of destinations
US11847409B2 (en) Management of presentation content including interjecting live feeds into presentation content
US7877701B2 (en) In-context total document views for manipulating data
US20050102630A1 (en) Meta window for merging and consolidating multiple sources of information
JP7293643B2 (ja) 構造化文書の内容をチャットベースのインタラクションに翻訳するための半自動化された方法及びシステム、プログラム
US11036806B2 (en) Search exploration using drag and drop
US20190095085A1 (en) Page construction method, terminal, computer readable storage medium, and page construction device
CN114003843A (zh) 一种页面生成方法、装置、设备及存储介质
US11934647B2 (en) Utilizing modularized action blocks in a graphical user interface to generate digital images with custom modifications
EP3819760A1 (en) Methods and apparatus for generating a platform-agnostic mobile application configuration data structure with a dynamic quiz
WO2024041009A1 (zh) 生成问答对的方法、装置、计算机集群和存储介质
US11868713B1 (en) Systems, devices, and methods for software coding
US11663199B1 (en) Application development based on stored data
US11450043B2 (en) Element association and modification
Yu Getting started with Salesforce Einstein analytics: A Beginner’s guide to building interactive dashboards
US11074735B2 (en) Multistep interactive image generation utilizing knowledge store
CN113704593B (zh) 一种运营数据处理方法及相关装置
US20240126807A1 (en) Visual Search Determination for Text-To-Image Replacement
Yu Getting Started with Salesforce Einstein Analytics

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23856104

Country of ref document: EP

Kind code of ref document: A1