CN117272988B - 优化提示词的方法、电子设备 - Google Patents

优化提示词的方法、电子设备 Download PDF

Info

Publication number
CN117272988B
CN117272988B CN202311499194.XA CN202311499194A CN117272988B CN 117272988 B CN117272988 B CN 117272988B CN 202311499194 A CN202311499194 A CN 202311499194A CN 117272988 B CN117272988 B CN 117272988B
Authority
CN
China
Prior art keywords
word
prompt
prompting
template
cue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311499194.XA
Other languages
English (en)
Other versions
CN117272988A (zh
Inventor
王垒
周曦
鲍军
孙仪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202311499194.XA priority Critical patent/CN117272988B/zh
Publication of CN117272988A publication Critical patent/CN117272988A/zh
Application granted granted Critical
Publication of CN117272988B publication Critical patent/CN117272988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了优化提示词的方法、电子设备。电子设备可以预存提示词的调试数据、提示词样例、用于优化提示词的提示词模板等数据,利用预存的数据对用户输入的原始提示词A进行优化,得到提示词B。该方法能够优化用户输入的提示词,保证用户能够得到好的结果,提升了用户的使用体验。

Description

优化提示词的方法、电子设备
技术领域
本申请涉及终端及计算机技术领域,尤其涉及优化提示词的方法、电子设备。
背景技术
在自然语言处理(natural language processing,NLP)中,提示词(prompt)可用于提醒学习的特定目标,使得预训练的大规模语言模型(largelanguagemodel,LLM)适应不同的任务场景。使用提示词可以利用大语言模型LLM解决大量任务,合适的提示词可以更好地提示LLM,让LLM预测的答案更准确。
当前提示词的人工调试过程较为复杂,难以获得合适的提示词,而通用的提示词或使用模型自动生成的提示词又难以适应特定的下游任务,并且相似任务也难以复用相同的提示词。如何设计、优化提示词,是NLP领域研究的重点。
发明内容
本申请提供了优化提示词的方法、电子设备,可以优化用户输入的提示词,保证用户能够得到好的结果,提升了用户的使用体验。
第一方面,提供一种优化提示词的方法,应用于电子设备,该方法可包括:获取第一提示词和第一标签,第一标签指示第一提示词的任务类型;获取优化信息,优化信息包括以下任一项或多项:第一集合,第二集合中提示词样例的调试数据,第一集合、第二集合包含的提示词样例均属于第一标签;获取用于优化属于第一标签的提示词的提示词模板;根据提示词模板和优化信息,优化第一提示词,得到第二提示词。
实施第一方面的方法,电子设备能够使用提示词样例和调试数据来优化提示词,保证用户能够得到好的结果,提升了用户的使用体验。
结合第一方面,在一些实施方式中,提示词模板包含固定部分和占位符,固定部分描述了第一标签指示的任务类型和优化提示词的目标,占位符用于填充优化信息。根据提示词模板和优化信息,优化第一提示词,得到第二提示词,具体包括:将优化信息填充进提示词模板的占位符中,得到第三提示词,将第三提示词输入至大语言模型LLM中,得到第二提示词。可见,该提示词模板可用于构建目标为优化提示词的一条提示词。
结合第一方面,在一些实施方式中,第一集合中的提示词样例和第一提示词的相似度大于第一相似度阈值;或者,第一集合中的提示词样例为属于第一标签的提示词样例中,和第一提示词的相似度最高的M1个提示词样例;或者,第一集合中的提示词样例为属于第一标签的提示词样例中,和第一提示词的相似度大于第一相似度阈值,且相似度最高的N1个提示词样例。和原始提示词相似度较高的提示词样例对于优化原始提示词更具有参考意义,这样优化而来的提示词更加符合用户需求,能更好地返回用户所需的结果。
结合第一方面,在一些实施方式中,第二集合中的提示词样例和第一提示词的相似度大于第二相似度阈值;或者,第二集合中的提示词样例为属于第一标签的提示词样例中,和第一提示词的相似度最高的M2个提示词样例;或者,第二集合中的提示词样例为属于第一标签的提示词样例中,和第一提示词的相似度大于第二相似度阈值,且相似度最高的N2个提示词样例。和原始提示词相似度较高的提示词样例的调试数据对于优化原始提示词更具有参考意义,这样优化而来的提示词更加符合用户需求,能更好地返回用户所需的结果。
结合第一方面,在一些实施方式中,第二集合中提示词样例的调试数据包括调试得到提示词样例过程中的中间提示词版本,以及,提示词样例。
第二方面,提供一种优化提示词的方法,应用于电子设备,该方法可包括:获取第一提示词和第一标签,第一标签指示第一提示词的任务类型;判断是否存在用于优化属于第一标签的提示词的提示词模板;若是,则判断是否存在提示词候选集,提示词候选集包括和第一提示词的相似度大于第三相似度阈值的提示词样例,或者,提示词候选集包括和第一提示词的相似度最高的M3个提示词样例,或者提示词候选集包括和第一提示词的相似度大于第三相似度阈值且相似度最高的N3个提示词样例;若是,则根据第一提示词模板和提示词候选集,优化第一提示词,得到第二提示词;第一提示词模板为用于优化属于第一标签的提示词的提示词模板中,采用提示词样例来优化提示词的提示词模板。
结合第二方面,在一些实施方式中,该方法还可包括:若不存在提示词候选集,则判断是否存在和第一提示词的相似度最高的提示词样例的调试数据;若是,则根据第二提示词模板和调试数据,优化第一提示词,得到第二提示词;第二提示词模板为用于优化属于第一标签的提示词的提示词模板中,采用提示词样例的调试数据来优化提示词的提示词模板。
结合上一实施方式,该方法还可包括:若不存在和第一提示词的相似度最高的提示词样例的调试数据,则根据第三提示词模板优化第一提示词,得到第二提示词;第三提示词模板为用于优化属于第一标签的提示词的默认提示词模板。
结合第二方面,在一些实施方式中,该方法还可包括:若不存在用于优化属于第一标签的提示词的提示词模板,则根据第四提示词模板优化第一提示词,得到第二提示词;第四提示词模板为用于优化提示词的全局提示词模板。
实施第二方面以及第二方面的各个实施方式的方法,电子设备优先使用提示词样例来优化提示词,其次使用调试数据来优化提示词,再次使用第一标签的默认提示词模板来优化提示词,最次才使用全局提示词模板来优化提示词。
结合第一方面及第二方面,在一些实施方式中,该方法还可包括:将第二提示词输入至LLM中,得到第二提示词对应的结果;输出第二提示词对应的结果。这样可以让用户直接获取到结果。
结合第一方面及第二方面,在一些实施方式中,该方法还可包括:如果第二提示词达到提示词样例标准,则将第二提示词存储为提示词样例。该提示词样例还可以用于后续其他提示词的优化。
在一些实施方式中,第二提示词是否达到提示词样例标准由用户评估,或者由电子设备通过LLM评估,或者由电子设备根据第一提示词和第二提示词的语义相似度评估。
结合第一方面及第二方面,在一些实施方式中,电子设备中可预存多个提示词样例,和/或,可预存多组提示词样例的调试数据。
第三方面,提供一种电子设备,包括:存储器、一个或多个处理器;存储器与一个或多个处理器耦合,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,一个或多个处理器调用计算机指令以使得电子设备执行如第一方面或第一方面的任意一种实施方式、或如第二方面或第二方面的任意一种实施方式中电子设备所执行的方法。
第四方面,提供一种计算机可读存储介质,包括指令,当指令在电子设备上运行时,使得电子设备执行如第一方面或第一方面的任意一种实施方式、或如第二方面或第二方面的任意一种实施方式中电子设备所执行的方法。
第五方面,提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第一方面或第一方面的任意一种实施方式、或如第二方面或第二方面的任意一种实施方式中电子设备所执行的方法。
第六方面,提供一种芯片系统,所述芯片系统包括至少一个处理器,用于实现如第一方面或第一方面的任意一种实施方式、或如第二方面或第二方面的任意一种实施方式中电子设备所执行的方法。
附图说明
图1为本申请实施例提供的在电子设备上用于调试提示词的用户界面;
图2为本申请实施例提供的原始提示词、用于优化提示词的提示词模板、LLM之间的关系;
图3为本申请实施例提供的一种优化提示词的方法的流程图;
图4为本申请提供的另一种优化提示词的方法的流程图;
图5为本申请实施例提供的电子设备的软件结构;
图6为本申请实施例提供的电子设备的硬件结构框图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、详尽地描述。
首先介绍本申请涉及的主要概念。
LLM
LLM是一种基于机器学习的人工智能模型,用于处理文本信息,完成复杂的人工智能任务,增强人机交互的效果。LLM利用基于深度学习的架构,在大量训练数据的基础上训练得到。当LLM的训练数据足够多时,其能够处理不同的问题,预测或生成不同类型的内容。LLM的训练过程通常包括预训练(pre-training)和微调(fine-tuning)。在预训练阶段,模型从庞大且多样化的数据集中学习,在微调阶段,模型在与目标任务或目标领域相关的具体数据集上进一步训练,以适应任务的特殊要求。
LLM例如可包括基于Transformer的双向编码(bidirectional encoderrepresentation from transformers)、生成式预训练变形器-3(generative pre-trainedtransformer-3,GPT-3)、chatGPT、文心一言等模型。
LLM有很多应用场景,用于执行不同类型的任务,例如智能写作、机器翻译、绘画、数据分析、生活助手等。其中,智能写作可进一步细分为撰写演讲稿、文本问答、文本摘要、文本润色、诗词创作、剧本创作、影评、图像描述等。数据分析可包括数据排序、数据对比、数据拼接等。绘画可包括生成头像、装修预览等。生活助手可包括礼物清单、人物百科等。
提示词
提示词用于提示LLM下游任务的目标,用于引出答案或者让LLM知道要做什么任务。
例如,以电影评论情感分类任务为例,输入为“I like this movie”,输出为“这句话的情感极性标签:positive/negative”,则可以构建提示词“The film is [mask]”来提示LLM执行情感分类任务。其中[mask]位置就是想让LLM预测出来的词语。
再例如,以翻译任务为例,输入为“I like XXX”,输出为“把这句话翻译为法语”,则可以构建提示词“Translate the sentence into system response: I like XXX”来提示LLM执行翻译任务。
将提示词输入至LLM,得到的结果就是LLM的下游任务的目标。
提示词模板
为了方便提示词的复用,可以设定提示词模板。例如,提示词模板可以是“请以${var}的风格写一首以大学毕业为主题的现代诗”,其中占位符${var}以用户输入的信息作为变量来填充,这样提示词模板结合用户输入的信息就可以得到一个提示词。如果用户输入的信息为“诗人A”,则结合提示词模板和该信息可以得到提示词“请以诗人A的风格写一首以大学毕业为主题的现代诗”;类似的,如果用户输入的信息为“诗人B”,则结合提示词模板和该信息可以得到信息提示词“请以诗人B的风格写一首以大学毕业为主题的现代诗”。
可见,提示词模板可用于构建提示词,其可包括固定的部分,以及,可用于填充用户输入信息的占位符。其中的固定部分可用于描述将要构建的提示词的主要目标和所应用的任务类型,如上述示例中的写一首以大学毕业为主题的现代诗等。占位符可用于填充可替代的内容,如上述示例中的${}。一个提示词模板中的占位符可以是一个,也可以是多个,即提示词模板中可填充多个变量。
在提示词模板的占位符中填充用户输入的信息后,该提示词模板和用户输入的信息就构建为一个提示词。
不同的任务类型,由于目标不同,可以对应有不同的提示词模板。
由此,上述介绍的三个概念之间的关系为,提示词模板用于构建提示词,提示词输入至LLM后,LLM可以预测得到该提示词的结果。
本申请以下实施例提供一种优化提示词的方法,应用于电子设备,电子设备可以选择合适的提示词模板以及合适的优化信息(如提示词的调试过程和/或提示词样例等),以此来优化提示词。
在该方法中,电子设备预存以下几类数据:
1. 用户优化提示词过程中的调试数据
该调试数据体现了用户主动修改提示词并不断确认修改后的提示词对应的结果,直至用户对结果满意的过程。在调试提示词的过程中,用户可增加或删除提示词中的部分词语,调整提示词的语序,微调提示词的语义等。调试数据可包含原始的提示词,中间修改的各个版本的提示词,以及最终用户满意结果的提示词。调试提示词的用户可以是研发人员或者电子设备的所属者。
电子设备中可存储不同标签下的调试数据。这里的标签指示任务类型,例如智能写作、机器翻译、绘画、数据分析、生活助手等,或者更进一步细分的任务类型等。一个标签下可包括一组或多组调试数据。
参考图1,图1示例性示出了电子设备在用户调试提示词时显示的第一用户界面21。该电子设备可以为电脑、平板等。如图1所示,第一用户界面21的左侧显示有多个提示词版本选项202,该选项被选中时,用户界面右侧显示对应该提示词版本的提示词展示区203,和结果展示区204。提示词展示区203用于显示用户输入的提示词,结果展示区204用于显示将该提示词输入至LLM后生成的结果。
第一用户界面21中还可包括以下四个控件:用于编辑提示词的控件205,用于优化提示词的控件206,用于保存提示词模板的控件207,用于保存提示词样例的控件208。上述四个控件上的文字可以自定义,这里不做限定。
用户点击用于编辑提示词的控件205,就可以对提示词展示区203显示的提示词进行编辑。用户点击用于优化提示词的控件206,电子设备就可以使用后续本申请提供的优化方法对当前的提示词进行优化,并生成一个新的提示词版本选项。在一些实施方式中,用户点击用于优化提示词的控件206后,电子设备还可以显示多个优化方式选项,以供用户选择具体的优化方式,该优化方式可包括后续方法实施例中使用到的默认优化方式、基于候选集的优化方式、基于调试数据的优化方式等。
用户点击用于保存提示词模板的控件207,电子设备可显示图1中的第二用户界面22,该第二用户界面22用于用户基于优化好的提示词创建提示词模板。如图1所示,用户可以在该第二用户界面22中输入创建的提示词模板的名称,该提示词模板可用于的业务类型、业务描述以及模板内容。其中,模板内容可以是在第一用户界面21当前显示的提示词基础上,用户选择将该提示词的部分词语替换为占位符的形式。填写完上述信息后,用户可点击第二用户界面22中的确定控件,之后电子设备即可保存创建的提示词模板。
用户点击用于保存提示词样例的控件208,电子设备可显示图1中的第三用户界面23。如图1所示,该第三用户界面23用于询问用户是否将当前显示的提示词保存为提示词样例。如果用户对当前显示的提示词的结果满意,则可以点击选项“是”,然后点击选项“确定”,之后电子设备即可将当前显示的提示词保存为提示词样例。
用户点击用于保存提示词模板的控件207或点击用于保存提示词样例的控件208,均表示用户对调试得到的提示词的结果满意,电子设备可保存调试得到该提示词的调试数据,以用于后续优化其他的提示词。图1仅为示例,电子设备还可提供其他的用户界面,以供用户调试提示词。
2. 提示词样例
提示词样例是指优秀的、能得到让用户满意结果的提示词。电子设备中可存储不同标签下的提示词样例。一个标签下可包含一个或多个提示词样例。
研发人员可以预先搜集提示词样例并将其预置在电子设备中。此外,电子设备在执行本申请提供的优化提示词的方法后,如果优化后的提示词达到样例标准,则也可以将优化后的提示词按标签存储到电子设备中,以用于后续优化其他的提示词。评估优化后的提示词是否达到样例标准的方式,可参考后续方法实施例的介绍,这里暂不展开。
部分或全部的提示词样例可以对应有优化得到该提示词样例的调试数据。
3. 用于优化提示词的提示词模板
用于优化提示词的提示词模板本质是一个提示词模板,其用于构建一个提示词,其构建的提示词的主要目标是优化原始提示词,其包含的固定部分描述该目标。由用于优化提示词的提示词模板构建得到的提示词输入至LLM后,能够得到对原始提示词优化后的提示词。由于原始提示词也对应有不同的任务类型,用于优化原始提示词的提示词模板也可按照任务类型区分。
用于优化提示词的提示词模板的固定部分还描述了用于优化原始提示词所使用的方式。根据所采用的优化信息的不同,优化原始提示词的方式也不同。例如,优化方式可包括基于调试数据的优化方式、基于提示词样例的优化方式等。
参考图2,图2示出了原始提示词、用于优化提示词的提示词模板、LLM之间的关系。如图2所示,原始提示词A和用于优化提示词的提示词模板两者组装,还可组装优化所需的信息(如调试数据、提示词样例等),组装后得到的提示词输入至LLM,由该LLM输出优化原始提示词A而得到的提示词B。提示词B再次输入至LLM,由该LLM输出根据该提示词B得到的结果。图2中两个LLM可以是同一个可用于处理多种不同问题的大语言模型,也可以是用于处理不同问题的不同的大语言模型。
电子设备中可存储一个全局的用于优化提示词的提示词模板,该全局模板MG可用于构建用于优化任意标签下原始提示词的提示词。相当于,TN无标签。
电子设备中还可按照标签分类存储多个用于优化提示词的提示词模板,一个标签下对应有三个用于优化提示词的提示词模板:一个构建的提示词采用默认方式来优化原始提示词,称为默认模板MD,一个构建的提示词利用调试数据来优化原始提示词,称为模板TN,一个构建的提示词利用提示词样例来优化原始提示词,称为模板TY。一个标签对应的用于优化提示词的提示词模板,即,用于优化属于该标签的提示词的提示词模板。
可见,电子设备中可存储一个无标签的TN,还可存储各个标签分别对应的三个模板,每个标签都对应存储有一个默认模板MD、一个模板TN和一个模板TY
下面列举几个用于优化提示词的提示词模板:
模板1:
假设你是一个提示词优化专家,擅长提示词优化工作,请优化用户的输入。
用户输入:${var}
模板2:
假设你是一个提示词优化专家,擅长提示词优化工作,针对[标签]任务,生成任务一般要求数据有多样性,如句式多样。请优化用户的输入。
模板3:
假设你是一个提示词优化专家,擅长提示词优化工作,下面样例是用户A针对[标签]任务调试提示词的过程,经过一次次的调试,用户A获得了理想的结果。
任务描述:${background_knowledge}
###
用户A的调试过程:
${debug_info}
###
用户B的提示词输入:
${待优化的提示词}
请你结合用户A的调试过程,深度思考理解A能获取理想结果的原因,帮助用户B优化其提示词,给出最终优化后的提示词并解释你这样优化的理由。深呼吸,让我们一步步思考。
模板4:
下面是用户针对如下“任务”写的提示词,请针对[标签]任务,根据“任务”和“样例提示词”优化“用户提示词”,直接返回优化后的提示词。
任务描述:${background_knowledge}
用户提示词:${user_instruction}
样例提示词:${example_instruction}
上述模板1-4均用于构建达成优化用户输入的原始提示词这一目的的提示词。上述模板1可以为全局模板MG的示例,模板2可以为默认模板MD的示例,模板3可以为模板TN的示例,模板3可以为模板TY的示例。模板2-4中的[标签]中的“标签”被替换为某个特定标签的描述语言后,模板2-4就成为该特定标签对应的默认模板MD、模板TN、模板TY的示例。
结合上述几个示例,再进一步介绍上述全局模板MG、默认模板MD、模板TN、模板TY
全局模板MG的固定部分描述了优化原始提示词这一目标,其至少包含一个占位符,该占位符可用于填充原始提示词。
默认模板MD的固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型。其至少包含一个占位符,该占位符可用于填充原始提示词。
模板TN的固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型,还描述了采用调试数据来优化原始提示词这一优化方式。其至少包含两个占位符,一个占位符可用于填充原始提示词,另一个占位符可用于填充调试数据。
模板TY的固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型,还描述了采用提示词样例来优化原始提示词这一优化方式。其至少包含两个占位符,一个占位符可用于填充原始提示词,另一个占位符可用于填充提示词样例。
可选的,全局模板MG、默认模板MD、模板TN、模板TY均可另外再包含一个占位符,该占位符可用于填充任务描述。其中,任务描述和原始提示词在语义上有一定的相似性,都用于解释LLM下游任务的目标。
参考图3,图3示出了本申请实施例提供的优化提示词的方法的流程。该方法可包括如下步骤:
S301,电子设备获取原始的提示词A和第一标签。
原始的提示词A可由用户输入至电子设备,例如可通过语音、文本等方式输入。
电子设备获取到原始的提示词A后,可以分析该提示词A,得到该提示词A对应的任务类型,即标签,称为第一标签。在一些实施方式中,该提示词的标签还可由用户输入至电子设备。
S302,电子设备判断存储的数据中是否包含第一标签对应的用于优化提示词的提示词模板。
具体的,电子设备可判断存储的用于优化提示词的提示词模板中,是否存在第一标签对应的默认模板MD、模板TN、模板TY。第一标签对应的用于优化提示词的提示词模板指,用于优化属于第一标签的提示词的提示词模板。
如果判断结果为是,则执行S303;如果判断结构为否,则执行S310。
S303,电子设备判断存储的数据中是否包含提示词候选集。
在一些实施方式中,提示词候选集包括电子设备存储的第一标签下,和提示词A的相似度大于第三相似度阈值的提示词样例。
在一些实施方式中,提示词候选集包括电子设备存储的第一标签下,和提示词A的相似度最高的M3个提示词样例。
在一些实施方式中,提示词候选集包括电子设备存储的第一标签下,和提示词A的相似度大于第三相似度阈值且相似度最高的N3个提示词样例。上述第三相似度阈值、M3、N3均可以预先按需设置。M3、N3为大于或等于1的整数,可以根据LLM的上下文限制长度确定,需保证后续提示词候选集中的提示词样例组装至提示词模板中后,得到的提示词的长度在LLM的上下文限制长度内。
提示词A和提示词样例之间的相似度可以通过余弦相似度衡量。具体的,可以对提示词A和提示词样例做向量化处理,之后再计算两个向量的夹角的余弦值来度量它们之间的相似性。两者的相似度越高,说明两者越相似。提示词候选集里的N个提示词样例对于提示词A的优化具有较高的参考意义。
如果判断结果为是,则执行S304;如果判断结构为否,则执行S306。
S304,电子设备从存储的数据中获取第一标签对应的模板TY
第一标签对应的模板TY是用于优化提示词的提示词模板,其固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型(即第一标签),还描述了采用提示词样例来优化原始提示词这一优化方式。模板TY至少包含两个占位符,一个用于填充原始提示词,另一个用于填充提示词样例。在一些实施方式中,模板TY还可包括用于填充任务描述的占位符。
S305,电子设备根据第一标签下的提示词候选集、第一标签对应的模板TY优化提示词A,得到提示词B。
电子设备可以将提示词候选集填充至模板TY用于填充提示词样例的占位符中,将提示词A填充至模板TY用于填充原始提示词的占位符中,组装后得到新的提示词。
在一些实施方式中,如果第一标签对应的模板TY还包含用于填充任务描述的占位符,则电子设备还可以提示用户输入任务描述。用户输入任务描述后,电子设备可以将该任务描述填充至模板TY用于填充任务描述的占位符中,组装后得到新的提示词。
组装得到新的提示词后,电子设备将该新的提示词输入至LLM中,经由LLM就能输出优化后的提示词B。
下面通过一个具体的示例1说明S305的实现:
任务描述(background_knowledge):
在用户和智能助手交谈中,模拟用户基于给定时间、事件,生成一条让助手理解的指令。
用户原始提示词(user_instruction):
用户(U)需要用手机照片制作一个视频,提供(时间/地点/人物/事件)中的一个或多个条件。请分别从下面的主题词中随机选择一个,使用用户的口吻生成一条指令;
事件:['溜冰、滑板、轮滑、滑板车、山地车、自行车等'];
时间: 二十四节气、节假日等。
提示词候选集(example_instruction):
用户(U)需要根据(时间/地点/人物/事件)中的一个或多个条件,选取手机照片剪辑成一段视频;
在每个条件范围中随机选择并确定具体的值,模拟用户生成一句话的指令,如:你好,帮我用昨天去游乐园玩的照片做一个vlog吧;
事件:['高风险运动,如蹦极、极限滑翔、跳伞、攀岩、潜水、赛车等'];
时间: 季节,如春夏秋冬。
模板TY:参考前文的模板4。
上述用户原始提示词即为提示词A,将上述任务描述、用户原始提示词、提示词候选集填充进模板TY,获得组装好的新的提示词,然后电子设备可以将该新的提示词输入至LLM,由LLM学习提示词候选集中的各个提示词样例的格式及生成方式,对用户原始提示词进行优化,得到符合任务描述的输出结果,即提示词B。
优化后的提示词(即提示词B):
用户(U)需要根据(时间/事件)中的一个或多个条件,从手机相册中选取照片剪辑成一段视频;
请从下面的主题词中选择条件,并确定具体的值,然后用用户的口吻生成一条指令,如:你好,请帮我把去游乐园玩时拍的照片剪辑成一个夏日游记的视频吧;
事件:['滑雪场玩雪'、'海边游泳'、'爬山郊游'、'游乐园玩耍'、'露营烧烤'等休闲活动];
时间:['春天'、'夏天'、'秋天'、'冬天'或具体的节日如'春节'、'端午节'、'中秋节'等]。
对比上述示例中的提示词A和提示词B,可见LLM对提示词A的优化点在于:1.用户需要基于时间和事件条件筛选照片。2.事件范围聚焦正面休闲活动。3.时间范围增加了季节和具体节日。4.提供了示范话语帮助生成用户指令。5.删除不相关信息,使提示更简洁。上述优化点可以由LLM在预训练过程中学习到,以及,从提示词候选集的提示词样例中学习到。
仍然以上述示例1为例:
以提示词A作为输入,LLM输出的结果为:我要用手机拍摄的照片制作一个在寒假期间去公园玩雪的视频。请帮我制作这个视频。
以提示词B作为输入,LLM输出的结果为:你好,请帮我把去年春节全家爬黄山时拍的照片,剪辑成一个春节郊游纪念视频吧。多加入些春节的元素,比如红灯笼、对联等,剪辑得更生动一些。
对比可知,优化后的提示词B相比提示词A而言,更利于电子设备理解下游任务的目标或任务,更够更好地引导电子设备执行下游任务,从而输出让用户满意的结果。
S306,电子设备判断存储的数据中,第一标签下和提示词A的相似度最高的提示词样例是否有调试数据。
电子设备在计算第一标签下的各提示词样例分别和提示词A的相似度后,找到相似度最高的提示词样例,然后判断存储的数据中是否包含调试得到该提示词样例的调试数据。
如果判断结果为是,则执行S307;如果判断结构为否,则执行S309。
S307,电子设备从存储的数据中获取第一标签对应的模板TN
第一标签对应的模板TN是用于优化提示词的提示词模板,其固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型(即第一标签),还描述了采用调试数据来优化原始提示词这一优化方式。模板TN至少包含两个占位符,一个用于填充原始提示词,另一个用于填充调试数据。在一些实施方式中,模板TN还可包括用于填充任务描述的占位符。
S308,电子设备根据S306中确定的调试数据、第一标签对应的模板TN优化提示词A,得到提示词B。
电子设备可以将S306确定的调试数据填充至模板TN用于填充调试数据的占位符中,将提示词A填充至模板TN用于填充原始提示词的占位符中,组装后得到新的提示词。
在一些实施方式中,如果第一标签对应的模板TN还包含用于填充任务描述的占位符,则电子设备还可以提示用户输入任务描述。用户输入任务描述后,电子设备可以将该任务描述填充至模板TN用于填充任务描述的占位符中,组装后得到新的提示词。
组装得到新的提示词后,电子设备将该新的提示词输入至LLM中,经由LLM就能输出优化后的提示词B。
利用第一标签下和提示词A的相似度最高的提示词样例的调试数据来优化提示词,由于该相似度最高的提示词样例的调试数据对于提示词A的优化具有较高的参考意义,有利于生成更好的优化结果。
在一些实施方式中,如果S306中确定的调试数据过多,则会导致组装后的模板TN超出LLM的上下文限制,从而LLM无法正常工作。在此种情况下,电子设备可从调试数据中挑选LLM能够处理数量的调试版本。具体的,电子设备获取到第一标签下和提示词A的相似度最高的提示词样例的调试数据后,先判断该调试数据的长度是否大于长度阈值,若否则直接使用该调试数据优化提示词A,若是则在保留调试数据中最后版本的提示词基础上获取M条版本的提示词,并且保证该M条版本的提示词的语义相似度差异尽量大。长度阈值可以预先设置,例如可以被设置为LLM能够处理的最大上下文长度,这样可以保证LLM处理的调试数据在其上下文限制内。M也可以预先按需设置。
获取上述M条版本的提示词时,可以先确定调试数据中最后版本的提示词,在最后版本的提示词的基础上依次往前寻找,保证找到的M条提示词中所有两两相邻的提示词的语义相似度的和相比其他M条提示词中所有两两相邻的提示词的语义相似度的和更小。这样能够保证找到的M条提示词之间的语义相似度差异尽量大,这样的调试过程对于LLM学习调试方式有更好的参考意义,能够得到更好的优化结果。
下面通过一个具体的示例2说明S305的实现:
用户A的任务描述:
在用户和智能助手交谈中,模拟用户基于给定时间、事件,生成一条让助手理解的指令。
用户A的调试过程:
[过程1]:
用户(U)需要用手机照片制作一个视频,提供(时间/地点/人物/事件)中的一个或多个条件。请分别从下面的主题词中随机选择一个,使用用户的口吻生成一条指令:
事件:'溜冰、滑板、轮滑、滑板车、山地车、自行车等';
时间: '二十四节气、节假日等’。
[过程2]:
用户(U)需要根据(时间/地点/人物/事件)中的一个或多个条件,选取手机照片剪辑成一段视频;
请根据下面的范围随机选择并确定具体的事件和时间,模拟用户生成一句话的指令:
事件:'溜冰、滑板、轮滑、滑板车、山地车、自行车等';
时间: '二十四节气、节假日等';
样例:请帮我用我周末做菜的照片制作一个视频。
[过程3]:
用户(U)需要根据(时间/地点/人物/事件)中的一个或多个条件,选取手机照片剪辑成一段视频;
请你在每个条件范围中随机选择并确定具体的事件和时间,模拟用户语气生成一句话的指令:
事件:'高风险运动,如蹦极、极限滑翔、跳伞、攀岩、潜水、赛车等';
时间:'节假日,如五一、中秋、国庆等';
样例:你好,帮我用昨天去游乐园玩的照片做一个vlog吧。
用户B的提示词:
用户需要通过语音助手下发任务,内容为根据手机中的照片制作一个视频,帮用户生成一句话的任务描述。
模板TN:参考前文的模板3。
上述用户B的提示词即为提示词A,用户A的调试过程即为调试数据,将上述用户B的提示词、用户A的调试过程、任务描述填充进模板TN,获得组装好的新的提示词,然后电子设备可以将该新的提示词输入至LLM,由LLM学习用户A对提示词的调试方式,对用户B的提示词进行优化,得到符合任务描述的输出结果,即提示词B。
优化后的提示词(即提示词B):
用户需要通过语音助手下发任务,内容是根据手机相册中的照片视频剪辑成一个vlog。请您随机选择如下的一个时间和一个事件,生成一句模拟用户的语音指令:
时间:周末,寒假,国庆节,元旦等节假日;
事件:游乐园,爬山,野炊,烧烤,露营等周末活动;
样例:你好,请帮我用上周末去游乐园的照片剪辑一个vlog。
对比上述示例中的提示词A和提示词B,可见LLM对提示词A的优化过程参考了用户A的调试过程。
仍然以上述示例2为例:
以提示词A作为输入,LLM输出的结果为:请帮我根据手机中的照片制作一个视频。
以提示词B作为输入,LLM输出的结果为:您好,请帮我把国庆节去露营的照片和视频剪辑成一个vlog。
对比可知,优化后的提示词B相比提示词A而言,更利于电子设备理解下游任务的目标或任务,更够更好地引导电子设备执行下游任务,从而输出让用户满意的结果。
S309,电子设备从存储的数据中获取第一标签对应的默认模板MD,根据默认模板MD优化提示词A,得到提示词B。
第一标签对应的默认模板MD是用于优化提示词的提示词模板,其固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型(即第一标签)。默认模板MD至少包含一个占位符,用于填充原始提示词。在一些实施方式中,默认模板MD还可包括用于填充任务描述的占位符。
电子设备可以将提示词A填充至默认模板MD用于填充原始提示词的占位符中,组装后得到新的提示词。在一些实施方式中,如果第一标签对应的默认模板MD还包含用于填充任务描述的占位符,则电子设备还可以提示用户输入任务描述。用户输入任务描述后,电子设备可以将该任务描述填充至默认模板MD用于填充任务描述的占位符中,组装后得到新的提示词。
组装得到新的提示词后,电子设备将该新的提示词输入至LLM中,经由LLM就能输出优化后的提示词B。
默认模板MD可参考前文的模板2。
S310,电子设备从存储的数据中获取全局模板MG,根据全局模板MG优化提示词A,得到提示词B。
全局模板MG是用于优化提示词的提示词模板,其固定部分描述了优化原始提示词这一目标。全局模板MG至少包含一个占位符,用于填充原始提示词。在一些实施方式中,全局模板MG还可包括用于填充任务描述的占位符。
电子设备可以将提示词A填充至全局模板MG用于填充原始提示词的占位符中,组装后得到新的提示词。在一些实施方式中,如果全局模板MG还包含用于填充任务描述的占位符,则电子设备还可以提示用户输入任务描述。用户输入任务描述后,电子设备可以将该任务描述填充至全局模板MG用于填充任务描述的占位符中,组装后得到新的提示词。
组装得到新的提示词后,电子设备将该新的提示词输入至LLM中,经由LLM就能输出优化后的提示词B。
全局模板MG可参考前文的模板1。
通过上述步骤S301-S310,电子设备能够对用户输入的原始提示词A进行优化,得到优化后的提示词B,提示词B更利于电子设备理解下游任务的目标或任务,更够更好地引导电子设备执行下游任务,从而输出让用户满意的结果。
在一些实施方式中,图3所示的方法还可包括以下步骤:
S311,电子设备将优化得到的提示词B输入至LLM,得到该提示词B对应的结果。
具体的,电子设备可以将提示词B输入至LLM,得到下游任务所需的目标,即该提示词B对应的结果。提示词B对应的结果可以是翻译文本、生成的诗歌、情感分类结果、摘要、回答等,这取决于提示词B本身的语义。
由于提示词B是原始提示词A经过优化而来,这样得到的结果能更符合用户的实际需求,能够提升用户的使用体验。
S312,电子设备展示提示词B对应的结果。
电子设备可通过显示屏显示该结果,或者,也可以语音播放该结果。这样,用户能过获知该结果。
图3所示的优化方法可应用于需要构建提示词来帮助LLM输出结果的场景,如用户和手机中的语音助手对话、用户和电脑中的聊天机器人对话等。用户仅需向电子设备输入原始的提示词A,电子设备就可以通过上述步骤S301-S309优化提示词A得到提示词B,然后利用提示词B作为LLM的输入得到最终结果。上述过程中,用户不感知电子设备内部执行的优化过程,但能感受到输入提示词A后电子设备返回了符合需求的结果。在构建提示词时,由于用户不了解专业背景,用户输入的提示词直接影响输出,本申请的方法能够自动优化提示词,保证用户能够得到好的结果,提升了用户的使用体验。
在一些实施方式中,电子设备还可以将优化得到的提示词B展示给用户,便于用户获知该提示词B。之后,用户还可以根据自身的实际需求对该提示词B进行微调,微调后得到提示词B’,然后电子设备可以将该提示词B’输入至LLM得到对应的结果。该实施方式结合电子设备和用户共同对原始提示词A做优化,能够让最终输出的结果符合用户需求。
不限于基于图3中步骤S301-S310介绍的优先利用提示词样例来优化提示词、次优先利用调试数据来优化提示词的方式,本申请还提供了其他的用于优化提示词的方法。在该方法中,电子设备可以利用优化信息来优化提示词,该优化方法可包括提示词样例和/或调试数据,该优化方法不区分两种优化方式的优先级。
示例性地,参考图4,该方法可包括如下步骤:
S401,电子设备获取原始的提示词A和第一标签。S401可参考图3中的S301。
S402,电子设备从存储的数据中获取优化信息,优化信息包括以下任一项或多项:第一集合,第二集合中提示词样例的调试数据,所述第一集合、所述第二集合包含的提示词样例均属于所述第一标签。
第一集合、第二集合均包含多个属于第一标签的提示词样例。
在一些实施方式中,所述第一集合中的提示词样例和所述提示词A的相似度大于第一相似度阈值;或者,第一集合中的提示词样例为属于所述第一标签的提示词样例中,和所述提示词A的相似度最高的M1个提示词样例;或者,第一集合中的提示词样例为属于所述第一标签的提示词样例中,和所述提示词A的相似度大于第一相似度阈值,且相似度最高的N1个提示词样例。
在一些实施方式中,第二集合中的提示词样例和所述提示词A的相似度大于第二相似度阈值;或者,第二集合中的提示词样例为属于所述第一标签的提示词样例中,和所述提示词A的相似度最高的M2个提示词样例;或者,第二集合中的提示词样例为属于所述第一标签的提示词样例中,和所述提示词A的相似度大于第二相似度阈值,且相似度最高的N2个提示词样例。
上述M1、M2、N1、N2为大于或等于1的整数,可以根据LLM的上下文限制长度确定,需保证后续优化信息组装至提示词模板中后,得到的提示词的长度在LLM的上下文限制长度内。上述的第一相似度阈值、第二相似度阈值均可以按需设置。
S403,电子设备从存储的数据中获取第一标签对应的用于优化提示词的提示词模板。
第一标签对应的用于优化提示词的提示词模板指,用于优化属于第一标签的提示词的提示词模板。该提示词模板包含固定部分和占位符,固定部分描述了第一标签指示的任务类型和优化提示词的目标,占位符用于填充优化信息。占位符的数量可以为一个或多个。
第一标签对应的用于优化提示词的提示词模板,用于根据优化信息来优化提示词,根据采用的优化信息的不同可分为多个不同的模板。
参考前文,如果采用的优化信息为提示词样例,则该提示词模板可参考前文的模板TY;如果采用的优化信息为调试数据,则该提示词模板可参考前文的模板TN
如果采用的优化信息同时包括提示词样例和调试数据,则该提示词模板可以为模板TYN;该模板YN的固定部分描述了优化原始提示词这一目标,还描述了原始提示词的任务类型,还描述了采用提示词样例和调试数据来优化原始提示词这一优化方式。其至少包含三个占位符,一个占位符可用于填充原始提示词,一个占位符可用于填充提示词样例,另一个占位符可用于填充调试数据。相当于模板TYN可以看作模板TY、模板TN的组合。可选的,模板TYN还可包括用于填充任务描述的占位符。
S404,根据用于优化提示词的提示词模板和优化信息,优化所述提示词A,得到提示词B。
电子设备在获取优化信息后,使用上述用于优化提示词的提示词模板中,能利用这类型的优化信息来优化提示词的提示词模板,来优化提示词A。
具体的,电子设备可以将优化信息填充进提示词模板中用于填充优化信息的占位符中,组装后得到新的提示词,该新的提示词可以被称为第三提示词。在一些实施方式中,如果提示词模板还包含用于填充任务描述的占位符,则电子设备还可以提示用户输入任务描述。用户输入任务描述后,电子设备可以将该任务描述填充至提示词模板用于填充任务描述的占位符中,组装后得到新的提示词。组装得到新的提示词后,电子设备将该新的提示词输入至LLM中,经由LLM就能输出优化后的提示词B。
本申请对S402和S403的执行顺序不做限定。
S405-S406,参考S311-S312。
在本申请实施例中,原始的提示词A还可被称为第一提示词,优化后得到的提示词B还可以被称为第二提示词。
在一些实施方式,本申请优化后得到的提示词还可以由电子设备评估,如果评估认为优化后的提示词符合样例标准,则可以将优化后的提示词加入到电子设备存储的提示词样例中。这样能够在用户使用电子设备的过程中,不断增加预存的数据量,可以为后续提示词的优化提供更多的数据,让后续的优化过程更加符合用户需求。
本申请中优化后的提示词可包括通过图3所示方法优化得到的提示词B,也可包括由用户微调得到的提示词B’。
电子设备评估优化的提示词是否符合样例标准的方式可包括如下三种:
1. 用户评估
电子设备可以根据优化后的提示词得到的结果展示给用户,用户可以反馈对该结果是否满意,反馈的机制可以是打分制或者是否满意的二分选择制。可选的,电子设备还可以同时将优化后的提示词展示给用户,方便用户衡量优化结构是否满意。电子设备接收到用户反馈后,可以根据该反馈决定是否将此次优化后的提示词置入提示词样例中,例如如果用户反馈的分数大于一定值或者用户选择了满意,则可以将此次优化后的提示词置入提示词样例。用户评估的用户界面可参考前文图1。
2. 模型评估
电子设备可以将优化前的提示词,优化后的提示词提交给LLM,通过LLM来评估优化方式是否合理,以及优化后的提示词是否达到样例标准。
具体的,可以预先设置用于评估优化前后的两个提示词哪个更好的提示词模板,这样将该模板和优化前后的两个提示词组装为一个新的提示词,将该新的提示词输入至LLM后电子设备就可以得到评估结果。如果优化后的提示词较优化前的提示词更为优秀,则可以人优化后的提示词达到样例标准。
3. 规则评估
电子设备可以计算优化前的提示词,优化后的提示词之间的语义相似度,若该相似度大于预设阈值,则认为优化后的提示词达到样例标准。
下面介绍本申请实施例提供的电子设备。本申请的电子设备用于执行上述本申请提供的优化提示词的方法。
该电子设备为智能终端设备,可以为各种类型,本申请实施例对其具体类型不作限制。例如,该电子设备例如可以是手机,还可以包括平板电脑、桌面型计算机、具有触敏表面或触控面板的台式计算机、膝上型计算机(laptop)、手持计算机、笔记本电脑、智慧屏、可穿戴式设备(如智能手表、智能手环等)、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、人工智能(artificial intelligence, AI)设备、车机、智能耳机,游戏机,还可以是物联网(internet of things,IOT)设备或智能家居设备如智能热水器、智能灯具、智能空调等等。
图5为本申请提供的电子设备的软件结构。
如图5所示,该电子设备可包括:调试模块、仓库、优化模块、评估模块。
调试模块可用于为用户提供调试提示词的入口及用户界面(例如图1所示的用户界面),支持用户在该用户界面中修改提示词。
仓库可用于存储电子设备中预存的数据,如来自调试模块的用户优化提示词过程中的调试数据、提示词样例(包括预搜集的以及电子设备使用过程中生成的)、提示词模板等。
优化模块可用于优化用户输入的原始提示词A,输出优化得到的提示词B。具体的,优化模块可根据仓库中存储的数据来优化提示词A,具体可执行图3所示方法中的步骤S301-S310。在一些实施方式中,优化模块还可提供用于用户微调提示词B得到提示词B’的用户界面。
评估模块用于评估优化后的提示词B或提示词B’是否符合样例标准,具体的评估方式可参考前文。
图5所示的各模块可以集成在电子设备安装的应用程序中,该应用程序可以是支持用户和电子设备对话或聊天的语音助手、聊天机器人等。电子设备启动该应用程序后,电子设备可利用上述模块完成对用户输入的原始提示词A的优化,给用户提供更加符合其需求的结果。
图6示出了本申请实施例提供的电子设备100的硬件结构示意图。
电子设备100可以包括处理器101,存储器102,无线通信模块103,移动通信模块104,天线103A,天线104A,电源开关105,传感器模块106,对焦马达107,摄像头108,显示屏109等。其中,传感器模块106可以包括陀螺仪传感器106A,加速度传感器106B,环境光传感器106C,图像传感器106D,距离传感器106E等。其中,无线通信模块103可以包括WLAN通信模块,蓝牙通信模块等。上述多个部分可以通过总线传输数据。
处理器101可以包括一个或多个处理单元,例如:处理器101可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
存储器102可以用于存储计算机可执行程序代码,可执行程序代码可以包括指令。处理器101通过运行存储在存储器102的指令,从而执行电子设备100的各种功能应用以及数据处理。存储器102可以包括存储程序区和存储数据区。具体实现中,存储器102可以包括高速随机存取的存储器,并且也可包括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。
电子设备100的无线通信功能可以通过天线103A,天线104A,移动通信模块104,无线通信模块103,调制解调处理器以及基带处理器等实现。
天线103A和天线104A可以用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。
移动通信模块104可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块104可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,LNA)等。移动通信模块104可以由天线104A接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块104还可以对经调制解调处理器调制后的信号放大,经天线104A转为电磁波辐射出去。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备输出声音信号,或通过显示屏109显示图像或视频。
无线通信模块103可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN),蓝牙(bluetooth,BT),全球导航卫星系统(globalnavigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块103可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块103经由天线103A接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器101。无线通信模块103还可以从处理器101接收待发送的信号,对其进行调频,放大,经天线103A转为电磁波辐射出去。
电源开关105可用于控制电源向电子设备100的供电。
陀螺仪传感器106A可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器106A确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器106A可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器106A检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器106A还可以用于导航,体感游戏场景。
加速度传感器106B可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,例如,加速度传感器106B可以应用于横竖屏切换,计步器等应用。
环境光传感器106C用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏109的亮度。环境光传感器106C也可用于拍照时自动调节白平衡。
图像传感器106D,又称为感光元件,可以利用光电器件的光电转换功能将感光面上的光像转换为与光像成相应比例关系的电信号。图像传感器可以是电荷耦合器件(charge coupled device,CCD)传感器或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)传感器。
距离传感器106E可以用于测量距离。电子设备100可以通过红外或激光测量距离。在一些拍摄场景中,电子设备100可以利用距离传感器106E测距以实现快速对焦。
对焦马达107可用于快速对焦。电子设备100可以通过对焦马达107控制镜片的移动,实现自动对焦。
电子设备100可以通过ISP,摄像头108,视频编解码器,GPU,显示屏109以及应用处理器等实现拍摄功能。
ISP用于处理摄像头108反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头108中。
摄像头108可用于捕获静态图像或视频。物体通过镜头生成光学图像投射到图像传感器。图像传感器可以把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP可以将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
视频编解码器用于对数字图像压缩或解压缩。电子设备100可以支持一种或多种图像编解码器。这样,电子设备100代开或保存多种编码格式的图片或视频。
电子设备100可以通过GPU,显示屏109,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏109和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器101可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏109用于显示图像,视频等。显示屏109包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏109,N为大于1的正整数。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件如还可包括麦克风等音频器件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
在本申请实施例中:
显示屏109、麦克风等可用于接收用户输入的原始提示词A。
处理器101可用于优化提示词A,得到提示词B,还可用于利用LLM输出提示词B对应的结果。显示屏109、扬声器等器件还可用于展示提示词B对应的结果。
处理器101还可用于评估优化后的提示词是否符合样例标准,若符合则将优化后的提示词送入存储器102存储。
处理器101优化提示词的过程,评估提示词的过程可参考前文方法实施例的相关描述。
存储器102中可存储用于实现本申请提供的优化提示词的方法的程序代码。具体的,存储器102还存储有电子设备中预存的数据,如来自调试模块的用户优化提示词过程中的调试数据、提示词样例(包括预搜集的以及电子设备使用过程中生成的)、用于优化提示词的提示词模板等。
电子设备100中各器件所执行的操作,具体可参考前文方法实施例的相关描述,这里不一一展开。
应理解,上述方法实施例中的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本申请还提供一种电子设备,该电子设备可以包括:存储器和处理器。其中,存储器可用于存储计算机程序;处理器可用于调用所述存储器中的计算机程序,以使得该电子设备执行上述任意一个实施例中电子设备侧执行的方法。
本申请还提供了一种芯片系统,所述芯片系统包括至少一个处理器,用于实现上述任一个实施例中电子设备侧所涉及的功能。
在一种可能的设计中,所述芯片系统还包括存储器,所述存储器用于保存程序指令和数据,存储器位于处理器之内或处理器之外。
该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
可选地,该芯片系统中的处理器可以为一个或多个。该处理器可以通过硬件实现也可以通过软件实现。当通过硬件实现时,该处理器可以是逻辑电路、集成电路等。当通过软件实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现。
可选地,该芯片系统中的存储器也可以为一个或多个。该存储器可以与处理器集成在一起,也可以和处理器分离设置,本申请实施例并不限定。示例性地,存储器可以是非瞬时性处理器,例如只读存储器ROM,其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请实施例对存储器的类型,以及存储器与处理器的设置方式不作具体限定。
示例性地,该芯片系统可以是现场可编程门阵列(field programmable gatearray,FPGA),可以是专用集成芯片(application specific integrated circuit,ASIC),还可以是系统芯片(system on chip,SoC),还可以是中央处理器(central processorunit,CPU),还可以是网络处理器(network processor,NP),还可以是数字信号处理电路(digital signal processor,DSP),还可以是微控制器(micro controller unit,MCU),还可以是可编程控制器(programmable logic device,PLD)或其他集成芯片。
本申请还提供一种计算机程序产品,所述计算机程序产品包括:计算机程序(也可以称为代码,或指令),当所述计算机程序被运行时,使得计算机执行上述任一个实施例中电子设备侧所执行的方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)。当所述计算机程序被运行时,使得计算机执行上述任一个实施例中电子设备侧所执行的方法。
本申请的各实施方式可以任意进行组合,以实现不同的技术效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solidstate disk,SSD))等。
在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
总之,以上所述仅为本申请技术方案的实施例而已,并非用于限定本申请的保护范围。凡根据本申请的揭露,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种优化提示词的方法,其特征在于,所述方法应用于电子设备,所述方法包括:
获取第一提示词,和,所述第一提示词所属的第一任务类型;
获取优化信息,所述优化信息包括第一集合,和/或,第二集合中提示词样例的调试数据,所述第一集合和所述第二集合均包含提示词样例,所述第一集合和所述第二集合包含的提示词样例均属于所述第一任务类型,且为能得到让用户满意的结果的提示词;所述第二集合中提示词样例的调试数据包括调试得到提示词样例过程中的中间提示词版本以及最终提示词版本;
获取用于优化属于所述第一任务类型的提示词的提示词模板,所述提示词模板包含固定部分和占位符,所述固定部分描述了所述第一任务类型和优化提示词的目标,所述占位符用于填充所述优化信息和所述第一提示词;
将所述第一提示词和所述优化信息填充进所述提示词模板中得到第三提示词,将所述第三提示词输入至大语言模型LLM中,得到第二提示词。
2.根据权利要求1所述的方法,其特征在于,所述第一集合中的提示词样例和所述第一提示词的相似度大于第一相似度阈值。
3.根据权利要求1所述的方法,其特征在于,所述第一集合中的提示词样例为属于所述第一任务类型的提示词样例中,和所述第一提示词的相似度最高的M1个提示词样例。
4.根据权利要求1所述的方法,其特征在于,所述第一集合中的提示词样例为属于所述第一任务类型的提示词样例中,和所述第一提示词的相似度大于第一相似度阈值,且相似度最高的N1个提示词样例。
5.根据权利要求1所述的方法,其特征在于,所述第二集合中的提示词样例和所述第一提示词的相似度大于第二相似度阈值。
6.根据权利要求1所述的方法,其特征在于,所述第二集合中的提示词样例为属于所述第一任务类型的提示词样例中,和所述第一提示词的相似度最高的M2个提示词样例。
7.根据权利要求1所述的方法,其特征在于,所述第二集合中的提示词样例为属于所述第一任务类型的提示词样例中,和所述第一提示词的相似度大于第二相似度阈值,且相似度最高的N2个提示词样例。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
将所述第二提示词输入至LLM中,得到所述第二提示词对应的结果;
输出所述第二提示词对应的结果。
9.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
如果所述第二提示词达到提示词样例标准,则将所述第二提示词存储为提示词样例。
10.根据权利要求9所述的方法,其特征在于,所述第二提示词是否达到提示词样例标准由用户评估,或者由所述电子设备通过LLM评估,或者由所述电子设备根据所述第一提示词和所述第二提示词的语义相似度评估。
11.一种优化提示词的方法,其特征在于,所述方法应用于电子设备,所述方法包括:
获取第一提示词,和,所述第一提示词所属的第一任务类型;
判断是否存在用于优化属于所述第一任务类型的提示词的提示词模板;
若是,
则判断是否存在提示词候选集,所述提示词候选集包括和所述第一提示词的相似度大于第三相似度阈值的提示词样例,或者,所述提示词候选集包括和所述第一提示词的相似度最高的M3个提示词样例,或者所述提示词候选集包括和所述第一提示词的相似度大于第三相似度阈值且相似度最高的N3个提示词样例,提示词样例为能得到让用户满意的结果的提示词;
若是,
则将所述第一提示词、所述提示词候选集填充进第一提示词模板中,得到第三提示词,将所述第三提示词输入至大语言模型LLM中,得到第二提示词;所述第一提示词模板包含固定部分和占位符,固定部分描述了所述第一任务类型和优化提示词的目标,占位符用于填充所述提示词候选集和所述第一提示词。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
若不存在所述提示词候选集,则判断是否存在和所述第一提示词的相似度最高的提示词样例的调试数据,所述调试数据包括调试得到提示词样例过程中的中间提示词版本以及最终提示词版本;
若是,
则将所述第一提示词、和所述第一提示词的相似度最高的提示词样例的调试数据填充进第二提示词模板中,得到第三提示词,将所述第三提示词输入至大语言模型LLM中,得到第二提示词;所述第二提示词模板包含固定部分和占位符,固定部分描述了所述第一任务类型和优化提示词的目标,占位符用于填充所述调试数据和所述第一提示词。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
若不存在和所述第一提示词的相似度最高的提示词样例的调试数据,则根据第三提示词模板优化所述第一提示词,得到第二提示词;所述第三提示词模板包含固定部分和占位符,固定部分描述了所述第一任务类型和优化提示词的目标,占位符用于填充所述第一提示词。
14.根据权利要求11-13任一项所述的方法,其特征在于,所述方法还包括:
若不存在用于优化属于所述第一任务类型的提示词的提示词模板,则根据第四提示词模板优化所述第一提示词,得到第二提示词;所述第四提示词模板包含固定部分和占位符,固定部分描述了优化提示词的目标,占位符用于填充所述第一提示词。
15.一种电子设备,其特征在于,包括:存储器、一个或多个处理器;所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述一个或多个处理器调用所述计算机指令以使得所述电子设备执行如权利要求1-14中任一项所述的方法。
16.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在电子设备上运行,使得所述电子设备执行如权利要求1-14中任一项所述的方法。
CN202311499194.XA 2023-11-13 2023-11-13 优化提示词的方法、电子设备 Active CN117272988B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311499194.XA CN117272988B (zh) 2023-11-13 2023-11-13 优化提示词的方法、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311499194.XA CN117272988B (zh) 2023-11-13 2023-11-13 优化提示词的方法、电子设备

Publications (2)

Publication Number Publication Date
CN117272988A CN117272988A (zh) 2023-12-22
CN117272988B true CN117272988B (zh) 2024-04-19

Family

ID=89212681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311499194.XA Active CN117272988B (zh) 2023-11-13 2023-11-13 优化提示词的方法、电子设备

Country Status (1)

Country Link
CN (1) CN117272988B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032819A (zh) * 2019-12-09 2021-06-25 阿里巴巴集团控股有限公司 搜索提示词的确定方法、系统以及信息处理方法
CN113468877A (zh) * 2021-07-09 2021-10-01 浙江大学 语言模型的微调方法、装置、计算设备和存储介质
CN114492363A (zh) * 2022-04-15 2022-05-13 苏州浪潮智能科技有限公司 一种小样本微调方法、系统及相关装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032819A (zh) * 2019-12-09 2021-06-25 阿里巴巴集团控股有限公司 搜索提示词的确定方法、系统以及信息处理方法
CN113468877A (zh) * 2021-07-09 2021-10-01 浙江大学 语言模型的微调方法、装置、计算设备和存储介质
CN114492363A (zh) * 2022-04-15 2022-05-13 苏州浪潮智能科技有限公司 一种小样本微调方法、系统及相关装置

Also Published As

Publication number Publication date
CN117272988A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
US8963916B2 (en) Coherent presentation of multiple reality and interaction models
CN115145529B (zh) 语音控制设备的方法及电子设备
US20130249947A1 (en) Communication using augmented reality
US20140063061A1 (en) Determining a position of an item in a virtual augmented space
US20130226758A1 (en) Delivering aggregated social media with third party apis
US20210165481A1 (en) Method and system of interactive storytelling with probability-based personalized views
CN111866404A (zh) 一种视频编辑方法及电子设备
US20130238778A1 (en) Self-architecting/self-adaptive model
CN113010740B (zh) 词权重的生成方法、装置、设备及介质
US11240550B2 (en) Electronic apparatus and control method thereof
CN115134646B (zh) 视频编辑方法和电子设备
CN116415594A (zh) 问答对生成的方法和电子设备
US11832015B2 (en) User interface for pose driven virtual effects
CN115858826A (zh) 数据处理方法、装置、计算机设备及存储介质
CN112073770B (zh) 显示设备及视频通讯数据处理方法
CN110555102A (zh) 媒体标题识别方法、装置及存储介质
CN117272988B (zh) 优化提示词的方法、电子设备
CN116166794A (zh) 语言模型的训练方法、文本分类方法、装置、设备及介质
CN117082359B (zh) 图像处理方法及相关设备
US20240160402A1 (en) Device and method for transmitting voice data of user in virtual space
Patra et al. Adoption of augmented reality mobile apps: Analysis of popularity
CN116205200A (zh) 视频封面的生成方法、装置、设备、介质及程序产品
CN118052907A (zh) 一种文本配图生成方法和相关装置
CN117332046A (zh) 文本生成方法、装置、电子设备及存储介质
CN116957932A (zh) 一种图像生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant