CN117033599A - 一种数字内容的生成方法及相关设备 - Google Patents
一种数字内容的生成方法及相关设备 Download PDFInfo
- Publication number
- CN117033599A CN117033599A CN202311036183.8A CN202311036183A CN117033599A CN 117033599 A CN117033599 A CN 117033599A CN 202311036183 A CN202311036183 A CN 202311036183A CN 117033599 A CN117033599 A CN 117033599A
- Authority
- CN
- China
- Prior art keywords
- user
- digital content
- question
- questions
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 33
- 230000001747 exhibiting effect Effects 0.000 claims abstract description 5
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010428 oil painting Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本说明书提供了一种数字内容的生成方法及相关设备。该方法包括:向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
Description
技术领域
本说明书一个或多个实施例涉及人工智能技术领域,尤其涉及一种数字内容的生成方法及相关设备。
背景技术
人工智能生成内容(AI-Generated Content,AIGC),是指利用人工智能算法生成具有一定创意和质量的数字内容。通过训练模型和大量数据的学习,AIGC可以基于用户输入的提示词(prompt),生成与之相关的数字内容,例如文章、图像和音频等。
随着AIGC技术的普及,用户对AIGC生成的数字内容的质量要求越来越高,但是,生成高质量的数字内容的前提是用户需要输入高质量的提示词。因此,如何协助普通用户获得高质量的提示词以生成高质量的数字内容,是亟待解决的问题。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种数字内容的生成方法及相关设备。
第一方面,本说明书提供了一种数字内容的生成方法,包括:
向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;
将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
第二方面,本说明书提供了一种数字内容的生成装置,包括:
展示单元,用于向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
提示词生成单元,用于获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;
数字内容生成单元,用于将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
第三方面,本说明书提供了一种数字内容的生成系统,包括:
提示词生成子系统,用于向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
所述提示词生成子系统,还用于获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,基于所述多个目标答案生成文本提示词,并将生成的所述文本提示词输入至数字内容生成子系统;
所述数字内容生成子系统,用于基于接收到的所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
相应地,本说明书还提供了一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述第一方面所述的数字内容的生成方法。
相应地,本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行如上述第一方面所述的数字内容的生成方法。
综上所述,本申请向用户输出展示了用于描述数字内容的多个问题,以及与多个问题中的各个问题对应的多个可选答案,以供用户进行选择。然后,本申请可以基于用户从中选择出的多个目标答案生成对应的文本提示词。进一步地,可以将生成的提示词输入预设的预训练模型中,以由该预训练模型基于该文本提示词生成对应的数字内容,并向用户输出展示该数字内容。如此,本申请不再依赖于用户自己输入提示词,而是通过交互式的提示词生成方式,让用户可以在展示出的多个问题的多个可选答案中选择出符合自己意图的答案,并基于用户的答案生成更加专业、丰富和准确的提示词,从而辅助普通用户获得到高质量的数字内容。
附图说明
图1是一示例性实施例提供的一种系统架构示意图;
图2是一示例性实施例提供的另一种系统架构示意图;
图3是一示例性实施例提供的一种数字内容的生成方法的流程示意图;
图4a-图4b是一示例性实施例提供的一组界面示意图;
图5是一示例性实施例提供的一种数字内容的生成装置的结构示意图;
图6是一示例性实施例提供的一种计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
需要说明的是,本申请中所述的“多个”是指两个或者两个以上。
此外,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
(1)人工智能生成内容(AI-Generated Content,AIGC),是指利用人工智能算法生成具有一定创意和质量的数字内容。通过训练模型和大量数据的学习,AIGC可以基于用户输入的提示词(prompt),生成与之相关的数字内容,例如文章、图像和音频等。
随着AIGC技术的普及,用户对AIGC生成的数字内容的质量要求越来越高,但是,生成高质量的数字内容的前提是用户需要输入高质量的提示词,然而,对于普通用户来说,很难给出专业、准确且丰富的提示词,从而严重影响AIGC生成的数字内容的质量,无法满足用户的实际需求,降低用户体验。
基于此,本说明书提供了一种技术方案,可以通过交互式的提示词生成方法,辅助用户获得更加专业、丰富的提示词,从而生成高质量的数字内容。
在实现时,本申请向用户输出展示与待生成的数字内容相关的多个问题,以及与该多个问题中的各个问题对应的多个可选答案。然后,本申请可以获取用户从多个问题对应的多个可选答案中选择出的多个目标答案,并基于该多个目标答案生成文本提示词。最后,本申请可以将生成的提示词输入基于文本提示词生成数字内容的预训练模型,以由该预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示该数字内容。
在以上技术方案中,本申请向用户输出展示了用于描述数字内容的多个问题,以及与多个问题中的各个问题对应的多个可选答案,以供用户进行选择。然后,本申请可以基于用户从中选择出的多个目标答案生成对应的文本提示词。进一步地,可以将生成的提示词输入预设的预训练模型中,以由该预训练模型基于该文本提示词生成对应的数字内容,并向用户输出展示该数字内容。如此,本申请不再依赖于用户自己输入提示词,而是通过交互式的提示词生成方式,让用户可以在展示出的多个问题的多个可选答案中选择出符合自己意图的答案,并基于用户的答案生成更加专业、丰富和准确的提示词,从而辅助普通用户获得到高质量的数字内容。
请参阅图1,图1是一示例性实施例提供的一种系统架构示意图。本说明书提供的一个或多个实施例可以在图1所示的系统架构或者类似的系统架构中具体实施。如图1所示,该系统可以包括计算机设备100a和计算机设备100b。在一示出的实施方式中,计算机设备100a和计算机设备100b可以通过无线网络的方式建立通信连接,本说明书对此不做具体限定。
在一示出的实施方式中,计算机设备100a上可以运行有与AIGC技术相关的应用程序或者网站,用户通过在该应用程序或者网站上注册的账号进行登录后,计算机设备100a可以通过预设界面向用户输出展示与待生成的数字内容相关的多个问题,以及与该多个问题中的各个问题对应的可选答案。
在一示出的实施方式中,与待生成的数字内容相关的多个问题可以包括用于从多个方面(或者说角度)描述该数字内容的多个问题。
示例性的,以待生成的数字内容为图像为例,该多个问题可以包括与图像的内容、风格、渲染方式和图像分辨率等有关的问题。
示例性的,该多个问题中可以包括“图像的绘画风格是什么?”,与该问题对应的多个可选答案可以包括“素描”、“油画”、“水彩”、“水墨画”,等等,本说明书对此不做具体限定。示例性的,该多个问题中还可以包括“图像中是否包含人物?”,与该问题对应的多个可选答案可以包括“不包含人物”、“包含男性”、“包含女性”、“包含儿童”,等等,本说明书对此不做具体限定。
进一步地,计算机设备100a可以获取用户从多个问题对应的多个可选答案中选择出的多个目标答案。
在一示出的实施方式中,计算机设备100a可以响应于用户通过计算机设备100a中的输入设备(例如触摸屏或者键盘等)对该多个问题对应的多个可选答案中的多个目标答案执行的触发操作,获取用户选择出的多个目标答案。示例性,上述触发操作可以是点击操作或者拖拽操作,等等,本说明书对此不做具体限定。
进一步地,计算机设备100a可以基于获取到的多个目标答案,生成对应的文本提示词。在一示出的实施方式中,计算机设备100a还可以向用户输出展示生成的提示词,以供用户确认。
进一步地,计算机设备100a可以基于该文本提示词生成对应的数字内容,最后,计算机设备100a可以向用户输出展示生成的数字内容。
在一示出的实施方式中,计算机设备100a中可以搭载了基于文本提示词生成数字内容的预训练模型(或者称之为大模型)。相应的,计算机设备100a在生成数字内容时,可以包括:将生成的提示词输入基于文本提示词生成数字内容的预训练模型,以由该预训练模型基于上述文本提示词生成对应的数字内容,等等,本说明书对此不做具体限定。
需要说明的是,本说明书对数字内容的具体类型不作特别限定。在一示出的实施方式中,该数字内容可以是文本、图像、音频和视频,等等,本说明书对此不做具体限定。
在一示出的实施方式中,计算机设备100a在向用户输出展示问题以及与问题对应的可选答案时,除了可以一次性地向用户输出展示所有问题以及与所有问题对应的多个可选答案之外,计算机设备100a也可以依次向用户展示每个问题以及对应的可选答案。
在一示出的实施方式中,计算机设备100a可以基于用户针对当前问题的多个可选答案所选择出的至少一个目标答案,生成下一个问题以及与下一个问题对应的多个可选答案,并向用户进行输出展示,以此类推,直至向用户输出展示的问题的数量达到预设阈值。示例性的,该预设阈值可以根据实际情况进行自定义设置,例如为8个、10个或者15个,等等,本说明书对此不做具体限定。
在一示出的实施方式中,计算机设备100a中可以搭载了预设的问题生成模型。相应的,计算机设备100a在生成问题以及与该问题对应的可选答案时,可以包括:将用户从当前问题(例如第一问题)的多个可选答案中选择出的至少一个目标答案输入预设的问题生成模型,以由该问题生成模型,基于该至少一个目标答案针对该用户进行意图理解计算,以确定该用户生成数据内容的用户意图,并生成符合该用户意图的下一个问题(例如第二问题)以及与该下一个问题对应的多个可选答案,等等,本说明书对此不做具体限定。
需要说明的是,本说明书对上述问题生成模型的具体类型不作特别限定。在一示出的实施方式中,该问题生成模型可以是预训练语言模型,或者其他任何可能的模型,本说明书对此不做具体限定。
此外,在一些可能的实施方式中,在计算机设备100a本身算力资源不足的情况下,可以通过与计算机设备100a对接的计算机设备100b实现上述部分功能。相应的,计算机设备100b中可以搭载了上述问题生成模型以及基于文本提示词生成数字内容的预训练模型。
在一示出的实施方式中,计算机设备100a可以作为AIGC相关应用程序或者网站的客户端,计算机设备100b可以作为服务端。在一示出的实施方式中,计算机设备100a可以通过无线网络等方式与计算机设备100b建立通信连接。
如此,计算机设备100a可以主要用于通过显示器向用户输出展示问题以及与问题对应的可选答案,并响应于用户的操作获取用户选择出的目标答案。
进一步地,计算机设备100a可以将用户选择出的目标答案发送至计算机设备100b。相应的,计算机设备100b可以接收计算机设备100a发送的目标答案,基于该目标答案生成下一个问题以及与下一个问题对应的多个可选答案,并打包成数据反馈至计算机设备100a。相应的,计算机设备100a可以基于计算机设备100b反馈的数据向用户输出展示下一个问题以及与该下一个问题对应的多个可选答案,以供用户选择。
进一步地,当计算机设备100a获取到用户从所有问题对应的多个可选答案中选择出的多个目标答案后,可以将该多个目标答案发送至计算机设备100b。相应的,计算机设备100b可以基于接收到的多个目标答案生成对应的文本提示词,并基于该文本提示词生成对应的数字内容。进一步地,计算机设备100b可以将生成的数字内容发送至计算机设备100a,以由计算机设备100a向用户输出展示该生成的数字内容。
如上所述,本申请不再依赖于用户自己输入提示词,而是通过交互式的提示词生成方式,让用户可以在展示出的多个问题的多个可选答案中选择出符合自己意图的答案,并基于用户的答案生成更加专业、丰富和准确的提示词,从而辅助普通用户获得到高质量的数字内容。
在一示出的实施方式中,计算机设备100a可以是具备上述功能的智能可穿戴设备、智能手机、平板电脑、笔记本电脑、台式电脑和车载计算机,等等,本说明书对此不做具体限定。
在一示出的实施方式中,计算机设备100b可以是具备上述功能的服务器,也可以是由多台服务器构成的服务器集群或者云计算服务中心,等等,本说明书对此不做具体限定。
请参阅图2,图2是一示例性实施例提供的一种系统架构示意图,本说明书提供的一个或多个实施例可以在图2所示的系统架构或者类似的系统架构中具体实施。如图2所示,该数字内容生成系统200可以包括提示词生成子系统201和数字内容生成子系统202,其中,提示词生成子系统201与数字内容生成子系统202对接。
在一示出的实施方式中,提示词生成子系统201可以用于向用户输出展示与待生成的数字内容相关的多个问题,以及与该多个问题中的各个问题对应的可选答案。
进一步地,提示词生成子系统201可以获取用户从多个问题对应的多个可选答案中选择出的多个目标答案,并基于该多个目标答案,生成对应的文本提示词。
进一步地,提示词生成子系统201可以将生成的文本提示词输入至与其对接的数字内容生成子系统202。相应的,该数字内容生成子系统202可以接收提示词生成子系统201输入的文本提示词,并基于该文本提示词生成对应的数字内容。
在一示出的实施方式中,提示词生成子系统201中可以搭载了上述问题生成模型,数字生成内容子系统202中可以搭载了上述基于文本提示词生成数字内容的预训练模型。其中,提示词生成子系统201和数字生成内容子系统202的具体功能可以参考上述图1对应实施例的描述,此处不再展开详述。
请一并参考图1,该数字内容生成系统200可以部署在计算机设备100a上,以由计算机设备100a实现上述所有功能。或者,该数字内容生成系统200也可以部署在计算机设备100a和计算机设备100b上。示例性的,该数字内容生成系统200中的数字内容生成子系统202可以部署在计算机设备100b上,以由计算机设备100b基于文本提示词生成数字内容;该数字内容生成系统200中的提示词生成子系统201所包含的前端界面交互功能可以部署在计算机设备100a上,以由计算机设备100a向用户输出展示问题和答案,而提示词生成子系统201所包含的问题生成功能以及提示词生成功能可以部署在计算机设备100b上,等等,本说明书对此不做具体限定。
请参阅图3,图3是一示例性实施例提供的一种数字内容的生成方法的流程示意图。该方法可以应用于图1或者图2所示的系统架构中。如图3所示,该方法具体可以包括如下步骤S301-步骤S303。
步骤S301,向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案。
在一示出的实施方式中,本申请可以通过预设界面向用户输出展示与待生成的数字内容相关的多个问题,以及与该多个问题中的各个问题对应的多个可选答案。
在一示出的实施方式中,与待生成的数字内容相关的多个问题可以包括用于从多个方面描述数字内容的多个问题。
示例性的,以待生成的数字内容为图像为例,该多个问题可以包括与图像的内容、风格、渲染方式和图像分辨率等有关的问题。
示例性的,该多个问题中可以包括“图像的绘画风格是什么?”,与该问题对应的多个可选答案可以包括“素描”、“油画”、“水彩”、“水墨画”,等等,本说明书对此不做具体限定。示例性的,该多个问题中还可以包括“图像中是否包含人物?”,与该问题对应的多个可选答案可以包括“不包含人物”、“包含男性”、“包含女性”、“包含儿童”,等等,本说明书对此不做具体限定。
示例性的,以待生成的数字内容为文本为例,该多个问题可以包括与文本的内容、类型、风格等有关的问题。
示例性的,该多个问题中可以包括“文本的类型是什么?”,与该问题对应的多个可选答案可以包括“诗歌”、“议论文”、“朋友圈文案”,等等,本说明书对此不做具体限定。示例性的,该多个问题中还可以包括“文本的风格是什么?”,与该问题对应的多个可选答案可以包括“幽默”、“感人”、“慷慨激昂”,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请可以一次性向用户输出展示预设数量的多个问题,以及与各个问题对应的多个可选答案。
在一示出的实施方式中,本申请可以获取用户的用户数据,该用户数据可以包括与用户生成数字内容的用户意图相关的用户数据。进一步地,本申请可以基于该用户数据生成预设数量的问题,以及与每个问题对应的多个可选答案,并向用户进行输出展示。
在一示出的实施方式中,该用户数据可以包括与该用户以往生成的数字内容相关的数据。示例性的,该用户数据可以包括:为该用户生成的历史数字内容,与历史数字内容对应的多个历史问题,以及,用户从这多个历史问题中的各个历史问题对应的多个可选答案中选择出的目标答案,等等,本说明书对此不做具体限定。
在一示出的实施方式中,该用户数据还可以包括其他任何可能的与用户生成数字内容的用户意图相关的数据,例如还可以包括不涉及用户隐私的用户个人信息,这些个人信息可以指示用户对数字内容的内容偏好,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请在基于获取到的用户数据生成问题和可选答案时,具体可以包括:将获取到的用户数据输入预设的问题生成模型,以由该问题生成模型,基于用户数据针对该用户进行意图理解计算,以确定该用户生成数据内容的用户意图,并生成符合该用户意图的预设数量的问题,以及与每个问题对应的多个可选答案,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请还可以依次向用户输出展示每个问题,以及与每个问题对应的多个可选答案。
示例性的,本申请可以基于用户针对当前问题的多个可选答案所选择出的至少一个目标答案,生成下一个问题以及与下一个问题对应的多个可选答案,并向用户进行输出展示,以此类推,直至向用户输出展示的问题的数量达到预设阈值。示例性的,该预设阈值可以根据实际情况进行自定义设置,例如为8个、10个或者15个,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请在基于当前问题的目标答案生成下一个问题,以及与下一个问题对应的可选答案时,具体可以包括:将用户从当前问题(例如第一问题)的多个可选答案中选择出的至少一个目标答案输入预设的问题生成模型,以由该问题生成模型,基于该至少一个目标答案针对该用户进行意图理解计算,以确定该用户生成数据内容的用户意图,并生成符合该用户意图的下一个问题(例如第二问题)以及与该下一个问题对应的多个可选答案,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请也可以基于用户针对当前已展示出的所有问题(例如多个第一问题)所选择出的目标答案,生成下一个问题以及与下一个问题对应的多个可选答案,并向用户进行输出展示,等等,本说明书对此不做具体限定。
在一示出的实施方式中,本申请还可以基于用户针对当前问题所选择出的目标答案,并结合上述获取到的与生成数据内容的用户意图相关的用户数据,来生成下一个问题以及与下一个问题对应的多个可选答案,并向用户进行输出展示,等等,本说明书对此不做具体限定。相应的,本申请可以将用户从当前问题的多个可选答案中选择出的至少一个目标答案以及上述数用户数据输入预设的问题生成模型,以由该问题生成模型,基于该至少一个目标答案和用户数据针对该用户进行意图理解计算,以确定该用户生成数据内容的用户意图,并生成符合该用户意图的下一个问题以及与该下一个问题对应的多个可选答案,等等,本说明书对此不做具体限定。
可以理解的是,对于第1个问题来说,由于在其之前没有其它问题,因此也无法基于之前问题的目标答案来生成第1个问题,所以第1个问题往往可以是预设的默认问题,例如图像的分辨率或者图像的风格等,或者,也可以基于上述用户数据来生成第1个问题,等等,本说明书对此不做具体限定。
需要说明的是,本说明书对问题生成模型的具体类型不作特别限定。在一示出的实施方式中,该问题生成模型可以是以下示出的任意一种模型:基于深度学习算法的深度学习模型;基于支持向量机支持向量机(support vector machines,SVM)算法的机器学习模型;基于极端梯度提升XGBoost算法的机器学习模型,等等,本说明书对此不做具体限定。
在一示出的实施方式中,该问题生成模型具体可以是预训练语言模型,等等,本说明书对此不做具体限定。
请参阅图4a-图4b,图4a-图4b是一示例性实施例提供的一组界面示意图。如图4a所示,在界面401中可以包括问题显示区域402和提示词显示区域403。如图4a所示,界面401当前输出展示了两个问题,基于用户针对当前第2个问题所选择出的目标答案(包含男性、包含女性),可以生成第3个问题以及与第3个问题对应的多个可选答案。示例性的,第3个问题可以是“请选择人物的行为”,与第3个问题对应的多个可选答案可以包括“拥抱”、“牵手”,等等,本说明书对此不做具体限定。
以此类推,如图4b所示,可以基于第7个问题的目标答案生成第8个问题及对应的多个可选答案。示例性的,第8个问题可以为最后一个问题(即问题数量的预设阈值可以为8),至此,向用户输出展示了所有问题及可选答案。
如图4a和图4b,在用户选择答案的过程中,提示词显示区域403可以响应于用户选择出的目标答案实时动态的显示由当前目标答案所构成的提示词,等等,本说明书对此不做具体限定。
步骤S302,获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词。
进一步地,本申请可以获取用户从多个问题对应的多个可选答案中选择出的多个目标答案。在一示出的实施方式中,本申请可以响应于用户对目标答案的触发操作(例如点击操作),获取用户从多个问题对应的多个可选答案中选择出的多个目标答案。
进一步地,本申请可以基于获取到的多个目标答案生成对应的提示词。在一示出的实施方式中,提示词一般可以是文本的形式,即本申请可以基于获取到的多个目标答案生成对应的文本提示词。
在一示出的实施方式中,在用户逐题选择目标答案的过程中,本申请可以依次获取用户从每个问题对应的多个可选答案中选择出的目标答案,并不断更新当前生成的文本提示词,直至获取到用户从最后一个问题对应的多个可选答案中选择出的目标答案,以获得最终的文本提示词。
步骤S303,将生成的文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
进一步地,在一示出的实施方式中,本申请可以基于生成的文本提示词进一步生成与该文本提示词相对应的数字内容,并向用户输出展示该数字内容。
在一示出的实施方式中,本申请可以将生成的文本提示词输入基于文本提示词生成数字内容的预训练模型,以由该预训练模型基于该文本提示词生成对应的数字内容。
示例性的,以上述图4b为例,响应于用户对界面401中的“确定”控件的触发操作(例如点击操作),可以基于用户从8个问题对应的多个可选答案中选择出的多个目标答案,生成对应的文本提示词,并将该文本提示词输入基于文本提示词生成数字内容的预训练模型,以由该预训练模型基于该文本提示词生成对应的数字内容。进一步地,本申请可以通过预设界面输出展示该数字内容。
如上所述,该数字内容可以是以下示出的任意一种:文本、图像、音频和视频,等等,本说明书对此不做具体限定。
综上所述,本申请向用户输出展示了用于描述数字内容的多个问题,以及与多个问题中的各个问题对应的多个可选答案,以供用户进行选择。然后,本申请可以基于用户从中选择出的多个目标答案生成对应的文本提示词。进一步地,可以将生成的提示词输入预设的预训练模型中,以由该预训练模型基于该文本提示词生成对应的数字内容,并向用户输出展示该数字内容。如此,本申请不再依赖于用户自己输入提示词,而是通过交互式的提示词生成方式,让用户可以在展示出的多个问题的多个可选答案中选择出符合自己意图的答案,并基于用户的答案生成更加专业、丰富和准确的提示词,从而辅助普通用户获得到高质量的数字内容。
与上述方法流程实现对应,本说明书的实施例还提供了一种数字内容的生成装置。请参阅图5,图5是一示例性实施例提供的一种数字内容的生成装置的结构示意图,该装置50可以应用于图1所示系统架构中的计算机设备100a。如图5所示,该装置50包括:
展示单元501,用于向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
提示词生成单元502,用于获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;
数字内容生成单元503,用于将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
在一示出的实施方式中,所述展示单元501,具体用于:
向用户输出展示与待生成的数字内容对应的第一问题,以及,与所述第一问题对应的多个可选答案;
获取所述用户从所述第一问题对应的多个可选答案中选择出的至少一个目标答案,并基于所述至少一个目标答案生成第二问题以及与所述第二问题对应的多个可选答案,并向用户输出展示所述第二问题,以及,与所述第二的对应的多个可选答案,以此类推,直至向用户输出展示的问题的数量达到预设阈值。
在一示出的实施方式中,所述展示单元501,具体用于:
将所述至少一个目标答案输入预设的问题生成模型,以由所述问题生成模型,基于所述至少一个目标答案针对所述用户进行意图理解计算,以确定所述用户生成数据内容的用户意图,并生成符合所述用户意图的第二问题以及与所述第二问题对应的多个可选答案。
在一示出的实施方式中,所述展示单元501,具体用于:
获取与所述用户生成数字内容的用户意图相关的用户数据;
将所述至少一个目标答案和所述用户数据输入预先训练完成的问题生成模型,以由所述问题生成模型,基于所述至少一个目标答案和所述用户数据针对所述用户进行意图理解计算,以确定所述用户生成数据内容的用户意图,并生成符合所述用户意图的第二问题以及与所述第二问题对应的多个可选答案。
在一示出的实施方式中,所述问题生成模型为预训练语言模型。
在一示出的实施方式中,所述用户数据包括:
为所述用户生成的历史数字内容;
与所述历史数字内容对应的多个历史问题;以及,
所述用户从与所述多个历史问题中的各个历史问题对应的多个可选答案中选择的目标答案。
在一示出的实施方式中,所述数字内容包括以下示出的任意一种:文本、图像、视频和音频。
上述装置50中各个单元的功能和作用的实现过程具体详见上述图1-图4b对应实施例的描述,在此不再进行赘述。应理解,上述装置50可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过所在设备的处理器(CPU)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了CPU以及存储器之外,上述装置所在的设备通常还包括用于进行无线信号收发的芯片等其他硬件,和/或用于实现网络通信功能的板卡等其他硬件。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部单元或模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的装置、单元、模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备、车载计算机或者这些设备中的任意几种设备的组合。
与上述方法实施例相对应,本说明书的实施例还提供了一种计算机设备。请参阅图6,图6是一示例性实施例提供的一种计算机设备的结构示意图。图6所示的计算机设备可以为上述图1所示系统架构中的计算机设备100a。如图6所示,该计算机设备包括处理器1001和存储器1002,进一步还可以包括输入设备1004(例如键盘等)和输出设备1005(例如显示器等)。处理器1001、存储器1002、输入设备1004和输出设备1005之间可以通过总线或其他方式连接。如图6所示,存储器1002包括计算机可读存储介质1003,该计算机可读存储介质1003存储有能够由处理器1001运行的计算机程序。处理器1001可以是CPU,微处理器,或用于控制以上方法实施例执行的集成电路。处理器1001在运行存储的计算机程序时,可以执行本说明书实施例中数字内容的生成方法的各个步骤,包括:向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;将生成的所述提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容,等等。
对上述数字内容的生成方法的各个步骤的详细描述请参见之前的内容,此处不再进行赘述。
与上述方法实施例相对应,本说明书的实施例还提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,这些计算机程序在被处理器运行时,执行本说明书实施例中数字内容的生成方法的各个步骤。具体请参见上述图1-图4b对应实施例的描述,此处不再进行赘述。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
在一个典型的配置中,终端设备包括一个或多个CPU、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。
计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (12)
1.一种数字内容的生成方法,其特征在于,包括:
向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;
将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
2.根据权利要求1所述的方法,其特征在于,所述向用户输出展示与待生成的数字内容对应的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案,包括:
向用户输出展示与待生成的数字内容对应的第一问题,以及,与所述第一问题对应的多个可选答案;
获取所述用户从所述第一问题对应的多个可选答案中选择出的至少一个目标答案,并基于所述至少一个目标答案生成第二问题以及与所述第二问题对应的多个可选答案,并向用户输出展示所述第二问题,以及,与所述第二的对应的多个可选答案,以此类推,直至向用户输出展示的问题的数量达到预设阈值。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个目标答案生成第二问题以及与所述第二问题对应的多个可选答案,包括:
将所述至少一个目标答案输入预设的问题生成模型,以由所述问题生成模型,基于所述至少一个目标答案针对所述用户进行意图理解计算,以确定所述用户生成数据内容的用户意图,并生成符合所述用户意图的第二问题以及与所述第二问题对应的多个可选答案。
4.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个目标答案生成第二问题以及与所述第二问题对应的多个可选答案,包括:
获取与所述用户生成数字内容的用户意图相关的用户数据;
将所述至少一个目标答案和所述用户数据输入预先训练完成的问题生成模型,以由所述问题生成模型,基于所述至少一个目标答案和所述用户数据针对所述用户进行意图理解计算,以确定所述用户生成数据内容的用户意图,并生成符合所述用户意图的第二问题以及与所述第二问题对应的多个可选答案。
5.根据权利要求3所述的方法,其特征在于,所述问题生成模型为预训练语言模型。
6.根据权利要求4所述的方法,其特征在于,所述用户数据包括:
为所述用户生成的历史数字内容;
与所述历史数字内容对应的多个历史问题;以及,
所述用户从与所述多个历史问题中的各个历史问题对应的多个可选答案中选择的目标答案。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述数字内容包括以下示出的任意一种:文本、图像、视频和音频。
8.一种数字内容的生成系统,其特征在于,包括:
提示词生成子系统,用于向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
所述提示词生成子系统,还用于获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,基于所述多个目标答案生成文本提示词,并将生成的所述文本提示词输入至数字内容生成子系统;
所述数字内容生成子系统,用于基于接收到的所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
9.根据权利要求8所述的系统,其特征在于,所述提示词生成子系统搭载了预训练语言模型;所述数字内容生成子系统搭载了基于文本提示词生成数字内容的预训练模型。
10.一种数字内容的生成装置,其特征在于,包括:
展示单元,用于向用户输出展示与待生成的数字内容相关的多个问题,以及与所述多个问题中的各个问题对应的多个可选答案;
提示词生成单元,用于获取所述用户从所述多个问题对应的多个可选答案中选择出的多个目标答案,并基于所述多个目标答案生成文本提示词;
数字内容生成单元,用于将生成的所述文本提示词输入基于文本提示词生成数字内容的预训练模型,以由所述预训练模型基于所述文本提示词生成对应的数字内容,并向用户输出展示所述数字内容。
11.一种计算机设备,其特征在于,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行如权利要求1至7任意一项所述的方法。
12.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311036183.8A CN117033599A (zh) | 2023-08-16 | 2023-08-16 | 一种数字内容的生成方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311036183.8A CN117033599A (zh) | 2023-08-16 | 2023-08-16 | 一种数字内容的生成方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117033599A true CN117033599A (zh) | 2023-11-10 |
Family
ID=88636997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311036183.8A Pending CN117033599A (zh) | 2023-08-16 | 2023-08-16 | 一种数字内容的生成方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117033599A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117271756A (zh) * | 2023-11-21 | 2023-12-22 | 安徽淘云科技股份有限公司 | 文本生成方法、装置、电子设备以及可读介质 |
-
2023
- 2023-08-16 CN CN202311036183.8A patent/CN117033599A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117271756A (zh) * | 2023-11-21 | 2023-12-22 | 安徽淘云科技股份有限公司 | 文本生成方法、装置、电子设备以及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11303590B2 (en) | Suggested responses based on message stickers | |
KR102295935B1 (ko) | 흉내 및 풍부한 멀티미디어로 응답하는 디지털 개인용 어시스턴트 상호작용 기법 | |
US10617959B2 (en) | Method and system for training a chatbot | |
EP3623957A1 (en) | Generation of point of interest copy | |
CN111768231B (zh) | 产品信息推荐方法及装置 | |
CN107085495B (zh) | 一种信息展示方法、电子设备及存储介质 | |
US10984794B1 (en) | Information processing system, information processing apparatus, information processing method, and recording medium | |
CN112698769A (zh) | 信息交互方法、装置、设备、存储介质及程序产品 | |
US11928985B2 (en) | Content pre-personalization using biometric data | |
CN108519998B (zh) | 基于知识图谱的问题引导方法及装置 | |
CN109801527B (zh) | 用于输出信息的方法和装置 | |
CN109978139B (zh) | 图片自动生成描述的方法、系统、电子装置及存储介质 | |
CN110232920B (zh) | 语音处理方法和装置 | |
CN117033599A (zh) | 一种数字内容的生成方法及相关设备 | |
CN112447073A (zh) | 一种讲解视频生成、讲解视频展示方法及装置 | |
US11232145B2 (en) | Content corpora for electronic documents | |
CN118132695A (zh) | 启发式人机对话方法及装置、电子设备和存储介质 | |
CN116962848A (zh) | 视频生成方法、装置、终端、存储介质及产品 | |
US10831812B2 (en) | Author-created digital agents | |
US12020683B2 (en) | Real-time name mispronunciation detection | |
CN117319340A (zh) | 语音消息的播放方法、装置、终端及存储介质 | |
CN112309390B (zh) | 信息交互方法和装置 | |
CN111159472A (zh) | 多模态聊天技术 | |
CN116776861A (zh) | 线索生成及展示方法、装置、计算机设备、存储介质 | |
CN117908736A (zh) | 交互方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |