CN118429470A - 一种基于aigc的地图生成方法和装置 - Google Patents

一种基于aigc的地图生成方法和装置 Download PDF

Info

Publication number
CN118429470A
CN118429470A CN202410645175.1A CN202410645175A CN118429470A CN 118429470 A CN118429470 A CN 118429470A CN 202410645175 A CN202410645175 A CN 202410645175A CN 118429470 A CN118429470 A CN 118429470A
Authority
CN
China
Prior art keywords
topographic
aigc
paragraph
map
text file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410645175.1A
Other languages
English (en)
Inventor
刘慧静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weihai Kaisi Information Technology Co ltd
Original Assignee
Weihai Kaisi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weihai Kaisi Information Technology Co ltd filed Critical Weihai Kaisi Information Technology Co ltd
Priority to CN202410645175.1A priority Critical patent/CN118429470A/zh
Publication of CN118429470A publication Critical patent/CN118429470A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本申请公开了一种基于AIGC的地图生成方法和装置,所述方法包括:获取文本文件,提取所述文本文件中的地形描述段落;通过深度学习模型对所述地形描述段落进行理解,利用生成对抗网络基于理解结果创建出目标地图;通过图像处理算法对所述目标地图进行优化,以加强所述目标地图的显示效果。本申请可以将小说等文字作品中的地理环境具象化,更加有利于读者的阅读体验和对故事背景、情节发展的理解。

Description

一种基于AIGC的地图生成方法和装置
技术领域
本申请涉及图像处理技术领域,特别涉及一种基于AIGC的地图生成方法和装置。
背景技术
随着播讲型应用产品的兴起,极大地扩展了小说的传播广泛度。这些平台通过音频形式,让小说内容触达了更广泛的受众,无论是忙碌的上班族,还是在路途中的人们,都能随时随地聆听精彩故事。小说的表现形式因此变得更为多样,其影响力和受众群体也随之大幅提升。
小说作为受众广泛的文学形式,常包含丰富的地理环境描述。然而,这些文字描述要求读者在脑海中构建虚拟场景,对于想象力有限的读者而言,这往往是一项挑战。他们可能难以将文字中的地理环境具象化,这无疑削弱了他们的阅读体验和对故事背景、情节发展的理解。
发明内容
本申请的目的在于提供一种基于AIGC的地图生成方法和装置,其能够改善上述问题。
本申请的实施例是这样实现的:
第一方面,本申请提供一种基于AIGC的地图生成方法,其中,S1、S2等仅为步骤标识,方法的执行顺序并不一定按照数字由小到大的顺序进行,比如可以是先执行步骤S2再执行步骤S1,本申请不做限制。该基于生成式人工智能(Artificial IntelligenceGenerated Content,AIGC)的地图生成方法包括以下步骤:
S1:获取文本文件,提取所述文本文件中的地形描述段落;
S2:通过深度学习模型对所述地形描述段落进行理解,利用生成对抗网络基于理解结果创建出目标地图;
S3:通过图像处理算法对所述目标地图进行优化,以加强所述目标地图的显示效果。
可以理解,本申请公开了一种基于AIGC的地图生成方法,通过深度学习模型对目标文本文件中的地形描述段落进行理解,再利用生成对抗网络基于理解结果创建出目标地图。本申请可以将小说等文字作品中的地理环境具象化,更加有利于读者的阅读体验和对故事背景、情节发展的理解。
在本申请可选的实施例中,所述S1包括以下步骤:
S11:获取文本文件,搜索所述文本文件中属于预设地形词库中的关键词。
其中,所述S11包括以下步骤:S111:获取文本文件,将所述文本文件中的连续文本切分成独立的词汇单元后,去除停用词,得到剩余词汇集;S112:在所述剩余词汇集中搜索属于预设地形词库中的关键词。
S12:在所述文本文件中,基于所述关键词附近的段落边界符号,提取出包含所述关键词的地形描述段落。
可以理解,为了更加准确地创建出目标地图,需要合理地安排深度学习模型的算力,因此需要从长篇大论的文本文件中提取出地形描述段落,将后续深度学习模型的学习重点集中到地形描述段落,以提高深度学习模型的学习效率。
在本申请可选的实施例中,所述S1还包括以下至少一项:
S13:搜索所述地形描述段落中属于预设比喻词库中的形容词,删除所述形容词对应的所述地形描述段落;
S14:通过训练好的比喻文本判断模型对各个所述地形描述段落进行判断,删除判断结果为比喻文本的所述地形描述段落。
可以理解,不是所有包含关键词的句子都是有效的地理环境描述,举例说明,有些句子虽然包含“山”这个词,但可能只是在比喻或描述其他事物,如“他的心情像山一样沉重”。这样的句子就不是有效的地理环境描述,因此需要删除,以避免对后续深度学习模型的学习造成障碍。
在本申请可选的实施例中,所述S2包括:
S21:提取所述地形描述段落的关键特征,所述关键特征包括空间关系特征、自然地形特征、人文地理特征中的至少一项。
其中,所述S21包括,S211:将所述地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第一关键词汇集;S212:通过训练好的词性标注工具对所述第一关键词汇集中的各个关键词进行词性划分,词性类别包括空间关系特征、自然地形特征、人文地理特征中的至少一项。
S22:通过训练好的Transformer架构模型深入理解所述关键特征。
S23:利用生成对抗网络基于理解结果创建出目标地图。
第二方面,本申请还提供一种基于AIGC的地图生成方法,包括以下步骤:
S1:获取文本文件,提取所述文本文件中的地形描述段落。
其中,所述识别各个所述地形描述段落中的时间标识词,包括:将所述地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第二关键词汇集;在所述第二关键词汇集中搜索属于预设时间词库中的时间标识词。
S4:识别各个所述地形描述段落中的时间标识词,按照所述时间标识词对所述地形描述段落进行分组,得到各个地形描述组。
S5:通过深度学习模型对各个所述地形描述组中的各个所述地形描述段落进行理解,利用生成对抗网络基于理解结果创建出每个所述地形描述组对应的时代地图。
可以理解,本申请还公开了另一种基于AIGC的地图生成方法,提取文本文件中的地形描述段落后,按照地形描述段落中的时间标识词对各个地形描述段落进行分组,随后根据AIGC技术创建出每个地形描述组对应的时代地图。本方法不仅考虑了传统空间维度的地图建设,还考虑了时间维度的地图变化,赋予每个单一地图时间标识,更加有利于读者的理解。
在本申请可选的实施例中,第二方面公开的基于AIGC的地图生成方法,还包括以下步骤:S6,按照所述时间标识词对应的时间顺序,排列所述时代地图,得到目标视频或长图。
第三方面,本申请提供一种基于AIGC的地图生成装置,其包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面和/或第二方面任一项所述的方法。
第四方面,本申请公开了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面和/或第二方面任一项所述的方法。
有益效果:本申请公开了一种基于AIGC的地图生成方法和装置,通过深度学习模型对目标文本文件中的地形描述段落进行理解,再利用生成对抗网络基于理解结果创建出目标地图。本申请可以将小说等文字作品中的地理环境具象化,更加有利于读者的阅读体验和对故事背景、情节发展的理解。
本申请还公开了另一种基于AIGC的地图生成方法,提取文本文件中的地形描述段落后,按照地形描述段落中的时间标识词对各个地形描述段落进行分组,随后根据AIGC技术创建出每个地形描述组对应的时代地图。本方法不仅考虑了传统空间维度的地图建设,还考虑了时间维度的地图变化,赋予每个单一地图时间标识,更加有利于读者的理解。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举可选实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请提供的一种基于AIGC的地图生成方法的流程示意图;
图2是图1所示的基于AIGC的地图生成方法所创建的一种目标地图;
图3是本申请提供的另一种基于AIGC的地图生成方法的流程示意图;
图4至图7是图3所示的基于AIGC的地图生成方法所创建的各个时代地图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一方面,本申请提供一种基于AIGC的地图生成方法,其中,S1、S2等仅为步骤标识,方法的执行顺序并不一定按照数字由小到大的顺序进行,比如可以是先执行步骤S2再执行步骤S1,本申请不做限制。该基于生成式人工智能(Artificial IntelligenceGenerated Content,AIGC)的地图生成方法包括以下步骤S1至S3,如图1所示。
S1,获取文本文件,提取文本文件中的地形描述段落。
上述文本文件可以包括小说等书籍的文本文件,其中常包含丰富的地理环境描述,比如“甲村就位于这东河和西河的交汇处”等语句均属于地形描述段落的范围。
在本申请可选的实施例中,S1包括以下步骤:
S11,获取文本文件,搜索文本文件中属于预设地形词库中的关键词。
上述预设地形词库可以是有开发者预先设置的关于地形描述的关键词,可以包括,“村”、“镇”、“市”、“国”等表征人文地理的词汇;“山”、“河”、“湖”、“海”等表征自然地理的词汇;以及,“东”、“南”、“西”、“北”等表征空间关系的词汇。
其中,S11包括以下步骤:获取文本文件,将文本文件中的连续文本切分成独立的词汇单元后,去除停用词,得到剩余词汇集;在剩余词汇集中搜索属于预设地形词库中的关键词。
可以使用NLTK(Natural Language Toolkit,自然语言处理工具包)、jieba(结巴分词,主要针对中文)等分词算法,这些算法能够对多种语言进行准确的分词处理,将文本文件中的连续文本切分成独立的词汇单元。比如,针对“甲村就位于这东河和西河的交汇处”一句,可以分为,“甲村”、“就”、“位于”、“这”、“东河”、“和”、“西河”、“的”、“交汇处”。
停用词是指在文本中频繁出现但对文本意义贡献较小的词,如“的”、“了”、“在”等。停用词库可以手动创建,也可以从各种开源资源中获取。许多NLP库(如NLTK、spaCy)都提供了停用词列表。去除停用词可以减少噪音,提高后续处理的准确性。比如,针对“甲村就位于这东河和西河的交汇处”一句,可将“就”、“这”、“和”、“的”四个停用词删除,保留“甲村”、“位于”、“东河”、“西河”、“交汇处”构成剩余词汇集。
接下来,利用构建好的预设地形词库,使用正则表达式(Regular Expressions)或者字符串匹配算法在剩余词汇集中搜索包含这些关键词的句子。Python中的re模块或者文本处理库如NLTK、spaCy等都提供了这样的搜索功能。
S12,在文本文件中,基于关键词附近的段落边界符号,提取出包含关键词的地形描述段落。
段落通常是由换行符、空行或者特定的段落标记来分隔的。通过识别这些边界,我们可以确定每个地理环境描述句子所在的段落。
可以理解,为了更加准确地创建出目标地图,需要合理地安排深度学习模型的算力,因此需要从长篇大论的文本文件中提取出地形描述段落,将后续深度学习模型的学习重点集中到地形描述段落,以提高深度学习模型的学习效率。
不是所有包含关键词的句子都是有效的地理环境描述,举例说明,有些句子虽然包含“山”这个词,但可能只是在比喻或描述其他事物,如“他的心情像山一样沉重”。这样的句子就不是有效的地理环境描述,因此需要删除,以避免对后续深度学习模型的学习造成障碍。因此,步骤S1还包括以下至少一项:
S13:搜索地形描述段落中属于预设比喻词库中的形容词,删除形容词对应的地形描述段落。可以使用基于语言使用的规则方法来排除包含“像”、“貌似”等预设比喻词库中的形容词的地形描述段落。
S14:通过训练好的比喻文本判断模型对各个地形描述段落进行判断,删除判断结果为比喻文本的地形描述段落。步骤S14可使用分类算法(如逻辑回归、支持向量机等)或深度学习模型(如卷积神经网络CNN、长短期记忆网络LSTM等)来训练一个分类器,用于排除比喻句的干扰、自动识别有效的地理环境描述。
S2:通过深度学习模型对地形描述段落进行理解,利用生成对抗网络基于理解结果创建出目标地图。步骤S2具体包括步骤S21至S23。
S21:提取地形描述段落的关键特征,关键特征包括空间关系特征、自然地形特征、人文地理特征中的至少一项。
举例说明,针对“甲村就位于这东河和西河的交汇处”,可将“甲村”作为表征人文地理的人文地理特征,将“东河”、“西河”作为表征自然地形的自然地形特征,将“交汇处”作为表征空间关系的空间关系特征。
其中,S21包括,将地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第一关键词汇集;通过训练好的词性标注工具对第一关键词汇集中的各个关键词进行词性划分,词性类别包括空间关系特征、自然地形特征、人文地理特征中的至少一项。
S22:通过训练好的Transformer架构模型深入理解关键特征。
使用深度学习模型(如基于Transformer架构的模型)对提取出的特征进行学习和推理。通过大量训练数据训练模型,使其能够捕捉到描述中的空间关系、地理特征和地貌类型等信息。例如,使用BERT(Bidirectional Encoder Representations fromTransformers)这样的预训练模型,通过微调(fine-tuning)来适应地理环境描述的理解任务。模型会学习到“两山之间”通常意味着一个狭长的地带,“河谷”和“森林”则分别代表了特定的地貌和植被类型。常用的深度学习框架包括TensorFlow、PyTorch等,而模型则可以选择BERT、GPT、T5等基于Transformer架构的模型。
S23:利用生成对抗网络基于理解结果创建出目标地图。
将上述深度学习模型的理解结果作为条件输入到生成对抗网络中,经过大量训练的生成对抗网络,便能根据上述深度学习模型对关键特征的理解,生成对应的目标地图。
如图2所示的地图便是针对地形描述段落“甲村就位于这东河和西河的交汇处,东河被视为甲村的母亲河,对沿河的村民有着养育之恩。村子东西两侧分别耸立有大大山和小小山,这些山体构成了甲村的自然屏障。甲村的张家湾和李家湾是两个主要的居住区域,隔河相望,分别以张姓和李姓家族为主”生成的目标地图。
S3:通过图像处理算法对目标地图进行优化,以加强目标地图的显示效果。
可以理解,本申请公开了一种基于AIGC的地图生成方法,通过深度学习模型对目标文本文件中的地形描述段落进行理解,再利用生成对抗网络基于理解结果创建出目标地图。本申请可以将小说等文字作品中的地理环境具象化,更加有利于读者的阅读体验和对故事背景、情节发展的理解。
第二方面,如图3所示,本申请还提供一种基于AIGC的地图生成方法,包括以下步骤S1、S4、S5。
S1:获取文本文件,提取文本文件中的地形描述段落。
S4:识别各个地形描述段落中的时间标识词,按照时间标识词对地形描述段落进行分组,得到各个地形描述组。
其中,识别各个地形描述段落中的时间标识词,包括:将地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第二关键词汇集;在第二关键词汇集中搜索属于预设时间词库中的时间标识词。
举例说明,现从文本文件中提取出6个地形描述段落。
段落一:公元前230年,甲国的原始领土主要集中在西部地区,包括A省地区、B省地区以及部分C省地区。以此为基地,甲国凭借强大的兵力和先进的制度,逐步向东扩张。
段落二:公元前229年,甲国肖灭乙国,占据了D省地区与E省地区的大片领土。
段落三:公元前225年,甲国攻克丙国都城f城,将F省地区归入其版图。
段落四:公元前222年,甲国灭丁国,疆域扩展至G省、H省地区一带。
段落五:公元前222年,甲国又将I省地区和J省地区收入囊中。
段落六:公元前222年,戊国投降,甲国的疆域扩展至K省地区。
首先,从这6个地形描述段落中提取出表征时间维度的时间标识词:“公元前230年”、“公元前229年”、“公元前225年”、“公元前222年”;之后,按照时间标识词将6个地形描述段落分为4个地形描述组,其中由于段落四、五、六的时间标识词一致,将段落四、五、六划归为同一地形描述组。
第一地形描述组:公元前230年,甲国的原始领土主要集中在西部地区,包括A省地区、B省地区以及部分C省地区。以此为基地,甲国凭借强大的兵力和先进的制度,逐步向东扩张。
第二地形描述组:公元前229年,甲国肖灭乙国,占据了D省地区与E省地区的大片领土。
第三地形描述组:公元前225年,甲国攻克丙国都城f城,将F省地区归入其版图。
第四地形描述组:公元前222年,甲国灭丁国,疆域扩展至G省、H省地区一带。公元前222年,甲国又将I省地区和J省地区收入囊中。公元前222年,戊国投降,甲国的疆域扩展至K省地区。
S5:通过深度学习模型对各个地形描述组中的各个地形描述段落进行理解,利用生成对抗网络基于理解结果创建出每个地形描述组对应的时代地图。
如图4至图7分别为生成对抗网络基于对第一至第四地形描述组的理解结果所生成的时代地图,其中阴影部分为甲国领域。
可以理解,本申请还公开了另一种基于AIGC的地图生成方法,提取文本文件中的地形描述段落后,按照地形描述段落中的时间标识词对各个地形描述段落进行分组,随后根据AIGC技术创建出每个地形描述组对应的时代地图。本方法不仅考虑了传统空间维度的地图建设,还考虑了时间维度的地图变化,赋予每个单一地图时间标识,更加有利于读者的理解。
在本申请可选的实施例中,第二方面公开的基于AIGC的地图生成方法,还包括以下步骤:S6,按照时间标识词对应的时间顺序,排列时代地图,得到目标视频或长图。
第三方面,本申请提供一种基于AIGC的地图生成装置。基于AIGC的地图生成装置包括一个或多个处理器;一个或多个输入设备,一个或多个输出设备和存储器。上述处理器、输入设备、输出设备和存储器通过总线连接。存储器用于存储计算机程序,该计算机程序包括程序指令,处理器用于执行存储器存储的程序指令。其中,处理器被配置用于调用该程序指令执行第一方面和/或第二方面任一方法的操作。
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备可以包括显示器(LCD等)、扬声器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器、输入设备、输出设备可执行第一方面任一方法所描述的实现方式,也可执行本发明实施例所描述的终端设备的实现方式,在此不再赘述。
第四方面,本发明供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时实现第一方面和/或第二方面任一方法的步骤。
上述计算机可读存储介质可以是前述任一实施例的终端设备的内部存储单元,例如终端设备的硬盘或内存。上述计算机可读存储介质也可以是上述终端设备的外部存储设备,例如上述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述计算机可读存储介质还可以既包括上述终端设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述终端设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例中方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的可选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种基于AIGC的地图生成方法,其特征在于,包括以下步骤:
S1:获取文本文件,提取所述文本文件中的地形描述段落;
S21:提取所述地形描述段落的关键特征,所述关键特征包括空间关系特征、自然地形特征、人文地理特征中的至少一项;
S22:通过训练好的Transformer架构模型深入理解所述关键特征;
S23:利用生成对抗网络基于理解结果创建出目标地图。
2.根据权利要求1所述的基于AIGC的地图生成方法,其特征在于,
所述S1包括以下步骤:
S11:获取文本文件,搜索所述文本文件中属于预设地形词库中的关键词;
S12:在所述文本文件中,基于所述关键词附近的段落边界符号,提取出包含所述关键词的地形描述段落。
3.根据权利要求2所述的基于AIGC的地图生成方法,其特征在于,
所述S11包括以下步骤:
S111:获取文本文件,将所述文本文件中的连续文本切分成独立的词汇单元后,去除停用词,得到剩余词汇集;
S112:在所述剩余词汇集中搜索属于预设地形词库中的关键词。
4.根据权利要求3所述的基于AIGC的地图生成方法,其特征在于,
所述S1还包括以下至少一项:
S13:搜索所述地形描述段落中属于预设比喻词库中的形容词,删除所述形容词对应的所述地形描述段落;
S14:通过训练好的比喻文本判断模型对各个所述地形描述段落进行判断,删除判断结果为比喻文本的所述地形描述段落。
5.根据权利要求1所述的基于AIGC的地图生成方法,其特征在于,
所述S21包括:
S211:将所述地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第一关键词汇集;
S212:通过训练好的词性标注工具对所述第一关键词汇集中的各个关键词进行词性划分,词性类别包括空间关系特征、自然地形特征、人文地理特征中的至少一项。
6.根据权利要求1至5任一项所述的基于AIGC的地图生成方法,其特征在于,
还包括以下步骤:
S4:识别各个所述地形描述段落中的时间标识词,按照所述时间标识词对所述地形描述段落进行分组,得到各个地形描述组;
S5:通过深度学习模型对各个所述地形描述组中的各个所述地形描述段落进行理解,利用生成对抗网络基于理解结果创建出每个所述地形描述组对应的时代地图。
7.根据权利要求6所述的基于AIGC的地图生成方法,其特征在于,
还包括以下步骤:
S6:按照所述时间标识词对应的时间顺序,排列所述时代地图,得到目标视频或长图。
8.根据权利要求6所述的基于AIGC的地图生成方法,其特征在于,
所述识别各个所述地形描述段落中的时间标识词,包括:
将所述地形描述段落中的连续文本切分成独立的词汇单元后,去除停用词,得到第二关键词汇集;在所述第二关键词汇集中搜索属于预设时间词库中的时间标识词。
9.一种基于AIGC的地图生成装置,其特征在于,
包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1至8任一项所述的方法。
CN202410645175.1A 2024-05-23 2024-05-23 一种基于aigc的地图生成方法和装置 Pending CN118429470A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410645175.1A CN118429470A (zh) 2024-05-23 2024-05-23 一种基于aigc的地图生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410645175.1A CN118429470A (zh) 2024-05-23 2024-05-23 一种基于aigc的地图生成方法和装置

Publications (1)

Publication Number Publication Date
CN118429470A true CN118429470A (zh) 2024-08-02

Family

ID=92025536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410645175.1A Pending CN118429470A (zh) 2024-05-23 2024-05-23 一种基于aigc的地图生成方法和装置

Country Status (1)

Country Link
CN (1) CN118429470A (zh)

Similar Documents

Publication Publication Date Title
CN110427463B (zh) 搜索语句响应方法、装置及服务器和存储介质
CN107153641B (zh) 评论信息确定方法、装置、服务器及存储介质
EP3926531B1 (en) Method and system for visio-linguistic understanding using contextual language model reasoners
CN112084331A (zh) 文本处理、模型训练方法、装置、计算机设备和存储介质
CN110795543A (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN106844341B (zh) 基于人工智能的新闻摘要提取方法及装置
WO2020103899A1 (zh) 用于生成图文信息的方法和用于生成图像数据库的方法
CN110309114B (zh) 媒体信息的处理方法、装置、存储介质和电子装置
CN109918506A (zh) 一种文本分类方法及装置
CN111488468B (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN114417865B (zh) 灾害事件的描述文本处理方法、装置、设备及存储介质
KR20200087977A (ko) 멀티모달 문서 요약 시스템 및 방법
JP6832322B2 (ja) 探索装置、探索方法、探索プログラムおよび記録媒体
CN112784598A (zh) 思维导图的生成方法、装置、设备及存储介质
CN110895656A (zh) 一种文本相似度计算方法、装置、电子设备及存储介质
CN111143507A (zh) 一种基于复合式问题的阅读理解方法
CN110795544A (zh) 内容搜索方法、装置、设备和存储介质
CN115640394A (zh) 文本分类方法、文本分类装置、计算机设备及存储介质
Jang et al. Understanding place identity with generative AI
Li et al. TrOMR: Transformer-Based Polyphonic Optical Music Recognition
CN112307754A (zh) 语句获取方法及装置
CN118429470A (zh) 一种基于aigc的地图生成方法和装置
CN115730221A (zh) 基于溯因推理的虚假新闻识别方法、装置、设备及介质
CN114238587A (zh) 阅读理解方法、装置、存储介质及计算机设备
CN114611529A (zh) 意图识别方法和装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication