CN114218407A - 一种基于数字化自动索引的内容创作系统 - Google Patents

一种基于数字化自动索引的内容创作系统 Download PDF

Info

Publication number
CN114218407A
CN114218407A CN202111542818.2A CN202111542818A CN114218407A CN 114218407 A CN114218407 A CN 114218407A CN 202111542818 A CN202111542818 A CN 202111542818A CN 114218407 A CN114218407 A CN 114218407A
Authority
CN
China
Prior art keywords
storage system
label
target
preset
hierarchical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111542818.2A
Other languages
English (en)
Inventor
韩忠义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Duoduo Metadata Co ltd
Original Assignee
Suzhou Duoduo Metadata Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Duoduo Metadata Co ltd filed Critical Suzhou Duoduo Metadata Co ltd
Priority to CN202111542818.2A priority Critical patent/CN114218407A/zh
Publication of CN114218407A publication Critical patent/CN114218407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于数字化自动索引的内容创作系统,包括:素材标签模块:用于获取并采集用户素材库,对所述用户素材库进行标签标定,生成素材标签;索引构建模块:用于通过所述素材标签,构建数字化自动索引机制;目标素材模块:用于获取目标关键词,将所述目标关键词传输至数字化自动索引机制进行自动化检索,获取对应的目标素材;创作模块:用于基于预设的约束条件,将所述目标素材自动切割,自动推荐并选中对应的切割素材,将所述切割素材上传至预设的创作编辑器中进行进行自动组合,确定创作组合视频。

Description

一种基于数字化自动索引的内容创作系统
技术领域
本发明涉及大数据搜寻、自动索引的技术领域,特别涉及一种基于数字化自动索引的内容创作系统。
背景技术
目前,网上创作越来越流行,通过大数据搜查,已经可以针对用户需求精准的搜寻,但是,对于越来越流行的网络创作而言,缺乏一种可以通过数字化自动对用户已有的素材库进行搜寻,从而辅助用户进行创作的系统,用户的创作往往依靠灵感,效率低下。
专利CN 1595399A公开了一种汉语文本中词及词属性自动索引和检索方法,在词及词属性检索的工作中可以免去语料库标注的巨大的工作量,进而大大节省语言研究、语言教学、词典编篆人员的人力,大大提高他们的工作效率,主要针对汉语文本进行研究,无法针对自动化索引并针对索引进行智能化创作。
发明内容
本发明提供一种基于数字化自动索引的内容创作系统,以解决上述问题。
本发明提供一种基于数字化自动索引的内容创作系统,包括:
素材标签模块:用于获取并采集用户素材库,对所述用户素材库进行标签标定,生成素材标签;
索引构建模块:用于通过所述素材标签,构建数字化自动索引机制;
目标素材模块:用于获取目标关键词,将所述目标关键词传输至数字化自动索引机制进行自动化检索,获取对应的目标素材;
创作模块:用于基于预设的约束条件,将所述目标素材自动切割,自动推荐并选中对应的切割素材,将所述切割素材上传至预设的创作编辑器中进行进行自动组合,确定创作组合视频。
作为本技术方案的一种实施例,所述素材标签模块,包括:
素材获取单元:用于获取用户素材库,对所述用户素材库进行类型分类,确定不同类型的素材;其中,
所述类型分类至少包括文字分类、视频分类、图片分类和语音分类;
分级存储系统单元:用于将预设的分布式存储系统按照素材的类型数量进行分层,划分对应的分级存储系统;
存储节点单元:用于获取分级存储系统对应的节点,基于预设的时间索引,将不同类型的素材存储至对应层分级存储系统的节点中,确定存储节点;
素材标签单元:用于提炼每个存储节点中保存的素材的特征信息,通过所述特征信息,对所述用户素材库进行标签限定,建立素材标签。
作为本技术方案的一种实施例,所述分级存储系统单元,包括:
存储内存子单元:用于基于素材的类型,采集素材对应的存储内存;
内存大小排列子单元:用于对所述存储内存进行比较,确定存储内存的内存大小排列;
分级存储系统子单元:用于基于所述内存大小排列,划分分布式存储系统,对分布式存储系统进行分层,确定对应的分级存储系统。
作为本技术方案的一种实施例,所述素材标签单元,包括:
目标素材子单元:用于按照时间索引和分级存储系统的分层类型,获取存储节点中保存的目标素材;
文字特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为文字分类,基于预设的语义识别系统,对所述目标素材进行快速分析和提炼,并确定文字特征信息;
视频特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为视频类型,将所述目标素材进行视频划分,并将划分后的视频上传至预设的大数据处理中心进行信息分析,采集视频中的特征要素,提炼所述特征要素的视频特征信息;
图片特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为图片类型,将所述目标素材传输至预设的大数据处理中心进行信息分析,获取图片特征信息;
文字特征信息子单元:用于当所述分级存储系统中的目标素材的分层类型为语音类型,基于预设的语音识别系统和语义识别系统,将语音转化为对应的文字素材,并确定对应的文字特征信息;
特征标签确定子单元:用于通过文字特征信息、视频特征信息、图片特征信息和文字特征信息,确定对应的文字特征标签、视频特征标签、图片特征标签和文字特征标签;
素材标签建立子单元:用于将所述文字特征标签、视频特征标签、图片特征标签和文字特征标签分别限定对应的用户素材库上,建立素材标签。
作为本技术方案的一种实施例,所述索引构建模块,包括:
分布式存储系统标号单元:用于通过预设的存储顺序,对已有的分布式存储系统进行标号,确定分布式存储系统标号,通过分布式存储系统标号,建立分布式存储系统目录;
分级存储系统标号单元:用于通过所述存储系统标号和预设的分级顺序,对分布式存储系统中的分级存储系统进行标号,确定分级存储系统标号,通过分级存储系统标号,建立分级存储系统目录;
素材标签单元:用于通过所述分级存储系统标号,按顺序检索对应分级存储系统中的素材标签;
对应节点单元:用于通过所述素材标签,追溯对应层分级存储系统对应的存储节点,确定对应节点;
聚类标签单元:用于采集素材标签和所述对应节点的对应关系,提取所述对应关系的关系特征,将类似的关系特征进行聚类,确定聚类标签;
聚类标签单元:用于目录将所述聚类标签进行标号,生成聚类标签目录;
数字化自动索引机制单元:用于通过所述分布式存储系统目录、分级存储系统目录和聚类标签目录,构建数字化自动索引机制。
作为本技术方案的一种实施例,所述数字化自动索引机制单元,包括:
通过所述分布式存储系统目录、分级存储系统目录和聚类标签目录,构建数字化自动索引机制。
作为本技术方案的一种实施例,所述目标素材模块,包括:
目标关键词采集单元:用于采集并获取目标关键词;
类似关键词单元:用于对所述目标关键词进行语义提取,并获取类似关键词;
目录信息单元:用于通过所述目标关键词和类似关键词,在数字化自动索引机制自动检索,获取对应的目录信息;
目标素材单元:用于读取所述目录信息,并确定对应的目标素材。
作为本技术方案的一种实施例,所述目标素材单元,包括:
第一目录信息子单元:用于读取目录信息,对目标关键词对应的目录信息设置为第一目录信息;
第二目录信息子单元:用于将类似关键词对应的目录信息设置为第二目录信息;
第一优先目标素材子单元:用于将第一目录信息对应的目标素材设为优先级最高,确定第一优先目标素材;
第二优先目标素材子单元:用于将第二目录信息对应的目标素材的优先级排在第一优先目标素材之后,并确定第二优先目标素材。
作为本技术方案的一种实施例,所述创作模块,包括:
需求指标单元:用于获取用户的业务需求,将所述业务需求上传至预设的大数据中心中的语义识别系统进行分析,采集需求指标;
素材切分机制更新单元:用于将所述需求指标传输并融合至预设的素材切分机制中,更新所述素材切分机制;
切割素材单元:用于通过更新后的素材切分机制,切割所述目标素材,自动推荐并选中对应的切割素材;
初步创作内容单元:用于基于预设的约束条件,确定创作时间序列,按照所述创作时间序列,将所述切割素材上传至预设的创作编辑器中进行创作初步构建,确定创作组合视频。
作为本技术方案的一种实施例,所述素材切分机制更新单元,包括:
需求指标记子单元:用于获取参与素材切分机制中的需求指标记,将参与的需求指标记为
Figure BDA0003414811730000051
其中,
Figure BDA0003414811730000052
代表参与的需求指标集合,bn代表第n个参与的需求指标,n代表需求指标集合中参与的需求指标的总个数;
素材类型获取子单元:用于获取预设的素材切分机制中预设的素材类型;
标准需求指标子单元:用于标准化所述需求指标,确定标准需求指标;
Figure BDA0003414811730000061
其中,
Figure BDA0003414811730000062
为第i个标准需求指标,min bi代表第i个需求指标最小化时的需求指标,max bi代表第i个需求指标最大化时的需求指标,bi代表第i个需求指标,i∈[1,n];
素材切分机制更新子单元:用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制。
作为本技术方案的一种实施例,所述素材切分机制更新子单元用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制,包括以下步骤:
步骤1:将所述标准需求指标传输至预设的素材切分机制中进行量化,确定量化数据;
Figure BDA0003414811730000063
其中,
Figure BDA0003414811730000064
代表关于第i个标准需求指标的量化数据,G0代表素材切分机制中初始量化数据,
Figure BDA0003414811730000065
为第i个标准需求指标,i∈[1,n],n代表需求指标集合中参与的需求指标的总个数,σ0代表初始素材切分机制中预设的离散的量化参数,
Figure BDA0003414811730000066
代表第i个标准需求指标
Figure BDA0003414811730000067
在初始素材切分机制中采集到的量化参数,σj代表经过j次更新后的素材切分机制中的离散的量化参数,
Figure BDA0003414811730000071
代表第i个标准需求指标
Figure BDA0003414811730000072
经过j次更新后的素材切分机制中的离散的量化参数,j=1,2,…,T,T代表素材切分机制更新的总次数,
步骤2:通过所述量化数据,筛选素材类型,确定筛选结果,将素材切分机制中的筛选结果进行限值,生成限值数据;其中,
将筛选结果中的素材类型记为
Figure BDA0003414811730000073
其中,
Figure BDA0003414811730000074
代表素材切分机制筛选结果中的素材类型样本集合,cm代表第m个素材类型样本,m代表素材类型样本集合中素材类型样本的总个数;
步骤3:基于所述限值数据,判断限值数据内的素材类型是否满足用户的需求指标,生成判断结果;
步骤4:当所述判断结果为限值数据内的素材类型满足用户的需求指标,更新所述素材切分机制;
步骤5:当所述判断结果为限值数据内的素材类型不满足用户的需求指标,初始化所述素材切分机制,并计算需求指标在量化过程中的影响数据,并通过所述影响数据,校准素材切分机制。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于数字化自动索引的内容创作系统模块图;
图2为本发明实施例中一种基于数字化自动索引的内容创作系统模块图;
图3为本发明实施例中一种基于数字化自动索引的内容创作系统模块图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
需说明的是,当部件被称为“固定于”或“设置于”另一个部件,它可以直接在另一个部件上或者间接在该另一个部件上。当一个部件被称为是“连接于”另一个部件,它可以是直接或者间接连接至该另一个部件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,“多个”的含义是两个或两个以上,除非另有明确具体的限定。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
实施例1:
根据图1所示,本发明实施例提供了一种基于数字化自动索引的内容创作系统,其特征在于,包括:
素材标签模块:用于获取并采集用户素材库,对所述用户素材库进行标签标定,生成素材标签;
索引构建模块:用于通过所述素材标签,构建数字化自动索引机制;
目标素材模块:用于获取目标关键词,将所述目标关键词传输至数字化自动索引机制进行自动化检索,获取对应的目标素材;
创作模块:用于基于预设的约束条件,将所述目标素材自动切割,获取对应的切割素材,将所述切割素材上传至预设的创作模型中进行创作初步构建,确定初步创作内容。
上述技术方案的工作原理有益效果在于:
本发明实施例提供了一种基于数字化自动索引的内容创作系统,包括素材标签模块、索引构建模块、目标素材模块和创作模块,素材标签模块用于获取并采集用户素材库,对用户素材库进行标签标定,生成素材标签,例如,用户是一名医生,他的素材中包括心脏图片、耳鼻喉视频和癌症文字素材,针对用户的喜好、习惯或者职业,将不同的素材进行分类,提高自动索引的效率,索引构建模块用于通过素材标签,构建数字化自动索引机制,用于在用户输入关键词的时候,自动化对用户预存的素材进行地毯式检索,从而为用户的创作内容提供素材原材料,目标素材模块用于获取目标关键词,将目标关键词传输至数字化自动索引机制进行自动化检索,获取对应的目标素材,创作模块用于基于预设的约束条件,将目标素材自动切割,获取对应的切割素材,将所述切割素材上传至预设的创作模型中进行创作初步构建,确定初步创作内容,用户如果是一名心理教育老师,需要在学校进行心理教育宣传,可以针对不同的心理情况,采集不同标签,亦或者在某个标签中,例如视频中心理教育关于校园欺凌的视频片段为1:35:00-2:45:00,用户可以基于自己的需求,对校园欺凌的片段进行截取,本技术方案提供了一种针对用户素材进行整理,同时提供自动化索引的内容创作辅助的系统,不仅有助于用户平时积累素材时的高效管理,同时在用户进行创作时,提高了用户的原材料凝聚度,帮助用户完善自己的内容。
实施例2:
根据图2所示,本技术方案提供了一种实施例,所述素材标签模块,包括:
素材获取单元:用于获取用户素材库,对所述用户素材库进行类型分类,确定不同类型的素材;其中,
所述类型分类至少包括文字分类、视频分类、图片分类和语音分类;
分级存储系统单元:用于将预设的分布式存储系统按照素材的类型数量进行分层,划分对应的分级存储系统;
存储节点单元:用于获取分级存储系统对应的节点,基于预设的时间索引,将不同类型的素材存储至对应层分级存储系统的节点中,确定存储节点;
素材标签单元:用于提炼每个存储节点中保存的素材的特征信息,通过所述特征信息,对所述用户素材库进行标签限定,建立素材标签。
上述技术方案的工作原理有益效果在于:
素材标签模块,获取用户素材库,对用户素材库进行类型分类,确定不同类型的素材;类型分类至少包括文字分类、视频分类、图片分类和语音分类;对不同种类的用户素材库进行保存,用户的素材库源于用户平时的积累或者用户提前存储下的材料,分级存储系统单元将预设的分布式存储系统按照素材的类型数量进行分层,划分对应的分级存储系统,例如对于一个视频为主的创作用户而言,大量积累材料可能更多来源于其他视频,少量的文字和图片,用户将保存的视频划分为比较多的一级,不仅提高了存储空间,并且同时也明显的规划处更重要的一级,存储节点单元用于获取分级存储系统对应的节点,基于预设的时间索引,将不同类型的素材存储至对应层分级存储系统的节点中,确定存储节点,通过设置不同的存储节点,有助于提高数字化自动索引的效率和速度,素材标签单元用于提炼每个存储节点中保存的素材的特征信息,通过所述特征信息,对所述用户素材库进行标签限定,建立素材标签,以便于后续中对用户素材进行数字化自动检索,提高检索速度,减少检索失误,加快检索效率。
实施例3:
根据图3所示,本技术方案提供了一种实施例,所述分级存储系统单元,包括:
存储内存子单元:用于基于素材的类型,采集素材对应的存储内存;
内存大小排列子单元:用于对所述存储内存进行比较,确定存储内存的内存大小排列;
分级存储系统子单元:用于基于所述内存大小排列,划分分布式存储系统,对分布式存储系统进行分层,确定对应的分级存储系统。
上述技术方案的工作原理和有益效果在于:
本技术方案的分级存储系统单元,存储内存子单元用于基于素材的类型,采集素材对应的存储内存,内存大小排列子单元用于对存储内存进行比较,确定存储内存的内存大小排列;分级存储系统子单元用于基于内存大小排列,划分分布式存储系统,对分布式存储系统进行分层,确定对应的分级存储系统,针对不同空间内存的素材类型,进行分级,从而使内存存储更有调理,在对应的层级查找的时候,也更加的方便和清晰,加快调用的时间。
实施例4:
本技术方案提供了一种实施例,所述素材标签单元,包括:
目标素材子单元:用于按照时间索引和分级存储系统的分层类型,获取存储节点中保存的目标素材;
文字特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为文字分类,基于预设的语义识别系统,对所述目标素材进行快速分析和提炼,并确定文字特征信息;
视频特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为视频类型,将所述目标素材进行视频划分,并将划分后的视频上传至预设的大数据处理中心进行信息分析,采集视频中的特征要素,提炼所述特征要素的视频特征信息;
图片特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为图片类型,将所述目标素材传输至预设的大数据处理中心进行信息分析,获取图片特征信息;
文字特征信息子单元:用于当所述分级存储系统中的目标素材的分层类型为语音类型,基于预设的语音识别系统和语义识别系统,将语音转化为对应的文字素材,并确定对应的文字特征信息;
特征标签确定子单元:用于通过文字特征信息、视频特征信息、图片特征信息和文字特征信息,确定对应的文字特征标签、视频特征标签、图片特征标签和文字特征标签;
素材标签建立子单元:用于将所述文字特征标签、视频特征标签、图片特征标签和文字特征标签分别限定对应的用户素材库上,建立素材标签。
上述技术方案的工作原理有益效果在于:
素材标签单元,按照时间索引和分级存储系统的分层类型,获取存储节点中保存的目标素材;划分的不同层级对应不同类型的目标素材,当分级存储系统的目标素材的分层类型为文字分类,基于预设的语义识别系统,对目标素材进行快速分析和提炼,并确定文字特征信息,语义识别系统可以快速分割语义,对文字进行主要信息提取,从而获取出文字标签,也可以由用户自行设置文字标签,文字类型对应的分级存储系统可以存储多种文字素材,每种文字素材可以设有多种标签;当分级存储系统的目标素材的分层类型为视频类型,将所述目标素材进行视频划分,并将划分后的视频上传至预设的大数据处理中心进行信息分析,采集视频中的特征要素,提炼所述特征要素的视频特征信息,对划分后的视频抓取后也就是图片特征,对于主要特征要素的提取,主要从视频中的语音信息和图片要素进行识别,对视频中多次出现的图像信息,语音识别信息等,获取到视频的要素特征,从而以便于对图片进行标签限定。当分级存储系统的目标素材的分层类型为图片类型,将目标素材传输至预设的大数据处理中心进行信息分析,获取图片特征信息;当分级存储系统中的目标素材的分层类型为语音类型,基于预设的语音识别系统和语义识别系统,将语音转化为对应的文字素材,并确定对应的文字特征信息;通过文字特征信息、视频特征信息、图片特征信息和文字特征信息,确定对应的文字特征标签、视频特征标签、图片特征标签和文字特征标签;将所述文字特征标签、视频特征标签、图片特征标签和文字特征标签分别限定对应的用户素材库上,建立素材标签,通过素材标签的自动化建立,提高用户对素材的使用效率,以便于快速的对素材进行索引。
实施例5:
本技术方案提供了一种实施例,所述索引构建模块,包括:
分布式存储系统标号单元:用于通过预设的存储顺序,对已有的分布式存储系统进行标号,确定分布式存储系统标号,通过分布式存储系统标号,建立分布式存储系统目录;
分级存储系统标号单元:用于通过所述存储系统标号和预设的分级顺序,对分布式存储系统中的分级存储系统进行标号,确定分级存储系统标号,通过分级存储系统标号,建立分级存储系统目录;
素材标签单元:用于通过所述分级存储系统标号,按顺序检索对应分级存储系统中的素材标签;
对应节点单元:用于通过所述素材标签,追溯对应层分级存储系统对应的存储节点,确定对应节点;
聚类标签单元:用于采集素材标签和所述对应节点的对应关系,提取所述对应关系的关系特征,将类似的关系特征进行聚类,确定聚类标签;
聚类标签单元:用于目录将所述聚类标签进行标号,生成聚类标签目录;
数字化自动索引机制单元:用于通过所述分布式存储系统目录、分级存储系统目录和聚类标签目录,构建数字化自动索引机制。
上述技术方案的工作原理有益效果在于:
通过预设的存储顺序,对已有的分布式存储系统进行标号,确定分布式存储系统标号,通过分布式存储系统标号,建立分布式存储系统目录,类如在一个虚拟机上和主机上,用户都设有分布式存储功能的系统,在存储时,可以对不同的存储设备进行全方位抓取,通过存储系统标号和预设的分级顺序,对分布式存储系统中的分级存储系统进行标号,确定分级存储系统标号,通过分级存储系统标号,建立分级存储系统目录,对于每个不同的分级存储系统目录,建有不同的目录,不仅在查找时提高查找效率,同时方便用户进行管理,通过分级存储系统标号,按顺序检索对应分级存储系统中的素材标签;通过素材标签,追溯对应层分级存储系统对应的存储节点,确定对应节点;采集素材标签和对应节点的对应关系,提取对应关系的关系特征,将类似的关系特征进行聚类,确定聚类标签,目录将聚类标签进行标号,生成聚类标签目录;通过分布式存储系统目录、分级存储系统目录和聚类标签目录,类如A-13-18代表标号为A的分布式存储系统中标号为13的分级存储系统目录中的第18个聚类标签目录中的标签为心理教育,从而建立索引目录,为构建数字化自动索引机制提高原始目录模型。
实施例6:
本技术方案提供了一种实施例,所述目标素材模块,包括:
目标关键词采集单元:用于采集并获取目标关键词;
类似关键词单元:用于对所述目标关键词进行语义提取,并获取类似关键词;
目录信息单元:用于通过所述目标关键词和类似关键词,在数字化自动索引机制自动检索,获取对应的目录信息;
目标素材单元:用于读取所述目录信息,并确定对应的目标素材。
上述技术方案的工作原理有益效果在于:
采集并获取目标关键词;对所述目标关键词进行语义提取,并获取类似关键词,通过对类似语义的推断,可以在目标关键词的检索时,扩大检索范围,帮助用户提供更多的创作辅助内容,相近的关键词,也可以提高检索的命中率,通过目标关键词和类似关键词,在数字化自动索引机制自动检索,获取对应的目录信息;读取目录信息,并确定对应的目标素材,从而以便于辅助用户进行内容创作,提高用户的创作效率。
实施例7:
本技术方案提供了一种实施例,所述目标素材单元,包括:
第一目录信息子单元:用于读取目录信息,对目标关键词对应的目录信息设置为第一目录信息;
第二目录信息子单元:用于将类似关键词对应的目录信息设置为第二目录信息;
第一优先目标素材子单元:用于将第一目录信息对应的目标素材设为优先级最高,确定第一优先目标素材;
第二优先目标素材子单元:用于将第二目录信息对应的目标素材的优先级排在第一优先目标素材之后,并确定第二优先目标素材。
上述技术方案的工作原理有益效果在于:
本技术方案的目标素材单元,第一目录信息子单元用于读取目录信息,对目标关键词对应的目录信息设置为第一目录信息;第二目录信息子单元用于将类似关键词对应的目录信息设置为第二目录信息;第一优先目标素材子单元用于将第一目录信息对应的目标素材设为优先级最高,确定第一优先目标素材;第二优先目标素材子单元用于将第二目录信息对应的目标素材的优先级排在第一优先目标素材之后,并确定第二优先目标素材,通过将用户搜索的关键词作为第一顺序发送,再发送类似词汇,从而提高用户搜索时的准确度,提高用户体验,加快用户查找时的精准度。
实施例8:
本技术方案提供了一种实施例,所述创作模块,包括:
需求指标单元:用于获取用户的业务需求,将所述业务需求上传至预设的大数据中心中的语义识别系统进行分析,采集需求指标;
素材切分机制更新单元:用于将所述需求指标传输并融合至预设的素材切分机制中,更新所述素材切分机制;
切割素材单元:用于通过更新后的素材切分机制,切割所述目标素材,自动推荐并选中对应的切割素材;
初步创作内容单元:用于基于预设的约束条件,确定创作时间序列,按照所述创作时间序列,将所述切割素材上传至预设的创作编辑器中进行创作初步构建,确定创作组合视频。
上述技术方案的工作原理有益效果在于:
本技术方案的创作模块,包括需求指标单元、素材切分机制更新单元、切割素材单元和初步创作内容单元,需求指标单元用于获取用户的业务需求,将业务需求上传至预设的大数据中心中的语义识别系统进行分析,采集需求指标;素材切分机制更新单元用于将需求指标传输并融合至预设的素材切分机制中,更新所述素材切分机制;切割素材单元用于通过更新后的素材切分机制,切割所述目标素材,获取对应的切割素材;初步创作内容单元用于基于预设的约束条件,将切割素材上传至预设的创作模型中进行创作初步构建,确定初步创作内容,通过对用户需求的分析,业务指标的处理,从而精准的针对用户的需求进行定位,提高用户的办公效率。
实施例9:
本技术方案提供了一种实施例,所述素材切分机制更新单元,包括:
需求指标记子单元:用于获取参与素材切分机制中的需求指标记,将参与的需求指标记为
Figure BDA0003414811730000181
其中,
Figure BDA0003414811730000182
代表参与的需求指标集合,bn代表第n个参与的需求指标,n代表需求指标集合中参与的需求指标的总个数;
素材类型获取子单元:用于获取预设的素材切分机制中预设的素材类型;
标准需求指标子单元:用于标准化所述需求指标,确定标准需求指标;
Figure BDA0003414811730000183
其中,
Figure BDA0003414811730000184
为第i个标准需求指标,min bi代表第i个需求指标最小化时的需求指标,max bi代表第i个需求指标最大化时的需求指标,bi代表第i个需求指标,i∈[1,n];
素材切分机制更新子单元:用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制。
上述技术方案的工作原理有益效果在于:
本技术方案通过素材切分机制更新单元,获取参与素材切分机制中的需求指标记,将参与的需求指标记为
Figure BDA0003414811730000191
通过对用户的需求分析,以便于后续更有针对性的、更加灵活的获取用户需要的素材,获取预设的素材切分机制中预设的素材类型,标准化所述需求指标,确定标准需求指标
Figure BDA0003414811730000192
标准化需求指标是在用户需求下,对于不同的标准需要,从而建设处统一标准的指标,便于对用户所需要的的素材进行筛选,将标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制,通过已搭建好的素材切分机制,不仅减少了重新搭建的时间,仅通过用户输入的指标,快速的更新优化用户数据,提高了用户对素材筛选的效率。
实施例10:
本技术方案提供了一种实施例,所述素材切分机制更新子单元用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制,包括以下步骤:
步骤1:将所述标准需求指标传输至预设的素材切分机制中进行量化,确定量化数据;
Figure BDA0003414811730000193
其中,
Figure BDA0003414811730000194
代表关于第i个标准需求指标的量化数据,G0代表素材切分机制中初始量化数据,
Figure BDA0003414811730000195
为第i个标准需求指标,i∈[1,n],n代表需求指标集合中参与的需求指标的总个数,σ0代表初始素材切分机制中预设的离散的量化参数,
Figure BDA0003414811730000196
代表第i个标准需求指标
Figure BDA0003414811730000197
在初始素材切分机制中采集到的量化参数,σj代表经过j次更新后的素材切分机制中的离散的量化参数,
Figure BDA0003414811730000198
代表第i个标准需求指标
Figure BDA0003414811730000199
经过j次更新后的素材切分机制中的离散的量化参数,j=1,2,…,T,T代表素材切分机制更新的总次数,
步骤2:通过所述量化数据,筛选素材类型,确定筛选结果,将素材切分机制中的筛选结果进行限值,生成限值数据;其中,
将筛选结果中的素材类型记为
Figure BDA0003414811730000201
其中,
Figure BDA0003414811730000202
代表素材切分机制筛选结果中的素材类型样本集合,cm代表第m个素材类型样本,m代表素材类型样本集合中素材类型样本的总个数;
步骤3:基于所述限值数据,判断限值数据内的素材类型是否满足用户的需求指标,生成判断结果;
步骤4:当所述判断结果为限值数据内的素材类型满足用户的需求指标,更新所述素材切分机制;
步骤5:当所述判断结果为限值数据内的素材类型不满足用户的需求指标,初始化所述素材切分机制,并计算需求指标在量化过程中的影响数据,并通过所述影响数据,校准素材切分机制。
上述技术方案的工作原理有益效果在于:
本技术方案素材切分机制更新子单元用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制,包括将所述标准需求指标传输至预设的素材切分机制中进行量化,确定量化数据
Figure BDA0003414811730000203
将需求指标量化处理,便于指标和素材切分机制的融合,提高了融合速度,加快了素材切分机制的更新效率,通过量化数据,筛选素材类型,确定筛选结果,将素材切分机制中的筛选结果进行限值,生成限值数据,限值数据是基于预设的条件,例如在多进程传输下,带宽的限制、传输效率的限制,传输内容以及传输数量的限制,通过该限制,获取对应限制范围内的限制素材,确定限制数据,在所述限制数据的基础上,判断限值数据内的素材类型是否满足用户的需求指标,生成判断结果,当判断结果为限值数据内的素材类型满足用户的需求指标,更新素材切分机制,当判断结果为限值数据内的素材类型不满足用户的需求指标,初始化素材切分机制,并计算需求指标在量化过程中的影响数据,并通过影响数据,校准素材切分机制。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于数字化自动索引的内容创作系统,其特征在于,包括:
素材标签模块:用于获取并采集用户素材库,对所述用户素材库进行标签标定,生成素材标签;
索引构建模块:用于通过所述素材标签,构建数字化自动索引机制;
目标素材模块:用于获取目标关键词,将所述目标关键词传输至数字化自动索引机制进行自动化检索,获取对应的目标素材;
创作模块:用于基于预设的约束条件,将所述目标素材自动切割,自动推荐并选中对应的切割素材,将所述切割素材上传至预设的创作编辑器中进行进行自动组合,确定创作组合视频。
2.如权利要求1所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述素材标签模块,包括:
素材获取单元:用于获取用户素材库,对所述用户素材库进行类型分类,确定不同类型的素材;其中,
所述类型分类至少包括文字分类、视频分类、图片分类和语音分类;
分级存储系统单元:用于将预设的分布式存储系统按照素材的类型数量进行分层,划分对应的分级存储系统;
存储节点单元:用于获取分级存储系统对应的节点,基于预设的时间索引,将不同类型的素材存储至对应层分级存储系统的节点中,确定存储节点;
素材标签单元:用于提炼每个存储节点中保存的素材的特征信息,通过所述特征信息,对所述用户素材库进行标签限定,建立和存储节点对应的素材标签。
3.如权利要求2所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述分级存储系统单元,包括:
存储内存子单元:用于基于素材的类型,采集素材对应的存储内存;
内存大小排列子单元:用于对所述存储内存进行比较,确定存储内存的内存大小排列;
分级存储系统子单元:用于基于所述内存大小排列,划分分布式存储系统,对分布式存储系统进行分层,确定对应的分级存储系统。
4.如权利要求2所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述素材标签单元,包括:
目标素材子单元:用于按照时间索引和分级存储系统的分层类型,获取存储节点中保存的目标素材;
文字特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为文字分类,基于预设的语义识别系统,对所述目标素材进行快速分析和提炼,并确定文字特征信息;
视频特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为视频类型,将所述目标素材进行视频划分,并将划分后的视频上传至预设的大数据处理中心进行信息分析,采集视频中的特征要素,提炼所述特征要素的视频特征信息;
图片特征信息子单元:用于当所述分级存储系统的目标素材的分层类型为图片类型,将所述目标素材传输至预设的大数据处理中心进行信息分析,获取图片特征信息;
文字特征信息子单元:用于当所述分级存储系统中的目标素材的分层类型为语音类型,基于预设的语音识别系统和语义识别系统,将语音转化为对应的文字素材,并确定对应的文字特征信息;
特征标签确定子单元:用于通过文字特征信息、视频特征信息、图片特征信息和文字特征信息,确定对应的文字特征标签、视频特征标签、图片特征标签和文字特征标签;
素材标签建立子单元:用于将所述文字特征标签、视频特征标签、图片特征标签和文字特征标签分别限定对应的用户素材库上,建立素材标签。
5.如权利要求1所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述索引构建模块,包括:
分布式存储系统标号单元:用于通过预设的存储顺序,对已有的分布式存储系统进行标号,确定分布式存储系统标号,通过分布式存储系统标号,建立分布式存储系统目录;
分级存储系统标号单元:用于通过所述存储系统标号和预设的分级顺序,对分布式存储系统中的分级存储系统进行标号,确定分级存储系统标号,通过分级存储系统标号,建立分级存储系统目录;
素材标签单元:用于通过所述分级存储系统标号,按顺序检索对应分级存储系统中的素材标签;
对应节点单元:用于通过所述素材标签,追溯对应层分级存储系统对应的存储节点,确定对应节点;
聚类标签单元:用于采集素材标签和所述对应节点的对应关系,提取所述对应关系的关系特征,将类似的关系特征进行聚类,确定聚类标签;
聚类标签单元:用于目录将所述聚类标签进行标号,生成聚类标签目录;
数字化自动索引机制单元:用于通过所述分布式存储系统目录、分级存储系统目录和聚类标签目录,构建数字化自动索引机制。
6.如权利要求1所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述目标素材模块,包括:
目标关键词采集单元:用于采集并获取目标关键词;
类似关键词单元:用于对所述目标关键词进行语义提取,并获取类似关键词;
目录信息单元:用于通过所述目标关键词和类似关键词,在数字化自动索引机制自动检索,获取对应的目录信息;
目标素材单元:用于读取所述目录信息,并确定对应的目标素材。
7.如权利要求6所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述目标素材单元,包括:
第一目录信息子单元:用于读取目录信息,对目标关键词对应的目录信息设置为第一目录信息;
第二目录信息子单元:用于将类似关键词对应的目录信息设置为第二目录信息;
第一优先目标素材子单元:用于将第一目录信息对应的目标素材设为优先级最高,确定第一优先目标素材;
第二优先目标素材子单元:用于将第二目录信息对应的目标素材的优先级排在第一优先目标素材之后,并确定第二优先目标素材。
8.如权利要求1所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述创作模块,包括:
需求指标单元:用于获取用户的业务需求,将所述业务需求上传至预设的大数据中心中的语义识别系统进行分析,采集需求指标;
素材切分机制更新单元:用于将所述需求指标传输并融合至预设的素材切分机制中,更新所述素材切分机制;
切割素材单元:用于通过更新后的素材切分机制,切割所述目标素材,自动推荐并选中对应的切割素材;
初步创作内容单元:用于基于预设的约束条件,确定创作时间序列,按照所述创作时间序列,将所述切割素材上传至预设的创作编辑器中进行创作初步构建,确定创作组合视频。
9.如权利要求8所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述素材切分机制更新单元,包括:
需求指标记子单元:用于获取参与素材切分机制中的需求指标记;
素材类型获取子单元:用于获取预设的素材切分机制中预设的素材类型;
标准需求指标子单元:用于标准化所述需求指标,确定标准需求指标;
素材切分机制更新子单元:用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制。
10.如权利要求9所述的一种基于数字化自动索引的内容创作系统,其特征在于,所述素材切分机制更新子单元用于将所述标准需求指标传输至预设的素材切分机制,基于所述素材类型,更新素材切分机制,包括以下步骤:
步骤1:将所述标准需求指标传输至预设的素材切分机制中进行量化,确定量化数据;
步骤2:通过所述量化数据,筛选素材类型,确定筛选结果,将素材切分机制中的筛选结果进行限值,生成限值数据;
步骤3:基于所述限值数据,判断限值数据内的素材类型是否满足用户的需求指标,生成判断结果;
步骤4:当所述判断结果为限值数据内的素材类型满足用户的需求指标,更新所述素材切分机制;
步骤5:当所述判断结果为限值数据内的素材类型不满足用户的需求指标,初始化所述素材切分机制,并计算需求指标在量化过程中的影响数据,并通过所述影响数据,校准素材切分机制。
CN202111542818.2A 2021-12-16 2021-12-16 一种基于数字化自动索引的内容创作系统 Pending CN114218407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111542818.2A CN114218407A (zh) 2021-12-16 2021-12-16 一种基于数字化自动索引的内容创作系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111542818.2A CN114218407A (zh) 2021-12-16 2021-12-16 一种基于数字化自动索引的内容创作系统

Publications (1)

Publication Number Publication Date
CN114218407A true CN114218407A (zh) 2022-03-22

Family

ID=80703164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111542818.2A Pending CN114218407A (zh) 2021-12-16 2021-12-16 一种基于数字化自动索引的内容创作系统

Country Status (1)

Country Link
CN (1) CN114218407A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644724A (zh) * 2023-07-27 2023-08-25 太平金融科技服务(上海)有限公司深圳分公司 一种投标书生成方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644724A (zh) * 2023-07-27 2023-08-25 太平金融科技服务(上海)有限公司深圳分公司 一种投标书生成方法、装置、设备及存储介质
CN116644724B (zh) * 2023-07-27 2024-03-26 太平金融科技服务(上海)有限公司深圳分公司 一种投标书生成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110209764B (zh) 语料标注集的生成方法及装置、电子设备、存储介质
CN101021855B (zh) 基于内容的视频检索系统
US20190213407A1 (en) Automated Analysis System and Method for Analyzing at Least One of Scientific, Technological and Business Information
KR20210040891A (ko) 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
WO2021098648A1 (zh) 文本推荐方法、装置、设备及介质
CN110895586B (zh) 生成新闻页面的方法、装置、计算机设备及存储介质
CN107357765B (zh) Word文档碎片化方法及装置
CN112182148B (zh) 一种基于全文检索的标准辅助编写方法
CN110795932B (zh) 基于地质本体的地质报告文本信息提取方法
JPH06119405A (ja) 画像検索装置
CN110750995A (zh) 一种基于自定义图谱的文件管理方法
CN113139141A (zh) 用户标签扩展标注方法、装置、设备及存储介质
CN110825914A (zh) 一种资源的标注管理系统
CN112188312A (zh) 用于确定新闻的视频素材的方法和装置
CN114218407A (zh) 一种基于数字化自动索引的内容创作系统
CN115580758A (zh) 视频内容生成方法及装置、电子设备、存储介质
CN113407775B (zh) 视频搜索方法、装置及电子设备
JP2008217701A (ja) メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体
US20080015843A1 (en) Linguistic Image Label Incorporating Decision Relevant Perceptual, Semantic, and Relationships Data
KR20210074734A (ko) 영상 내 자막 키워드 추출 및 순위 산정 시스템 및 방법
CN113742496B (zh) 一种基于异构资源融合的电力知识学习系统及方法
KR20050074058A (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에자동송출하는 시스템 및 그 제어방법
CN114218437A (zh) 自适应图片裁剪融合方法、系统、计算机设备及介质
Camelin et al. Frnewslink: a corpus linking tv broadcast news segments and press articles
CN114357205A (zh) 挖掘候选词方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination