CN115129806A - 数据处理方法、装置、电子设备及计算机存储介质 - Google Patents
数据处理方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN115129806A CN115129806A CN202110336398.6A CN202110336398A CN115129806A CN 115129806 A CN115129806 A CN 115129806A CN 202110336398 A CN202110336398 A CN 202110336398A CN 115129806 A CN115129806 A CN 115129806A
- Authority
- CN
- China
- Prior art keywords
- attribute
- target
- materials
- information
- description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 239000000463 material Substances 0.000 claims abstract description 253
- 238000000034 method Methods 0.000 claims abstract description 51
- 239000013077 target material Substances 0.000 claims abstract description 50
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 70
- 238000004891 communication Methods 0.000 claims description 15
- 238000005065 mining Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种数据处理方法、装置、电子设备及计算机存储介质。该数据处理方法用于生成与一目标对象相关的描述信息档案,包括:获取与目标对象相关的描述框架和多种类型的多个素材,描述框架包括与目标对象对应的属性选择信息;对每个素材执行至少一种处理以获取素材的属性信息,属性信息包括属性层级和属性内容;从素材中选取属性内容和属性层级与描述框架的属性选择信息匹配的目标素材;根据描述框架和目标素材,生成描述信息档案。该数据处理方法的可以自动生成描述信息档案。
Description
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。
背景技术
随着人工智能技术的发展,人工智能的应用也越来越广泛,例如针对目标对象生成描述信息档案,以对目标对象的属性、特点等进行说明。但是,由于目标对象的种类、数量繁多,自身的特点各不相同,因此使得描述信息档案的生成过程中仍然是人工承担大部分工作,人工智能进行辅助。这使得难以针对大量的目标对象生成相应的描述信息档案,且劳动强度大、成本高。
发明内容
有鉴于此,本申请实施例提供一种数据处理方案,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种数据处理方法,用于生成与一目标对象相关的描述信息档案,包括:获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息;对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容;从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;根据描述框架和所述目标素材,生成描述信息档案。
根据本申请实施例的第二方面,提供了一种数据处理方法,用于生成与一目标对象相关的描述信息档案,包括:在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项;接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容;接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息;从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;根据描述框架和所述目标素材,生成描述信息档案。
根据本申请实施例的第三方面,提供了一种数据处理装置,用于生成与一目标对象相关的描述信息档案,包括:第一获取模块,用于获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息;第一处理模块,用于对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容;第一匹配模块,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;第一生成模块,用于根据描述框架和所述目标素材,生成描述信息档案。
根据本申请实施例的第四方面,提供了一种数据处理装置,用于生成与一目标对象相关的描述信息档案,包括:展示模块,用于在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项;第二处理模块,用于接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容;接收模块,用于接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息;第二匹配模块,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;第二生成模块,用于根据描述框架和所述目标素材,生成描述信息档案。
根据本申请实施例的第五方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的数据处理方法对应的操作。
根据本申请实施例的第六方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的数据处理方法。
根据本申请实施例提供的数据处理方案,使用描述框架限定描述信息档案的框架,这样可以与素材解耦,使得目标对象的描述信息档案不受限于不同的素材,通过对素材进行处理确定属性信息,进而根据描述框架匹配出目标素材,并根据描述框对目标素材进行组合形成描述信息档案。这样由于描述框架按照属性对剧本进行分层,使得描述框架与素材解耦,从而提升了适应性,能够针对不同的目标对象生成对应的描述信息档案,且描述信息档案中能够包含不同目标对象的特点,保证了描述信息档案的质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1A为根据本申请实施例一的一种数据处理方法的步骤流程图;
图1B为图1A所示实施例中的一种场景示例的示意图;
图2A为根据本申请实施例二的一种数据处理方法的步骤流程图;
图2B为图2A所示实施例中的一种场景示例的示意图;
图3为根据本申请实施例三的一种数据处理方法的步骤流程图;
图4为根据本申请实施例四的一种数据处理装置的结构框图;
图5为根据本申请实施例五的一种数据处理装置的结构框图;
图6为根据本申请实施例六的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
实施例一
参照图1A,示出了本申请的实施例一的数据处理方法的步骤流程示意图。
在本实施例中,该方法包括以下步骤:
步骤S102:获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息。
目标对象可以是商品、建筑物等等,商品可以是实物商品或者虚拟商品。本实施例中,以该方法应用于以虚拟对象作为主播的虚拟直播场景,用于生成虚拟直播时使用的剧本为例进行说明。当然,在其他实施例中,该方法也可以应用于其他任何适当的场景中,对此不作限制。
描述框架用于按照属性对目标对象对应的描述信息档案进行分层,使得生成的描述信息档案中不同的内容段落用于描述目标对象的不同属性,这样使得一类目标对象可以采用相同或相似的描述框架,从而使得描述框架与目标对象的素材解耦,从而提升适应性,降低成本,且实现自动化生成描述信息档案。
针对不同的目标对象可以配置不同的描述框架。在本实施例中,所述描述框架包括与所述目标对象对应的属性选择信息。所述描述框架的属性选择信息用于指示主题顺序、所述主题对应选择的目标属性、和所述目标属性对应选择的属性值。
主题顺序例如产品名称、亮点和特点等等。每个主题对应至少一个备选属性,每个备选属性具有至少一个属性值,属性选择信息还用于指示从主题对应的备选属性中选择的目标属性、以及目标属性中被选择的属性值。
下表示出了一种酒类商品的描述框架。
其中,表中第一行为描述框架中涉及的主题顺序,如产品名称、亮点、特点和净含量等。每个主题可以拆分为多个子主题,一个子主题可以对应一个或多个属性。如产品名称拆分为两个子主题,分别对应分类属性和特产品类属性。亮点可以拆分为2个子主题,分别对应其他元素属性和酒香型属性。特点拆分为3个子主题,其中两个子主题对应一个属性,即包装方式和口味,另一个子主题对应两个属性,即成分和原料成分。这些主题对应的属性即为备选属性。
描述框架中的属性介绍和属性选择用于指示对应主题中选择的目标属性。例如,属性介绍对应的值为“是”且属性选择对应的值为“any”则表示从主题对应的备选属性中选择部分作为目标属性。
描述框架中的属性值选择和属性值罗列用于指示属性对应选择的属性值。例如,属性值罗列的值为“是”,属性值选择的值为“all”,则表示选择目标属性对应的所有属性值。
通过描述框架可以控制描述信息档案中的内容,既保证描述信息档案的内容充分、满足需求,又不会过度冗余。
素材可以是采用适当的方式获得的图片类型的素材和/或文本类型的素材,所述文本类型的素材包括对音频类型的素材进行语音识别获得的文本、和原始文本中的至少之一。
针对商品类的目标对象,素材可以是从详情页、展示图、题图等获取,文本类型的素材可以从说明文本中获取。
音频类型的素材可以是从视频中提取出的音频,也可以未包含图片的纯音频。
步骤S104:对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容。
在一种可行方式中,对所述图片类型的素材进行图文识别,以获得所述图片类型的素材对应的属性句子。其中的图文识别可以采用具有图像识别功能的神经网络模型、OCR(光学字符识别)等方式识别出其中的物品、文字等等,并将物品和文字等转换相应的属性句子,后续可以根据属性句子的语义确定属性信息。
在另一种可行方式中,对于文本类型的素材,可以对所述文本类型的素材进行属性挖掘,以获得所述文本素材对应的属性句子。例如,通过能够进行语义识别的自然语言处理模型等对其进行属性挖掘,从而获得相应的属性句子,以便候选根据属性句子的语义确定属性信息。
在本实施例中,所述素材的属性层级用于指示所述素材对应的主题,所述素材的属性内容用于指示所述素材所描述的目标对象的属性和属性值。例如,属性内容可以是“口味-草莓味”等。
步骤S106:从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材。
在一种可行方式中,根据属性层级和属性选择信息中指示的主题顺序,确定属性层级匹配的素材,进而根据属性选择信息中指示选择的属性和属性值,从属性层级匹配的素材中选取属性内容匹配的素材。
例如,属性选择信息指示产品名称这一主题下选择部分属性进行介绍,主题对应属性为“分类”和“特产品类”,则可从中选取属性“分类”作为目标属性。对应的属性“分类”下的属性值可以全部选择。
相应地,根据素材的属性层级,从中选取与主题对应的素材,并从这些素材中选取描述属性“分类”中的属性值的素材作为目标素材。
步骤S108:根据描述框架和所述目标素材,生成描述信息档案。
在一种可行方式中可以按照描述框架中的主题顺序对目标素材进行组合,从而生成描述信息档案。
通过这种方式可以解决素材中可能存在语义重复、冗余的问题,而且可以根据描述框架控制描述信息档案中的句子顺序和内容,使得描述信息档案的语句简洁、清楚、没有冗余。而且描述框架与目标对象的素材解耦,从而使得描述框架可以适用于一个或多个品类的目标对象,以此实现了针对目标对象自动生成对应的描述信息档案,而且当目标对象的特性发生变更时也可以快速地更新描述信息档案,使得适用性良好。
参照图1B,示出了本申请实施例的一个使用场景中的描述框架的示意图。其中,素材可以通过目标对象的评论、详情页和主图进行内容挖掘获得,本使用场景中对其获取方式不作限制。
通过对获得的素材进行处理可以获得其属性信息,例如属性信息包括属性层级和属性内容,属性层级例如为“主题”、“特点”等。属性内容例如为“分类-酒品”、“口味-草莓味”等。
基于描述框架对应的属性选择信息,从素材中选取与其对应的素材,并按照描述框架指示的主题顺序对选取的素材进行组合,从而获得描述信息档案。
下面结合前述的描述框架,例举一种酒品对应的描述信息档案。根据描述框架确定主题“特点”中选择的属性为“口味”,该属性对应的所有属性值均为选择属性值。基于此,从属性层级为“特征”的素材中选取属性内容与口味对应的所有属性值。通过类似的方式可以针对其他主体匹配出相应的素材。
基于属性选择信息指示的主题顺序,对各主题对应的素材进行组合,从而形成描述信息档案。
通过本实施例,使用描述框架限定描述信息档案的框架,这样可以与素材解耦,使得目标对象的描述信息档案不受限于不同的素材,通过对素材进行处理确定属性信息,进而根据描述框架匹配出目标素材,并根据描述框对目标素材进行组合形成描述信息档案。这样由于描述框架按照属性对剧本进行分层,使得描述框架与素材解耦,从而提升了适应性,能够针对不同的目标对象生成对应的描述信息档案,且描述信息档案中能够包含不同目标对象的特点,保证了描述信息档案的质量。
本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例二
参照图2A,示出了本申请的实施例二的数据处理方法的步骤流程示意图。
在本实施例中,数据处理方法包括:
步骤S202:获取与目标对象相关的描述框架和多种类型的多个素材。
所述描述框架包括与所述目标对象对应的属性选择信息。描述框架可以根据目标对象自动生成,也可以通过人工根据需要对描述框架进行调整。针对不同的目标对象适应性地调整属性或者属性选择等对应的值,从而获得与目标对象匹配性更好的描述框架。
所述描述框架的属性选择信息用于指示主题顺序、所述主题对应选择的目标属性、和所述目标属性对应选择的属性值。
目标对象的素材可以采用任何适当的方式获得,在此不再赘述。
步骤S204:对每个素材执行至少一种处理以获取素材的属性信息。
素材的类型可能不同,针对不同类型的素材可以采用适当的手段进行处理,并获得相应的属性句子,以根据属性句子获得属性信息。
在一种可行方式中,步骤S204包括以下子步骤:
子步骤S2041:对所述图片类型的素材进行图文识别,以获得所述图片类型的素材对应的属性句子;和/或,对所述文本类型的素材进行属性挖掘,以获得所述文本素材对应的属性句子。
图文识别例如对图片类型的素材进行物体检测、光学字符识别等,以获得图片类型的素材中的文本和物体,并根据文本和物体确定相应的属性句子。
属性挖掘例如对文本素材进行自然语言处理,从而获得用于描述目标对象属性的属性句子。
子步骤S2042:根据所述属性句子的语义信息,对所述属性句子进行清洗处理。
为了减少后续匹配的时间成本和算力需求,提升匹配效率,并使得生成的描述信息档案语义明确且清晰、简洁,对属性句子进行清洗处理,去除语义重复的句子、去除表义不清晰的句子、以及去除不符合规定的句子。
除此之外,还可以对属性句子进行摘要抽取,从而获得达人摘要,进行图文挖掘以获得图文内容,进行信息抽取以获得活动优惠,进行详情页改写,以获得详情页介绍,进行评论抽取,以获得短评等。
子步骤S2043:对清洗剩余的所述属性句子对应的属性内容进行标准化处理,以根据标准化处理结果确定所述属性句子的属性内容、以及相应的属性层级作为对应素材的属性信息。
由于同一属性和属性值具有多种不同的描述方式,为了保证后续匹配的准确性,可以对属性内容进行标准化处理,将同义不同形式的表述统一成标准的表述。
如“分类”、“类别”等可以标准化为“分类”。“口味”、“味道”等均标准化为“口味”。属性值和属性层级等也可以通过类似的方式进行标准化。
基于标准化出的与“主题”对应的内容确定属性层级,基于标准化处的与“属性”和“属性值”对应的内容确定属性内容。在本实施例中,所述素材的属性层级用于指示所述素材对应的主题,所述素材的属性内容用于指示所述素材所描述的目标对象的属性和属性值。
可选地,针对属性层级对应的素材还可以进行如下处理:
子步骤S2044:对属性值相同的素材按照第一热度信息排序,并通过最长公共子序列算法去除语义相似度满足设定值的重复素材。
由于同一属性层级可以包括多个素材,且针对同一属性的属性值可以有一种或一种以上的表述形式,因此对于同一属性层级中同一属性的属性值相同的素材可以按照第一热度信息进行排序。
针对不同的使用场景第一热度信息可以对应不同的指标,如对象是商品,则第一热度信息可以是销售热度。又如对象是课程内容,则第一热度信息可以是知识点的重要程度或者知识点热度等。
此外,还可以通过最长公共子序列算法对素材进行去重,将语义相似度较高的素材进行去重处理,从而避免重复语义过多使得表述啰嗦。
对同一属性层级中同一属性的素材可以按照第二热度信息进行排序,该热度可以是被选用的热度等。
子步骤S2045:按照属性内容,将对应相同属性内容的去除重复后剩余的素材形成素材组。
例如,同一属性的素材可以组成素材组。该素材组内可以包括同一属性的不同属性值。
子步骤S2046:将属性内容属于同一主题的素材组合并成素材段落。
由于主题与属性层级对应,为了使得描述信息档案的逻辑性更好、层次更加分明,可以将属于同一属性层级(即属于同一主题)的素材组形成一个素材段落,以方便后续对素材段落进行组合。
步骤S206:从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材。
在一种可行方式中,步骤S206包括以下子步骤:
子步骤S2061:根据所述描述框架中属性选择信息指示的主题顺序,确定各所述主题对应的属性层级对应的候选素材。
由于素材的属性层级与描述框架中指示的主题对应,因此可以将素材的属性层级与属性选择信息中的主题进行匹配。例如,针对描述框架中的第一个主题“产品名称”,选取属性层级为“产品名称”的素材作为候选素材。
子步骤S2062:根据各主题对应的目标属性和所述目标属性介绍的属性值,从所述候选素材中确定属性内容与所述目标属性匹配的目标素材。
基于描述框架中的属性介绍和属性选择可以确定主题对应选择的目标属性,基于描述框架中的属性值选择和属性值罗列可以确定目标属性对应选择的属性值。
如主题“特点”对应的属性介绍为“是”、属性选择为“any”,则其对应的目标属性可以是从“包装方式”、“成分”、“原料成分”和“口味”中选取一部分座位目标属性。例如,每个对应的子主题中选择一个,因此目标属性可以是“包装方式”、“成分”、和“口味”。
由于属性值罗列为“是”、属性值选择为“all”,因此,可以罗列目标属性所有对应的属性值。基于此子步骤S2062通过下述过程实现:
过程A1:根据各所述主题对应的目标属性,选取属性内容与所述目标属性匹配的候选素材。
以目标属性是“包装方式”、“成分”、和“口味”为例,根据候选素材的属性内容,选取所有属性内容包含“包装方式”、“成分”、和“口味”作为匹配的候选素材。
过程A2:根据所述目标属性选择的属性值,从匹配的候选素材中选取包含目标属性选择的属性值的候选素材作为所述目标素材。
以罗列目标属性所有对应的属性值为例,可以将所有匹配的候选素材作为目标素材。或者,若仅罗列目标属性中的部分,则从匹配的候选素材中选取属性内容包含选择的属性值的候选素材作为目标素材。
步骤S208:根据描述框架和所述目标素材,生成描述信息档案。
在一种可行方式中,步骤S208可以实现为:根据所述描述框架指示的主题顺序和所述目标素材形成的素材段落对应的属性层级,对所述素材段落进行排序,并根据所述排序结果生成所述描述信息档案。
由于每个素材段落均具有对应的属性层级,因此根据属性层级和描述框架中的主题的对应关系和主题顺序确定素材段落的顺序,并按照顺序对素材段落进行合并,从而形成描述信息档案。
可选地,为了使得描述信息档案的信息描述更加顺畅、连贯,描述框架的属性选项信息中还包括衔接句信息,衔接句信息用于指示是否在素材段落或者素材段落内添加衔接句。若衔接句信息的值为“是”,则表示添加衔接句;反之若为“否”则不添加衔接句。
下面结合图2B,例举一种描述信息档案的生成过程。
如图2B所示,若目标对象为商品,则从目标对象的主图或者详情图中获取图片类型的素材,从目标对象的属性描述、卖点描述和说明文章中获得文本类型的素材。
对于图片类型的素材,通过OCR识别、物体检测和内容挖掘等方式获得图片和OCR文本等,进而根据OCR文本输出相应的属性句子。
针对文本类型的素材,通过属性挖掘(如XG生成等)获得相应的属性句子结合已有的属性知识获得属性句子。
针对这些属性句子,对于属性层级为亮点的属性句子,可以进行句子合并,并清洗语义重复的句子从而形成属性层级为亮点的素材。对于属性层级为商品介绍的属性句子,可以进行句子清洗和处理从而形成属性层级为商品介绍的素材。对于属性层级为达人摘要的属性句子,可以进行摘要抽取等,从而获得属性层级为达人摘要的素材。类似地还可以对属性句子进行图文挖掘、信息抽取、详情页改写和评论抽取等处理,从而获得相应的素材。在合成的过程中根据需要可以在相邻的素材段落之间增加衔接句,以使得描述信息档案更加顺畅,避免过于生硬,更加符合表达习惯、更加连贯和顺畅。
通过上述方式,使用基于属性分层的描述框架和串接话术,对构建出的素材进行拼接和整合,可以支持多源素材的语义维度整合,避免内容之间的无关性、冗余性、连贯性等问题,并且在内容上能够保持篇章级别的丰富度;使用多模展现可以有效丰富虚拟直播上需要的内容表现形式。描述框架构建合理,且描述框架的可扩展性好,可以快速复用到新的品类或行业中。
该方法可以应用于虚拟直播领域,快速地生成相应的直播剧本,当然也可以应用到其他领域,从而生成需要的描述信息档案。
通过本实施例,使用描述框架从素材中获得不同属性对应的素材,并依据描述框架中的属性选择信息对素材进行处理,以获得描述信息档案。由于描述框架按照属性对描述信息档案进行分层,使得描述框架与素材解耦,从而提升了适应性,能够针对不同的目标对象生成对应的描述信息档案,且能够保留不同目标对象的特点,保证了使用效果。
本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例三
参照图3,示出了本实施例的数据处理方法的步骤流程示意图。
在本实施例中,该方法用于生成与一目标对象相关的描述信息档案,其包括:
步骤S302:在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项。
为了便于根据不同的目标对象获得更加适配的描述框架,以及对素材进行更加准确的分类,可以在展示界面上展示素材对应的处理选项和描述框架编辑选项。
处理选项用于选择对素材进行的处理,处理完成获得的属性信息也可以在展示界面上展示,并供人工进行查阅和/或编辑。
描述框架编辑选项用于对描述框架进行调整,如修改描述框架中的内容。
在本实施例中,所述描述框架编辑选项包括用于调整所述描述框架中主题顺序的主题调整选项、用于调整主题对应选择的目标属性的属性调整选项、以及用于调整目标属性介绍的属性值的属性值调整选项。
通过主题调整选项可以根据需要增加或减少主题,或者调整主题之间的排序。
通过属性调整选项用于根据需要调整选择的属性。类似地,属性值调整选项用于根据需要调整选择的属性值。
可选地,描述框架编辑选项中还可以包括衔接句调整选项,用于根据需要调整是否增加衔接句。
步骤S304:接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容。
例如,通过触发处理选项,以对不同类型的素材进行相应的处理。如对图片类型的素材进行物体检测等处理,从而获得相应的属性句子、以及该属性句子对应的属性信息,如属性层级、属性和属性值等。
对文本类型的素材进行属性挖掘等,以获得相应的属性句子、以及该属性句子对应的属性信息,如属性层级、属性和属性值等。
获取的属性信息可以在展示界面中展示,以供查看和编辑。
步骤S306:接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息。
在展示界面中针对每个主题、属性选择等均配置对应的描述框架编辑选项,通过对其进行编辑可以改变相应的值,进而获得描述框架。
在一种可行方式中,步骤S306包括以下子步骤:
子步骤S3061:接收对所述主题调整选项、所述属性调整选项和所述属性值调整选项中的至少一个的调整操作。
例如,需要增加新的主题,则可以通过主题调整选项在主题一行中添加新的主题。
和/或,在需要针对某个属性选择所有属性值时,将其对应的属性值调整选项进行调整操作使属性值选择的值调整为“ALL”。
子步骤S3062:根据所述调整结果,确定所述播报指示的主题顺序、所述主题对应选择的目标属性、和所述目标属性介绍的属性值形成所述描述框架的属性选择信息。
主题顺序可以根据展示界面中显示的主题以从左到右的顺序确定为先后顺序。
针对目标属性可以根据展示界面中属性选择和属性介绍两行对应的取值确定。
目标属性对应的属性值可以根据展示界面中属性值选择和属性值罗列两行对应的取值确定。
步骤S308:从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材。
根据描述框架和素材进行匹配的过程与前述的实施例一或二的方式类似,故不再赘述。
步骤S310:根据描述框架和所述目标素材,生成描述信息档案。
生成描述信息档案的过程与前述的实施例一或二的方式类似,故不再赘述。
通过本实施例,可以根据需要对描述框架和素材进行处理,从而获得更加适当的描述框架,以保证生成的描述信息档案的使用效果更好,能够满足要求。
本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例四
参照图4,示出了本申请实施例四的数据处理装置的结构框图。
在本实施例中,数据处理装置,用于生成与一目标对象相关的描述信息档案,其包括:
第一获取模块402,用于获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息;
第一处理模块404,用于对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容;
第一匹配模块406,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
第一生成模块408,用于根据描述框架和所述目标素材,生成描述信息档案。
可选地,所述多种类型的素材包括图片类型的素材和/或文本类型的素材,所述文本类型的素材包括对音频类型的素材进行语音识别获得的文本、和原始文本中的至少之一;所述第一处理模块404,用于对所述图片类型的素材进行图文识别,以获得所述图片类型的素材对应的属性句子;和/或,对所述文本类型的素材进行属性挖掘,以获得所述文本素材对应的属性句子。
可选地,所述第一处理模块404还用于根据所述属性句子的语义信息,对所述属性句子进行清洗处理;对清洗剩余的所述属性句子对应的属性内容进行标准化处理,以根据标准化处理结果确定所述属性句子的属性内容、以及相应的属性层级作为对应素材的属性信息。
可选地,所述描述框架的属性选择信息用于指示主题顺序、所述主题对应选择的目标属性、和所述目标属性对应选择的属性值。
可选地,所述素材的属性层级用于指示所述素材对应的主题,所述素材的属性内容用于指示所述素材所描述的目标对象的属性和属性值。
可选地,第一匹配模块406,用于根据所述描述框架中属性选择信息指示的主题顺序,确定各所述主题对应的属性层级对应的候选素材;根据各主题对应的目标属性和所述目标属性选择的属性值,从所述候选素材中确定属性内容与所述目标属性匹配的目标素材。
可选地,第一匹配模块406,用于在所述根据各主题对应的目标属性和所述目标属性选择的属性值,从所述候选素材中确定属性内容与所述目标属性匹配的目标素材时,根据各所述主题对应的目标属性,选取属性内容与所述目标属性匹配的候选素材;根据所述目标属性选择的属性值,从匹配的候选素材中选取包含目标属性选择的属性值的候选素材作为所述目标素材。
可选地,第一处理模块404,还用于对属性值相同的素材按照第一热度信息排序,并通过最长公共子序列算法去除语义相似度满足设定值的重复的素材;按照属性内容,将对应相同属性内容的去除重复后剩余的素材形成素材组;将属性内容属于同一主题的素材组合并成素材段落。
可选地,第一生成模块408用于根据所述描述框架指示的主题顺序和所述目标素材形成的素材段落对应的属性层级,对所述素材段落进行排序,并根据所述排序结果生成所述描述信息档案。
本实施例的数据处理装置用于实现前述多个方法实施例中相应的数据处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的数据处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例五
参照图5,示出了本申请实施例五的数据处理装置的结构框图。
在本实施例中,数据处理装置,用于生成与一目标对象相关的描述信息档案,其包括:
展示模块502,用于在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项;
第二处理模块504,用于接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容;
接收模块506,用于接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息;
第二匹配模块508,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
第二生成模块510,用于根据描述框架和所述目标素材,生成描述信息档案。
可选地,所述描述框架编辑选项包括用于调整所述描述框架中主题顺序的主题调整选项、用于调整主题对应选择的目标属性的属性调整选项、以及用于调整目标属性介绍的属性值的属性值调整选项。
可选地,接收模块506用于接收对所述主题调整选项、所述属性调整选项和所述属性值调整选项中的至少一个的调整操作;根据所述调整结果,确定所述播报指示的主题顺序、所述主题对应选择的目标属性、和所述目标属性介绍的属性值形成所述描述框架的属性选择信息。
本实施例的数据处理装置用于实现前述多个方法实施例中相应的数据处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的数据处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例六
参照图6,示出了根据本申请实施例六的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。
如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(Communic6tions Interf6ce)604、存储器(memory)606、以及通信总线608。
其中:
处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它电子设备或服务器进行通信。
处理器602,用于执行程序610,具体可以执行上述数据处理方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路6SIC(6pplic6tionSpecific Integr6ted Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个6SIC。
存储器606,用于存放程序610。存储器606可能包含高速R6M存储器,也可能还包括非易失性存储器(non-vol6tile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行前述的数据处理方法对应的操作。
程序610中各步骤的具体实现可以参见上述数据处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、R6M、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如6SIC或FPG6)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,R6M、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的数据处理方法。此外,当通用计算机访问用于实现在此示出的数据处理方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的数据处理方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。
Claims (16)
1.一种数据处理方法,用于生成与一目标对象相关的描述信息档案,包括:
获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息;
对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容;
从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
根据描述框架和所述目标素材,生成描述信息档案。
2.根据权利要求1所述的方法,其中,所述多种类型的素材包括图片类型的素材和/或文本类型的素材,所述文本类型的素材包括对音频类型的素材进行语音识别获得的文本、和原始文本中的至少之一;
所述对每个素材执行至少一种处理以获取素材的属性信息,包括:
对所述图片类型的素材进行图文识别,以获得所述图片类型的素材对应的属性句子;和/或,
对所述文本类型的素材进行属性挖掘,以获得所述文本素材对应的属性句子。
3.根据权利要求2所述的方法,其中,所述对每个素材执行至少一种处理以获取素材的属性信息,还包括:
根据所述属性句子的语义信息,对所述属性句子进行清洗处理;
对清洗剩余的所述属性句子对应的属性内容进行标准化处理,以根据标准化处理结果确定所述属性句子的属性内容、以及相应的属性层级作为对应素材的属性信息。
4.根据权利要求1所述的方法,其中,所述描述框架的属性选择信息用于指示主题顺序、所述主题对应选择的目标属性、和所述目标属性对应选择的属性值。
5.根据权利要求4所述的方法,其中,所述素材的属性层级用于指示所述素材对应的主题,所述素材的属性内容用于指示所述素材所描述的目标对象的属性和属性值。
6.根据权利要求4或5所述的方法,其中,所述从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材,包括:
根据所述描述框架中属性选择信息指示的主题顺序,确定各所述主题对应的属性层级对应的候选素材;
根据各主题对应的目标属性和所述目标属性选择的属性值,从所述候选素材中确定属性内容与所述目标属性匹配的目标素材。
7.根据权利要求6所述的方法,其中,所述根据各主题对应的目标属性和所述目标属性选择的属性值,从所述候选素材中确定属性内容与所述目标属性匹配的目标素材,包括:
根据各所述主题对应的目标属性,选取属性内容与所述目标属性匹配的候选素材;
根据所述目标属性选择的属性值,从匹配的候选素材中选取包含目标属性选择的属性值的候选素材作为所述目标素材。
8.根据权利要求1所述的方法,其中,所述对每个素材执行至少一种处理以获取素材的属性信息,还包括:
对属性值相同的素材按照第一热度信息排序,并通过最长公共子序列算法去除语义相似度满足设定值的重复的素材;
按照属性内容,将对应相同属性内容的去除重复后剩余的素材形成素材组;
将属性内容属于同一主题的素材组合并成素材段落。
9.根据权利要求4或5所述的方法,其中,所述根据描述框架和所述目标素材,生成描述信息档案,包括:
根据所述描述框架指示的主题顺序和所述目标素材形成的素材段落对应的属性层级,对所述素材段落进行排序,并根据所述排序结果生成所述描述信息档案。
10.一种数据处理方法,用于生成与一目标对象相关的描述信息档案,包括:
在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项;
接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容;
接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息;
从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
根据描述框架和所述目标素材,生成描述信息档案。
11.根据权利要求10所述的方法,其中,所述描述框架编辑选项包括用于调整所述描述框架中主题顺序的主题调整选项、用于调整主题对应选择的目标属性的属性调整选项、以及用于调整目标属性介绍的属性值的属性值调整选项。
12.根据权利要求11所述的方法,其中,所述接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,包括:
接收对所述主题调整选项、所述属性调整选项和所述属性值调整选项中的至少一个的调整操作;
根据所述调整结果,确定所述播报指示的主题顺序、所述主题对应选择的目标属性、和所述目标属性介绍的属性值形成所述描述框架的属性选择信息。
13.一种数据处理装置,用于生成与一目标对象相关的描述信息档案,包括:
第一获取模块,用于获取与目标对象相关的描述框架和多种类型的多个素材,所述描述框架包括与所述目标对象对应的属性选择信息;
第一处理模块,用于对每个素材执行至少一种处理以获取素材的属性信息,所述属性信息包括属性层级和属性内容;
第一匹配模块,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
第一生成模块,用于根据描述框架和所述目标素材,生成描述信息档案。
14.一种数据处理装置,用于生成与一目标对象相关的描述信息档案,包括:
展示模块,用于在展示界面上展示与所述目标对象对应的多种类型的素材、素材对应的处理选项和描述框架编辑选项;
第二处理模块,用于接收对所述展示界面中的至少一个素材对应的处理选项的触发操作,对所述素材进行处理以获得所述素材的属性信息,并展示所述属性信息,所述属性信息包括属性层级和属性内容;
接收模块,用于接收对所述描述框架编辑选项的编辑操作,并根据编辑结果获得所述描述框架,所述描述框架包括与所述目标对象对应的属性选择信息;
第二匹配模块,用于从所述素材中选取所述属性内容和所述属性层级与所述描述框架的属性选择信息匹配的目标素材;
第二生成模块,用于根据描述框架和所述目标素材,生成描述信息档案。
15.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-9中任一项或10-12中任一项所述的数据处理方法对应的操作。
16.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-9中任一项或10-12中任一项所述的数据处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110336398.6A CN115129806A (zh) | 2021-03-29 | 2021-03-29 | 数据处理方法、装置、电子设备及计算机存储介质 |
US17/701,455 US12032914B2 (en) | 2021-03-29 | 2022-03-22 | Data processing method, apparatus, electronic device, and computer storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110336398.6A CN115129806A (zh) | 2021-03-29 | 2021-03-29 | 数据处理方法、装置、电子设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115129806A true CN115129806A (zh) | 2022-09-30 |
Family
ID=83364850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110336398.6A Pending CN115129806A (zh) | 2021-03-29 | 2021-03-29 | 数据处理方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115129806A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116661856A (zh) * | 2023-08-01 | 2023-08-29 | 上海合见工业软件集团有限公司 | Eda软件的数据拼接系统 |
CN117493978A (zh) * | 2023-12-22 | 2024-02-02 | 明亚保险经纪股份有限公司 | 一种素材分类管理方法、装置、设备和介质 |
-
2021
- 2021-03-29 CN CN202110336398.6A patent/CN115129806A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116661856A (zh) * | 2023-08-01 | 2023-08-29 | 上海合见工业软件集团有限公司 | Eda软件的数据拼接系统 |
CN116661856B (zh) * | 2023-08-01 | 2023-10-20 | 上海合见工业软件集团有限公司 | Eda软件的数据拼接系统 |
CN117493978A (zh) * | 2023-12-22 | 2024-02-02 | 明亚保险经纪股份有限公司 | 一种素材分类管理方法、装置、设备和介质 |
CN117493978B (zh) * | 2023-12-22 | 2024-03-19 | 明亚保险经纪股份有限公司 | 一种素材分类管理方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220309249A1 (en) | 2022-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8775918B2 (en) | System and method for automatic improvement of electronic presentations | |
WO2016197767A2 (zh) | 一种表情输入方法、装置、终端和计算机可读存储介质 | |
CN113641859B (zh) | 脚本生成方法、系统、计算机存储介质及计算机程序产品 | |
CN109508448A (zh) | 基于长篇文章生成短资讯方法、介质、装置和计算设备 | |
CN115129806A (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
KR102490319B1 (ko) | 인공지능 콘텐츠 자동 생성 및 변형 방법 | |
CN112929746B (zh) | 视频生成方法和装置、存储介质和电子设备 | |
CN112199932A (zh) | Ppt生成方法、装置、计算机可读存储介质及处理器 | |
CN113536172B (zh) | 一种百科信息展示的方法、装置及计算机存储介质 | |
CN114938473B (zh) | 评论视频生成方法及装置 | |
CN112163560A (zh) | 一种视频信息处理方法、装置、电子设备及存储介质 | |
CN113660526B (zh) | 脚本生成方法、系统、计算机存储介质及计算机程序产品 | |
US20220375223A1 (en) | Information generation method and apparatus | |
CN111125384B (zh) | 一种多媒体答案生成方法、装置、终端设备以及存储介质 | |
CN114090766A (zh) | 视频文本筛选方法、装置及电子设备 | |
CN117746143A (zh) | 基于aigc的图像描述文本的生成方法及装置、存储介质 | |
CN115442540B (zh) | 音乐视频生成方法、装置、计算机设备及存储介质 | |
CN113099267B (zh) | 视频生成方法、装置、电子设备及存储介质 | |
US20230396857A1 (en) | Video generation method and apparatus, and electronic device and computer-readable medium | |
CN114218437A (zh) | 自适应图片裁剪融合方法、系统、计算机设备及介质 | |
CN116266204A (zh) | 一种订阅内容处理方法、装置、计算机设备及存储介质 | |
CN114328990B (zh) | 图像完整性识别方法、装置、计算机设备和存储介质 | |
US12032914B2 (en) | Data processing method, apparatus, electronic device, and computer storage medium | |
US20230336839A1 (en) | Method, computer device, and storage medium for generating video cover | |
CN117009581A (zh) | 视频生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240323 Address after: 51 Belarusian Pasha Road, Singapore, Lai Zan Da Building 1 # 03-06, Postal Code 189554 Applicant after: Alibaba Innovation Co. Country or region after: Singapore Address before: Room 01, 45th Floor, AXA Building, 8 Shanton Road, Singapore Applicant before: Alibaba Singapore Holdings Ltd. Country or region before: Singapore |