CN108491370A - 使用元数据结构和数据驱动的方式产生内容的系统与方法 - Google Patents

使用元数据结构和数据驱动的方式产生内容的系统与方法 Download PDF

Info

Publication number
CN108491370A
CN108491370A CN201810250391.0A CN201810250391A CN108491370A CN 108491370 A CN108491370 A CN 108491370A CN 201810250391 A CN201810250391 A CN 201810250391A CN 108491370 A CN108491370 A CN 108491370A
Authority
CN
China
Prior art keywords
content
module
context
connector
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810250391.0A
Other languages
English (en)
Other versions
CN108491370B (zh
Inventor
曾敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Digital Peak Technology Co Ltd
Chengdu Rui Code Technology Co Ltd
Original Assignee
Hangzhou Digital Peak Technology Co Ltd
Chengdu Rui Code Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Digital Peak Technology Co Ltd, Chengdu Rui Code Technology Co Ltd filed Critical Hangzhou Digital Peak Technology Co Ltd
Priority to CN201810250391.0A priority Critical patent/CN108491370B/zh
Publication of CN108491370A publication Critical patent/CN108491370A/zh
Application granted granted Critical
Publication of CN108491370B publication Critical patent/CN108491370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种使用元数据结构和数据驱动的方式产生内容的系统及内容生产方法,该系统包括编辑器、内容生成模块、内容请求模块和存储模块,内容生成模块包括内容句连接器、内容上下文连接器和内容生成算法模块;用户通过编辑器输入内容资源数据,分类、设置关键字信息属性后存储到存储模块;应用程序通过内容请求模块调用内容生成模块,内容生成算法模块从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从存储模块检索内容,内容句连接器选择部分内容组合成句子,内容上下文连接器组合内容的上下文结构形成有上下文意义的内容段落,用关键字信息属性替换关键字占位符后返回给应用程序。

Description

使用元数据结构和数据驱动的方式产生内容的系统与方法
技术领域
本发明涉及一种计算机生成内容的系统与方法,具体涉及一种使用元数据结构和数据驱动的方式产生内容的系统与方法,属于计算机技术领域。
背景技术
在许多用户场景中,我们希望通过计算机生成提供关键信息并且非重复的内容,以供人们阅读。
对计算机生成内容的要求包括:首先,我们希望计算机生成内容的过程效率高;其次,要求计算机生成的内容语句通顺易于理解;再次,要求计算机生成的内容是不重复的和没有机械化的感觉;最后,要求计算机生成的内容包括准确的关键信息。
因此,研制一种高效的、内容语句易于理解、不重复的、包括准确关键信息的使用元数据结构和数据驱动的方式产生内容的系统与方法是非常必要的,并且该发明也有重要的应用前景。
发明内容
本发明公开了一种使用元数据结构和数据驱动的方式产生内容的系统及内容生产方法,由计算机高效的生成内容语句易于理解、不重复的、包括准确关键信息的内容。
为了实现上述目标,本发明所采用的技术方案是:
使用元数据结构和数据驱动的方式产生内容的系统,包括编辑器(1)、内容生成模块(2)、内容请求模块(3)和存储模块(4),所述内容生成模块(2)包括内容句连接器(21)、内容上下文连接器(22)和内容生成算法模块(23),所述内容句连接器(21)用于定义一句话中不同内容部分的关系,所述内容上下文连接器(22)用于定义内容的上下文结构和内容的句子结构;
用户通过所述编辑器(1)输入内容资源数据,分类、设置关键字信息属性后存储到所述存储模块(4);
应用程序通过所述内容请求模块(3)调用所述内容生成模块(2),所述内容生成算法模块(23)从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从所述存储模块(3)检索内容,所述内容句连接器(21)选择部分内容组合成句子,所述内容上下文连接器(22)组合内容的上下文结构形成有上下文意义的内容段落,用关键字信息属性替换关键字占位符后返回给应用程序。
前述的使用元数据结构和数据驱动的方式产生内容的系统,内容资源数据的分类、设置内容背景类参数和关键信息参数由人工或计算机人工智能完成。
前述的使用元数据结构和数据驱动的方式产生内容的系统,所述内容请求模块(3)通过一个关键信息参数属性来描述调用所述内容生成模块(2)后生成的内容。
前述的使用元数据结构和数据驱动的方式产生内容的系统,所述内容生成模块(2)输出的生成内容为JSON格式。
一种基于前述的使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法,包括以下步骤:
S1、用户通过所述编辑器(1)输入内容资源数据,分类、设置标签后存储到所述存储模块(4);
S2、应用程序通过所述内容请求模块(3)调用所述内容生成模块(2),执行步骤S3;
S3、所述内容生成算法模块(23)从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从所述存储模块(3)检索内容,执行步骤S4;
S4、所述内容句连接器(21)选择部分内容组合成句子,执行步骤S5;
S5、所述内容上下文连接器(22)组合内容的上下文结构形成有上下文意义的内容段落,完成后执行步骤S6,否则执行步骤S3获取下一个内容的上下文结构;
S6、用关键字信息属性替换关键字占位符后返回给应用程序。
前述的内容生产方法,所述步骤S3中,从关键字信息参数中获取内容属性。。
与现有技术相比,本发明的有益之处在于:
(1)计算机生产内容的过程效率高;
(2)用户能够通过设置内容上下文连接器、内容句连接器来描述输出的结构和上下文,从而使内容能够更具组织性地生成,语句通顺易于理解;
(3)考虑了和句子之间的上下文关系,内容资源与内容上下文关系的不同组合,使得每个内容输出都是唯一的、不重复的;
(4)在内容资源中使用关键字占位符,在每次程序调用时用关键字替换关键字占位符,确保关键信息准确。
附图说明
图1是本发明的使用元数据结构和数据驱动的方式产生内容的系统的一个具体实施例的系统架构示意图;
图2是图1中的使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法的一个具体实施例的流程图;
图3是图1中的使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法的一个具体实施例的生成内容结果示意图。
其中:
1-编辑器 2-内容生产模块
21-内容句连接器 22-内容上下文连接器
3-内容请求模块 4-存储模块。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
参照图1,本发明的使用元数据结构和数据驱动的方式产生内容的系统,包括编辑器1、内容生成模块2、内容请求模块3和存储模块4,内容生成模块2包括内容句连接器21、内容上下文连接器22和内容生成算法模块23,内容句连接器21用于定义一句话中不同内容部分的关系,内容上下文连接器22用于定义内容的上下文结构和内容的句子结构;
存储模块4优选MySQL实现,也可以由其它数据库实现;内容请求模块3优选MySQL存储过程实现,也可以替换为Java或其他语言编程实现;内容生成算法模块23优选MySQL存储过程实现,也可以替换Java或其他语言编程实现。
用户通过编辑器1输入内容资源数据,分类、设置关键字信息属性后存储到存储模块4;
内容资源数据的原始数据是从内容源收集的。例如,如果我们想在Facebook上生成用户评论或回复,为了维护内容风格则最好从Facebook收集原始评论;如果我们要生成体育或财经新闻,则需要从体育和财经新闻网站获取文章内容。
内容资源数据用不同的标签进行分类,以描述含义和何时使用。以生成社交网络回复为例,类别可以是:像这样的帖子/同意作者/喜欢这个产品/只是这样/做笑话/欣赏/遵循最后的评论等。每个内容资源可以放置不同的属性,描述海报,如性别等。内容资源数据包含用输入关键字参数替换的关键字占位符。
表1:内容资源数据
应用程序通过内容请求模块3调用内容生成模块2,内容生成算法模块23从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从存储模块3检索内容,内容句连接器21选择部分内容组合成句子,内容上下文连接器22组合内容的上下文结构形成有上下文意义的内容段落,用关键字信息属性替换关键字占位符后返回给应用程序。
内容上下文连接器22描述一个内容或文章的结构。就像一个内容脚本,上下文连接器中的每一行都包含上下文类型名称、内容类型、顺序。以生成社交网络回复为例,如果我们想得到关于一个产品的讨论的一组回复。
表2:内容上下文连接器设置
ContextConnector No SourceType
discussProduct 1 like this product
discussProduct 2 I used it before
discussProduct 3 I agree
discussProduct 4 valuable information
discussProduct 5 follow previous comment
discussProduct 6 I want to try
内容句连接器21用于描述一句话中不同内容部分的关系。例如:强调,过渡,平行,跟随,表情等。内容句连接器21连接两个或多个内容资源部分,以生成一个句子。
表3:内容句连接器设置
SentenceConnector No SourceType
transition 1 transition
emphasize 2 emphasize
follow 3 follow
emojj 4 emojj
作为一种优选的方案,内容资源数据的分类、设置内容背景类参数和关键信息参数由人工或计算机人工智能完成。
作为一种优选的方案,内容请求模块3通过一个关键信息参数属性来描述调用内容生成模块2后生成的内容。
关键信息参数属性是描述将在内容资源中被替换的信息的一组属性。关键信息属性将决定内容输出,如内容输入的关键信息,内容将具有什么样的音调和风格。
参照图3,例如,如果我们要为一个名人产生评论,我们将记录名人的名字,昵称,他/她的粉丝如何称呼自己,性别,他/她的特征(大多数粉丝在他们的评论中会出现相同的特征)。例如,对贾斯汀·比伯的评论,大多数评论将显得很酷,从少年,特别是少年女孩等。
表3:关键信息属性
Keyword FansName Characteristic Gender Nickname
G-Dragon VIP Talent male GD
Twice once Beauty female
IU GuiStar Cute female 小仙女
TaylorSwift 霉粉 Talent female Tay
作为一种优选的方案,内容生成模块2输出的生成内容为JSON格式。
参照图2,本发明的基于使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法,包括以下步骤:
S1、用户通过编辑器1输入内容资源数据,分类、设置标签后存储到存储模块4;
S2、应用程序通过内容请求模块3调用内容生成模块2,执行步骤S3;
S3、内容生成算法模块23从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从存储模块3检索内容,执行步骤S4;
S4、内容句连接器21选择部分内容组合成句子,执行步骤S5;
S5、内容上下文连接器22组合内容的上下文结构形成有上下文意义的内容段落,完成后执行步骤S6,否则执行步骤S3获取下一个内容的上下文结构;
S6、用关键字信息属性替换关键字占位符后返回给应用程序。
作为一种优选的方案,步骤S3中,从关键字信息参数获取内容属性。
需要说明的是,以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.使用元数据结构和数据驱动的方式产生内容的系统,包括编辑器(1)、内容生成模块(2)、内容请求模块(3)和存储模块(4),其特征在于,所述内容生成模块(2)包括内容句连接器(21)、内容上下文连接器(22)和内容生成算法模块(23),所述内容句连接器(21)用于定义一句话中不同内容部分的关系,所述内容上下文连接器(22)用于定义内容的上下文结构和内容的句子结构;
用户通过所述编辑器(1)输入内容资源数据,分类、设置关键字信息属性后存储到所述存储模块(4);
应用程序通过所述内容请求模块(3)调用所述内容生成模块(2),所述内容生成算法模块(23)从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从所述存储模块(3)检索内容,所述内容句连接器(21)选择部分内容组合成句子,所述内容上下文连接器(22)组合内容的上下文结构形成有上下文意义的内容段落,用关键字信息属性替换关键字占位符后返回给应用程序。
2.根据权利要求1所述的使用元数据结构和数据驱动的方式产生内容的系统,其特征在于,内容资源数据的分类、设置内容背景类参数和关键信息参数由人工或计算机人工智能完成。
3.根据权利要求2所述的使用元数据结构和数据驱动的方式产生内容的系统,其特征在于,所述内容请求模块(3)通过一个关键信息参数属性来描述调用所述内容生成模块(2)后生成的内容。
4.根据权利要求1所述的使用元数据结构和数据驱动的方式产生内容的系统,其特征在于,所述内容生成模块(2)输出的生成内容为JSON格式。
5.一种基于权利要求1-4任一项所述的使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法,其特征在于,包括以下步骤:
S1、用户通过所述编辑器(1)输入内容资源数据,分类、设置标签后存储到所述存储模块(4);
S2、应用程序通过所述内容请求模块(3)调用所述内容生成模块(2),执行步骤S3;
S3、所述内容生成算法模块(23)从应用程序传递的内容背景类参数获取内容类别,从关键信息参数获取内容属性,根据内容类别和内容属性随机从所述存储模块(3)检索内容,执行步骤S4;
S4、所述内容句连接器(21)选择部分内容组合成句子,执行步骤S5;
S5、所述内容上下文连接器(22)组合内容的上下文结构形成有上下文意义的内容段落,完成后执行步骤S6,否则执行步骤S3获取下一个内容的上下文结构;
S6、用关键字信息属性替换关键字占位符后返回给应用程序。
6.根据权利要求5所述的使用元数据结构和数据驱动的方式产生内容的系统的内容生产方法,其特征在于,所述步骤S3中,从关键字信息参数中获取内容属性。
CN201810250391.0A 2018-03-26 2018-03-26 使用元数据结构和数据驱动的方式产生内容的系统与方法 Active CN108491370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810250391.0A CN108491370B (zh) 2018-03-26 2018-03-26 使用元数据结构和数据驱动的方式产生内容的系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810250391.0A CN108491370B (zh) 2018-03-26 2018-03-26 使用元数据结构和数据驱动的方式产生内容的系统与方法

Publications (2)

Publication Number Publication Date
CN108491370A true CN108491370A (zh) 2018-09-04
CN108491370B CN108491370B (zh) 2021-11-26

Family

ID=63337506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810250391.0A Active CN108491370B (zh) 2018-03-26 2018-03-26 使用元数据结构和数据驱动的方式产生内容的系统与方法

Country Status (1)

Country Link
CN (1) CN108491370B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020026339A1 (en) * 1998-12-18 2002-02-28 Richard Frankland Integrated change management unit
US20030078958A1 (en) * 2000-09-01 2003-04-24 Pace Charles P. Method and system for deploying an asset over a multi-tiered network
CN104346357A (zh) * 2013-07-29 2015-02-11 中国科学院声学研究所 一种嵌入式终端的文件存取方法及系统
CN105683912A (zh) * 2013-07-09 2016-06-15 马克西密瑟有限公司 对于应用程序的优化的方法
CN107463603A (zh) * 2017-06-16 2017-12-12 中国科学院计算机网络信息中心 一种基于量化dmp的科研项目生命周期数据管理定制化控制方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020026339A1 (en) * 1998-12-18 2002-02-28 Richard Frankland Integrated change management unit
US20030078958A1 (en) * 2000-09-01 2003-04-24 Pace Charles P. Method and system for deploying an asset over a multi-tiered network
CN105683912A (zh) * 2013-07-09 2016-06-15 马克西密瑟有限公司 对于应用程序的优化的方法
CN104346357A (zh) * 2013-07-29 2015-02-11 中国科学院声学研究所 一种嵌入式终端的文件存取方法及系统
CN107463603A (zh) * 2017-06-16 2017-12-12 中国科学院计算机网络信息中心 一种基于量化dmp的科研项目生命周期数据管理定制化控制方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TRAN DOAN HUAN 等: ""A polymer dataset for accelerated property prediction and design"", 《SCIENTIFIC DATA》 *
王超 等: ""基于形式概念分析的创新政策内容结构研究方法"", 《中国科技论坛》 *

Also Published As

Publication number Publication date
CN108491370B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN110728541A (zh) 信息流媒体广告创意推荐方法及装置
CN109376775B (zh) 在线新闻多模态情感分析方法
US20170364797A1 (en) Computing Systems and Methods for Determining Sentiment Using Emojis in Electronic Data
CN112396462B (zh) 基于Clickhouse的人群圈选方法及装置
CN110175323B (zh) 消息摘要的生成方法和装置
CN108710647A (zh) 一种用于聊天机器人的数据处理方法及装置
CN115018588A (zh) 产品推荐方法、装置、电子设备及可读存储介质
Bhat et al. Assigning sentiment score for twitter tweets
CN113255079A (zh) 一种基于人工智能的包装设计方法及装置
CN108491370A (zh) 使用元数据结构和数据驱动的方式产生内容的系统与方法
CN110909174A (zh) 一种基于知识图谱的简单问答中实体链接的改进方法
CN113099267B (zh) 视频生成方法、装置、电子设备及存储介质
Serrano et al. The evaluation of ordered features for sms spam filtering
Cetinkaya et al. Twitter account classification using account metadata: organizationvs. individual
CN115114519A (zh) 基于人工智能的推荐方法、装置、电子设备及存储介质
Sagar et al. Emoji Prediction using Sentiment Analysis
Acharya et al. Semantic Analysis of Twitter Posts
CN108536685A (zh) 信息处理装置
CN116456289B (zh) 一种富媒体信息处理方法及系统
Dimitrakopoulos et al. A knowledge-based integrated framework for increasing social management intelligence
CN114036294A (zh) 文本情绪识别方法、装置、计算机设备和可读存储介质
Springstein et al. Visual Narratives: Large-scale Hierarchical Classification of Art-historical Images
Waterschoot et al. A time-robust group recommender for featured comments on news platforms
Bilwani et al. Diversity and Representation in ICCC: A review of Computational Creativity publication content and authorship trends 2017-2022
Agarwal Developing an Approach to Evaluate and Observe Sentiments of Tweets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant