CN113220901B - 基于增强智能的写作构思辅助系统、网路系统 - Google Patents
基于增强智能的写作构思辅助系统、网路系统 Download PDFInfo
- Publication number
- CN113220901B CN113220901B CN202110513566.4A CN202110513566A CN113220901B CN 113220901 B CN113220901 B CN 113220901B CN 202110513566 A CN202110513566 A CN 202110513566A CN 113220901 B CN113220901 B CN 113220901B
- Authority
- CN
- China
- Prior art keywords
- thought
- module
- new
- work
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims abstract description 58
- 230000000007 visual effect Effects 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 238000003860 storage Methods 0.000 claims abstract description 23
- 230000004927 fusion Effects 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 14
- 230000003340 mental effect Effects 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 17
- 239000000203 mixture Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 6
- 238000012549 training Methods 0.000 description 17
- 238000000605 extraction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 239000012634 fragment Substances 0.000 description 10
- 238000005457 optimization Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000021824 exploration behavior Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于混合增强智能领域,具体涉及了一种基于增强智能的写作构思辅助系统、网络系统,本发明辅助系统包括思路探索单元、思路构建单元;思路探索单元包括作品思路知识图谱模块、创作思路可视化分析模块、思路推荐模块、新思路输入模块;思路构建单元包括思路语义建模模块、思路融合模块、完整思路存储模块;基于已有作品思路知识图谱,通过对已有作品思路心智模型方式可视化展示及基于人机交互的用户数据的进行意图获取和相似知识实体向量的推荐,在获取新思路信息后进行语义建模并与新作品思路知识图谱进行融合,同时基于新增信息对思路探索单元进行优化。本发明提高了意图识别的准确度,推荐信息匹配的准确度,间接提高了作品创作效率。
Description
技术领域
本发明属于混合增强智能领域,具体涉及了一种基于增强智能的写作构思辅助系统、网络系统。
背景技术
创造力增强技术一直是人机交互与人工智能结合的一个重要研究方向,在中国新一代人工智能战略中,属于“人在回路”的混合增强智能研究领域。创造力可以被多种因素所影响,如社交、科技、经济等。很多领域都需要,如文创、出版和智能制造中的设计。人工智能创造力还无法达到人类水平,因此,通过人工智能与人类用户进行协同工作,结合人工智能的高效计算和存储能力以及人类创造性等高级认知能力,实现人机互补,增强人类的创造力。创造力增强技术能够促进大众的创新和发明,其中基于混合增强智能的人机协同创造力增强技术将会成为未来的重要发展趋势。
写作分为构思和撰写两个重要阶段,构思阶段决定着整部作品的思想和主线,对内容撰写具有指导性的作用。因此,构思阶段对于整部作品来说,具有非常重要的地位。
发明内容
为了解决现有技术中的上述问题,即通过混合增强智能技术准确识别用户意图、从现有作品中匹配相关的高价值信息,提高作品创作效率,本发明提供了一种基于增强智能的写作构思辅助系统,该系统包括思路探索单元、思路构建单元;
所述思路探索单元包括作品思路知识图谱模块、创作思路可视化分析模块、思路推荐模块、新思路输入模块;所述作品思路知识图谱模块存储作品思路知识图谱,所述作品思路知识图谱初始为预设作品知识图谱,并基于新作品思路知识图谱进行更新;所述创作思路可视化分析模块基于心智模型对作品思路知识图谱进行可视化,同时可视化所述思路推荐模块的推荐信息并获取用户反馈数据;所述思路推荐模块基于用户数据从所述作品思路知识图谱中选取知识实体推送给所述创作思路可视化分析模块;所述新思路输入模块用于输入用户的新思路信息;
所述思路构建单元包括思路语义建模模块、思路融合模块、完整思路存储模块;所述思路语义建模模块用于对所述新思路信息进行语义建模;所述思路融合模块用于将新思路的语义建模与新作品思路知识图谱进行融合,得到更新后的新作品思路知识图谱,并存储于所述完整思路存储模块。
在一些优选实施方式中,所述作品思路知识图谱包括概念网络和情节网络;
所述概念网络包括作品中的实体概念及其静态关系;
所述情节网络包括作品中的实体动态活动。
在一些优选实施方式中,所述思路推荐模块包括意图计算模块和推荐计算模块;
所述意图计算模块用于从用户数据中提取特征,获取意图向量;
所述推荐计算模块用于基于所述意图向量,与作品思路知识图谱中知识实体进行相似度计算,并基于相似度选取所推荐的知识实体。
在一些优选实施方式中,所述用户数据包括新作品思路知识图谱、最邻近N个新思路对应的知识实体序列、用户反馈数据;所述用户反馈数据为创作思路可视化分析模块获取的所述思路推荐模块推荐后选项的决策数据。
在一些优选实施方式中,所述意图计算模块中基于第一模型、第二模型、第三模型分别进行特征提取;
所述第一模型,用于获取新作品思路知识图谱中的结构关系特征,计算图谱语义空间的Embedding向量集合;
所述第二模型,用于提取最邻近N个新思路对应的知识实体序列的位置关系,计算时序语义空间的Embedding向量集合;
所述第三模型,用于依据用户反馈数据计算推荐后选项的Embedding向量集合。
在一些优选实施方式中,所述思路推荐模块还包括意图理解网络模型;
所述意图理解网络模型基于深度神经网络构建,依据从用户数据中提取的三个Embedding向量集合,预测下一个实体的特征向量表示,作为用户意图信息。
在一些优选实施方式中,所述思路推荐模块还包括推荐计算模块;
所述推荐计算模块,通过计算所述用户意图信息与所述作品思路知识图谱中知识实体向量的相似度,选取相似度最高的M个知识实体推送给所述创作思路可视化分析模块。
在一些优选实施方式中,所述创作思路可视化分析模块采用的心智模型包括Thinking Map模型、Mind Map模型、Concept Map模型。
在一些优选实施方式中,所述思路语义建模模块通过跨领域本体模型对对所述新思路信息进行语义建模。
在一些优选实施方式中,所述思路融合模块中“将新思路的语义建模与新作品思路知识图谱进行融合”,其方法为:
如果新思路的语义模型中的知识实体存在于之前的新作品思路知识图谱,则将新思路的语义建模生成的子图,通过节点合并的方式,融合到新作品思路知识图谱中;否则,通过向量匹配法,计算新思路实体与新作品思路知识图谱实体之间的余弦相似度,如果小于设定阀值,则进行实体合并。
本发明的第二方面,提出了一种基于增强智能的写作构思辅助的网络系统,该系统包服务器、一个或多个终端设备;
所述服务器用于存储多个作品的作品思路知识图谱;
所述终端设备设置有上述的基于增强智能的写作构思辅助系统;所述作品思路知识图谱模块基于用户指令从所述服务器获取对应作品的作品思路知识图谱并存储;
所述服务器还设置有用户创作数据存储单元,用于按照预设时间周期存储用户作品创作过程中的新作品思路知识图谱及基于增强智能的写作构思辅助系统的网络参数。
本发明的有益效果:
本发明通过思路推荐模块,基于作品思路知识图谱、创作思路可视化分析模块的用户决策信息、完整思路存储模块的新作品思路知识图谱,进行用户意图的识别,提高了意图识别的准确度,提高了从作品思路知识图谱中匹配相关的高价值信息的准确度,进而使使用者高效、准确的获得所需要的在先作品中的关联信息,更容易触发新思路的形成,提高作品创作效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明一实施例中基于增强智能的写作构思辅助系统的信息流示意图;
图2是本发明一实施例的基于增强智能的写作构思辅助系统框架示意图;
图3是本发明一实施例中的作品思路知识图谱示意图;
图4是本发明一实施例中思路推荐模块的框架示意图;
图5是本发明一实施例中特征提取模型训练与优化流程示意图;
图6是用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明面向写作的构思阶段,提出一种基于增强智能的写作构思辅助系统,依据人机协同创造力增强机制,在写作过程中,以人机交互为途径,通过人工智能启发和增强人类的构思能力。本发明聚焦两个方面的创新:人机协同的可视化智能思路探索,和基于语义的思路建模与融合。
人机协同的可视化智能思路探索:智能系统为用户提供已存在的作品构思知识图谱作为用户知识探索的载体;智能系统提供基于用户动态探索行为的个性化知识推荐方法,在用户进行海量知识探索时,分析用户的探索意图,提供精准知识推荐,提高用户对已有思路知识的检索和理解能力,缓解信息过载问题。通过可视化将知识图谱和知识推荐促相结合,形成知识图谱可视分析,构建构思的决策支持,促进新思路产生。同时,用户对于智能推荐的反馈信息,以及用户创造的新思路信息,也支撑着智能系统的优化,形成人机双向增强的机制。
基于语义的思路建模与融合:构思是个思路创造的迭代过程,每一轮迭代中出现的新思路,都会融合到之前迭代创造的思路中,最终形成完整的思路。因此,本发明提出形式化的思路模型,使思路具备可计算性,进而通过对语义特征的计算,实现思路融合。语义模型化的思路表示方法,支撑着思路探索中的创作思路可视化分析。创作思路可视化分析对思路语义模型进行解析,利用可视化技术实现图形化数据展示,并提供交互,供用户进行交互分析,实现交互式的思路探索。
本发明提出的基于增强智能的写作构思辅助系统的信息流如图1所示,包括:
(1)在作品思路图谱可视化和思路知识智能推荐的结合下,形成可视分析系统;
(2)用户在可以进行交互式可视化知识探索分析;
(3)通过多轮交互的分析,用户获得了新的思路;
(4)系统对新思路进行语义建模;
(5)通过计算,系统将新思路与之前形成的完整思路进行融合;
(6)融合后的思路,用于更新作品思路图谱可视化和优化思路知识推荐模型。
本发明提供的一种基于增强智能的写作构思辅助系统,包括思路探索单元、思路构建单元;
所述思路探索单元包括作品思路知识图谱模块、创作思路可视化分析模块、思路推荐模块、新思路输入模块;所述作品思路知识图谱模块存储作品思路知识图谱,所述作品思路知识图谱初始为预设作品知识图谱,并基于新作品思路知识图谱进行更新;所述创作思路可视化分析模块基于心智模型对作品思路知识图谱进行可视化,同时可视化所述思路推荐模块的推荐信息并获取用户反馈数据;所述思路推荐模块基于用户数据从所述作品思路知识图谱中选取知识实体推送给所述创作思路可视化分析模块;所述新思路输入模块用于输入用户的新思路信息;
所述思路构建单元包括思路语义建模模块、思路融合模块、完整思路存储模块;所述思路语义建模模块用于对所述新思路信息进行语义建模;所述思路融合模块用于将新思路的语义建模与新作品思路知识图谱进行融合,得到更新后的新作品思路知识图谱,并存储于所述完整思路存储模块。
为了更清晰地对本发明进行说明,下面结合附图对本发明实施例展开详述。
本发明一种实施例的基于增强智能的写作构思辅助系统,包括两个主要部分,如图2所示,包括:思路探索单元、思路构建单元;思路探索阶段为用户提供交互式可视化作品思路知识图谱的探索分析,帮助用户获得新思路;思路构建阶段在抽象的新思路获取之后,进行思路建模和思路融合,形成完整思路,并支撑思路探索阶段的优化。
1、思路探索单元
思路探索单元主要用于增强用户的思路获取能力,包括作品思路知识图谱模块、创作思路可视化分析模块、思路推荐模块、新思路输入模块。
1.1作品思路知识图谱模块
作品思路知识图谱模块存储作品思路知识图谱,所述作品思路知识图谱初始为预设作品知识图谱,并基于新作品思路知识图谱进行更新。
作品思路知识图谱基本结构如图3所示,包括概念网络和情节网络。概念网络描述了作品中的实体概念及其静态关系,例如人和物的概念以及人与物之间的关系等。情节网络描述了作品中的实体动态活动,包括人物、物品和事件等主要节点,人物或物品节点之间由事件节点连接。事件节点中包含时间、地点、活动或状态等主要属性,对事件进行描述。情节网络中的人物和物品等概念及关系由概念网络定义。这样,一个文学创作思路就可以通过包含概念网络和情节网络的作品图谱,对创作思路进行形式化表示,完整清晰描述创作思路的语义。
1.2创作思路可视化分析模块
创作思路可视化分析模块基于心智模型对作品思路知识图谱进行可视化,同时可视化所述思路推荐模块的推荐信息并获取用户反馈数据。
创作思路可视化分析模块如图2中所示,以心智模型(Mental Map Theory)作为参考模板,对作品思路知识图谱进行可视化,同时基于交互手段,实现图谱的交互分析。心智模型的结构都是类网络结构,通过关键词表示思维对象,通过连线表示关系,帮助用户将脑中想法,即隐性知识,通过图形进行表示,将外显化为可以描述的思路。其中,基于ThinkingMap模型的方法,主要用于表示过程性的思路信息;基于Mind Map模型的方法,表示思路的附加属性;基于Concept Map模型的方法,表示思路的概念及关系。本发明实施例中将三种方法进行结合,构建综合的作品思路知识图谱可视化,展示图谱中的实体、属性和关系。
该模块的显示输出通过显示装置进行展示,并集基于触控屏幕或者鼠标等输入设备对思路推荐模块的推荐信息进行决策交互。
1.3思路推荐模块
思路推荐模块基于用户数据从所述作品思路知识图谱中选取知识实体推送给所述创作思路可视化分析模块。
思路推荐模块如图3中所示,包括意图计算模块和推荐计算模块。继续参看图4,意图计算模块用于从用户产生数据中提取特征,并进行融合,分析用户的探索意图,计算探索意图的向量值,作为意图向量;推荐计算模块利用意图向量,与作品思路知识图谱中实体进行相似度计算,进而实现系统对作品思路知识图谱中实体的推荐。
(1)意图计算模块
意图计算模块用于从用户数据中提取特征,获取意图向量。意图计算模块分析用户探索过程中的数据,提取历史探索行为特征,预测下一个行为的特征。该模块的特征提取部分包括三个特征提取模型,基于所提取特征获取意图向量是通过意图理解网络模型进行获取,模型中参数通过训练样本进行优化,在使用过程中,当用户在思路探索和构建过程中产生新数据的时候,新数据将会驱动推荐模型参数的优化,实现人机系统中的人类智能对智能系统的改进。在用户产生新数据的时候,通过模型优化方法,调整推荐模型参数。
如图4所示,意图计算模块包括特征提取计算及意图理解网络模型两部分。
A、特征提取计算
特征提取计算主要是面向三类用户数据:新作品思路知识图谱、最邻近N个新思路对应的知识实体序列、用户反馈数据;用户反馈数据为创作思路可视化分析模块获取的所述思路推荐模块推荐后选项的决策数据。提取的特征分别为:新作品思路知识图谱中的结构关系特征、基于新思路对应的知识实体的时间序列特征;基于用户对于系统推荐反馈数据的兴趣偏好特征。其中,N为预设的自然数。
特征提取计算包括第一模型、第二模型、第三模三个特征提取模型,这三个特征提取模型可以分别为:基于GAT模型(图注意力模型)的用户思路图谱特征模型、基于BERT模型(基于Transformer的双向编码表示模型)的思路知识实体序列特征模型、基于LFM(latentfactor model,隐语义模型)的兴趣模型。特征提取模型的训练和优化的细节如图5所示。图右侧部分描述了训练过程,左侧部分描述了数据更新内容。
针对新作品思路知识图谱,通过基于GAT模型的用户思路图谱特征模型(简称GAT模型),获取用户思路图谱中的结构关系特征,计算出图谱语义空间的Embedding(嵌入)向量集合。在训练阶段,训练数据是已有作品思路知识图谱,通过GAT模型学习知识图谱中的关系结构特征,计算每个实体在结构关系特征空间中的向量值。在优化阶段,通过增量训练方法,用新数据训练思路图谱的GAT模型。
用户每次获得新思路时候,会创建新的思路知识实体或者直接利用知识实体,根据时间顺序,会形成实体的时间序列数据,即新思路的最邻近N个新思路对应的知识实体序列。针对新思路的最邻近N个新思路对应的知识实体序列,采用基于BERT模型的思路知识实体序列特征模型(简称BERT模型),提取其位置关系特征,计算时序语义空间的Embedding向量序列。在训练阶段,将实体id序列输入BERT模型,提取序列数据的位置上下文特征,计算每个实体在时序空间中向量值。BERT模型采用预训练+微调的方式,将经过其他项目预训练的BERT模型(如Google的BERT-large模型(大参数量的基于Transformer的双向编码表示模型))的参数作为初始值,采用Masked Language Model(掩码语言模型)的训练策略,通过思路知识实体序列数据进行模型微调。在优化阶段,通过新数据进一步对思路知识序列特征模型进行微调,实现参数优化。
针对用户反馈数据,通过基于LFM的兴趣模型,计算推荐候选项的Embedding向量集合。用户反馈数据是用户对推荐系统的推荐候选项的决策,分为“接受”和“拒绝”2种反馈状态。“接收”是指用户明确表示该推荐项对新思路是有意义的,甚至可以直接作为当前作品构思的新思路;“拒绝”是指用户明确接收了推荐列表中其他的候选项。在训练阶段,每轮系统推荐的候选项序列的值可以通过Multi-hot编码,“接收”状态值为1,“拒绝”状态值为0。多轮的历史推荐数据形成一个矩阵。通过隐性因子分解模型LFM(Latent FactorModel),对该矩阵进行分解,得到“候选项实体-潜在因子”矩阵,获得候选项实体的向量值。在优化阶段,通过新的用户反馈数据,更新矩阵分解的结果。
B、意图理解网络模型
特征提取计算完成之后,计算结果的三个向量集合作为输入项,输入意图理解网络模型。意图理解网络模型基于深度神经网络构建,依据从用户数据中提取的三个Embedding向量集合,预测下一个实体的特征向量表示,作为用户意图信息。
在模型训练阶段,训练数据是用户新思路实体序列数据;标签是是序列中最后一个实体的向量。训练完毕后,系统进行模型推理时,根据用户最新的N个有序的新思路知识实体,预测下一个实体的特征表示。
意图理解网络模型对特征提取计算出的三类特征向量集合,使用向量拼接进行特征拼接。以思路知识实体序列数据为核心,查询用户思路图谱的实体和用户反馈数据中的实体,并进行实体匹配。如果在后两个数据中,出现没有匹配实体的情况,则将该空间的实体特征向量设为0。匹配完毕后,将同一个实体的三类Embedding向量进行拼接。针对1个实体,拼接后的特征格式为:
其中,第1部分为序列位置特征,第2部分为图谱结构关系特征,第3部分是兴趣特征。其中,n是BERT模型计算出的序列特征Embedding向量的维度,m是GAT模型计算出的图谱节点Embedding向量的维度,l是LFM兴趣模型计算出的节点Embedding向量维度。
之后进入归一化层,将拼接特征向量通过Min-Max normalization(min-max标准化)方法进行归一化计算。然后进入自注意力层(Self-Attention Layer),计算每次输入的思路实体序列中实体的权重。之后进入全链接层,实现特征组合,得到预测的实体特征向量,最后进入基于Sigmoid函数的输出层,判断与训练数据中的标签是否一致。
训练完成后,在模型推理使用阶段,不需要使用输出层,在全链接层可以输出预测的下一个实体的特征向量表示,即是用户的意图向量表示。
(2)推荐计算模块
推荐计算模块用于基于所述意图向量,与作品思路知识图谱中知识实体进行相似度计算,并基于相似度选取所推荐的知识实体。
推荐计算模块获取用户意图信息,通过向量内积方法,计算用户意图信息与作品思路知识图谱中知识实体向量的相似度(其中,作品思路知识图谱中实体向量是通过GAT模型计算获得的),根据相似度进行排序,选取相似度最高的M个知识实体推送给所述创作思路可视化分析模块,其中M为预设的自然数。
1.4新思路输入模块
新思路输入模块用于输入用户的新思路信息。用户在可视分析过程中,洞察新信息,启发新思路。新思路是用户的隐性知识,无法描述和展示。因此,需要在思路构建阶段进行隐性知识项显性知识转化,将抽象的新思路,构建成可描述、可显示和可计算的模型。新思路的形式是图结构,包括节点和节点之间的连接。输入有以下方式:(1)新建节点:表示思路中的实体;(2)新建节点之间的边:表示思路实体之间的逻辑关系。
2、思路构建单元
思路构建单元包括思路语义建模模块、思路融合模块、完整思路存储模块。
(1)思路语义建模模块
思路语义建模模块用于对所述新思路信息进行语义建模。
使用形式化描述方法定义思路语义模型。本发明将思路语义模型定义为是一个知识图谱模型,作为作品思路知识图谱的子图,包括概念层和数据层。概念层定义本体模型,包含概念和概念之间的逻辑关系,作为知识图谱实体和关系的高度抽象;数据层基于本体模型,构建实体、属性和实体之间的关系。模型可以通过RDF(资源描述框架)等语义描述方式进行存储,实现思路数据到语义模型的转化,是一个从数据到知识的映射。
(2)思路融合模块
一个完整的新作品思路是由通过多次探索获得的多个思路碎片组成的,用户每次输入的新思路都被定义为一个思路碎片,然后与新作品思路知识图谱进行融合,最终得完整的思路知识图谱,并存储于所述完整思路存储模块。
如果新获得的思路碎片的语义模型中的知识实体存在于之前的新作品思路知识图谱,则将该思路碎片的语义模型生成的子图,通过节点合并的方式,融合到在先的新作品思路知识图谱中。融合方法:基于本体匹配的方法,通过对思路碎片子图的本体概念与新作品思路知识图谱的本体概念进行比较,如果相同,则合并概念;在此基础上,如果实体名称相同,则合并实体,实现融合。
如果思路碎片的语义模型中的有全新的知识实体,不存在于之前的新作品思路知识图谱,则通过向量匹配法,计算思路碎片实体与新作品思路知识图谱实体之间的余弦相似度,如果小于设定阀值,则进行实体合并。使用向量匹配法,需要借助已有的通用知识图谱,如FreeBase数据或者DBpedia-CN数据等,通过GCN(图卷积网络)计算出知识图谱节点的向量作为备查库,如果一个思路碎片子图的实体与一个思路图谱的实体都在备查库中,并且二者的余弦相似度小于预置阀值,则合并实体,实现融合。
经过多轮的新思路碎片与新作品思路知识图谱的融合之后,最终将形成完整的新作品思路知识图谱,作为子图对作品思路知识图谱进行扩展;输入推荐系统,用于更新推荐模型。
(3)完整思路存储模块
完整思路存储模块用于存储新作品思路知识图谱,在思路构建过程中存储最新版本的新作品思路知识图谱;在思路构建完成后,存储完整的新作品思路知识图谱。
本发明第二实施例的一种基于增强智能的写作构思辅助的网络系统,该系统包服务器、一个或多个终端设备;
所述服务器用于存储多个作品的作品思路知识图谱;
所述终端设备设置有上述的基于增强智能的写作构思辅助系统;所述作品思路知识图谱模块基于用户指令从所述服务器获取对应作品的作品思路知识图谱并存储;
所述服务器还设置有用户创作数据存储单元,用于按照预设时间周期存储用户作品创作过程中的新作品思路知识图谱及基于增强智能的写作构思辅助系统的网络参数。
为了便于用户对同一创作思路在不同的时间、不同的设备上进行连续创作,本实施例中的终端设备可以基于服务器的用户创作数据存储单元存储的用户创作数据,进行前一次作品数据及网络参数的加载,作为此次的初始状态。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的基于增强智能的写作构思辅助的网络系统的具体工作过程及有关说明,可以参考前述基于增强智能的写作构思辅助系统实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于增强智能的写作构思辅助系统、基于增强智能的写作构思辅助的网络系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
下面参考图6,其示出了用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)601,其可以根据存储在只读存储器(ROM,Read Only Memory)602中的程序或者从存储部分608加载到随机访问存储器(RAM,Random Access Memory)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O,Input/Output)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (5)
1.一种基于增强智能的写作构思辅助系统,其特征在于,该系统包括思路探索单元、思路构建单元;
所述思路探索单元包括作品思路知识图谱模块、创作思路可视化分析模块、思路推荐模块、新思路输入模块;所述作品思路知识图谱模块存储作品思路知识图谱,所述作品思路知识图谱初始为预设作品知识图谱,并基于新作品思路知识图谱进行更新;所述创作思路可视化分析模块基于心智模型对作品思路知识图谱进行可视化,同时可视化所述思路推荐模块的推荐信息并获取用户反馈数据;所述思路推荐模块基于用户数据从所述作品思路知识图谱中选取知识实体推送给所述创作思路可视化分析模块;所述新思路输入模块用于输入用户的新思路信息;
其中,所述思路推荐模块包括意图计算模块和推荐计算模块;
所述意图计算模块用于从用户数据中提取特征,获取意图向量:
获取用户数据;所述用户数据包括新作品思路知识图谱、最邻近N个新思路对应的知识实体序列、用户反馈数据;所述用户反馈数据为创作思路可视化分析模块获取的所述思路推荐模块推荐后选项的决策数据;
将所述新作品思路知识图谱输入预构建的基于GAT模型的用户思路图谱特征模型计算图谱语义空间的嵌入向量集合;将所述最邻近N个新思路对应的知识实体序列输入预构建的基于BERT模型的思路知识实体序列特征模型计算时序语义空间的嵌入向量序列;将所述用户反馈数据输入基于LFM的兴趣模型计算推荐候选项的嵌入向量集合;
将所述图谱语义空间的嵌入向量集合、所述时序语义空间的嵌入向量序列、所述推荐候选项的嵌入向量集合输入基于深度神经网络构建的意图理解网络模型预测下一个实体的特征向量表示,得到意图向量:所述意图理解网络模型包括依次连接的归一化层、自注意力层、全连接层以及Sigmoid函数层;所述归一化层的输入为同一实体三类嵌入向量的拼接特征向量;
所述推荐计算模块用于通过计算所述意图向量与所述作品思路知识图谱中知识实体向量的相似度,选取相似度最高的M个知识实体推送给所述创作思路可视化分析模块;
所述思路构建单元包括思路语义建模模块、思路融合模块、完整思路存储模块;所述思路语义建模模块用于对所述新思路信息进行语义建模;所述思路融合模块用于将新思路的语义建模与新作品思路知识图谱进行融合,得到更新后的新作品思路知识图谱,并存储于所述完整思路存储模块;
其中,将新思路的语义建模与新作品思路知识图谱进行融合,其方法为:
如果新思路的语义模型中的知识实体存在于之前的新作品思路知识图谱,则将新思路的语义建模生成的子图,通过节点合并的方式,融合到新作品思路知识图谱中;否则,通过向量匹配法,计算新思路实体与新作品思路知识图谱实体之间的余弦相似度,如果小于设定阈值,则进行实体合并。
2.根据权利要求1所述的基于增强智能的写作构思辅助系统,其特征在于,所述作品思路知识图谱包括概念网络和情节网络;
所述概念网络包括作品中的实体概念及其静态关系;
所述情节网络包括作品中的实体动态活动。
3.根据权利要求1-2任一项所述的基于增强智能的写作构思辅助系统,其特征在于,所述创作思路可视化分析模块采用的心智模型包括Thinking Map模型、Mind Map模型、Concept Map模型。
4.根据权利要求1-2任一项所述的基于增强智能的写作构思辅助系统,其特征在于,所述思路语义建模模块通过跨领域本体模型对对所述新思路信息进行语义建模。
5.一种基于增强智能的写作构思辅助的网络系统,其特征在于,该系统包括服务器、一个或多个终端设备;
所述服务器用于存储多个作品的作品思路知识图谱;
所述终端设备设置有权利要求1-4任一项所述的基于增强智能的写作构思辅助系统;所述作品思路知识图谱模块基于用户指令从所述服务器获取对应作品的作品思路知识图谱并存储;
所述服务器还设置有用户创作数据存储单元,用于按照预设时间周期存储用户作品创作过程中的新作品思路知识图谱及基于增强智能的写作构思辅助系统的网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110513566.4A CN113220901B (zh) | 2021-05-11 | 2021-05-11 | 基于增强智能的写作构思辅助系统、网路系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110513566.4A CN113220901B (zh) | 2021-05-11 | 2021-05-11 | 基于增强智能的写作构思辅助系统、网路系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113220901A CN113220901A (zh) | 2021-08-06 |
CN113220901B true CN113220901B (zh) | 2023-07-25 |
Family
ID=77095058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110513566.4A Active CN113220901B (zh) | 2021-05-11 | 2021-05-11 | 基于增强智能的写作构思辅助系统、网路系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220901B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114186139B (zh) * | 2021-12-30 | 2022-08-16 | 重庆理工大学 | 一种基于时间增强的图神经网络会话推荐方法 |
CN116611424A (zh) * | 2023-07-18 | 2023-08-18 | 北京澜舟科技有限公司 | 一种写作辅助模型构建方法、写作辅助方法及存储介质 |
CN116821377A (zh) * | 2023-08-31 | 2023-09-29 | 南京云创大数据科技股份有限公司 | 基于知识图谱和大模型的小学语文自动评测系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120123992A1 (en) * | 2010-11-11 | 2012-05-17 | Rovi Technologies Corporation | System and method for generating multimedia recommendations by using artificial intelligence concept matching and latent semantic analysis |
CN107704572B (zh) * | 2017-09-30 | 2021-07-13 | 北京奇虎科技有限公司 | 人物实体的创作角度挖掘方法及装置 |
CN110457439B (zh) * | 2019-08-06 | 2022-03-01 | 超级知识产权顾问(北京)有限公司 | 一站式智能写作辅助方法、装置和系统 |
CN111475625A (zh) * | 2020-05-09 | 2020-07-31 | 山东舜网传媒股份有限公司 | 基于知识图谱的新闻稿件生成方法及系统 |
CN112115252B (zh) * | 2020-08-26 | 2023-06-02 | 罗彤 | 智能辅助写作处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-05-11 CN CN202110513566.4A patent/CN113220901B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113220901A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Gpt4graph: Can large language models understand graph structured data? an empirical evaluation and benchmarking | |
CN113220901B (zh) | 基于增强智能的写作构思辅助系统、网路系统 | |
Tamašauskaitė et al. | Defining a knowledge graph development process through a systematic review | |
Preidel et al. | Data retrieval from building information models based on visual programming | |
CN110888943B (zh) | 基于微模板的法院裁判文书辅助生成的方法和系统 | |
Shen et al. | Dynamic knowledge modeling and fusion method for custom apparel production process based on knowledge graph | |
Ali et al. | A method for clustering unlabeled BIM objects using entropy and TF-IDF with RDF encoding | |
Wątróbski | Ontology learning methods from text-an extensive knowledge-based approach | |
Gargouri et al. | Ontology Theory, Management and Design: Advanced Tools and Models: Advanced Tools and Models | |
CN112084304A (zh) | 一种人工智能辅助创新方法、装置及计算机可读介质 | |
CN114428862A (zh) | 基于油气管道的知识图谱构建方法及处理器 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
Kaur et al. | A review of artificial intelligence techniques for requirement engineering | |
CN115905528A (zh) | 具有时序特征的事件多标签分类方法、装置及电子设备 | |
CN116595191A (zh) | 一种交互式低代码知识图谱的构建方法及装置 | |
Leng et al. | Automatic MEP knowledge acquisition based on documents and natural language processing | |
Schwarz et al. | Towards an integrated development and sustainability evaluation of energy scenarios assisted by automated information exchange | |
CN117271901A (zh) | 基于技术能力的社交关系推荐方法及系统 | |
CN112199558A (zh) | 一种创新知识库构建工具、电子设备及计算机可读介质 | |
Okoye | Linked open data: State-of-the-art mechanisms and conceptual framework | |
CN117473054A (zh) | 基于知识图谱的通用智能问答方法及装置 | |
Fang et al. | Using Bayesian network technology to predict the semiconductor manufacturing yield rate in IoT | |
CN116795341A (zh) | 生成带有预测占位符的代码段的机器学习的模型来优化软件开发 | |
KR101499571B1 (ko) | 일반문서의 자동계층 분류를 통한 의미적 문서로의 변환 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
CN116502648A (zh) | 一种基于多跳推理的机器阅读理解语义推理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |