CN111159421A - 基于知识图谱的基金查询方法及装置 - Google Patents
基于知识图谱的基金查询方法及装置 Download PDFInfo
- Publication number
- CN111159421A CN111159421A CN201911356893.2A CN201911356893A CN111159421A CN 111159421 A CN111159421 A CN 111159421A CN 201911356893 A CN201911356893 A CN 201911356893A CN 111159421 A CN111159421 A CN 111159421A
- Authority
- CN
- China
- Prior art keywords
- fund
- knowledge
- preset
- entity
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 238000013461 design Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种基于知识图谱的基金查询方法及装置,方法包括:接收用户发送的基金查询请求;根据所述基金查询请求在预设基金知识图谱中进行基金匹配;若匹配成功,则向所述用户发送对应的基金数据;本申请能够通过构建基金专业领域的知识图谱,从海量数据中准确提炼出基金相关知识,满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
Description
技术领域
本申请涉及知识图谱领域,具体涉及一种基于知识图谱的基金查询方法及装置。
背景技术
随着我国金融市场的不断的发展,全国已发公募产品总体规模在继续攀升。面对如此庞大的基金市场,投资者在选择基金时总是会产生迷茫,将各种基金之间的关系进行关联,选出合适的投资基金是当前急需解决的重要课题。
发明内容
针对现有技术中的问题,本申请提供一种基于知识图谱的基金查询方法及装置,能够通过构建基金专业领域的知识图谱,从海量数据中准确提炼出基金相关知识,满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种基于知识图谱的基金查询方法,包括:
接收用户发送的基金查询请求;
根据所述基金查询请求在预设基金知识图谱中进行基金匹配;
若匹配成功,则向所述用户发送对应的基金数据。
进一步地,所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配,包括:
根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
进一步地,在所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配之前,包括:
根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体;
根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
进一步地,在所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配之前,包括:
根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
第二方面,本申请提供一种基于知识图谱的基金查询装置,包括:
查询请求接收模块,用于接收用户发送的基金查询请求;
知识图谱匹配模块,用于根据所述基金查询请求在预设基金知识图谱中进行基金匹配;
匹配结果发送模块,用于若匹配成功,则向所述用户发送对应的基金数据。
进一步地,所述知识图谱匹配模块包括:
基金数据查询单元,用于根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
进一步地,还包括:
实体识别单元,用于根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体;
实体消歧单元,用于根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
进一步地,还包括:
基金类关系确定单元,用于根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于知识图谱的基金查询方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于知识图谱的基金查询方法的步骤。
由上述技术方案可知,本申请提供一种基于知识图谱的基金查询方法及装置,通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的基于知识图谱的基金查询方法的流程示意图之一;
图2为本申请实施例中的基于知识图谱的基金查询方法的流程示意图之二;
图3为本申请实施例中的基于知识图谱的基金查询装置的结构图之一;
图4为本申请实施例中的基于知识图谱的基金查询装置的结构图之二;
图5为本申请实施例中的构建基金知识图谱的流程图;
图6为本申请实施例中的实体识别模型结构图;
图7为本申请实施例中的实体消歧模型工作流程图;
图8为本申请实施例中的基金实体类关系示意图;
图9为本申请实施例中的依存句法分析模型关系抽取流程图;
图10为本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到随着我国金融市场的不断的发展,全国已发公募产品总体规模在继续攀升,面对如此庞大的基金市场,投资者在选择基金时总是会产生迷茫的问题,本申请提供一种基于知识图谱的基金查询方法及装置,通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
为了能够通过构建基金专业领域的知识图谱,从海量数据中准确提炼出基金相关知识,满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题,本申请提供一种基于知识图谱的基金查询方法的实施例,参见图1,所述基于知识图谱的基金查询方法具体包含有如下内容:
步骤S101:接收用户发送的基金查询请求。
步骤S102:根据所述基金查询请求在预设基金知识图谱中进行基金匹配。
步骤S103:若匹配成功,则向所述用户发送对应的基金数据。
可以理解的是,所述预设基金知识图谱可以通过已有的基金结构化数据,并使用自然语言处理技术和深度学习技术从半结构化和非结构化数据中挖掘出更多的实体和实体关系。基金知识图谱可以满足可视化要求高的需求,能够非常方便的以图的形式展示出各实体之间的关系,以及实体的属性;基金知识图谱能够实现传统结构化数据库无法满足的关系高效深度搜索;基金知识图谱满足关系查询效率实时性的需求;基金知识图谱能够解决数据多样化、解决数据孤岛问题。
可选地,在构建所述预设基金知识图谱时可以包括基金顶层本体的设计、基金类的定义设计、基金关系节点的设计、基金类关系的设计和基金各实体属性的设计共五部分。
从上述描述可知,本申请实施例提供的基于知识图谱的基金查询方法,能够通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
为了能够通过基金知识图谱准确的得到基金查询请求所需要的基金数据,在本申请的基于知识图谱的基金查询方法的一实施例中,还可以具体包含如下内容:
根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
为了能够对基金知识图谱中的基金类进行准确的定义设计,在本申请的基于知识图谱的基金查询方法的一实施例中,参见图2,还可以具体包含如下内容:
步骤S201:根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体。
步骤S202:根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
可选地,针对基金实体的类别的定义设计,可以从结构化数据中抽象出类的定义,例如,类包括包括基金(Fund)、股票(Stock)、基金经理(Fund_Manager)、基金公司(Fund_Company)、股份制公司(Stock_Company)、股上市公司(Listed_Company)。
可选地,还可以从半结构化和非结构化数据中扩展出更多的类实体,具体地,参见图6,实体识别的实现具体是基于BiLSTM(Bi-directional Long Short-Term Memory,双向长短时记忆神经网络)和CRF(Conditional Random Fields,条件随机场)实现的基于字的实体识别模型。
具体地,实体识别模型采用BIO标注模式:(B-begin,I-inside,O-outside)。
例如,以句子为单位,可以将一个包含k个字的句子X表示为:
X=(x1,x2,…,xk),
其中xi表示句子第i个字在字典中的id,可以得到每个字的one-hot向量,向量的维数位k。
模型第一层通过word-embedding处理得到句子的字向量(character embedding)xi∈Rd;
模型第二层是LSTM层,自动提取句子特征,将第一层得到的字向量通过dropout后的序列(x1,x2,…,xk)作为LSTM各个时间步的输入,再将正向和反向LSTM输出的隐状态序列(1)和(2)进行拼接(3),得到完整的隐形状态序列(4),最后设置dropout后接入一个线性层,将(4)映射成(5),其中n是标注集的标签数,从而得到自动提取句子特征P。
(h1,h2,…,hk)∈Rk×m,(4)拼接后的完整的隐性状态序列;
P=(p1,p2,…,pk)∈Rk×n,(5)将隐状态向量从m维映射到k维,k是标注集的标签数,从而得到自动提取的句子特征,pi是将字xi分类到第k个标签的打分值;
模型第三层是CRF层,进行句子级的序列标注,记标签序列为y,模型对于句子X的标签Y的打分为:
其中,P是上面第(5)步的矩阵,A是一个(n+2)×(n+2)的矩阵,Aij表示的是从第ii个标签到第jj个标签的转移得分,进而在为一个位置进行标注的时候可以利用此前已经标注过的标签,之所以要加2是因为要为句子首部添加一个起始状态以及为句子尾部添加一个终止状态。y=(y1,y2,…,yk)表示一个长度等于句子长度的标签序列。
对抽取出来的实体进行歧义消除的方法,是基于预设的在线知识库的词语消歧,主要的流程参见图7。
为了能够对基金知识图谱中类之间的关系进行准确的定义设计,在本申请的基于知识图谱的基金查询方法的一实施例中,还可以具体包含如下内容:
根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
可选地,首选需要确定类之间的关系设计。根据上述步骤中设计的类,对类之间的关系进行设计,例如,可以包括:
持股[:OWNS_STOCK|OWNED_BY];
雇佣[:HIRED_BY|HIRES];
发行产品[:HAS_PRODUCT|PRODUCED_BY];
管理[:MANAGES|MANAGED_BY];
发行[:ISSUES|ISSUED_BY];
控股[:HOLD|HOLD_BY]。
可选地,根据上述步骤确定的基金类的定义设计和基金类的定义设计,可以进一步地进行基金类关系的设计,主要是将关系节点映射到不同的类之间,主要的类关系参见图8,实体关系的抽取具体实现采用基于依存句法分析的模板的方式,具体的流程参见图9。
为了能够通过构建基金专业领域的知识图谱,从海量数据中准确提炼出基金相关知识,满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题,本申请提供一种用于实现所述基于知识图谱的基金查询方法的全部或部分内容的基于知识图谱的基金查询装置的实施例,参见图3,所述基于知识图谱的基金查询装置具体包含有如下内容:
查询请求接收模块10,用于接收用户发送的基金查询请求。
知识图谱匹配模块20,用于根据所述基金查询请求在预设基金知识图谱中进行基金匹配。
匹配结果发送模块30,用于若匹配成功,则向所述用户发送对应的基金数据。
从上述描述可知,本申请实施例提供的基于知识图谱的基金查询装置,能够通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
为了能够通过基金知识图谱准确的得到基金查询请求所需要的基金数据,在本申请的基于知识图谱的基金查询装置的一实施例中,参见图4,所述知识图谱匹配模块20包括:
基金数据查询单元21,用于根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
为了能够对基金知识图谱中的基金类进行准确的定义设计,在本申请的基于知识图谱的基金查询装置的一实施例中,还包括:
实体识别单元,用于根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体。
实体消歧单元,用于根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
为了能够对基金知识图谱中类之间的关系进行准确的定义设计,在本申请的基于知识图谱的基金查询装置的一实施例中,还包括:
基金类关系确定单元,用于根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
为了更进一步说明本方案,本申请还提供一种应用上述基于知识图谱的基金查询装置实现基于知识图谱的基金查询方法的具体应用实例,参见图5,具体包含有如下内容:
步骤1、基金顶层本体的设计,基金相关的主要领域顶层本体包括资产(Asset)、公司(Company)、人(Person)、证券(Security)。
步骤2、基金类的定义设计,从结构化数据中抽象出类的定义,根据步骤1,类包括包括基金(Fund)、股票(Stock)、基金经理(Fund_Manager)、基金公司(Fund_Company)、股份制公司(Stock_Company)、股上市公司(Listed_Company),从半结构化和非结构化数据中扩展出更多的类实体。
可选地,参见图6,实体识别的实现具体是基于BiLSTM(Bi-directional LongShort-Term Memory,双向长短时记忆神经网络)和CRF(Conditional Random Fields,条件随机场)实现的基于字的实体识别模型。
具体地,实体识别模型采用BIO标注模式:(B-begin,I-inside,O-outside)。
例如,以句子为单位,可以将一个包含k个字的句子X表示为:
X=(x1,x2,…,xk),
其中xi表示句子第i个字在字典中的id,可以得到每个字的one-hot向量,向量的维数位k。
模型第一层通过word-embedding处理得到句子的字向量(character embedding)xi∈Rd(xi由one-hot向量映射为低维稠密的字向量,R^d表示d维向量);
模型第二层是LSTM层,自动提取句子特征,将第一层得到的字向量通过dropout后的序列(x1,x2,...,xk)作为LSTM各个时间步的输入,再将正向和反向LSTM输出的隐状态序列(1)和(2)进行拼接(3),得到完整的隐形状态序列(4),最后设置dropout后接入一个线性层,将(4)映射成(5),其中n是标注集的标签数,从而得到自动提取句子特征P。
(h1,h2,...,hk)∈Rk×m,(4)拼接后的完整的隐性状态序列;
P=(p1,p2,...,pk)∈Rk×n,(5)将隐状态向量从m维映射到k维,k是标注集的标签数,从而得到自动提取的句子特征,pi是将字xi分类到第k个标签的打分值;
模型第三层是CRF层,进行句子级的序列标注,记标签序列为y,模型对于句子X的标签Y的打分为:
其中,P是上面第(5)步的矩阵,A是一个(n+2)×(n+2)的矩阵,Aij表示的是从第ii个标签到第jj个标签的转移得分,进而在为一个位置进行标注的时候可以利用此前已经标注过的标签,之所以要加2是因为要为句子首部添加一个起始状态以及为句子尾部添加一个终止状态。y=(y1,y2,...,yk)表示一个长度等于句子长度的标签序列。
对抽取出来的实体进行歧义消除的方法,是基于在线知识库的词语消歧,主要的流程参见图7。通过在线知识库得到消歧词语所有表示的知识信息,通过语义分割、语义聚类、语义表示出词语表示的所有意思,然后从待消歧词语所在句子中得到消歧词语的上下文表示,与词语所有的语义表示通过语义相似度计算,得到最终匹配的消歧结果,即词语在句子中对应的语义。
步骤3、基金关系节点的设计,即类之间的关系设计。根据步骤2中设计的类,对类之间的关系进行设计,主要包括:
持股[:OWNS_STOCK|OWNED_BY];
雇佣[:HIRED_BY|HIRES];
发行产品[:HAS_PRODUCT|PRODUCED_BY];
管理[:MANAGES|MANAGED_BY];
发行[:ISSUES|ISSUED_BY];
控股[:HOLD|HOLD_BY];
步骤4、根据步骤2和步骤3,进行基金类关系的设计,主要是将关系节点映射到不同的类之间,主要的类关系参见图8。实体关系的抽取具体实现采用基于依存句法分析的模板的方式,具体的流程参见图9。首先指定一个抽取实体的规则库,通过依存句法分析得到一个句子的依存句法树,然后将依存句树与规则库中的规则进行匹配,得到符合要求的三元组,然后通过三元组通过规则扩展实体的关系,等到最后的评价结果。
步骤5、最后一步是对各个实体节点的属性值进行设计,主要包括共有属性、属性名称、属性值和属性代码。例如基金节点,可以设置的属性包括基金名称,基金代码,成立时间,基金类型等。
由上述内容可知,本申请还可以实现如下技术效果:
一,实现一种自顶向下的构造方法实现基金知识图谱;
二,结构化的数据只能提供部分基金信息,为了构建更加丰富的基金知识图谱,需要从大量的半结构化和非结构化数据中识别和抽取相关的基金信息,基金相关实体之间的关系抽取。该方法主要对自顶向下构造基金知识图谱的方法进行说明,其中对关键技术实体识别、实体消歧和关系抽取实现的具体方法进行说明。其中,自顶向下的构造流程主要包括顶层本体设计、类的定义、关系节点定义、类关系定义和节点属性的定义;实体识别的实现具体是基于BiLSTM(Bi-directional Long Short-Term Memory,双向长短时记忆神经网络)和CRF(Conditional Random Fields,条件随机场)实现的基于字的实体识别模型;实体消歧的实现具体是基于在线百科知识库的词语消歧方法;实体关系的抽取具体实现采用基于依存句法分析的模板的方式。本专利的实现构建和完善知识图谱的技术特性,是实现金融与技术的融合,基金知识图谱能为投资者带来更高效、更精准的相关服务。
从硬件层面来说,为了能够通过构建基金专业领域的知识图谱,从海量数据中准确提炼出基金相关知识,满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题,本申请提供一种用于实现所述基于知识图谱的基金查询方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现基于知识图谱的基金查询装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的基于知识图谱的基金查询方法的实施例,以及基于知识图谱的基金查询装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,基于知识图谱的基金查询方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
图10为本申请实施例的电子设备9600的系统构成的示意框图。如图10所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图10是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,基于知识图谱的基金查询方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤S101:接收用户发送的基金查询请求。
步骤S102:根据所述基金查询请求在预设基金知识图谱中进行基金匹配。
步骤S103:若匹配成功,则向所述用户发送对应的基金数据。
从上述描述可知,本申请实施例提供的电子设备,通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
在另一个实施方式中,基于知识图谱的基金查询装置可以与中央处理器9100分开配置,例如可以将基于知识图谱的基金查询装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现基于知识图谱的基金查询方法功能。
如图10所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图10中所示的所有部件;此外,电子设备9600还可以包括图10中没有示出的部件,可以参考现有技术。
如图10所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的基于知识图谱的基金查询方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的基于知识图谱的基金查询方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤S101:接收用户发送的基金查询请求。
步骤S102:根据所述基金查询请求在预设基金知识图谱中进行基金匹配。
步骤S103:若匹配成功,则向所述用户发送对应的基金数据。
从上述描述可知,本申请实施例提供的计算机可读存储介质,通过接收用户发送的基金查询请求;根据所述基金查询请求在预先构建的基金专业领域的基金知识图谱中进行基金匹配,从海量数据中准确提炼出相应的基金数据;并在匹配成功时,向用户发送对应的基金数据,以满足针对基金数据的高效、深度搜索,以及查询的实时性,解决数据多样化和数据孤岛问题。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于知识图谱的基金查询方法,其特征在于,所述方法包括:
接收用户发送的基金查询请求;
根据所述基金查询请求在预设基金知识图谱中进行基金匹配;
若匹配成功,则向所述用户发送对应的基金数据。
2.根据权利要求1所述的基于知识图谱的基金查询方法,其特征在于,所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配,包括:
根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
3.根据权利要求1所述的基于知识图谱的基金查询方法,其特征在于,在所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配之前,包括:
根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体;
根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
4.根据权利要求1所述的基于知识图谱的基金查询方法,其特征在于,在所述根据所述基金查询请求在预设基金知识图谱中进行基金匹配之前,包括:
根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
5.一种基于知识图谱的基金查询装置,其特征在于,包括:
查询请求接收模块,用于接收用户发送的基金查询请求;
知识图谱匹配模块,用于根据所述基金查询请求在预设基金知识图谱中进行基金匹配;
匹配结果发送模块,用于若匹配成功,则向所述用户发送对应的基金数据。
6.根据权利要求5所述的基于知识图谱的基金查询装置,其特征在于,所述知识图谱匹配模块包括:
基金数据查询单元,用于根据所述基金查询请求的查询条件包含的基金实体的种类,在预设基金数据库中提取与所述基金实体的种类对应的基金数据。
7.根据权利要求5所述的基于知识图谱的基金查询装置,其特征在于,还包括:
实体识别单元,用于根据预设实体识别模型对预设半结构化初始数据和预设非结构化初始数据进行基金实体识别,得到基金实体;
实体消歧单元,用于根据预设实体消歧模型和预设知识库对所述基金实体进行歧义消除,并将经过所述歧义消除后的基金实体设定为所述基金知识图谱中的基金实体。
8.根据权利要求5所述的基于知识图谱的基金查询装置,其特征在于,还包括:
基金类关系确定单元,用于根据预设依存句法分析模型对不同种类的基金实体之间的基金类关系进行关系抽取,并将收取后的基金类关系设定为所述基金知识图谱中的基金类关系。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一项所述的基于知识图谱的基金查询方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一项所述的基于知识图谱的基金查询方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356893.2A CN111159421A (zh) | 2019-12-25 | 2019-12-25 | 基于知识图谱的基金查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356893.2A CN111159421A (zh) | 2019-12-25 | 2019-12-25 | 基于知识图谱的基金查询方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159421A true CN111159421A (zh) | 2020-05-15 |
Family
ID=70558126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911356893.2A Pending CN111159421A (zh) | 2019-12-25 | 2019-12-25 | 基于知识图谱的基金查询方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159421A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886435A (zh) * | 2021-12-08 | 2022-01-04 | 国能大渡河大数据服务有限公司 | 一种基于循环神经网络的信息查询方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109377375A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 基金关系图谱生成方法、系统、计算机设备和存储介质 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110019560A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团上海有限公司 | 一种基于知识图谱的查询方法及装置 |
CN110362660A (zh) * | 2019-07-23 | 2019-10-22 | 重庆邮电大学 | 一种基于知识图谱的电子产品质量自动检测方法 |
-
2019
- 2019-12-25 CN CN201911356893.2A patent/CN111159421A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019560A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团上海有限公司 | 一种基于知识图谱的查询方法及装置 |
CN109377375A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 基金关系图谱生成方法、系统、计算机设备和存储介质 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110362660A (zh) * | 2019-07-23 | 2019-10-22 | 重庆邮电大学 | 一种基于知识图谱的电子产品质量自动检测方法 |
Non-Patent Citations (1)
Title |
---|
蔡圆媛: "大数据环境下基于知识整合的语义计算技术与应用", 北京理工大学出版社, pages: 154 - 155 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886435A (zh) * | 2021-12-08 | 2022-01-04 | 国能大渡河大数据服务有限公司 | 一种基于循环神经网络的信息查询方法及系统 |
CN113886435B (zh) * | 2021-12-08 | 2022-03-18 | 国能大渡河大数据服务有限公司 | 一种基于循环神经网络的信息查询方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107735804B (zh) | 用于不同标记集合的转移学习技术的系统和方法 | |
US9965465B2 (en) | Distributed server system for language understanding | |
CN112328761B (zh) | 一种意图标签设置方法、装置、计算机设备及存储介质 | |
CN107112009B (zh) | 用于生成混淆网络的方法、系统和计算机可读存储设备 | |
WO2023040493A1 (zh) | 事件检测 | |
US20220284171A1 (en) | Hierarchical structure learning with context attention from multi-turn natural language conversations | |
CN114357973A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
WO2024099457A1 (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN114357117A (zh) | 事务信息查询方法、装置、计算机设备及存储介质 | |
CN111798118B (zh) | 企业经营风险监控方法及装置 | |
CN113569017A (zh) | 一种模型处理方法、装置、电子设备及存储介质 | |
CN113850080A (zh) | 一种押韵词推荐方法、装置、设备及存储介质 | |
CN113011126A (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN112199954A (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
CN110795547A (zh) | 文本识别方法和相关产品 | |
CN117609612A (zh) | 资源推荐方法、装置、存储介质及电子设备 | |
CN110807097A (zh) | 分析数据的方法和装置 | |
CN111159421A (zh) | 基于知识图谱的基金查询方法及装置 | |
CN112712056A (zh) | 视频语义分析方法、装置、存储介质及电子设备 | |
CN113408292A (zh) | 语义识别方法、装置、电子设备及计算机可读存储介质 | |
CN116166858A (zh) | 基于人工智能的信息推荐方法、装置、设备及存储介质 | |
CN115496830A (zh) | 产品需求流程图的生成方法及装置 | |
CN114637831A (zh) | 基于语义分析的数据查询方法及其相关设备 | |
CN112632962B (zh) | 人机交互系统中实现自然语言理解方法和装置 | |
CN115062136A (zh) | 基于图神经网络的事件消歧方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220908 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |