CN114840693B - 一种基于分布式图数据库的金融图像数据搜索方法及系统 - Google Patents

一种基于分布式图数据库的金融图像数据搜索方法及系统 Download PDF

Info

Publication number
CN114840693B
CN114840693B CN202210780504.4A CN202210780504A CN114840693B CN 114840693 B CN114840693 B CN 114840693B CN 202210780504 A CN202210780504 A CN 202210780504A CN 114840693 B CN114840693 B CN 114840693B
Authority
CN
China
Prior art keywords
graph
image data
financial
financial image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210780504.4A
Other languages
English (en)
Other versions
CN114840693A (zh
Inventor
孙勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tobo Software Co ltd
Original Assignee
Shenzhen Tobo Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tobo Software Co ltd filed Critical Shenzhen Tobo Software Co ltd
Priority to CN202210780504.4A priority Critical patent/CN114840693B/zh
Publication of CN114840693A publication Critical patent/CN114840693A/zh
Application granted granted Critical
Publication of CN114840693B publication Critical patent/CN114840693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于分布式图数据库的金融图像数据搜索方法,包括步骤:构建图数据库,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,构建表示图Q、图E;计算图Q与图E的相似度,根据相似度s(Q,E),选择显示最接近的K个历史金融图像数据。本发明的方法及系统显著了提高使用便捷性,在准确率方面大大增强,增强用户体验。

Description

一种基于分布式图数据库的金融图像数据搜索方法及系统
技术领域
本发明涉及图像数据处理领域,具体地涉及一种基于基于分布式图数据库的金融图像数据搜索方法及系统。
背景技术
随着图像处理技术以及股票金融债券市场的快速发展,金融图像数据处理相关技术迅猛发展,用图对复杂数据进行建模的应用渐渐兴起,图被广泛应用在生物领域、化学领域、社会科学领域,一般用无向图对结构化的数据建模成图数据,用图数据库管理及查询图数据,但是较少用于基于内容的图片检索和视频检索领域,尤其是对金融数据处理领域。
且在现有技术中,金融领域股票债券市场大部分的系统仅支持根据时间段、关键词进行金融信息的搜索,例如根据某个时间段的股票变化,选择时间段然后生成趋势图、K线图然后进行人工分析判断,或输入关键词,例如行业,股票名称、股票代码进行搜索对应股票的趋势图、K线图。但是随着各类智能系统的普及,人们不仅仅满足于这种单一功能的金融搜索系统,人们希望金融搜索系统能够实现更多智能化的搜索,提高用户体验。
例如,根据股票历史变化趋势预测未来变化趋势是非常重要的股票判断方法,但是目前只能选取某个时间段的人为观看,如果想找与最近一个月股票的变化趋势相似的历史上的股票变化趋势,根据历史上的变化趋势预测下一个月的股票走势,需要人工一个时间段一个时间段的筛选对比,导致智能化程度、准确度大大降低。
虽然存在股票趋势预测等应用,只是简单的数据处理或图像处理,智能化程度较低,预测不准确导致股票操作失误度大大增加,且对股票数据的加工不能够很好的呈现结果,且图像处理过程中没有对数据进行选择导致对所有数据处理导致数据传输速率较慢,且不能够实现与大量无效数据的筛选;且现有技术中还没有将图数据库应用在金融图像数据处理过程中,且搜索方式方式单一。如何能够让股票搜索预测更加智能化,人性化,提高其运行效率及准确度,增强用户实用性成为新的研究课题,但是现有股票分析效率较低;且主要是针对特定数据的单独的处理,因此,一种基于分布式图数据库的金融图像数据搜索方法及系统技术成为了改进搜索效果的迫切需求,从而改善用户的体验。
发明内容
为解决上述技术问题,本发明提供一种基于基于分布式图数据库的金融图像数据搜索方法及系统,本发明的种基于基于分布式图数据库的金融图像数据搜索方法及系统显著降低了人工分析股票进行图像对比的复杂度,提升了数据准确度以及传输效率,在准确率方面大大增强,增强用户体验;一种基于分布式图数据库的金融图像数据搜索方法,包括步骤:构建图数据库,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 944114DEST_PATH_IMAGE001
其中θ为调节值,根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
优选地,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。但不限于以上股票,正常情况下是数据库中所有的股票。
优选地,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
优选地,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
优选地,金融图像数据K线图的直方图为:
Figure 460546DEST_PATH_IMAGE002
l=1,2,…L-1
M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 35884DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 185237DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 504223DEST_PATH_IMAGE008
本发明还包括一种基于分布式图数据库的金融图像数据搜索系统,包括:构建图数据库模块,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入模块:用于输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
层次树构建模块:对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
频数统计模块:对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
相似度计算模块:计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 875161DEST_PATH_IMAGE001
其中θ为调节值;
显示模块;根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
优选地,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。但不限于以上股票,正常情况下是数据库中所有的股票。
优选地,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
优选地,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
优选地,金融图像数据K线图的直方图为:
Figure 401826DEST_PATH_IMAGE002
l=1,2,…L-1
M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure 225426DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 816944DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure 42389DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 490688DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure 270425DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 947525DEST_PATH_IMAGE008
与现有技术相比,本发明的技术方案具有以下有益效果:
本申请的一种基于分布式图数据库的金融图像数据搜索方法及系统,解决了传统技术中金融领域股票债券市场大部分的系统仅支持根据时间段、关键词进行金融信息的搜索,而不能输入趋势图或K线图进行搜索,导致智能化程度低,需人工判断较为繁琐、准确性大大降低,且现有的处理方式是简单的图像处理,本发明采用图数据库进行计算,即将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值;将图数据应用到图像处理上,能够实现与大量无效数据的筛选。本申请在计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度,通过θ调节值的设置,大大增加了股票预测调节灵活度,使得预测更加便利,大大提高了预测准确性;本发明通过将金融图像数据K线图的图像信息,例如直方图、偏移度、饱和度,充分利用了K线图的图像信息大大增强了相似图片的筛选准确的,解决了传统计算红大量计算资源在无效数据上。本发明的一种基于分布式图数据库的金融图像数据搜索方法及系统显著了提高使用便捷性,在准确率方面大大增强,增强用户体验。
附图说明
为了更清楚地说明本申请的技术方案,下面将对本申请的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种基于分布式图数据库的金融图像数据搜索系统图。
具体实施方式
本领域技术人员理解,如背景技术所言,虽然存在股票趋势预测等应用,只是简单的数据处理或图像处理,智能化程度较低,预测不准确导致股票操作失误度大大增加,且对股票数据的加工不能够很好的呈现结果,且图像处理过程中没有对数据进行选择导致对所有数据处理导致数据传输速率较慢,且不能够实现与大量无效数据的筛选;且现有技术中还没有将图数据库应用在金融图像数据处理过程中,且搜索方式方式单一。如何能够让股票搜索预测更加智能化,人性化,提高其运行效率及准确度,增强用户实用性成为新的研究课题,但是现有股票分析效率较低;且主要是针对特定数据的单独的处理。为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
实施例1:
图1示出了本申请的一种基于分布式图数据库的金融图像数据搜索系统图,在一些实施例中,一种基于分布式图数据库的金融图像数据搜索方法,包括步骤:构建图数据库,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 293056DEST_PATH_IMAGE001
其中θ为调节值,根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
在一些实施例中,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。但不限于以上股票,正常情况下是数据库中所有的股票。
在一些实施例中,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
在一些实施例中,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
在一些实施例中,金融图像数据K线图的直方图为:
Figure 912256DEST_PATH_IMAGE002
l=1,2,…L-1
M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure 710448DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 689774DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure 827494DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 883175DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure 168663DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 436833DEST_PATH_IMAGE008
实施例2:
本发明还包括一种基于分布式图数据库的金融图像数据搜索系统,包括:构建图数据库模块,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入模块:用于输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
层次树构建模块:对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
频数统计模块:对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
相似度计算模块:计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 694639DEST_PATH_IMAGE001
其中θ为调节值;
显示模块;根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
在一些实施例中,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份,但不限于以上股票,正常情况下是数据库中所有的股票。
在一些实施例中,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
在一些实施例中,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
在一些实施例中,金融图像数据K线图的直方图为:
Figure 406374DEST_PATH_IMAGE002
l=1,2,…L-1
M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure 179158DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 251019DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure 628911DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 495236DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure 276022DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 885995DEST_PATH_IMAGE008
本申请的一种基于分布式图数据库的金融图像数据搜索方法及系统,解决了传统技术中金融领域股票债券市场大部分的系统仅支持根据时间段、关键词进行金融信息的搜索,而不能输入趋势图或K线图进行搜索,导致智能化程度低,需人工判断较为繁琐、准确性大大降低,且现有的处理方式是简单的图像处理,本发明采用图数据库进行计算,即将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值;将图数据应用到图像处理上,能够实现与大量无效数据的筛选。本申请在计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度,通过θ调节值的设置,大大增加了股票预测调节灵活度,使得预测更加便利,大大提高了预测准确性;本发明通过将金融图像数据K线图的图像信息,例如直方图、偏移度、饱和度,充分利用了K线图的图像信息大大增强了相似图片的筛选准确的,解决了传统计算红大量计算资源在无效数据上。本发明的一种基于分布式图数据库的金融图像数据搜索方法及系统显著了提高使用便捷性,在准确率方面大大增强,增强用户体验。
本领域技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品,因此本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (10)

1.一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,包括步骤:构建图数据库,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 699533DEST_PATH_IMAGE001
其中θ为调节值,根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
2.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。
3.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
4.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
5.根据权利要求4所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,金融图像数据K线图的直方图为:
Figure 343003DEST_PATH_IMAGE002
l=1,2,…L-1
M为像 素总数,N(l)为灰度值为l 的像素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure 412591DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 875933DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure 941365DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 173764DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure 945411DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 630470DEST_PATH_IMAGE008
6.一种基于分布式图数据库的金融图像数据搜索系统,其特征在于,包括:构建图数据库模块,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;
输入模块:用于输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;
层次树构建模块:对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;
频数统计模块:对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;
相似度计算模块:计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:
Figure 512975DEST_PATH_IMAGE009
其中θ为调节值;
显示模块;根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
7.根据权利要求6所述的一种基于分布式图数据库的金融图像数据搜索系统,其特征在于,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。
8.根据权利要求6所述的一种基于分布式图数据库的金融图像数据搜索系统,其特征在于,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
9.根据权利要求6所述的一种基于分布式图数据库的金融图像数据搜索系统,其特征在于,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
10.根据权利要求6所述的一种基于分布式图数据库的金融图像数据搜索系统,其特征在于,金融图像数据K线图的直方图为:
Figure 599880DEST_PATH_IMAGE002
l=1,2,…L-1
M为像 素总数,N(l)为灰度值为l 的像素数,l=1,2,…L-1 为图像的灰度;
金融图像数据K线图的像素均值:
Figure 276849DEST_PATH_IMAGE003
金融图像数据K线图的像素方差:
Figure 449204DEST_PATH_IMAGE004
金融图像数据K线图的像素偏移度:
Figure 869821DEST_PATH_IMAGE005
金融图像数据K线图的像素直度:
Figure 76812DEST_PATH_IMAGE006
金融图像数据K线图的像素饱和度:
Figure 924682DEST_PATH_IMAGE007
金融图像数据K线图的log值:
Figure 849913DEST_PATH_IMAGE008
CN202210780504.4A 2022-07-05 2022-07-05 一种基于分布式图数据库的金融图像数据搜索方法及系统 Active CN114840693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210780504.4A CN114840693B (zh) 2022-07-05 2022-07-05 一种基于分布式图数据库的金融图像数据搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210780504.4A CN114840693B (zh) 2022-07-05 2022-07-05 一种基于分布式图数据库的金融图像数据搜索方法及系统

Publications (2)

Publication Number Publication Date
CN114840693A CN114840693A (zh) 2022-08-02
CN114840693B true CN114840693B (zh) 2022-09-16

Family

ID=82573315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210780504.4A Active CN114840693B (zh) 2022-07-05 2022-07-05 一种基于分布式图数据库的金融图像数据搜索方法及系统

Country Status (1)

Country Link
CN (1) CN114840693B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572886A (zh) * 2014-12-23 2015-04-29 浙江大学 基于k线图表示的金融时间序列相似性查询方法
JP2017097698A (ja) * 2015-11-26 2017-06-01 富士通株式会社 グラフ処理プログラム、グラフ処理方法、および情報処理装置
CN114201598A (zh) * 2022-02-18 2022-03-18 药渡经纬信息科技(北京)有限公司 文本推荐方法及文本推荐装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930247B1 (en) * 2007-01-31 2015-01-06 Financialsharp, Inc. System and methods for content-based financial decision making support
US10642891B2 (en) * 2013-04-12 2020-05-05 Avigilon Fortress Corporation Graph matching by sub-graph grouping and indexing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572886A (zh) * 2014-12-23 2015-04-29 浙江大学 基于k线图表示的金融时间序列相似性查询方法
JP2017097698A (ja) * 2015-11-26 2017-06-01 富士通株式会社 グラフ処理プログラム、グラフ処理方法、および情報処理装置
CN114201598A (zh) * 2022-02-18 2022-03-18 药渡经纬信息科技(北京)有限公司 文本推荐方法及文本推荐装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Efficient Probabilistic Approach for Graph Similarity Search;Zijian Li et al;《2018 IEEE 34th International Conference on Data Engineering》;20181025;第533-544页 *
图数据库中的相似性搜索问题研究;李昱杭;《中国优秀硕士学位论文全文数据库 基础科学辑》;20210915;第A002-86页 *

Also Published As

Publication number Publication date
CN114840693A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
US20240045898A1 (en) Search result display method, apparatus and device, and medium
JPH09179883A (ja) データ間結合ルール導出方法及び装置
WO2022126961A1 (zh) 针对数据偏移的目标对象行为预测方法及其相关设备
US20100042644A1 (en) Tree-structured data display
CN110110198A (zh) 一种网页信息抽取方法及装置
US20140325405A1 (en) Auto-completion of partial line pattern
Nusrat et al. Visualizing cartograms: Goals and task taxonomy
CN114840693B (zh) 一种基于分布式图数据库的金融图像数据搜索方法及系统
CN111275683B (zh) 图像质量评分处理方法、系统、设备及介质
CN110874366A (zh) 数据处理、查询方法和装置
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
MUMINOV et al. Fvs-Technology: Intellectual Search Tools
CN112100177A (zh) 数据存储方法、装置、计算机设备及存储介质
CN111125158A (zh) 数据表处理方法、装置、介质及电子设备
CN113407537B (zh) 数据处理方法、装置及电子设备
CN115563342A (zh) 一种视频主题检索的方法、系统、设备及存储介质
CN114254014A (zh) 一种业务数据的展示方法、装置、设备及存储介质
CN114092819A (zh) 一种图像分类方法及装置
CN113886615A (zh) 一种基于多粒度联想学习的手绘图像实时检索方法
CN112036501A (zh) 基于卷积神经网络的图片的相似度检测方法及其相关设备
CN110659419A (zh) 确定目标用户的方法及相关装置
JP2001175735A (ja) 時系列予測装置及びシステム及び方法及び記憶媒体
KR102635894B1 (ko) 스마트 발전 연료 가격 예측 시스템 및 방법
JP2005122683A (ja) 情報提供方法及びシステム及び情報提供プログラム
CN116775989A (zh) 一种基于时效性辅助任务驱动的个性化论文推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant