CN113554118B - 量子金融票据分类方法、系统、存储介质和终端 - Google Patents

量子金融票据分类方法、系统、存储介质和终端 Download PDF

Info

Publication number
CN113554118B
CN113554118B CN202110961891.7A CN202110961891A CN113554118B CN 113554118 B CN113554118 B CN 113554118B CN 202110961891 A CN202110961891 A CN 202110961891A CN 113554118 B CN113554118 B CN 113554118B
Authority
CN
China
Prior art keywords
quantum
quantum gate
financial
path
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110961891.7A
Other languages
English (en)
Other versions
CN113554118A (zh
Inventor
李晓瑜
吴妍依
朱钦圣
胡勇
李清海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yuanjiang Technology Co ltd
Original Assignee
Sichuan Yuanjiang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yuanjiang Technology Co ltd filed Critical Sichuan Yuanjiang Technology Co ltd
Priority to CN202110961891.7A priority Critical patent/CN113554118B/zh
Publication of CN113554118A publication Critical patent/CN113554118A/zh
Application granted granted Critical
Publication of CN113554118B publication Critical patent/CN113554118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Technology Law (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种量子金融票据分类方法、系统、存储介质和终端,方法包括以下步骤:针对将待处理金融票据的表达信息,进行对应的预处理;将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;所述最优路径的生成包括以下子步骤:将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;建立对应数量的量子门块;根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;输出风险率最低的路径作为对应表达信息的最优路径。本发明建立了金融票据图像与量子电路的联系,通过合理的量子计算方法与图编码的合理应用,实现对金融票据分类的风险不断降低。

Description

量子金融票据分类方法、系统、存储介质和终端
技术领域
本发明涉及量子金融领域,尤其涉及量子金融票据分类方法、系统、存储介质和终端。
背景技术
近年来,金融事务不断增多,相应的金融票据形式及种类也在增多,比如:普通发票、电子发票、专用发票、银行发票。由于金融票据数量多、品种多,导致计算金融票据的相关人员工作量大、耗时长、工作效率低,也会影响到输入信息的准确性,加大预测分类的风险。所以采用计算机进行金融票据分类的行为不仅减轻了工作人员的工作任务,还促进了金融行业智能化与信息化。在现代社会,通过扫描或摄影的方式可以将金融票据数字化,从而产生金融票据图像。金融票的种类很多,如普通发票、银行票据、火车票、公共客运车票、飞机票、公司财务票据、旅游景点门票。这些都被称为“票据”,所以金融票据类型多种多样。同时收纳过程中的偶然因素,如人为破坏、环境影响会导致票据图像质量不同。
前人提出了很多方法去处理这项工作,包括基于过滤器学习网络的金融票据分类网络和全样本金融票据快速识别算法。这些方法都是在深度学习的基础上提出,可满足特定条件下金融工作中对精度的要求。而量子计算作为运算系统中的一种快速运算方法,近年来被广泛研究。对不同的机器学习任务,量子系统的加入不仅给算法带来了更快的运算速度,在实际应用领域也发挥着很大的作用。因此,采用量子的方式对金融票据进行分类预测的方式值得关注。
发明内容
本发明的目的在于克服现有技术的不足,提供量子金融票据分类方法、系统、存储介质和终端。
本发明的目的是通过以下技术方案来实现的:
本发明的第一方面,提供量子金融票据分类方法,包括以下步骤:
针对将待处理金融票据的表达信息,进行对应的预处理;
将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;
所述最优路径的生成包括以下子步骤:
将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
根据所述量子位k,建立对应数量的量子门块;
根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
如果没有一个路径的风险率小于fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;所述产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
输出风险率最低的路径作为对应表达信息的最优路径。
进一步地,所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
进一步地,所述量子门块包括具有长度为的矢量,其中:前/>个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转;
所述量子门块的总数量为:
进一步地,所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
本发明的第二方面,提供量子金融票据分类系统,包括输出分类模块和最优路径生成模块,所述输出分类模块包括:
预处理子模块:用于针对将待处理金融票据的表达信息,进行对应的预处理;
分类结果输出子模块:用于将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;
所述最优路径生成模块包括:
预处理与量子化子模块:用于将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
量子门块建立子模块:用于根据所述量子位k,建立对应数量的量子门块;
路径随机生成子模块:用于根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
判断分类结果获取子模块:用于将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
迭代子模块:如果没有一个路径的风险率小于fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;所述产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
最优路径输出子模块:用于输出风险率最低的路径作为对应表达信息的最优路径。
进一步地,所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
进一步地,所述量子门块包括具有长度为的矢量,其中:前/>个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转;
所述量子门块的总数量为:
进一步地,所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
本发明的第三方面,提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的量子金融票据分类方法的步骤。
本发明的第四方面,提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的量子金融票据分类方法的步骤。
本发明的有益效果是:
(1)在本发明的一示例性实施例中,建立了金融票据图像与量子电路的联系,通过合理的量子计算方法与图编码的合理应用,实现对金融票据分类的风险不断降低,并且分类过程不断加快的模拟,避免因人为破坏、环境影响导致的金融票据图像质量不同使得分类效果不好、风险高、效率低的问题。另外,在量子电路与路径之间采用一一映射的方式,不仅简化了寻找最优路径的流程,也减少了寻找合适门序列的问题。
(2)在本发明的几个示例性实施例中,分别公开了表达信息的具体实现方式(即也对应公开了最优路径的分类实现)以及其与量子位k的关系、量子门块的具体实现方式、马尔可夫式连接规则的具体实现方式。
并且系统、存储介质和终端也具有相同的优点。
附图说明
图1为本发明一示例性实施例公开的方法流程图;
图2为本发明一示例性实施例公开的量子门块结构示意图;
图3为本发明一示例性实施例公开的马尔可夫式连接规则示意图;
图4为本发明一示例性实施例公开的系统框图。
具体实施方式
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图所述的方向或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,属于“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。此外,属于“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
参见图1,图1示出了本发明一示例性实施例中提供的量子金融票据分类方法,包括以下步骤:
S101:针对将待处理金融票据的表达信息,进行对应的预处理;
S102:将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果。
该两个步骤(S101和S102)为分类步骤,根据表达信息的不同种类进行对应的预处理后并输入至对应的最优路径中,从而得到分类结果,得到金融票据的类型。在其中一示例性实施例中,金融票据可以分为普通发票、银行票据、火车票、公共客运车票、飞机票、公司财务票据、旅游景点门票等等。
所述最优路径的生成包括以下子步骤:
S201:将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
S202:根据所述量子位k,建立对应数量的量子门块;
S203:根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
S204:将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
S205:如果没有一个路径的风险率小于fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;所述产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
S206:输出风险率最低的路径作为对应表达信息的最优路径。
上述六个步骤(S201~S206)用于对S101~S102步骤中的最优路径进行生成,以量子门块的标签=10为例(这里的10对应的是量子门块的标签,即分别以1~10进行说明),对步骤S203~S206进行详细展开。具体地:
在步骤S203中的第一代路径,随机生成的量子门块连接的路径长度L=5,路径数量=5,则步骤S203中生成的路径和步骤S205中对应的风险率为可以为:“1-3-4-5-6,60%”、“2-3-4-5-7,40%”、“3-1-5-6-7,35%”、“4-3-5-8-9,60%”、“3-2-1-5-6,30%”。
由于最小的风险率30%未达到小于fc的要求且迭代次数也未超过给定数值h,因此进行下一次迭代,此时选择风险率最小的一条路径产生两条第二代路径(在其他示例性实施例中,选择最小的2-3条路径进行下一代产生):“3-2-1-5-6-4-7-8,50%”,“3-2-1-5-6-7-8-9,12%”。若fc的要求为15%,则“3-2-1-5-6-7-8-9”的路径符合要求,即可以作为最优路径进行输出;否则可以进一步产生第三代路径,直到满足上述要求。
也就是说,为保证迭代流程持续有效的进行,通过上述内容设置了终止参数,如果生成路径的风险率小于给定的阈值fc时,将终止迭代,输出最终路径,此路径即为风险率最低的路径;同样的,如果在迭代过程中迭代次数超过了给定的数值h,为保证资源不浪费,同样将终止迭代。而如果没有一个电路的风险率小于fc,我们将重复操作以生成下一代的路径和电路。
对于风险率的判断,采用的计算方式为n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;也就是说风险率指的是经过路径后的判断分类结果和已知分类结果的错误比(即不相同的比例)。同批次金融票据的数量可以是不同分类的金融票据。
另外,所述路径是由多个量子门块的连接方式构成的,因此它又是一条量子电路。
采用该示例性实施例的方法,建立了金融票据图像与量子电路的联系,通过合理的量子计算方法与图编码的合理应用,实现对金融票据分类的风险不断降低,并且分类过程不断加快的模拟(其中,首先初始路径与最优路径的风险率相比,最优路径的风险率更低一点,在算法实现过程中,对金融票据分类的风险率是在一步又一步的降低的。至于分类过程加快是针对经典分类方式来说的,量子计算是有并行性的,在经典计算机上,信息通过逻辑门进行处理,而在量子计算上,量子态是通过量子门的酉变换进行处理的。对于n位的量子计算模型,量子门相当于同时对2的n次方个数进行运算,所以在分类领域融入量子计算可以对该任务有加速效果),避免因人为破坏、环境影响导致的金融票据图像质量不同使得分类效果不好、风险高、效率低的问题。
另外,在量子电路与路径之间采用一一映射的方式,不仅简化了寻找最优路径的流程,也减少了寻找合适门序列的问题。
更优地,在一示例性实施例中,所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
在该示例性实施例中,公开了表达信息的具体实现方式(即也对应公开了最优路径的分类实现),并且公开了其与量子位k的关系。
具体地,在其中一示例性实施例中,对于图片信息,灰度图像有许多像素点,如果一张金融票据的灰度图像是512*64像素的图像,对灰度图像进行下采样缩小处理图像的尺寸,下采样到64*64=4096=2的12次方像素(即p=64,q=6);此时量子位k就是2q+1=13,其中1位用于表示存储位。而对于图像信息的量子化,属于本领域惯用技术手段,例如可以参考“基于量子门线路神经网络的肿瘤细胞图像识别研究”,可以将图像信息转化为量子序列|x1>,|x2>,|x3>...|xm×n>(即步骤S201中的X序列),通过路径后可以得到输出数据|y1>,|y2>,|y3>...|ym×n>(即步骤S204中的Y序列),该Y序列可以对应于一判断分类结果。
在又一示例性实施例中,所述数字信息的预处理和量子化包括:当金融票据上的数字较多,可以采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化(这里相当于单个字符的特征值),然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示存储位。其中,对于数字信息的量子化,属于本领域惯用技术手段。
在又一示例性实施例中,对于文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成32*32=1024=2的10次方的矩阵(即t=32,u=5),此时量子位k就是2u+1=11,其中1表示存储位。其中,对于文字信息的量子化,属于本领域惯用技术手段,例如可以参考“Text Detection and Recognition in Imagery:ASurvey”。
更优地,在一示例性实施例中,所述量子门块包括量子位旋转门R、量子位受控Rx门、和用于量子计算的通用门集所组成,假设量子位以一维几何结构排列,并且受控Rx门仅作用于相邻的量子位。
如图2所示,使用一个长度为的矢量来表示一个量子门块,其中:前个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转。例如图2所示的具体示例性实施例中,如果k=5,则前/>对受控Rx门进行编码,后k=5个对量子位旋转门R进行编码,其中一个量子门块可编码为120000345。受控Rx门是双量子位。
在没有其他限制的情况下,很容易获得可能的量子门块数量。这些门模块形成一个门模块库,可以使用有向图来表示该库。图的每个节点对应一个量子门块,每个有向边根据连接规则表示量子门块的合法连接:当且仅当量子门块y被允许指向下一个量子门块x时,才有一条从节点x指向y的边。为了方便起见,我们使用一个邻接矩阵来表示有向图。量子电路只是相应库中一系列门的序列,所以,设计性能良好的量子线路可以有效地在有向图中寻找到最佳路径。
对于量子门块的数量,由于设计的是k量子位的量子线路,对量子门块进行编码,可以将所有量子门模块分类为包含0个受控Rx门,1个受控Rx门,直到个Rx门。对于包含0个受控Rx门的量子门模块,k个量子位中的每一个都可以由单量子位旋转门R或标识门作用,总共相当于2个这种类型的量子门模块。同样,对于包含1个受控Rx门的量子门模块,其余的k-2量子比特可以通过旋转门R或与k-2可能性有关的标识门来作用。通过一些组合计算,可以获得1个受控Rx门的总数:
同理,对于包含i个受控Rx门(其中)的量子门模块,其余的k-2i个量子位都可以被门R或标识门所作用,得到:
因此,对应的会产生所述量子门块的总数量为:
不同量子门块之间通过连接规则进行连接,可获得一条路径,该路径与量子电路一一映射,路径的节点对应于基本的量子门块,有向边则代表两个量子门块之间允许连接。
更优地,在一示例性实施例中,所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
即在该示例性实施例中,判断两个量子门块是否能够连接起来,规定了一种马尔可夫式连接规则。
参见图3,图3的第一、三列表示了马尔可夫式连接规则中的(a)情况,图3中的第二、四列表示了马尔可夫式连接规则中的(b)情况。
与上述示例性实施例具有相同的发明构思,本发明的又一示例性实施例提供量子金融票据分类系统,如图4所示,包括输出分类模块和最优路径生成模块,所述输出分类模块包括:
预处理子模块:用于针对将待处理金融票据的表达信息,进行对应的预处理;
分类结果输出子模块:用于将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;
所述最优路径生成模块包括:
预处理与量子化子模块:用于将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
量子门块建立子模块:用于根据所述量子位k,建立对应数量的量子门块;
路径随机生成子模块:用于根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
判断分类结果获取子模块:用于将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
迭代子模块:如果没有一个路径的风险率小于fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;所述产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
最优路径输出子模块:用于输出风险率最低的路径作为对应表达信息的最优路径。
对应地,在一示例性实施例中,所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
对应地,在一示例性实施例中,所述量子门块包括具有长度为的矢量,其中:前/>个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转;
所述量子门块的总数量为:
对应地,在一示例性实施例中,所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
与上述示例性实施例具有相同的发明构思,本发明的一示例性实施例提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的量子金融票据分类方法的步骤。
与上述示例性实施例具有相同的发明构思,本发明的一示例性实施例提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的量子金融票据分类方法的步骤。
基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (6)

1.量子金融票据分类方法,其特征在于:包括以下步骤:
针对将待处理金融票据的表达信息,进行对应的预处理;
将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;
所述最优路径的生成包括以下子步骤:
将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
根据所述量子位k,建立对应数量的量子门块;
根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
如果没有一个路径的风险率小于给定阈值fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
输出风险率最低的路径作为对应表达信息的最优路径;
所述量子门块包括具有长度为的矢量,其中:前/>个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转;
所述量子门块的总数量为:
所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
2.根据权利要求1所述的量子金融票据分类方法,其特征在于:所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
3.量子金融票据分类系统,其特征在于:包括输出分类模块和最优路径生成模块,所述输出分类模块包括:
预处理子模块:用于针对将待处理金融票据的表达信息,进行对应的预处理;
分类结果输出子模块:用于将预处理后的金融票据量子化后输入至对应表达信息生成的最优路径中,输出分类结果;
所述最优路径生成模块包括:
预处理与量子化子模块:用于将相同表达信息的同批次多个金融票据进行预处理后进行量子化得到量子化序列X;所述预处理使得量子化序列的量子位k相同,所述同批次多个金融票据具有已知分类结果;
量子门块建立子模块:用于根据所述量子位k,建立对应数量的量子门块;
路径随机生成子模块:用于根据马尔可夫式连接规则,随机生成长度为L的若干条通过量子门块连接的路径;
判断分类结果获取子模块:用于将每个量子化序列X依次输入至各个路径,得到类别序列Y,从而得到判断分类结果;
迭代子模块:如果没有一个路径的风险率小于给定阈值fc或者迭代次数不超过给定数值h,选择风险率小的几条路径产生若干条下一代路径,直到第i代路径满足给定条件;所述风险率的计算为:n/m×100%,其中n表示对应单条路径中判断分类结果与已知分类结果不同的数量,m表示同批次金融票据的数量;产生下一代路径包括:选择风险率最小的预设数量条路径作为备用路径,根据马尔可夫式连接规则分别连接预设数量的剩下的量子门块,在连接到备用路径后进行给定条件判断;
最优路径输出子模块:用于输出风险率最低的路径作为对应表达信息的最优路径;
所述量子门块包括具有长度为的矢量,其中:前/>个数字在门控块中对受控Rx门进行编码,两个相邻的非零数字表示作用于用它们标记的这两个量子位的受控Rx门,并且两个相邻的0数字表示没有作用于其余量子位的受控Rx门;接下来的k个数字对门块中的单个量子位旋转门R门进行编码,使用0表示对应的量子位不存在旋转;
所述量子门块的总数量为:
所述马尔可夫式连接规则用于判断后一量子门块是否能与前一量子门块连接,具体为:(a)后一个量子门块不应包括任何可与前一个量子门块并行操作的门;(b)后一个量子门块不应在相同的量子位上包括与前一个量子门块相同的门。
4.根据权利要求3所述的量子金融票据分类系统,其特征在于:所述表达信息包括图片信息、数字信息和文本信息;
所述图片信息的预处理包括:将图片转换为灰度图,并对这张图像进行下采样缩小处理图像的尺寸,下采样到p*p像素,其中p是2的q次方;此时量子位k就是2q+1,其中1表示分类结果的存储位;
所述数字信息的预处理和量子化包括:采用分割字符的方法把连续的数字字符分割成单个字符,然后对单个字符的颜色信息和角度信息进行提取并进行量子化,然后将所有数字字符的特征值量子化后的量子态数据组合成一个r*r的矩阵,其中r是2的s次方;此时量子位k就是2s+1,其中1表示分类结果的存储位;
所述文本信息的预处理和量子化包括:用几何特征抽取法抽取文字的一些几何特征,包括文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜在内的各方向的线段、闭合环路,根据这些特征的位置和相互关系进行逻辑组合判断,并将这些特征量子化形成一个量子序列,将这些特征组合成t*t的矩阵,其中t是2的u次方;此时量子位k就是2u+1,其中1表示分类结果的存储位。
5.一种计算机可读存储介质,其上存储有计算机指令,其特征在于:所述计算机指令运行时执行权利要求1或2所述的量子金融票据分类方法的步骤。
6.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1或2所述的量子金融票据分类方法的步骤。
CN202110961891.7A 2021-08-20 2021-08-20 量子金融票据分类方法、系统、存储介质和终端 Active CN113554118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110961891.7A CN113554118B (zh) 2021-08-20 2021-08-20 量子金融票据分类方法、系统、存储介质和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110961891.7A CN113554118B (zh) 2021-08-20 2021-08-20 量子金融票据分类方法、系统、存储介质和终端

Publications (2)

Publication Number Publication Date
CN113554118A CN113554118A (zh) 2021-10-26
CN113554118B true CN113554118B (zh) 2024-02-09

Family

ID=78105861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110961891.7A Active CN113554118B (zh) 2021-08-20 2021-08-20 量子金融票据分类方法、系统、存储介质和终端

Country Status (1)

Country Link
CN (1) CN113554118B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740758A (zh) * 2019-01-09 2019-05-10 电子科技大学 一种基于量子计算的核方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10169445B2 (en) * 2008-11-07 2019-01-01 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for determining optimal parameters for dynamic quantum clustering analyses
US20170132699A1 (en) * 2015-11-10 2017-05-11 Astir Technologies, Inc. Markov decision process-based decision support tool for financial planning, budgeting, and forecasting
US11694103B2 (en) * 2018-09-19 2023-07-04 Microsoft Technology Licensing, Llc Quantum-walk-based algorithm for classical optimization problems
US11475345B2 (en) * 2018-12-06 2022-10-18 International Business Machines Corporation Controlled NOT gate parallelization in quantum computing simulation
EP3674999A1 (en) * 2018-12-27 2020-07-01 Bull SAS Method of classification of images among different classes
US11048839B2 (en) * 2019-03-29 2021-06-29 International Business Machines Corporation Adaptive error correction in quantum computing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740758A (zh) * 2019-01-09 2019-05-10 电子科技大学 一种基于量子计算的核方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Classical versus quantum models in machine learning: insights from a finance application;Javier Alcazar;Machine Learning: Science and Technology;第1卷(第3期);1-5节 *
量子马氏链与马氏决策过程的可达性分析;应圣钢;中国博士学位论文全文数据库基础科学辑(第7期);A002-43 *

Also Published As

Publication number Publication date
CN113554118A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN110738090B (zh) 使用神经网络进行端到端手写文本识别的系统和方法
US11256960B2 (en) Panoptic segmentation
CN107526785B (zh) 文本分类方法及装置
US20220382553A1 (en) Fine-grained image recognition method and apparatus using graph structure represented high-order relation discovery
CN112001498B (zh) 基于量子计算机的数据识别方法、装置及可读存储介质
CN112699937B (zh) 基于特征引导网络的图像分类与分割的装置、方法、设备及介质
Chacko et al. Handwritten character recognition using wavelet energy and extreme learning machine
Long et al. Building compact MQDF classifier for large character set recognition by subspace distribution sharing
Tuba et al. Handwritten digit recognition by support vector machine optimized by bat algorithm
CN111461127A (zh) 基于一阶段目标检测框架的实例分割方法
CN113658100A (zh) 三维目标物体检测方法、装置、电子设备及存储介质
CN111914085A (zh) 文本细粒度情感分类方法、系统、装置及存储介质
CN115937655A (zh) 多阶特征交互的目标检测模型及其构建方法、装置及应用
CN108021908B (zh) 人脸年龄段识别方法及装置、计算机装置及可读存储介质
CN114092742B (zh) 一种基于多角度的小样本图像分类装置和方法
CN107240185B (zh) 一种冠字号识别方法、装置、设备及存储介质
Zhan et al. DenseNet-CTC: An end-to-end RNN-free architecture for context-free string recognition
CN113283514B (zh) 一种基于深度学习的未知类别分类方法、装置及介质
Shayegan et al. A New Dataset Size Reduction Approach for PCA‐Based Classification in OCR Application
CN113688715A (zh) 面部表情识别方法及系统
Obaidullah et al. Comparison of different classifiers for script identification from handwritten document
CN113569048A (zh) 一种基于企业经营范围自动划分所属行业的方法及系统
CN113554118B (zh) 量子金融票据分类方法、系统、存储介质和终端
CN112070116A (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant