CN114120336B - 手写数字识别方法、系统、设备及计算机可读存储介质 - Google Patents
手写数字识别方法、系统、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN114120336B CN114120336B CN202010862683.7A CN202010862683A CN114120336B CN 114120336 B CN114120336 B CN 114120336B CN 202010862683 A CN202010862683 A CN 202010862683A CN 114120336 B CN114120336 B CN 114120336B
- Authority
- CN
- China
- Prior art keywords
- quantum
- sub
- parameter
- value
- logic gate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了手写数字识别方法、系统、设备及计算机可读存储介质,属于量子计算技术领域。手写数字识别方法包括:获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。本发明通过将预设的量子线路与神经网络结合能够实现对包含手写数字的图片进行数字读取。
Description
技术领域
本发明属于量子计算技术领域,特别是一种手写数字的识别方法,尤其涉及一种对包含手写数字的图片进行识别的方法。
背景技术
近年来随着计算机技术和数字图像处理技术的飞速发展,手写数字识别技术在大规模数据统计、邮件分拣、财务、税务和金融等领域中都有着较为深远的应用需求。
目前,通过将带有手写数字的图片输入训练好的数字识别模型能够实现数据的自动录入,例如输入一个28×28像素的图片,识别输出一个标签值M′代表该图片上是什么数字,这能够极大地降低人工劳动成本。
但量子计算的技术如何应用于手写数字识别领域亟需探索解决。
发明内容
本发明的目的是提供一种手写数字识别方法,以解决上述的问题,它利用预设量子线路和神经网络结合能够实现对包含手写数字的图片的识别,它包括:
获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;
利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述预设量子线路计算的子量子态ψi及对应的概率Ci;
根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
如上所述的手写数字识别方法,较优选的,所述特征信息为特征矩阵,所述获得包含手写数字的目标图片的特征信息,包括:
接收包含手写数字的目标图片,对所述目标图片进行二值化处理,获得对应的二值图片;
对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵。
如上所述的手写数字识别方法,较优选的,所述对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵的步骤,包括:
对所述二值图片中的各像素进行矩阵化处理,获得像素矩阵;
对所述像素矩阵进行特征提取,获得对应的特征矩阵。
如上所述的手写数字识别方法,较优选的,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
确定与ψi相对应的十进制数xi,
计算出∑xiCi作为所述目标图片的识别结果。
如上所述的手写数字识别方法,较优选的,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
根据所述子量子态ψi及对应的概率Ci,确定最大概率所对应的子量子态为第一子量子态;
确定与所述第一子量子态相对应的十进制数作为所述目标图片的识别结果。
如上所述的手写数字识别方法,较优选的,所述设定步骤包括:
获取训练集中各样本图片对应的特征信息和标签值M,其中M=0、1、…、9;
初始化所述预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定与各所述标签值M相对应的量子逻辑门的参量值;
根据各所述样本图片对应的特征信息以及与各所述标签值M相对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数并存储到所述神经网络获得训练完成的神经网络。
如上所述的手写数字识别方法,较优选的,所述初始化所述预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定与各所述标签值M相对应的量子逻辑门的参量的值,具体包括:
针对所述训练集中的每一标签值M,初始化一组随机值作为当前参量值θ;
根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ;
分别利用所述当前参量值θ、正偏移θ+δ、负偏移θ-δ更新所述预设量子线路中量子逻辑门的参量,获得对应的子量子态及对应的概率;
根据所述子量子态及对应的概率,计算得到与所述当前参量值θ、正偏移θ+δ、负偏移θ-δ对应的十进制数N、N+、N-;
确定梯度grad为(N+-N-)(N-M);
利用θ=(θ-grad)迭代所述当前参量的值θ,并返回所述根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ的步骤,直至迭代次数达到设定值;
确定与各所述标签值M相对应的量子逻辑门的参量值。
如上所述的手写数字识别方法,较优选的,所述根据各所述样本图片对应的特征信息以及与各所述标签值M相对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数,具体包括:
针对所述训练集中的每一样本图片对应的特征信息,初始化一组随机值作为所述神经网络的权重参数W和偏置参数B;
利用所述神经网络对样本图片的特征信息进行处理以获得量子逻辑门的参量的计算值;
根据所述参量的计算值和与所述标签值M相对应的量子逻辑门的参量的值构建误差函数;
根据所述误差函数,采用基于梯度下降的反向传播算法迭代调整所述神经网络的权重参数W和偏置参数B,返回所述利用所述神经网络对样本图片的特征信息进行处理以获得量子逻辑门的参量的计算值的步骤,直至迭代次数达到设定值。
如上所述的手写数字识别方法,较优选的,所述预设量子线路包含至少4个量子比特,且各所述量子比特上均作用有含参量子逻辑门。
本申请的另一个实施例提供了一种手写数字识别系统,包括:
神经网络模块,用于获得目标图片的特征信息,并利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;
量子线路模块,用于利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;
识别结果计算模块,用于根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
本申请的还有一个实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行所述的方法。
本申请的另外还有一个实施例提供了一种手写数字识别设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述的方法。
与现有技术中传统的手写数字识别技术方案相比,本发明利用预设量子线路和神经网络结合识别包含手写数字的图片以实现量子计算在手写数字图片识别方面的应用,首先,通过获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;然后,利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;最后,根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
附图说明
图1为本发明实施例提供一种手写数字识别方法的流程示意图;
图2为本发明实施例提供一种预设量子线路的示意图;
图3为本发明实施例提供一种手写数字识别方法中神经网络的训练方法流程图;
图4为本发明实施例提供一种手写数字识别系统的结构示意图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明实施例首先提供了一种手写数字识别方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等,形成手写数字识别设备。即在实施例中,一种手写数字识别设备可以为计算机设备,计算机设备上装载有进行手写数字识别的软件。手写数字识别设备包括交互模块、至少一个处理器和存储器。可选地,上述计算机终端还可以包括用于通信功能的传输装置,本领域普通技术人员可以理解,计算机终端还可包括比上述所列更多或者更少的组件,或者具有与上述所列不同的配置。
其中,交互模块可以包括设备的输入/输出装置,例如显示屏、鼠标、键盘、触摸屏等,交互模块用于接收输入指令以及提供配置界面,例如,用户触发计算机设备上的手写数字识别的软件图标,显示屏可以提供手写数字识别的功能界面,用户可以通过键盘或鼠标或触摸屏在功能界面输入配置指令,以进行手写数字的识别。
存储器与至少一个处理器通信连接,存储器存储有可被至少一个存储器执行的指令,指令被至少一个处理器执行时,使至少一个处理器执行手写数字的识别方法。存储器为计算机可读存储介质,可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端被计算机读取。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
下面参照附图描述根据本发明实施例的手写数字识别方法。
本发明的实施例提供了一种手写数字的识别方法,参见图1,所述方法包括步骤S100至S300,其中:
S100、获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值。
在本发明实施例中,所述特征信息为特征矩阵,在步骤S100中所述获得包含手写数字的目标图片的特征信息,包括:
S101、接收包含手写数字的目标图片,对所述目标图片进行二值化处理,获得对应的二值图片;
S102、对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵。
在本实施中,包含手写数字的目标图片的获取可通过由识别装置与手写输入装置电连接直接获取,例如,由触摸板、触摸屏或手写板等感触设备接收用户触碰感触设备获得的数字笔画,并由感触设备将数字笔画转换为bmp或jpg等格式的目标图片;或者,由扫描仪或摄像头等设备将用户写在纸上或其他可视界面上的数字笔画转换为bmp或jpg等格式的目标图片。其中,在接收目标图片之后,还可对目标图片中的手写数字进行分割处理,以使每一目标图片中仅包括唯一待识别手写数字。
随后,手写数字的识别装置在接收该目标图片之后,对该目标图片进行二值化处理,以获得呈现黑白效果的二值图片。在二值处理的过程中,二值处理的灰度阈值可由本领域技术人员自行设定,可知的是,该灰度阈值可用于确定目标图片中每一个像素在二值图片中的像素值。经过上述的二值处理,目标图片被处理为宽度为U个像素、高度为V个像素的二值图片;其中,所述U为正整数,所述V正整数;其中的U与V可相等,也可不相等,本实施例对此不进行限制。
在本发明的一些实施例中,步骤S102、所述对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵的步骤,具体包括:首先,对所述二值图片中的各像素进行矩阵化处理,获得像素矩阵;然后,对所述像素矩阵进行特征提取,获得对应的特征矩阵。具体来说,二值图片的宽度为M个像素、高度为N个像素,先根据该二值图片中的各像素,获得M×N的矩阵,该矩阵中的各矩阵元素的位置与二值图片的各像素的位置相对应。之后,进一步对该像素矩阵进行处理,即根据预设的元素数量阈值和该像素矩阵中的各元素的元素值对该像素矩阵进行特征提取,以获得像素矩阵的一维特征矩阵。一般来说,在二值图片中,仅有若干像素点的灰度值不为0,这些不为0的灰度值可理解为手写数字的笔画所在位置或笔画轨迹,因此,当利用像素矩阵的方式表示二值图片时,可进一步对该像素矩阵进行简化处理,在像素矩阵的各元素中选取元素值不为0的元素,并获得这些元素的行列值,并将这些行列值以一维数组的形式进行展现,以表示像素矩阵的特征矩阵,其中,由于各像素矩阵对应的一维特征矩阵的元素数量的差异,在该实施方式中,可对其元素数量阈值进行设置,以使经设定步骤预先训练完成的神经网络对其进行识别,该神经网络处理后输出结果即为量子逻辑门的参量值,示例性的,经设定步骤预先训练完成的神经网络的输出结果包含4个含参量子逻辑门的参量值,则所述特征矩阵经过该神经网络识别处理后输出结果可表示为一维向量[a0,a1,a2,a3]T,其中,ak(0≤k≤3)即分别为其中一个含参量子逻辑门的参量值。
S200、利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述预设量子线路计算的子量子态ψi及对应的概率Ci。
在本发明的实施例中,所述预设量子线路包含至少4个量子比特,且各所述量子比特上均作用有含参量子逻辑门,在执行量子线路时,含参量子逻辑门的参量根据步骤S100中获得的参量值更新。
示例性的,参见图2所示,预设量子线路包括q0、q1、q2、q3共4个量子比特,且每个量子比特上均依次的作用有H门以及RY门,其中,RY门的矩阵形式包含一个参量,称之为含参量子逻辑门。预设量子线路中量子比特q3q2q1q0的初始态为|0000>,经H门作用后的各子量子态的概率均等,然后经RY门作用旋转,各子量子态的概率发生改变,预设量子线路按这种方式构建,便于快速运算、旋转至任一子量子态。除RY门之外,含参量子逻辑门还可以采用RX、RZ、U门。在本发明一些实施例中,预设量子线路中各量子比特上也可以直接作用含参量子逻辑门,或者是采用X、Y、Z门替代上述示例中的H门。关于以上量子逻辑门的具体形式参见如下表1介绍。
示例性的,结合图2所示,记q0、q1、q2、q3上作用的RY门的参量分别为θq0、θq1、θq2、θq3,经步骤S100处理后,获得[a0,a1,a2,a3]T,在本步骤中利用a0、a1、a2、a3分别更新θq0、θq1、θq2、θq3的值,执行所述预设量子线路即可获得计算的子量子态ψi及对应的概率Ci,在此需要说明的是,子量子态ψi所对应的概率Ci为子量子态ψi所对应的振幅ci的平方,即Ci=ci 2。
本领域技术人员应该了解,量子比特是量子计算中基本的信息单位,n个量子比特对应有2n个子量子态,q0、q1、…、qn-1是指比特位从0至n-1的量子比特。另外需要说明的是,子量子态的表示对应qn-1qn-2……q0的排布规则,且从右至左对应的比特位由低位到高位。
举例而言:
1个量子比特所处的逻辑状态为2个子量子态ψ0和ψ1的叠加态,ψ0和ψ1分别为|0>和|1>,该1个量子比特所处的任一逻辑状态可以表示为:
ψ=a|0>+b|1>
其中,a、b分别为|0>、|1>的振幅,a、b均为复数形式。
ψ对应的矩阵表示为:
测量后,该1个量子比特所处的逻辑状态塌缩至一个固定的子量子态|0>或|1>,其中,塌缩至|0>的概率是a2,塌缩至|1>的概率是b2,a2+b2=1。
4个量子比特所处的逻辑状态为24(即16)子个量子态的叠加态,其中,这16个子量子态ψ0至ψ15分别为|0000>、|0001>、|0010>、|0011>、|0100>、|0101>、|0110>和|0111>、|1000>、|1001>、|1010>、|1011>、|1100>、|1101>、|1110>和|1111>,此时,该4个量子比特所处的任一逻辑状态ψ可以表示为:
ψ=c0|0000>+c1|0001>+c2|0010>+c3|0011>+c4|0100>+c5|0101>+c6|0110>+c7|0111>+c8|1000>+c9|1001>+c10|1010>+c11|1011>+c12|1100>+c13|1101>+c14|1110>+c15|1111>
且ψ对应的矩阵表示为:
其中,16个子量子态中的每个子量子态(或称量子态分量)对应的振幅为c0至c15这些复数中的一个,c0至c15的下标值为该振幅所属量子态的二进制对应的十进制值,我们把c0至c15这些复数中的每一个称作一个振幅。测量后,坍缩至子量子态ψ0至ψ15的概率分别为对应振幅的平方,即坍缩至子量子态ψi的概率Ci=ci 2,i=0、1、2、……、15。
量子计算的过程,是不同的量子逻辑门按次序操作对应量子比特的过程,其中,我们把这些按次序组合起来以作用在对应量子比特上的量子逻辑门序列称为量子线路。通常用酉矩阵表示量子逻辑门,则量子线路执行计算时,即是不同的量子逻辑门对应的酉矩阵对初始的量子态按次序进行左乘的过程。
部分常用的量子逻辑门及其对应的矩阵表示如下表,H代表阿达马Hadamard门,X代表泡利-X门(其对应的矩阵为泡利矩阵σx),Y代表泡利-Y门(其对应的矩阵为泡利矩阵σy),Z代表泡利-Z门(其对应的矩阵为泡利矩阵σz),RX代表任意旋转泡利-X门,RY代表任意旋转泡利-Y门,RZ代表任意旋转泡利-Z门,关于量子逻辑门的其他知识在此不再赘述。
表1部分常用的量子逻辑门
S300、根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
在本发明的一些实施例中,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
S301、确定与ψi相对应的十进制数xi,其中:
ψ0=|0000>,与ψ0相对应的十进制数x0=0;ψ1=|0001>,与ψ1相对应的十进制数x1=1;ψ2=|0010>,与ψ2相对应的十进制数x2=2;ψ3=|0011>,与ψ3相对应的十进制数x3=3;ψ4=|0100>,与ψ4相对应的十进制数x4=4;ψ5=|0101>,与ψ5相对应的十进制数x5=5;ψ6=|0110>,与ψ6相对应的十进制数x6=6;ψ7=|0111>,与ψ7相对应的十进制数x7=7;ψ8=|1000>,与ψ8相对应的十进制数x8=8;ψ9=|1001>,与ψ9相对应的十进制数x9=9;ψ10=|1010>,与ψ10相对应的十进制数x10=10;ψ11=|1011>,与ψ11相对应的十进制数x11=11;ψ12=|1100>,与ψ12相对应的十进制数x12=12;ψ13=|1101>,与ψ13相对应的十进制数x13=13;ψ14=|1110>,与ψ14相对应的十进制数x14=14;ψ15=|1111>,与ψ15相对应的十进制数x15=15。
S302、利用∑xiCi计算出的十进制值即作为所述目标图片的识别结果。
在本发明的另一些实施例中,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
S301′、根据所述子量子态ψi及对应的概率Ci,确定最大概率所对应的子量子态为第一子量子态,对于前述包含q0、q1、q2、q3的量子线路示例中,即先确定C0、C1、…、C15中的最大值Cmax,然后确定该最大值Cmax所对应的子量子态为第一量子态;
S302′、确定与所述第一子量子态相对应的十进制数作为所述目标图片的识别结果,通俗的说,即先筛选出所述子量子态ψi中哪一个子量子态所对应的概率最大,再确定与这个子量子态相对应的十进制数作为所述目标图片的识别结果。根据子量子态确定相对应的十进制数作的过程,同前述介绍,在此不再赘述。
由此可见,本发明实施例利用预设量子线路和神经网络结合识别包含手写数字的图片以实现量子计算在手写数字图片识别方面的应用,具体的,本发明实施例中,首先通过获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;然后,利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;最后,根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果,从而完成对包含手写数字的图片的识别。
图3为本发明实施例提供的手写数字识别方法中神经网络的训练方法流程图。
参见图3所示,在步骤S100中所述设定步骤,具体包括步骤S601至步骤S603,其中:
S601、获取训练集中各包含手写数字的样本图片对应的特征信息和所述手写数字对应的标签值M,其中M=0、1、…、9;本步骤中,所述特征信息为特征矩阵,获得训练集中各样本图片对应的特征矩阵的方式可以参照前述,所述训练集中有多个样本图片,每个样本图片都有一个特征矩阵和一个标签值,其中,所述标签值与样本图片上的手写数字相对应。
S602、初始化所述预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定各所述标签值M对应的量子逻辑门的参量值;
即,本步骤S602利用训练集中各样本图片的标签值,通过反向传播算法确定预设量子线路中与各样本图片的标签值相对应的量子逻辑门的参量值,作为本步骤S602的一种具体实施方式如下:
针对所述训练集中的每一标签值M,初始化一组随机值作为所述预设量子线路中量子逻辑门的当前参量值θ,本步骤可以记迭代次数λ=0;
根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ;
分别利用所述当前参量值θ、正偏移θ+δ、负偏移θ-δ更新所述预设量子线路中量子逻辑门的参量,获得对应的子量子态及对应的概率,为了便于区分,在此可将所述当前参量值θ更新所述预设量子线路中量子逻辑门的参量所获得对应的子量子态记为ψθ,i,对应的概率记为Cθ,i;将所述正偏移θ+δ更新所述预设量子线路中量子逻辑门的参量所获得对应的子量子态记为ψθ+δ,i,对应的概率记为Cθ+δ,i;将所述负偏移θ-δ更新所述预设量子线路中量子逻辑门的参量所获得对应的子量子态记为ψθ-δ,i,对应的概率记为Cθ-δ,i;其中,i为整数,且0≤i≤2n-1,n为量子比特的数量。
根据所述子量子态及对应的概率,计算得到与所述当前参量值θ、正偏移θ+δ、负偏移θ-δ对应的十进制数N、N+、N-;
确定梯度grad为(N+-N-)(N-M);
利用θ=(θ-grad)迭代所述当前参量的值θ,更新迭代次数λ=λ+1,并返回所述根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ的步骤,直至迭代次数λ达到设定值;
确定与各所述标签值M相对应的量子逻辑门的参量值,也即通过确定训练集中每一标签值M对应的当前参量值θ,确定与训练集中各所述标签值M对应的量子逻辑门的参量值。
基于上述的一种具体实施步骤,即可确定训练集中各样本图片的标签值M所对应的量子逻辑门的参量值,基于训练集中各样本图片的特征矩阵、以及各样本图片的标签值M所对应的量子逻辑门的参量值,再进行下述步骤S603。
S603、根据各所述样本图片对应的特征矩阵以及各所述标签值M对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数,并存储到所述神经网络,即获得经预先设定步骤训练完成的神经网络。
即,本步骤S603利用所获得的各样本图片对应的特征矩阵,以及经过预设量子线路确定的与各样本图片的标签值相对应的量子逻辑门的参量值作为输入神经网络的训练样本,通过训练样本训练神经网络以确定神经网络中的权重参数W和偏置参数B,需要说明的是,本步骤中的神经网络可以是BP神经网络,抑或是卷积神经网络,对于训练过程中所涉及的其他参数,例如学习率、迭代次数等本领域技术人员可根据具体应用情况预设,在此不赘述。在本发明的一些实施例中,本步骤中的神经网络可以是仅包含输入层、隐含层的网络模型,输入层根据所述目标图片的特征信息进行计算处理并将计算处理结果传输给隐含层,隐含层对输入层传输的计算处理结果计算处理获得量子逻辑门的参量值,其中,输入层、隐含层之间的权重参数和偏置参数参照前述步骤确定,经隐含层输出获得的向量[a0,a1,a2,a3]T用于更新θq0、θq1、θq2、θq3,预设量子线路计算即可获得子量子态及对应的概率,进而确定识别结果,相对于传统的手写数字识别神经网络模型中设置单独的输出层连接隐含层,对隐含层传输的计算处理结果进一步计算处理并输出识别结果的方式,本发明实施例利用量子线路确定识别结果予以替代,充分借助了量子计算的优势,具有运算效率高的特点。
作步骤S603中所述根据各所述样本图片对应的特征矩阵以及各所述标签值M对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数的一种具体实施方式如下:
针对所述训练集中的每一样本图片对应的特征矩阵,初始化一组随机值作为所述神经网络的权重参数W和偏置参数B,本步骤可以记迭代次数μ=0;
利用所述神经网络对样本图片的特征矩阵进行处理以获得量子逻辑门的参量的计算值;
根据所述参量的计算值和与所述每一样本图片的标签值M所对应的量子逻辑门的参量的值构建误差函数;
根据所述误差函数,采用基于梯度下降的反向传播算法迭代调整所述神经网络的权重参数W和偏置参数B,更新迭代次数μ=μ+1,返回所述利用所述神经网络对样本图片的特征矩阵进行处理以获得量子逻辑门的参量的计算值的步骤,直至迭代次数μ达到设定值,即可确定所述神经网络的权重参数和偏置参数。
将上述一种具体实施方式所确定的权重参数和偏置参数存储到所述神经网络,即获得经预先设定步骤训练完成的神经网络。
需要说明的是,反向传播算法是用来求解神经网络中误差函数对其参数的偏导数,进而优化误差函数以获得需要的神经网络模型。反向传播算法的流程:首先,进行前向传播运算,逐层计算神经网络每层节点的输出值。然后,针对每层节点,计算其残差,残差是从后向前的求导过程。接着,计算权重参数和偏置参数的偏导数,并更新权重参数和偏置参数。最后,重复以上方法迭代神经网络参数使误差函数收敛到一个极小值,最终求解得到神经网络模型。
参见图4,图4为本发明实施例提供的一种手写数字识别系统的结构示意图,与图1所示的流程相对应,它包括:
神经网络模块801,用于获得目标图片的特征信息,并利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;
量子线路模块802,用于利用所述参量值更新预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;
以及识别结果计算模块803,用于根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
在本发明的一些实施中,所述神经网络模块801包括:
二值化处理单元,用于接收包含手写数字的目标图片,并对所述目标图片进行二值化处理,以获得对应的二值图片;
特征矩阵处理单元,用于对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵。
在本发明的一些实施中,所述识别结果计算模块803包括:
十进制数确定单元,用于确定与ψi相对应的十进制数xi;
识别结果计算单元,用于计算出∑xiCi作为所述目标图片的识别结果。
在本发明的另一些实施中,所述识别结果计算模块803包括:
子量子态比较单元,用于根据所述子量子态ψi及对应的概率Ci,确定最大概率所对应的子量子态为第一子量子态;
十进制数转换单元,用于确定与所述第一子量子态相对应的十进制数作为所述目标图片的识别结果。
本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行本发明实施例中所述手写数字识别方法的步骤。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本实施例还提供一种手写数字识别设备,它包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如本发明实施例中所述手写数字识别方法的步骤。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个模块或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或模块的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的模块可以是、或也可以不是物理上分开的,作为模块显示的部件可以是、或也可以不是物理模块;既可以位于一个地方,也可以分布到多个网络模块上;可以根据实际的需要选择其中的部分或全部模块来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能模块可以全部集成在一个处理模块中,也可以是各模块分别单独作为一个模块,也可以两个或两个以上模块集成在一个模块中;上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台实现资源变更的设备(可以是计算机、服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种手写数字识别方法,其特征在于,包括:
获得包含手写数字的目标图片的特征信息,利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;所述设定步骤包括:获取训练集中各样本图片对应的特征信息和标签值M,初始化预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定与各所述标签值M相对应的量子逻辑门的参量值;根据各所述样本图片对应的特征信息以及与各所述标签值M相对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数,并存储到所述神经网络获得所述训练完成的神经网络;
利用所述参量值更新所述预设量子线路中量子逻辑门的参量,并获得所述预设量子线路计算的子量子态ψi及对应的概率Ci;
根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
2.根据权利要求1所述的手写数字识别方法,其特征在于,所述特征信息为特征矩阵,所述获得包含手写数字的目标图片的特征信息,包括:
接收包含手写数字的目标图片,对所述目标图片进行二值化处理,获得对应的二值图片;
对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵。
3.根据权利要求2所述的手写数字识别方法,其特征在于,所述对所述二值图片进行矩阵化处理,获得目标图片的特征矩阵的步骤,包括:
对所述二值图片中的各像素进行矩阵化处理,获得像素矩阵;
对所述像素矩阵进行特征提取,获得对应的特征矩阵。
4.根据权利要求1所述的手写数字识别方法,其特征在于,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
确定与ψi相对应的十进制数xi;
计算出作为所述目标图片的识别结果。
5.根据权利要求1所述的手写数字识别方法,其特征在于,所述根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果的步骤,包括:
根据所述子量子态ψi及对应的概率Ci,确定最大概率所对应的子量子态为第一子量子态;
确定与所述第一子量子态相对应的十进制数作为所述目标图片的识别结果。
6.根据权利要求1所述的手写数字识别方法,其特征在于,所述标签值M=0、1、…、9。
7.根据权利要求6所述的手写数字识别方法,其特征在于,所述初始化所述预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定与各所述标签值M相对应的量子逻辑门的参量的值,具体包括:
针对所述训练集中的每一标签值M,初始化一组随机值作为当前参量值θ;
根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ;
分别利用所述当前参量值θ、正偏移θ+δ、负偏移θ-δ更新所述预设量子线路中量子逻辑门的参量,获得对应的子量子态及对应的概率;
根据所述子量子态及对应的概率,计算得到与所述当前参量值θ、正偏移θ+δ、负偏移θ-δ对应的十进制数N、N+、N-;
确定梯度grad为(N+-N-)(N-M);
利用θ=(θ-grad)迭代所述当前参量的值θ,并返回所述根据设定的偏移量δ,确定当前参量值θ对应的正偏移、负偏移分别为θ+δ、θ-δ的步骤,直至迭代次数达到设定值;
确定与各所述标签值M相对应的量子逻辑门的参量值。
8.根据权利要求6所述的手写数字识别方法,其特征在于,所述根据各所述样本图片对应的特征信息以及与各所述标签值M相对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数,具体包括:
针对所述训练集中的每一样本图片对应的特征信息,初始化一组随机值作为所述神经网络的权重参数W和偏置参数B;
利用所述神经网络对样本图片的特征信息进行处理以获得量子逻辑门的参量的计算值;
根据所述参量的计算值和与所述标签值M相对应的量子逻辑门的参量值构建误差函数;
根据所述误差函数,采用基于梯度下降的反向传播算法迭代调整所述神经网络的权重参数W和偏置参数B,返回所述利用所述神经网络对样本图片的特征信息进行处理以获得量子逻辑门的参量的计算值的步骤,直至迭代次数达到设定值。
9.根据权利要求1所述的手写数字识别方法,其特征在于,所述预设量子线路包含至少4个量子比特,且各所述量子比特上均作用有含参量子逻辑门。
10.一种手写数字识别系统,其特征在于,包括:
神经网络模块,用于获得目标图片的特征信息,并利用经设定步骤预先训练完成的神经网络对所述特征信息进行处理以获得量子逻辑门的参量值;所述设定步骤包括:获取训练集中各样本图片对应的特征信息和标签值M,初始化预设量子线路中各含参量子逻辑门的参量,利用反向传播算法确定与各所述标签值M相对应的量子逻辑门的参量值;根据各所述样本图片对应的特征信息以及与各所述标签值M相对应的量子逻辑门的参量值,利用反向传播算法确定所述神经网络的权重参数和偏置参数,并存储到所述神经网络获得所述训练完成的神经网络;
量子线路模块,用于利用所述参量值更新所述预设量子线路中量子逻辑门的参量,并获得所述量子线路计算的子量子态ψi及对应的概率Ci;
识别结果计算模块,用于根据所述子量子态ψi及对应的概率Ci,确定与所述手写数字对应的十进制值作为所述目标图片的识别结果。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行权利要求1至9中任意一项所述的方法。
12.一种手写数字识别设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862683.7A CN114120336B (zh) | 2020-08-25 | 2020-08-25 | 手写数字识别方法、系统、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862683.7A CN114120336B (zh) | 2020-08-25 | 2020-08-25 | 手写数字识别方法、系统、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114120336A CN114120336A (zh) | 2022-03-01 |
CN114120336B true CN114120336B (zh) | 2023-08-08 |
Family
ID=80373823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010862683.7A Active CN114120336B (zh) | 2020-08-25 | 2020-08-25 | 手写数字识别方法、系统、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114120336B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407932A (zh) * | 2016-09-20 | 2017-02-15 | 中国石油大学(华东) | 基于分数阶微积分与广义逆神经网络的手写数字识别方法 |
CN108764195A (zh) * | 2018-06-04 | 2018-11-06 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
CN110245578A (zh) * | 2019-05-24 | 2019-09-17 | 北京大学 | 一种采用量子粒子群算法优化神经网络权值的手势识别方法 |
CN111242306A (zh) * | 2020-01-22 | 2020-06-05 | 北京百度网讯科技有限公司 | 量子主成分分析的方法、装置、电子设备以及计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3598339A1 (en) * | 2018-07-19 | 2020-01-22 | Tata Consultancy Services Limited | Systems and methods for end-to-end handwritten text recognition using neural networks |
-
2020
- 2020-08-25 CN CN202010862683.7A patent/CN114120336B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407932A (zh) * | 2016-09-20 | 2017-02-15 | 中国石油大学(华东) | 基于分数阶微积分与广义逆神经网络的手写数字识别方法 |
CN108764195A (zh) * | 2018-06-04 | 2018-11-06 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
CN110245578A (zh) * | 2019-05-24 | 2019-09-17 | 北京大学 | 一种采用量子粒子群算法优化神经网络权值的手势识别方法 |
CN111242306A (zh) * | 2020-01-22 | 2020-06-05 | 北京百度网讯科技有限公司 | 量子主成分分析的方法、装置、电子设备以及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
Yuanlong Wang,and etc.Efficient identification of unitary quantum processes.《2017 Australian and New Zealand Control Conference (ANZCC)》.2018,第196-201页. * |
Also Published As
Publication number | Publication date |
---|---|
CN114120336A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11875268B2 (en) | Object recognition with reduced neural network weight precision | |
CN111615702B (zh) | 一种从图像中提取结构化数据的方法、装置和设备 | |
JP2018535491A (ja) | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 | |
RU2716322C2 (ru) | Репродуцирующая аугментация данных изображения | |
CN108229287B (zh) | 图像识别方法和装置、电子设备和计算机存储介质 | |
US20180247183A1 (en) | Method and system for generative model learning, and recording medium | |
US20240095563A1 (en) | Quantum convolution operator | |
CN109408058B (zh) | 基于机器学习的前端辅助开发方法和装置 | |
CN114821217B (zh) | 一种基于量子经典混合神经网络的图像识别方法及装置 | |
WO2022236824A1 (zh) | 目标检测网络构建优化方法、装置、设备、介质及产品 | |
CN113344826B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114187598B (zh) | 手写数字识别方法、设备及计算机可读存储介质 | |
CN114120336B (zh) | 手写数字识别方法、系统、设备及计算机可读存储介质 | |
CN114741697B (zh) | 恶意代码分类方法、装置、电子设备和介质 | |
CN116049691A (zh) | 模型转换方法、装置、电子设备和存储介质 | |
CN115760775A (zh) | 番茄病害检测方法、装置、设备及存储介质 | |
CN115862015A (zh) | 文字识别系统的训练方法及装置、文字识别方法及装置 | |
CN112651467B (zh) | 卷积神经网络的训练方法和系统以及预测方法和系统 | |
US20220156490A1 (en) | Method and system for extracting information from a document image | |
CN112465092A (zh) | 一种二维码样本的生成方法、装置、服务器和存储介质 | |
CN107845116B (zh) | 生成平面图像的压缩编码的方法和装置 | |
US11837000B1 (en) | OCR using 3-dimensional interpolation | |
CN116612474B (zh) | 对象检测方法、装置、计算机设备及计算机可读存储介质 | |
CN114819171B (zh) | 一种量子卷积操作的实现方法及装置 | |
RU2777354C2 (ru) | Система распознавания изображения: beorg smart vision |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 230088 6th floor, E2 building, phase II, innovation industrial park, 2800 innovation Avenue, high tech Zone, Hefei City, Anhui Province Applicant after: Benyuan Quantum Computing Technology (Hefei) Co.,Ltd. Address before: 230088 6th floor, E2 building, phase II, innovation industrial park, 2800 innovation Avenue, high tech Zone, Hefei City, Anhui Province Applicant before: ORIGIN QUANTUM COMPUTING COMPANY, LIMITED, HEFEI |
|
GR01 | Patent grant | ||
GR01 | Patent grant |