CN108647310A - 识别模型建立方法及装置、文字识别方法及装置 - Google Patents
识别模型建立方法及装置、文字识别方法及装置 Download PDFInfo
- Publication number
- CN108647310A CN108647310A CN201810439752.6A CN201810439752A CN108647310A CN 108647310 A CN108647310 A CN 108647310A CN 201810439752 A CN201810439752 A CN 201810439752A CN 108647310 A CN108647310 A CN 108647310A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- recognition
- lteral data
- identification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例提供一种识别模型建立方法及装置、文字识别方法及装置。所述识别模型建立方法包括:将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种识别模型建立方法及装置、文字识别方法及装置。
背景技术
随着计算机技术的发展,各种技术都可以通过计算机实现,其中文字的识别希望能够通过计算机直接识别,但是现有的文字识别并不能很好地满足需求。
发明内容
有鉴于此,本发明实施例的目的在于提供一种识别模型建立方法及装置、文字识别方法及装置。
本发明实施例提供的一种识别模型建立方法,所述识别模型建立方法包括:
将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
本发明实施例还提供一种文字识别方法,使用上述的识别模型建立方法训练得到的目标识别模型对文字进行识别,所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别方法包括:
将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
本发明实施例还提供一种识别模型建立装置,所述识别模型建立装置包括:
第一标记模块,用于将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
第一训练模块,用于将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
第二标记模块,用于对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
第二训练模块,用于将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
本发明实施例还提供一种文字识别装置,用于使用上述的识别模型建立装置训练得到的目标识别模型对文字进行识别,所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别装置包括:
识别模块,用于将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
与现有技术相比,本发明实施例的识别模型建立方法及装置、文字识别方法及装置,所述识别模型建立方法先建立图像识别模型,再建立语义识别模型,两个模型组合形成所述目标识别模型,以在识别待识别数据时,通过双重识别能够更好地识别文字信息,提高文字识别的准确率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的电子终端的方框示意图。
图2为本发明实施例提供的识别模型建立方法的流程图。
图3为本发明实施例提供的识别模型建立方法的步骤S102的详细流程图。
图4为本发明实施例提供的识别模型建立方法的步骤S104的详细流程图。
图5为本发明实施例提供的识别模型建立方法的步骤S103的详细流程图。
图6为本发明实施例提供的文字识别方法的流程图。
图7为本发明实施例提供的识别模型建立装置的功能模块示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,是一电子终端100的方框示意图。所述电子终端100包括识别模型建立装置110、存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、显示单元116。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对电子终端100的结构造成限定。例如,电子终端100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
所述存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115及显示单元116各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述识别模型建立装置110包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器111中或固化在所述电子终端100的操作系统(Operating System,OS)中的软件功能模块。所述处理器113用于执行存储器中存储的可执行模块,例如所述识别模型建立装置110包括的软件功能模块或计算机程序。
其中,所述存储器111可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器111用于存储程序,所述处理器113在接收到执行指令后,执行所述程序,本发明实施例任一实施例揭示的过程定义的电子终端100所执行的方法可以应用于处理器113中,或者由处理器113实现。
所述处理器113可能是一种集成电路芯片,具有信号的处理能力。上述的处理器113可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口114将各种输入/输入装置耦合至处理器113以及存储器111。在一些实施例中,外设接口114,处理器113以及存储控制器112可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
所述输入输出单元115用于提供给用户输入数据。所述输入输出单元115可以是,但不限于,鼠标和键盘等。
所述显示单元116在所述电子终端100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。
本发明实施例中,所述电子终端100的存储器111还可以存储有文字识别装置(图未示),所述文字识别装置用于识别目标文字。
在其它实施例中,所述电子终端100的存储器111存储有识别模型建立装置110,其它电子终端的存储器中存储有所述文字识别装置。也就是说,所述识别模型建立装置110与所述文字识别装置可以在不同的电子终端分别被执行。
藏族传统文化是中国灿烂文化摇篮中的一员,藏文的历史悠久,文字的造型优美,用藏文记载的文献古籍和译作数不胜数,而为了将这些传统的优秀的文化长久地留存下去,文字的信息化便显得非常重要,在现有的信息科技大时代下,对藏文的文字的信息化也就尤为重要了。
现有的字符识别技术,主要以特征提取为主,送入特征分类器,输出最后识别的字符;而英语、汉字的字型固定,在预处理上相对容易,但藏文的结构变化比较多,字节也有很多形状,以现有的字符识别技术难以提高识别率,对藏文字符识别的准确率低。因为,本发明实施例可以针对艺术的文字进行识别,具体通过以下几个实施例进行详细描述。
请参阅图2,是本发明实施例提供的应用于图1所示的电子终端的识别模型建立方法的流程图。下面将对图2所示的具体流程进行详细阐述。
步骤S101,将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据。
本实施例中,所述步骤S101包括:对所述第一文字数据进行识别,将识别到的字丁和非字丁进行标记得到第一标记数据。
本实施例中,所述电子终端可以加载存储的目标文字的书籍、网页等数据。例如,所述网页可以是所述目标文字相关的游戏网页,所述第一文字数据可以是在游戏过程中显示在页面中的文字数据,也可以是游戏过程中用户输入的文字数据。
在一种实施方式中,所述目标文字可以是藏文、回族文字、阿拉伯文字等。
步骤S102,将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型。
本实施例中,可以经过多次训练,对所述全卷积网络模型的各项参数进行多次调整,直到调整参数的全卷积网络模型的输出数据的准确率达到预设值时,退出训练得到所述图像识别模型。
具体地,所述步骤S102可以通过以下流程进行处理:
将所述第一文字数据输入所述全卷积网络模型进行计算,得到第一轮的输出数据。将所述第一轮的输出数据与所述第一标记数据进行比对,判断所述第一轮的输出数据的准确率。如果准确率小于所述预设值时,调整所述全卷积网络模型的各项参数,将所述前一轮的输出数据输入调整参数后的全卷积网络模型进行计算,得到新一轮的输出数据,并将新一轮的输出数据与所述第一标记数据进行对比,判断所述第一轮的输出数据的准确率;重复上述流程直到输出数据的准确率达到预设值时,将达到退出条件的全卷积网络模型作为所述图像识别模型。
步骤S103,对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据。
详细地,通过对所述第二文字数据进行分词标注、查找核心词、关键词标注、词性标注等操作。
步骤S104,将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型。
具体地,所述步骤S104可以通过以下流程进行处理:
将所述第二文字数据输入所述语义训练模型进行计算,得到第二轮的输出数据。将所述第二轮的输出数据与所述第二标记数据进行比对,判断所述第二轮的输出数据的准确率。如果准确率小于所述预设值时,调整所述语义训练模型的各项参数,将所述前一轮的输出数据输入调整参数后的语义训练模型进行计算,得到新一轮的输出数据,并将新一轮的输出数据与所述第二标记数据进行对比,判断所述第二轮的输出数据的准确率;重复上述流程直到输出数据的准确率达到预设值时,将达到退出条件的语义训练模型作为所述图像识别模型。
本实施例中,所述图像识别模型与所述语义识别模型形成目标识别模型。
本实施例中,如图3所示,所述步骤S102包括:步骤S1021至步骤S1025。
步骤S1021,提取所述第一标记数据中的多种特征信息。
步骤S1022,定义与所述多种特征信息包含特征数量对应数量的多层滤波器。
步骤S1023,通过所述多层滤波器定义全卷积网络模型。
步骤S1024,将输入数据输入所述全卷积网络模型进行训练得到第一输出结果。
第一轮训练中所述输入数据为所述第一文字数据,后面的训练的输入数据为所述全卷积网络模型训练后的输出数据。
步骤S1025,将所述第一输出结果与所述第一标记数据的类型做误差对比,调整全卷积网络模型中的各项参数。经过多次训练迭代执行步骤S1024和步骤S1025以调整所述全卷积网络模型中的各项参数得到图像识别模型。
本实施例中,如图4所示,步骤S104包括:步骤S1041至步骤S1023。
步骤S1041,使用深度学习算法框架TensorFlow建立语义训练模型。
TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。
步骤S1042,将输入数据输入所述语义训练模型进行训练得到第二输出结果。
第一轮训练中所述输入数据为所述第二文字数据,后面的训练的输入数据为所述语义训练模型训练后的输出数据。
步骤S1043,将所述第二输出结果与所述第二标记数据进行误差对比,以调整所述语义训练模型中的各项参数。
经过多次训练迭代执行步骤S1042和步骤S1043以调整所述语义训练模型中的各项参数得到语义识别模型。
本实施例中,如图5所示,所述步骤S103包括:步骤S1031和步骤S1032。
步骤S1031,将所述第二文字数据中的字符串进行分词,以将相邻的词语和句子分开。
在一个实例中,所述第二文字数据为藏文相关数据,由于藏文的词与词之间没有空格,需要预先将相邻的词分开以方便识别。
步骤S1032,对分词后的所述第二文字数据进行标记,得到第二标记数据。
本实施例中,所述识别模型建立方法先建立图像识别模型,再建立语义识别模型,两个模型组合形成所述目标识别模型,以在识别待识别数据时,通过双重识别能够更好地识别文字信息,提高文字识别的准确率。
请参阅图6,是本发明实施例提供的应用于图1所示的电子终端或其它电子终端的识别模型建立方法的流程图。下面将对图6所示的具体流程进行详细阐述。
步骤S201,加载目标识别模型。
所述目标识别模型为上述方法实施例处理得到的。
步骤S202,将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
本实施例中,将所述待识别数据输入所述图像识别模型中进行计算,然后将计算结果再输入所述语义识别模型进行计算可以得到所述识别结果。
本实施例中,本实施例中的文字识别模型使用所述识别模型建立方法建立的图像识别模型和语义识别模型,两个模型组合形成所述目标识别模型识别文字数据。在识别待识别数据时,通过双重识别能够更好地识别文字信息,提高文字识别的准确率。
请参阅图7,是本发明实施例提供的图1所示的识别模型建立装置110的功能模块示意图。本实施例中的所述识别模型建立装置110用于执行上述所述识别模型建立方法实施例中的各个步骤。所述识别模型建立装置110包括:第一标记模块1101、第一训练模块1102、第二标记模块1103及第二训练模块1104。
所述第一标记模块1101,用于将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据。
所述第一训练模块1102,用于将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型。
所述第二标记模块1103,用于对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
所述第二训练模块1104,用于将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
本实施例中,所述第一训练模块包括:
提取单元,用于提取所述第一标记数据中的多种特征信息;
第一定义单元,用于定义与所述多种特征信息包含特征数量对应数量的多层滤波器;
第二定义单元,用于通过所述多层滤波器定义全卷积网络模型;
图像训练单元,用于将所述第一文字数据输入所述全卷积网络模型进行训练得到第一输出结果,将所述第一输出结果与所述第一标记数据的类型做误差对比,调整全卷积网络模型中的各项参数,经过多次训练迭代以调整所述全卷积网络模型中的各项参数得到图像识别模型。
本实施例中,所述第二训练模块包括:
建立单元,用于使用深度学习算法框架TensorFlow建立语义训练模型;
语义训练单元,用于将所述第二文字数据输入所述语义训练模型进行训练得到第二输出结果,将所述第二输出结果与所述第二标记数据进行误差对比,以调整所述语义训练模型中的各项参数,经过多次训练迭代以调整所述语义训练模型中的各项参数得到语义识别模型。
关于所述识别模型建立装置110的其它细节可以进一步地参考上述的识别模型建立方法实施例中的描述,在此不再赘述。
本发明实施例还提供一种文字识别装置,本实施例中的文字识别装置用于使用上述实施例中的识别模型建立装置110训练得到的目标识别模型对文字进行识别。本实施例中的所述文字识别装置用于执行上述所述文字识别方法实施例中的各个步骤。所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别装置包括:识别模块,用于将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
关于所述文字识别装置的其它细节可以进一步地参考上述的文字识别方法实施例中的描述,在此不再赘述。
上述实施例中,所述识别模型建立装置先建立图像识别模型,再建立语义识别模型,两个模型组合形成所述目标识别模型,以在识别待识别数据时,通过双重识别能够更好地识别文字信息,提高文字识别的准确率。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种识别模型建立方法,其特征在于,所述识别模型建立方法包括:
将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
2.如权利要求1所述的识别模型建立方法,其特征在于,所述将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型的步骤包括:
提取所述第一标记数据中的多种特征信息;
定义与所述多种特征信息包含特征数量对应数量的多层滤波器;
通过所述多层滤波器定义全卷积网络模型;
将所述第一文字数据输入所述全卷积网络模型进行训练得到第一输出结果,将所述第一输出结果与所述第一标记数据的类型做误差对比,调整全卷积网络模型中的各项参数,经过多次训练迭代以调整所述全卷积网络模型中的各项参数得到图像识别模型。
3.如权利要求1或2所述的识别模型建立方法,其特征在于,所述将所述第一文字数据进行标记得到第一标记数据的步骤包括:
对所述第一文字数据进行识别,将识别到的字丁和非字丁进行标记得到第一标记数据。
4.如权利要求1所述的识别模型建立方法,其特征在于,所述将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型的步骤包括:
使用深度学习算法框架TensorFlow建立语义训练模型;
将所述第二文字数据输入所述语义训练模型进行训练得到第二输出结果,将所述第二输出结果与所述第二标记数据进行误差对比,以调整所述语义训练模型中的各项参数,经过多次训练迭代以调整所述语义训练模型中的各项参数得到语义识别模型。
5.如权利要求1或4所述的识别模型建立方法,其特征在于,所述对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据的步骤包括:
将所述第二文字数据中的字符串进行分词,以将相邻的词语和句子分开;
对分词后的所述第二文字数据进行标记,得到第二标记数据。
6.一种文字识别方法,其特征在于,使用权利要求1-5任意一项所述的识别模型建立方法训练得到的目标识别模型对文字进行识别,所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别方法包括:
将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
7.一种识别模型建立装置,其特征在于,所述识别模型建立装置包括:
第一标记模块,用于将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
第一训练模块,用于将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
第二标记模块,用于对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
第二训练模块,用于将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
8.如权利要求7所述的识别模型建立装置,其特征在于,所述第一训练模块包括:
提取单元,用于提取所述第一标记数据中的多种特征信息;
第一定义单元,用于定义与所述多种特征信息包含特征数量对应数量的多层滤波器;
第二定义单元,用于通过所述多层滤波器定义全卷积网络模型;
图像训练单元,用于将所述第一文字数据输入所述全卷积网络模型进行训练得到第一输出结果,将所述第一输出结果与所述第一标记数据的类型做误差对比,调整全卷积网络模型中的各项参数,经过多次训练迭代以调整所述全卷积网络模型中的各项参数得到图像识别模型。
9.如权利要求7所述的识别模型建立装置,其特征在于,所述第二训练模块包括:
建立单元,用于使用深度学习算法框架TensorFlow建立语义训练模型;
语义训练单元,用于将所述第二文字数据输入所述语义训练模型进行训练得到第二输出结果,将所述第二输出结果与所述第二标记数据进行误差对比,以调整所述语义训练模型中的各项参数,经过多次训练迭代以调整所述语义训练模型中的各项参数得到语义识别模型。
10.一种文字识别装置,其特征在于,用于使用权利要求7-9任意一项所述的识别模型建立装置训练得到的目标识别模型对文字进行识别,所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别装置包括:
识别模块,用于将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810439752.6A CN108647310A (zh) | 2018-05-09 | 2018-05-09 | 识别模型建立方法及装置、文字识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810439752.6A CN108647310A (zh) | 2018-05-09 | 2018-05-09 | 识别模型建立方法及装置、文字识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108647310A true CN108647310A (zh) | 2018-10-12 |
Family
ID=63753789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810439752.6A Pending CN108647310A (zh) | 2018-05-09 | 2018-05-09 | 识别模型建立方法及装置、文字识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647310A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657683A (zh) * | 2018-12-19 | 2019-04-19 | 北京像素软件科技股份有限公司 | 文字识别建模方法及装置、文字识别方法及电子设备 |
CN112183513A (zh) * | 2019-07-03 | 2021-01-05 | 杭州海康威视数字技术股份有限公司 | 一种图像中文字的识别方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014049118A (ja) * | 2012-08-31 | 2014-03-17 | Fujitsu Ltd | 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 |
CN104462066A (zh) * | 2014-12-24 | 2015-03-25 | 北京百度网讯科技有限公司 | 语义角色标注方法及装置 |
CN104809176A (zh) * | 2015-04-13 | 2015-07-29 | 中央民族大学 | 藏语实体关系抽取方法 |
CN105654129A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种光学文字序列识别方法 |
CN107729865A (zh) * | 2017-10-31 | 2018-02-23 | 中国科学技术大学 | 一种手写体数学公式离线识别方法及系统 |
-
2018
- 2018-05-09 CN CN201810439752.6A patent/CN108647310A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014049118A (ja) * | 2012-08-31 | 2014-03-17 | Fujitsu Ltd | 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 |
CN104462066A (zh) * | 2014-12-24 | 2015-03-25 | 北京百度网讯科技有限公司 | 语义角色标注方法及装置 |
CN104809176A (zh) * | 2015-04-13 | 2015-07-29 | 中央民族大学 | 藏语实体关系抽取方法 |
CN105654129A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种光学文字序列识别方法 |
CN107729865A (zh) * | 2017-10-31 | 2018-02-23 | 中国科学技术大学 | 一种手写体数学公式离线识别方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657683A (zh) * | 2018-12-19 | 2019-04-19 | 北京像素软件科技股份有限公司 | 文字识别建模方法及装置、文字识别方法及电子设备 |
CN112183513A (zh) * | 2019-07-03 | 2021-01-05 | 杭州海康威视数字技术股份有限公司 | 一种图像中文字的识别方法、装置、电子设备及存储介质 |
CN112183513B (zh) * | 2019-07-03 | 2023-09-05 | 杭州海康威视数字技术股份有限公司 | 一种图像中文字的识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Improving one-stage visual grounding by recursive sub-query construction | |
Xie et al. | 3D shape segmentation and labeling via extreme learning machine | |
CN111753081B (zh) | 基于深度skip-gram网络的文本分类的系统和方法 | |
Benchimol et al. | Text mining methodologies with R: An application to central bank texts | |
EP3612960A1 (en) | Hybrid approach to approximate string matching using machine learning | |
CN108874992A (zh) | 舆情分析方法、系统、计算机设备和存储介质 | |
CN105740236B (zh) | 结合写作特征和序列特征的中文情感新词识别方法和系统 | |
CN103605691B (zh) | 用于处理社交网络中发布内容的装置和方法 | |
US11361002B2 (en) | Method and apparatus for recognizing entity word, and storage medium | |
CN106970912A (zh) | 中文语句相似度计算方法、计算装置以及计算机存储介质 | |
CN109657204A (zh) | 使用非对称度量学习的自动配对字体 | |
CN109062972A (zh) | 网页分类方法、装置及计算机可读存储介质 | |
KR20200009117A (ko) | 텍스트 데이터 수집 및 분석을 위한 시스템 | |
CN107145485A (zh) | 用于压缩主题模型的方法和装置 | |
CN110427614A (zh) | 段落层级的构建方法、装置、电子设备及存储介质 | |
CN106649276B (zh) | 标题中核心产品词的识别方法以及装置 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
CN108496190A (zh) | 用于从电子数据结构中提取属性的注释系统 | |
CN108876452A (zh) | 用电客户需求信息获取方法、装置以及电子设备 | |
CN110364186A (zh) | 一种基于对抗学习的端到端的跨语言语音情感识别方法 | |
Kia et al. | A novel method for recognition of Persian alphabet by using fuzzy neural network | |
CN109800440A (zh) | 汉字的序列标注方法及系统、计算机设备及可读存储介质 | |
Capobianco et al. | Historical handwritten document segmentation by using a weighted loss | |
CN108647310A (zh) | 识别模型建立方法及装置、文字识别方法及装置 | |
Xia et al. | Large-scale categorization of japanese product titles using neural attention models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20211116 |
|
AD01 | Patent right deemed abandoned |