CN110287881A - 图书识别系统、图书识别方法、电子装置及储存介质 - Google Patents

图书识别系统、图书识别方法、电子装置及储存介质 Download PDF

Info

Publication number
CN110287881A
CN110287881A CN201910558895.3A CN201910558895A CN110287881A CN 110287881 A CN110287881 A CN 110287881A CN 201910558895 A CN201910558895 A CN 201910558895A CN 110287881 A CN110287881 A CN 110287881A
Authority
CN
China
Prior art keywords
books
book
image
book cover
content information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910558895.3A
Other languages
English (en)
Inventor
唐恺辰
施晓华
卢宏涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
CERNET Corp
Original Assignee
Shanghai Jiaotong University
CERNET Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, CERNET Corp filed Critical Shanghai Jiaotong University
Priority to CN201910558895.3A priority Critical patent/CN110287881A/zh
Publication of CN110287881A publication Critical patent/CN110287881A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/10544Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum
    • G06K7/10821Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum further details of bar or optical code scanning devices
    • G06K7/10861Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum further details of bar or optical code scanning devices sensing of data fields affixed to objects or articles, e.g. coded labels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Toxicology (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本申请提供一种图书识别系统、图书识别方法、电子装置及储存介质,包括:采集模块,用于采集记录有图书的图书封面内容信息的图像;识别模块,耦接所述采集模块,接收所述图像并提取出所述图书封面内容信息;在无法通过条码识别的情况下,通过光学字符识别方式得到识别结果以得到至少一个分词结果,在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表,将其内容合并,以出现频次最高的作为所述图书的识别结果。解决了由于工作人员分类整理或盘点图书的工作量大,浪费人力并耗费了大量时间且工作效率和工作准确度低的问题,本申请使得在图书的识别及分类整理方面节省了人力和大量时间且提高了工作效率和工作准确度。

Description

图书识别系统、图书识别方法、电子装置及储存介质
技术领域
本申请涉及一种图书管理领域,特别是涉及一种图书识别系统、图书识别方法、电子装置及储存介质。
背景技术
随着现代化社会的发展,人们对知识量的需求不断增加,越来越多的人开始去图书馆借阅书,使得图书馆的图书储备量越来越大,在图书馆或者是其他储藏由大量图书的场所,工作人员都会有一个任务,在每次购置新书后,需要将图书进行归位、分类整理、分拣或盘点时,在之前大多是利用这种传统的方法:在图书分类和贴编号后,还要慢慢输入书本简介信息和图书编号信息,大部分是由图书馆工作人员人工作业,但由于不同的图书种类及巨大的图书数量的图书识别和整理让图书馆工作人员的劳动强度大,浪费大量的人力并加大了工作人员的工作量,并且需要很多时间进行图书识别和分类整理工作,并且在识别和整理过程中由于疏忽和设备不完善的情况下很容易出现错误使得工作准确率不高,进而使工作效率降低。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种图书识别系统、图书识别方法、电子装置及储存介质,用于解决现有技术中由于不同的图书种类及巨大的图书数量的图书识别和整理让图书馆工作人员的劳动强度大,浪费大量的人力并加大了工作人员的工作量,并且需要很多时间进行图书识别和分类整理工作,并且在识别和整理过程中由于疏忽和设备不完善的情况下很容易出现错误使得工作准确率不高,进而使工作效率降低的问题。
为实现上述目的及其他相关目的,本申请提供一种图书识别系统,包括:采集模块,用于采集记录有图书的图书封面内容信息的图像;识别模块,耦接所述采集模块,接收所述图像并提取出所述图书封面内容信息;在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;对所述识别结果进行分词得到至少一个分词结果;根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
于本申请的一实施例中,当所述采集模块采集的图像为静态图像时,所述识别模块接收所述图像并提取该静态图像作为所述图书封面内容信息;当所述采集模块采集的图像为动态图像时,所述识别模块接收所述图像并提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
于本申请的一实施例中,所述条码识别为条形码识别或二维码识别。
为实现上述目的及其他相关目的,本申请提供一种图书识别方法,包括:接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息;在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;对所述识别结果进行分词得到至少一个分词结果;根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
于本申请的一实施例中,所述接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息的步骤包括:当所述图像为静态图像时,提取该静态图像作为所述图书封面内容信息;当所述图像为动态图像时,提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
于本申请的一实施例中,通过jieba分词工具对所述识别结果进行分词。
于本申请的一实施例中,所述方法包括:采集记录有图书的图书封面内容信息的图像。
于本申请的一实施例中,所述条码识别为条形码识别或二维码识别。
为实现上述目的及其他相关目的,本申请提供一种电子装置,包括:存储器,用于存储计算机程序;处理器,耦接所述存储器,用于运行所述计算机程序,以执行所述的图书识别方法。
为实现上述目的及其他相关目的,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器行所述的图书识别方法。
如上所述,本申请的图书识别系统、图书识别方法、电子装置及储存介质,具有以下有益效果:解决现有技术中由于不同的图书种类及巨大的图书数量的图书识别和整理让图书馆工作人员的劳动强度大,浪费大量的人力并加大了工作人员的工作量,并且需要很多时间进行图书识别和分类整理工作,并且在识别和整理过程中由于疏忽和设备不完善的情况下很容易出现错误使得工作准确率不高,进而使工作效率降低的问题,本申请使得在图书的识别及分类整理方面节省了人力和大量时间且提高了工作效率和工作准确度。
附图说明
图1显示为本申请一实施例中的图书识别系统的结构示意图。
图2显示为本申请一实施例中的图书识别方法的流程示意图。
图3显示为本申请一实施例中的电子装置的结构示意图。
元件标号说明
11 采集模块
12 识别模块
30 电子装置
31 存储器
32 处理器
S201~S205 步骤
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
在通篇说明书中,当说某部分与另一部分“耦接”时,这不仅包括“直接连接”的情形,也包括其它元件置于其间而“间接连接”的情形。另外,当说某种部分“包括”某种构成要素时,只要没有相反的记载,则并非将其它构成要素排除在外,而是意味着可以还包括其它构成要素。
其中提到的第一、第二及第三等术语是为了说明多样的部分、成份、区域、层及/或段而使用的,但并非限定于此。这些术语只用于把某部分、成份、区域、层或段区别于其它部分、成份、区域、层或段。因此,以下叙述的第一部分、成份、区域、层或段在不超出本申请范围的范围内,可以言及到第二部分、成份、区域、层或段。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本申请提供一种图书识别系统,用于解决解决现有技术中由于不同的图书种类及巨大的图书数量让图书馆工作人员的劳动强度大,浪费大量的人力并加大了工作人员的工作量,并且需要很多时间进行图书整理工作,并且在整理过程中由于疏忽和设备不完善的情况下很容易出现错误使得工作准确率不高,进而使工作效率降低的问题,使得在图书的分类整理方面节省了人力和大量时间且提高了工作效率和工作准确度。
所述系统包括:采集模块,用于采集记录有图书的图书封面内容信息的图像;识别模块,耦接所述采集模块,接收所述图像并提取出所述图书封面内容信息;在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;对所述识别结果进行分词得到至少一个分词结果;根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
下面以附图1为参考,针对本申请得实施例进行详细说明,以便本申请所述技术领域的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限于此处说明的实施例。
如图1所示,为本申请实施例中的一种图书识别系统的结构示意图。
所述图书识别系统包括:采集模块11,用于采集记录有图书的图书封面内容信息的图像;所述采集模块11为可记录采集图像功能的装置,例如摄像头等带有图像采集功能的设备。
识别模块12,耦接所述采集模11,接收所述图像并提取出所述图书封面内容信息;识别模块12将所述图书封面内容信息先进行条码识别,所述条码是将线条与空白按照一定的编码规则组合起来的符号,用以代表由一定的字母、数字等表示的图书资料。在进行辨识的时候,是用条码阅读机即(条码扫描器又叫条码扫描枪或条码阅读器)扫描,得到一组反射光信号,此信号经光电转换后变为一组与线条、空白相对应的电子信号,经解码后还原为相应的文本数字对应的图书信息,所述条码可以为一维条形码或是二维码等条码类型,在此不作限定。具体的,将所述图书封面内容信息进行条码识别出该图书的信息。
若在所述图书封面内容信息无法通过条码识别的情况下,识别模块12通过光学字符识别方式得到识别结果。所述光学字符识别方式是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。所述光学字符识别方式可以是在线识别或深度学习光符识别中的一种或多种,所述光学字符识别方式可以利用一种方式识别也可以用多种方式进行同时识别,将得到的多个识别结果进行对比,选择相匹配程度高的识别结果进行下一步识别。
识别模块12对所述识别结果进行分词得到至少一个分词结果,所述分词可以有多种分词方式,可以进行中文、英文、日文等多种语言的分词,经过分词的分词结果根据具体的识别结果可以为一个或多个。举例来说,识别结果为“整理图书的系统”,即得到“整理”、“图书”、“的”以及“系统”四个分词结果。识别模块12根据得到的所述一个或多个分词结果分别在包含图书信息的数据库中进行搜索得到与每个分词对应的图书信息列表;所述图书信息列表包括该分词信息的所有图书信息的排列列表,识别模块12根据每个分词结果在数据库中进行搜索后得到至少一个图书信息列表,将所述图书信息列表的内容合并,可以得到重复或非重复的图书信息,将得到的重复或非重复的图书信息进行统计得到重复出现的次数也就是频次,以出现频次最高的图书信息作为最后的图书识别结果。
可选的,当所述采集模块11采集的图像为静态图像时,所述识别模块12接收所述图像并提取该静态图像作为所述图书封面内容信息;当所述采集模块11采集的图像为动态图像时,所述识别模块12接收所述图像并提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
可选的,所述条码识别为条形码识别或二维码识别,具体的,将所述图书封面内容信息先进行条码识别,所述条码是将线条与空白按照一定的编码规则组合起来的符号,用以代表一定的字母、数字等图书资料。其中所述条形码和二维码都是条码中的一种,所述条形码为一维条码,所述二维码为二维条码。在本实施例中所述条码为条形码识别或二维码识别,在进行辨识的时候,是用条码阅读机即(条码扫描器又叫条码扫描枪或条码阅读器)扫描,得到一组反射光信号,此信号经光电转换後变为一组与线条、空白相对应的电子讯号,经解码后还原为相应的文数字对应的图书信息,再传入电脑,经过识别后在包含图书信息的数据库中搜索到该图书的识别信息。
可选的,所述光学字符识别方式可以是在线识别或深度学习光符识别中的一种或多种。具体的,所述深度学习光符识别方式为首先连通区域分析,检测出字符区域(轮廓外形),以及子轮廓;在此阶段轮廓线集成为块区域,再由字符轮廓和块区域识别出单词,固定字宽文本通过字符单元分割出单个字符,依次对每个单词进行分析,采用自适应分类器,分类器有学习能力,先分析且满足条件的单词也作为训练样本,所以后面的字符(比如页尾)识别更准确,最后,识别含糊不清的空格,及用其他方法识别文本。所述深度学习光符识别方式可以为Tesseract字符识别、CTPN+CRNN字符识别、Densenet字符识别中的一种或多种,所述Tesseract字符识别可以实现文字识别使用长短期记忆网络(LSTM)作为框架,对于对背景图的色彩单一要求和图像像素要求比较高,300dpi+的图片识别度更高;Densenet字符识别运用拥有较深层数的卷积神经网络-密集卷积网络,该识别方式对复杂场景识别度低,对于色彩单一要求和图像像素要求比Tesseract低;或者选择CTPN+CRNN字符识别,这是基于faster RCNN,改进了风险系数(rpn),使anchor产生的window的宽度固定为3,rpn后面不再通过一个LSTM,再接全连接层。利用RNN和CNN的无缝结合可以提高检测精度。CNN用来提取深度特征,RNN用来序列的特征识别(2类),二者无缝结合。
所述在线识别方式为API光符识别,其中API(Application ProgramingInterface)为应用编程接口,它们为不同的应用提供了方便友好的接口方便友好的接口。不同的开发者用不同的架构,甚至不同的语言编写软件都没问题。因为API设计的目的就是要成为一种通用语言,让不同的软件进行信息共享。我们通过调用百度AI的API,可以使用百度AI的文字识别技术,响应一般以XML和JSON格式返回。
若在所述图书封面内容信息无法通过条码识别的情况下,我们可以选择多种组合方式进行光符识别,例如,通过选择Tesseract字符识别、CTPN+CRNN字符识别、Densenet字符识别以及API文字识别中的一种或多种方式进行识别。当选择其中多种识别方式的时候,可以将选择的字符识别方式进行同时对图书封面内容进行识别,并在数据库中分别搜索,将匹配程度高的作为最终结果。例如,同时使用了以下两种识别方法:Tesseract深度学习字符识别和API字符识别,并将两种方法在数据库中分别搜索,将匹配程度高的作为最终结果。
可选的,对所述识别结果进行分词得到至少一个分词结果,例如可以通过jieba分词工具来进行分词,所述jieba分词是一种使用最广泛的中文分词工具,其中所述jieba分词支持三种模式:(1)精确模式:试图将句子最精确地切开,适合文本分析;(2)全模式:把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;(3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。所述jieba分词过程中主要涉及如下几种算法:(1)基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);(2)采用了动态规划查找最大概率路径,找出基于词频的最大切分组合;(3)对于未登录词,采用了基于汉字成词能力的HMM模型,采用Viterbi算法进行计算;(4)基于Viterbi算法做词性标注;(5)基于tf-idf和textrank模型抽取关键词。
与上述实施例原理相似的是,本申请提供一种图书识别方法,所述方法包括:
接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息;
在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;
对所述识别结果进行分词得到至少一个分词结果;
根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;
将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
以下结合附图提供具体实施例:
如图2所示,展示本申请实施例中的一种图书识别方法流程示意图。
所述方法包括:
步骤S201:接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息。
可选的,当采集的图像为静态图像时,接收所述图像并提取该静态图像作为所述图书封面内容信息;当采集的图像为动态图像时,接收所述图像并提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
步骤S202:在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果。
可选的,将所述图书封面内容信息先进行条码识别,所述条码是将线条与空白按照一定的编码规则组合起来的符号,用以代表由一定的字母、数字表示的图书资料。在进行辨识的时候,是用条码阅读机即(条码扫描器又叫条码扫描枪或条码阅读器)扫描,得到一组反射光信号,此信号经光电转换後变为一组与线条、空白相对应的电子信号,经解码后还原为相应的文本数字对应的图书信息,所述条码可以为一维条形码或是二维码等条码类型,在此不作限定。具体的,将所述图书封面内容信息进行条码识别出该图书的信息。
若在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果。所述光学字符识别方式是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。所述光学字符识别方式可以是在线识别或深度学习光符识别中的一种或多种,所述光学字符识别方式可以利用一种方式识别也可以用多种方式进行同时识别,将得到的多个识别结果进行对比,选择相匹配程度高的识别结果进行下一步识别。
步骤S203:对所述识别结果进行分词得到至少一个分词结果。
可选的,对所述识别结果进行分词得到至少一个分词结果,所述分词可以有跟多种分词方式,可以进行中文、英文、日文等多种语言的分词,经过分词的分词结果根据具体的识别结果可以为一个或多个。举例来说,识别结果为“整理图书的系统”,即得到“整理”、“图书”、“的”以及“系统”四个分词结果。
步骤S204:根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表。
可选的,根据得到的所述一个或多个分词结果分别在包含图书信息的数据库中进行搜索得到与每个分词对应的图书信息列表;所述图书信息列表包括该分词信息的所有图书信息的排列列表,经过根据每个分词结果在数据库中进行搜索后得到至少一个图书信息列表。
步骤S205:将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
可选的,所述光学字符识别方式可以是在线识别或深度学习光符识别中的一种或多种。具体的,所述深度学习光符识别方式为首先连通区域分析,检测出字符区域(轮廓外形),以及子轮廓;在此阶段轮廓线集成为块区域,再由字符轮廓和块区域识别出单词,固定字宽文本通过字符单元分割出单个字符,依次对每个单词进行分析,采用自适应分类器,分类器有学习能力,先分析且满足条件的单词也作为训练样本,所以后面的字符(比如页尾)识别更准确,最后,识别含糊不清的空格,及用其他方法识别文本。所述深度学习光符识别方式可以为Tesseract字符识别、CTPN+CRNN字符识别、Densenet字符识别中的一种或多种,所述Tesseract字符识别可以实现文字识别使用长短期记忆网络(LSTM)作为框架,对于对背景图的色彩单一要求和图像像素要求比较高,300dpi+的图片识别度更高;Densenet字符识别运用拥有较深层数的卷积神经网络-密集卷积网络,该识别方式对复杂场景识别度低,对于色彩单一要求和图像像素要求比Tesseract低;或者选择CTPN+CRNN字符识别,这是基于faster RCNN,改进了风险系数(rpn),使anchor产生的window的宽度固定为3,rpn后面不再通过一个LSTM,再接全连接层。利用RNN和CNN的无缝结合可以提高检测精度。CNN用来提取深度特征,RNN用来序列的特征识别(2类),二者无缝结合。所述在线识别方式为API光符识别,其中API(Application Programing Interface)为应用编程接口,它们为不同的应用提供了方便友好的接口方便友好的接口。不同的开发者用不同的架构,甚至不同的语言编写软件都没问题。因为API设计的目的就是要成为一种通用语言,让不同的软件进行信息共享。我们通过调用百度AI的API,可以使用百度AI的文字识别技术,响应一般以XML和JSON格式返回。
若在所述图书封面内容信息无法通过条码识别的情况下,我们可以选择多种组合方式进行光符识别,例如,通过选择Tesseract字符识别、CTPN+CRNN字符识别、Densenet字符识别以及API文字识别中的一种或多种方式进行识别。当选择其中多种识别方式的时候,可以将选择的字符识别方式进行同时对图书封面内容进行识别,并在数据库中分别搜索,将匹配程度高的作为最终结果。例如,同时使用了以下两种识别方法:Tesseract深度学习字符识别和API字符识别,并将两种方法在数据库中分别搜索,将匹配程度高的作为最终结果。
可选的,对所述识别结果进行分词得到至少一个分词结果,例如可以通过jieba分词工具来进行分词,所述jieba分词是一种使用最广泛的中文分词工具,其中所述jieba分词支持三种模式:(1)精确模式:试图将句子最精确地切开,适合文本分析;(2)全模式:把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;(3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。所述jieba分词过程中主要涉及如下几种算法:(1)基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);(2)采用了动态规划查找最大概率路径,找出基于词频的最大切分组合;(3)对于未登录词,采用了基于汉字成词能力的HMM模型,采用Viterbi算法进行计算;(4)基于Viterbi算法做词性标注;(5)基于tf-idf和textrank模型抽取关键词。
可选的,所述方法包括:采集记录有图书的图书封面内容信息的图像,当采集的图像为静态图像时,接收所述图像并提取该静态图像作为所述图书封面内容信息;当采集的图像为动态图像时,接收所述图像并提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
可选的,所述条码识别为条形码识别或二维码识别。
如图3所示,展示本申请实施例中的电子装置30的结构示意图。
所述电子装置30包括:存储器31及处理器32所述存储器31用于存储计算机程序;所述处理器32运行所述计算机程序实现如所述的图书识别方法。
可选的,所述电子装置30中的处理器32会按照如图2所述的步骤,将一个或多个以应用程序的进程对应的指令加载到处理器32中,并由处理器32来运行以实现如图2所述图书识别方法中的各种功能。
可选的,所述存储器31,可包括但不限于高速随机存取存储器、非易失性存储器。例如所述存储器31可以为一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。所述处理器32,可包括但不限于中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请还提供计算机可读存储介质,存储有计算机程序,所述计算机程序运行时实现如图2所示的图书识别方法。所述计算机可读存储介质可包括,但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件
综上所述,本申请一种图书识别系统、图书识别方法、电子装置及储存介质。根据本申请的实施例,解决了现有技术中的下述问题:由于不同的图书种类及巨大的图书数量的图书识别和整理让图书馆工作人员的劳动强度大,浪费大量的人力并加大了工作人员的工作量,并且需要很多时间进行图书识别和分类整理工作,并且在识别和整理过程中由于疏忽和设备不完善的情况下很容易出现错误使得工作准确率不高,进而使工作效率降低。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

Claims (10)

1.一种图书识别系统,其特征在于,包括:
采集模块,用于采集记录有图书的图书封面内容信息的图像;
识别模块,耦接所述采集模块,接收所述图像并提取出所述图书封面内容信息;在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;
对所述识别结果进行分词得到至少一个分词结果;根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
2.根据权利要求1所述的图书识别系统,其特征在于,当所述采集模块采集的图像为静态图像时,所述识别模块接收所述图像并提取该静态图像作为所述图书封面内容信息;当所述采集模块采集的图像为动态图像时,所述识别模块接收所述图像并提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
3.根据权利要求1所述的图书识别系统,其特征在于,所述条码识别为条形码识别或二维码识别。
4.一种图书识别方法,其特征在于,所述方法包括:
接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息;
在所述图书封面内容信息无法通过条码识别的情况下,通过光学字符识别方式得到识别结果;
对所述识别结果进行分词得到至少一个分词结果;
根据所述至少一个分词结果分别在包含图书信息的数据库中搜索得到每个分词结果对应的图书信息列表;
将每个分词结果对应的图书信息列表的内容合并,并以合并的内容中出现频次最高的图书信息作为所述图书的识别结果。
5.根据权利要求4所述的图书识别方法,其特征在于,所述接收记录有图书的图书封面内容信息的图像并提取出所述图书封面内容信息的步骤包括:当所述图像为静态图像时,提取该静态图像作为所述图书封面内容信息;当所述图像为动态图像时,提取出记录有图书的图书封面内容的帧作为图书封面内容信息。
6.根据权利要求4所述的图书识别方法,其特征在于,通过jieba分词工具对所述识别结果进行分词。
7.根据权利要求4所述的图书识别方法,其特征在于,所述方法包括:采集记录有图书的图书封面内容信息的图像。
8.根据权利要求6所述的图书识别方法,其特征在于,其特征在于,所述条码识别为条形码识别或二维码识别。
9.一种电子装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,耦接所述存储器,用于运行所述计算机程序,以执行如权利要求4至8中任一项所述的图书识别方法。
10.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序运行时实现如权利要求4至8中任一项所述的图书识别方法。
CN201910558895.3A 2019-06-26 2019-06-26 图书识别系统、图书识别方法、电子装置及储存介质 Pending CN110287881A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910558895.3A CN110287881A (zh) 2019-06-26 2019-06-26 图书识别系统、图书识别方法、电子装置及储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910558895.3A CN110287881A (zh) 2019-06-26 2019-06-26 图书识别系统、图书识别方法、电子装置及储存介质

Publications (1)

Publication Number Publication Date
CN110287881A true CN110287881A (zh) 2019-09-27

Family

ID=68005828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910558895.3A Pending CN110287881A (zh) 2019-06-26 2019-06-26 图书识别系统、图书识别方法、电子装置及储存介质

Country Status (1)

Country Link
CN (1) CN110287881A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090817A (zh) * 2019-12-20 2020-05-01 掌阅科技股份有限公司 书籍扩展信息的展示方法、电子设备及计算机存储介质
CN111368697A (zh) * 2020-02-28 2020-07-03 中国建设银行股份有限公司 一种信息识别方法和装置
CN111428569A (zh) * 2020-02-26 2020-07-17 北京光年无限科技有限公司 基于人工智能的绘本或教材的视觉识别方法及装置
CN111667260A (zh) * 2020-05-29 2020-09-15 广州微体科技有限公司 云扫付设备及其云扫付方法、计算机可读存储介质
CN112181969A (zh) * 2020-10-11 2021-01-05 北京维应科技有限责任公司 一种基于nlp和图像识别的二手图书版次识别装置
CN112329514A (zh) * 2020-09-07 2021-02-05 江苏感创电子科技股份有限公司 一种基于Faster R-CNN算法的图书盘点方法及系统
CN112395939A (zh) * 2020-09-07 2021-02-23 江苏感创电子科技股份有限公司 一种图书盘点方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079056A (zh) * 2007-02-06 2007-11-28 腾讯科技(深圳)有限公司 一种搜索方法和系统
CN103761893A (zh) * 2013-01-25 2014-04-30 陈旭 一种图书阅读器
WO2015192246A1 (en) * 2014-06-19 2015-12-23 Bitlit Media Inc Method and system for identifying books on a bookshelf
CN107908653A (zh) * 2017-10-12 2018-04-13 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN107944030A (zh) * 2017-12-13 2018-04-20 四川九鼎智远知识产权运营有限公司 一种图书自动分类装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079056A (zh) * 2007-02-06 2007-11-28 腾讯科技(深圳)有限公司 一种搜索方法和系统
CN103761893A (zh) * 2013-01-25 2014-04-30 陈旭 一种图书阅读器
WO2015192246A1 (en) * 2014-06-19 2015-12-23 Bitlit Media Inc Method and system for identifying books on a bookshelf
CN107908653A (zh) * 2017-10-12 2018-04-13 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN107944030A (zh) * 2017-12-13 2018-04-20 四川九鼎智远知识产权运营有限公司 一种图书自动分类装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090817A (zh) * 2019-12-20 2020-05-01 掌阅科技股份有限公司 书籍扩展信息的展示方法、电子设备及计算机存储介质
CN111428569A (zh) * 2020-02-26 2020-07-17 北京光年无限科技有限公司 基于人工智能的绘本或教材的视觉识别方法及装置
CN111368697A (zh) * 2020-02-28 2020-07-03 中国建设银行股份有限公司 一种信息识别方法和装置
CN111667260A (zh) * 2020-05-29 2020-09-15 广州微体科技有限公司 云扫付设备及其云扫付方法、计算机可读存储介质
CN112329514A (zh) * 2020-09-07 2021-02-05 江苏感创电子科技股份有限公司 一种基于Faster R-CNN算法的图书盘点方法及系统
CN112395939A (zh) * 2020-09-07 2021-02-23 江苏感创电子科技股份有限公司 一种图书盘点方法及系统
CN112181969A (zh) * 2020-10-11 2021-01-05 北京维应科技有限责任公司 一种基于nlp和图像识别的二手图书版次识别装置

Similar Documents

Publication Publication Date Title
CN110287881A (zh) 图书识别系统、图书识别方法、电子装置及储存介质
Diem et al. cBAD: ICDAR2017 competition on baseline detection
Khan et al. Table structure extraction with bi-directional gated recurrent unit networks
Karatzas et al. ICDAR 2011 robust reading competition-challenge 1: reading text in born-digital images (web and email)
Bissacco et al. Photoocr: Reading text in uncontrolled conditions
Pan et al. A robust system to detect and localize texts in natural scene images
Rehman et al. Performance analysis of character segmentation approach for cursive script recognition on benchmark database
Wei et al. Evaluation of svm, mlp and gmm classifiers for layout analysis of historical documents
Nair et al. Automated analysis of line plots in documents
Mali et al. ScanSSD: Scanning single shot detector for mathematical formulas in PDF document images
Baechler et al. Multi resolution layout analysis of medieval manuscripts using dynamic mlp
Song et al. Robust and parallel Uyghur text localization in complex background images
Bolelli et al. Historical handwritten text images word spotting through sliding window HOG features
He et al. Aggregating local context for accurate scene text detection
Akinbade et al. An adaptive thresholding algorithm-based optical character recognition system for information extraction in complex images
Dey et al. A two-stage CNN-based hand-drawn electrical and electronic circuit component recognition system
Rai et al. Pho (SC) Net: an approach towards zero-shot word image recognition in historical documents
Yuan et al. An opencv-based framework for table information extraction
Shah et al. A math formula extraction and evaluation framework for PDF documents
Zhou et al. A text recognition and retrieval system for e-business image management
CN111553361A (zh) 一种病理切片标签识别方法
Wang et al. Robust recognition of Chinese text from cellphone-acquired low-quality identity card images using convolutional recurrent neural network.
Li et al. Unsupervised speech text localization in comic images
Lin et al. Multilingual corpus construction based on printed and handwritten character separation
Milleville et al. Automatic extraction of specimens from multi-specimen herbaria

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927