CN113761257A - 一种图片解析方法和装置 - Google Patents
一种图片解析方法和装置 Download PDFInfo
- Publication number
- CN113761257A CN113761257A CN202010936801.4A CN202010936801A CN113761257A CN 113761257 A CN113761257 A CN 113761257A CN 202010936801 A CN202010936801 A CN 202010936801A CN 113761257 A CN113761257 A CN 113761257A
- Authority
- CN
- China
- Prior art keywords
- picture
- information
- keyword
- recognition
- original picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 33
- 239000002131 composite material Substances 0.000 claims description 26
- 238000012015 optical character recognition Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 238000004806 packaging method and process Methods 0.000 claims description 6
- 238000010191 image analysis Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种图片解析方法和装置,涉及图像识别技术领域。该方法的一具体实施方式包括:接收终端发送的解析请求,所述解析请求携带图片信息;采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;将所述识别结果写入所述原始图片中,得到合成图片;将所述合成图片和所述关键字信息返回至所述终端。该实施方式能够解决无法直观地与图片内容进行比对的技术问题。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种图片解析方法和装置。
背景技术
随着业务的快速发展,为了能够让用户更加直观的看到商品的基本属性(比如价格信息等),通常会把一些关键字信息直接标注在图片上,使得用户可以一目了然。很多时候也需要统计大量的关键字信息,如果能够从图片中直接解析出关键字信息,可以避免对页面内容进行大量的文字和算法的解析。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
通过文字识别算法(比如OCR)和关键字识别算法解析得到的识别结果和关键字信息无法与图片直接关联,也无法直观地与图片内容进行比对,导致运维人员很难定位出问题所在。尤其在图片中一些肉眼很难看到的干扰项,使得运维人员无法准确定位出问题所在。上述技术问题都不利于文字识别算法和关键字识别算法的优化。
发明内容
有鉴于此,本发明实施例提供一种图片解析方法和装置,以解决无法直观地与图片内容进行比对的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种图片解析方法,包括:
接收终端发送的解析请求,所述解析请求携带图片信息;
采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;
将所述识别结果写入所述原始图片中,得到合成图片;
将所述合成图片和所述关键字信息返回至所述终端。
可选地,采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息,包括:
调用光学字符识别接口,以将所述图片信息传入所述光学字符识别接口;
接收所述光学字符识别接口返回的识别结果;
调用关键字识别接口,以将所述识别结果传入所述关键字识别接口;
接收所述关键字识别接口返回的关键字信息。
可选地,所述图片信息包括图片或者图片的唯一标识或者图片的URL地址。
可选地,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。
可选地,将所述识别结果写入所述原始图片中,得到合成图片,包括:
获取所述图片信息对应的原始图片,将所述原始图片转换成信息流;
将所述识别结果写入所述原始图片的信息流中,得到合成图片的信息流。
可选地,将所述识别结果写入所述原始图片的信息流中,包括:
根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框;
将所述文字信息写入所述原始图片的信息流中,并且所述文字信息位于所述标记框的附近。
可选地,将所述合成图片和所述关键字信息返回至所述终端,包括:
对所述合成图片的信息流进行Base64编码;
将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中;
将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。
另外,根据本发明实施例的另一个方面,提供了一种图片解析装置,包括:
接收模块,用于接收终端发送的解析请求,所述解析请求携带图片信息;
解析模块,用于采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;
合成模块,用于将所述识别结果写入所述原始图片中,得到合成图片;
返回模块,用于将所述合成图片和所述关键字信息返回至所述终端。
可选地,所述解析模块还用于:
调用光学字符识别接口,以将所述图片信息传入所述光学字符识别接口;
接收所述光学字符识别接口返回的识别结果;
调用关键字识别接口,以将所述识别结果传入所述关键字识别接口;
接收所述关键字识别接口返回的关键字信息。
可选地,所述图片信息包括图片或者图片的唯一标识或者图片的URL地址。
可选地,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。
可选地,所述合成模块还用于:
获取所述图片信息对应的原始图片,将所述原始图片转换成信息流;
将所述识别结果写入所述原始图片的信息流中,得到合成图片的信息流。
可选地,所述合成模块还用于:
根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框;
将所述文字信息写入所述原始图片的信息流中,并且所述文字信息位于所述标记框的附近。
可选地,所述返回模块还用于:
对所述合成图片的信息流进行Base64编码;
将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中;
将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用将识别结果写入原始图片中得到合成图片,将合成图片和识别结果中的关键字信息返回至终端的技术手段,所以克服了现有技术中无法直观地与图片内容进行比对的技术问题。本发明实施例将识别结果展示在图片上,运维人员可以直观地将图片内容与识别结果、关键字信息进行比对,方便判断识别结果和关键字信息是否满足要求,从而准确地定位出问题所在,还能够排除肉眼难以确认的内容信息。因此,本发明实施例对于文字识别算法和关键字识别算法的优化提供了极大的帮助。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的图片解析方法的主要流程的示意图;
图2是根据本发明实施例的合成图片的示意图;
图3是根据本发明实施例的终端浏览器的展示结果;
图4是根据本发明一个可参考实施例的图片解析方法的主要流程的示意图;
图5是根据本发明另一个可参考实施例的图片解析方法的主要流程的示意图;
图6是根据本发明实施例的图片解析装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的图片解析方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述图片解析方法可以包括:
步骤101,接收终端发送的解析请求,所述解析请求携带图片信息。
如果运维人员发送图片的解析内容(比如关键字信息)不符合预期,通常需要人工参与判断是否解析正确,还需要定位出问题所在。此时,运维人员可以通过终端的浏览器向服务端发送解析请求,服务端接收终端发送的解析请求。
可选地,所述图片信息包括图片、图片的唯一标识或者图片的URL地址。为了能够查找到原始图片,运维人员可以通过终端的浏览器指定原始图片的唯一标识或者原始图片的URL地址,又或者是直接向服务端发送原始图片。服务端接收到终端发送的解析请求后,对其进行解析,从而得到图片信息,比如原始图片的唯一标识、原始图片的URL地址或者原始图片等。
步骤102,采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息。
服务端解析得到图片信息之后,通过图片信息获取对应的原始图片,然后先采用文字识别算法对所述原始图片进行识别,得到识别结果,然后采用关键字识别算法对所述识别结果进行关键字提取,从而得到关键字信息。本发明实施例采用文字识别算法和关键字识别算法可以准确地得到识别结果以及识别结果汇总的关键字信息。
可选地,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。为了在步骤103中将识别结果写入原始图片的合适位置,所述识别结果不但包括原始图片中的文字信息,还包括所述文字信息在所述原始图片中的位置信息。可选地,所述识别结果还可以进一步包括所述识别结果的可信度。
例如,识别结果如下所示:
{“area”:{“x”:244,“y”:4,“width”:93,“height”:38},“probability”:0.99985194,“text”:“全国”},
{“area”:{“x”:245,“y”:46,“width”:97,“height”:41},“probability”:0.99999356,“text”:“联保”},
{“area”:{“x”:374,“y”:669,“width”:296,“height”:37},“probability”:0.9998299,“text”:“晒单就送现金红包”},等等。
可选地,所述文字识别算法可以是光学字符识别(Optical CharacterRecognition,简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。可选地,步骤102可以包括:调用光学字符识别接口,以将所述图片信息传入所述光学字符识别接口;接收所述光学字符识别接口返回的识别结果;调用关键字识别接口,以将所述识别结果传入所述关键字识别接口;接收所述关键字识别接口返回的关键字信息。在本发明的实施例中,可以通过调用接口的方式(比如HTTP调用或者RPC调用)分别获取原始图片的识别结果以及所述识别结果中的关键字信息。OCR接口基于传入的图片信息获取原始图片,然后采用OCR对原始图片进行识别,最后返回识别结果。关键字识别接口采用关键字识别算法对识别结果中的文字信息进行关键字识别,然后返回关键字信息。需要指出的是,可以只将识别结果中的文字信息传入所述关键字识别接口。
关键字信息可以是价格、产地、姓名等,
例如,关键字信息如下所示:
{“data”:{“startTime”:“”,“endTime”:“”,“price”:1994.0,},“error”:null,“success”:true}
步骤103,将所述识别结果写入所述原始图片中,得到合成图片。
将步骤102得到的识别结果写入原始图片中,从而得到合成图片。因此所述合成图片中既有原始图片的文字信息,还有标识出了所述文字信息在所述原始图片中的位置。
可选地,步骤103可以包括:获取所述图片信息对应的原始图片,将所述原始图片转换成信息流;将所述识别结果写入所述原始图片的信息流中,得到合成图片的信息流。服务端对终端发送的解析请求进行解析之后,可以得到图片信息(比如原始图片的唯一标识、原始图片的URL地址或者本地地址等),然后根据图片信息获取对应的原始图片,接着将原始图片转换成信息流,最后将步骤102得到的识别结果写入到原始图片的信息流中,即得到合成图片的信息流。
可选地,将所述识别结果写入所述原始图片的信息流中,包括:根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框;将所述文字信息写入所述原始图片的信息流中,并且所述文字信息位于所述标记框的附近。由于识别结果包括原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息,因此将文字信息与信息流信息结合时,可以根据文字信息在所述原始图片中的位置信息找到原始图片的目标区域,然后该目标区域添加标记框,以标记出文字信息在原始图片中的位置,如图2所示,接着将文字信息写入原始图片中。为了方便运维人员比对文字信息与图片内容,文字信息的写入位置最好位于标记框的附近,比如位于标记框外围的上方或者下方,如图2所示。
可选地,为了便于合成新的图片,在本发明的实施例中,可以使用Java-AWT在原始图片的信息流中添加标记框以及将文字信息写入原始图片的信息流中。Java-AWT:Java-Abstract Window Toolkit抽象窗口工具包,该工具包提供了一套与本地图形界面进行交互的接口,是Java提供的用来建立和设置Java的图形用户界面的基本工具。
步骤104,将所述合成图片和所述关键字信息返回至所述终端。
服务端通过步骤103得到合成图片之后,将合成图片和关键字信息返回至所述终端,使得运维人员既可以直接查看合成图片,又可以直接查看解析出的关键字信息。
可选地,步骤104可以包括:对所述合成图片的信息流进行Base64编码;将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中;将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。为了使运维人员能够通过终端游览器方便地查看合成图片和关键字信息,服务端通过步骤103得到合成图片之后,对所述合成图片的信息流进行Base64编码,以方便传输给浏览器进行展示,然后将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息都封装到HTML字符串中,最后将封装后的HTML字符串返回至所述终端。如图3所示,浏览器一个标签一个标签地解析HTML字符串,解析到img标签就会对合成图片的信息流进行Base64解码,最后通过浏览器展示合成图片、识别结果和关键字信息。因此,运维人员通过浏览器很容易判断出识别结果和关键字信息是否符合要求或者发现解析明显错误的原因,还可以将识别结果和关键字信息直接与合成图片进行比对。
根据上面所述的各种实施例,可以看出本发明实施例通过将识别结果写入原始图片中得到合成图片,将合成图片和识别结果中的关键字信息返回至终端的技术手段,解决了现有技术中无法直观地与图片内容进行比对的技术问题。本发明实施例将识别结果展示在图片上,运维人员可以直观地将图片内容与识别结果、关键字信息进行比对,方便判断识别结果和关键字信息是否满足要求,从而准确地定位出问题所在,还能够排除肉眼难以确认的内容信息。因此,本发明实施例对于文字识别算法和关键字识别算法的优化提供了极大的帮助。
图4是根据本发明一个可参考实施例的图片解析方法的主要流程的示意图。作为本发明的又一个实施例,如图4所示,所述图片解析方法可以包括:
步骤401,接收终端发送的解析请求,所述解析请求携带图片信息。
如果运维人员发送图片的解析内容(比如关键字信息)不符合预期,通常需要人工参与判断是否解析正确,还需要定位出问题所在。那么运维人员可以通过终端的浏览器向服务端发送解析请求,所述解析请求携带图片信息;其中,所述图片信息包括图片、图片的唯一标识或者图片的URL地址。服务端接收到终端发送的解析请求后,对其进行解析,从而得到图片信息。
步骤402,调用OCR接口,以将所述图片信息传入所述OCR接口。
步骤403,接收所述OCR接口返回的识别结果。
可以通过调用接口的方式(比如HTTP调用或者RPC调用)获取原始图片的识别结果。OCR接口基于传入的图片信息获取原始图片,然后采用OCR对原始图片进行识别,最后返回识别结果。所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。可选地,所述识别结果还可以进一步包括所述识别结果的可信度。
步骤404,调用关键字识别接口,以将所述识别结果中的文字信息传入所述关键字识别接口。
步骤405,接收所述关键字识别接口返回的关键字信息。
可以通过调用接口的方式(比如HTTP调用或者RPC调用)提取出文字信息中的关键字信息。关键字识别接口采用关键字识别算法对识别结果中的文字信息进行关键字识别,然后返回关键字信息。
步骤406,将所述识别结果写入所述原始图片中,得到合成图片。
由于识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息,因此合成图片中既有原始图片的文字信息,还有标识出了所述文字信息在所述原始图片中的位置(比如采用标记框的方式标记出来)。在本发明的实施例中,可以使用Java-AWT将所述识别结果写入所述原始图片中,从而得到合成图片。
步骤407,将所述合成图片和所述关键字信息返回至所述终端。
服务端通过步骤406得到合成图片之后,将合成图片和关键字信息一起返回至终端,使得运维人员既可以直接查看合成图片,又可以直接查看解析出的关键字信息。
另外,在本发明一个可参考实施例中图片解析方法的具体实施内容,在上面所述图片解析方法中已经详细说明了,故在此重复内容不再说明。
图5是根据本发明另一个可参考实施例的图片解析方法的主要流程的示意图。作为本发明的又一个实施例,如图5所示,所述图片解析方法可以包括:
步骤501,接收终端发送的解析请求,所述解析请求携带图片信息。
步骤502,采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息。其中,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。
步骤503,获取所述图片信息对应的原始图片,将所述原始图片转换成信息流。
服务端对终端发送的解析请求进行解析之后,可以得到图片信息(比如原始图片的唯一标识、原始图片的URL地址或者本地地址等),然后根据图片信息获取对应的原始图片,接着将原始图片转换成信息流。
步骤504,根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框。
步骤505,将所述文字信息写入所述原始图片的信息流中,得到合成图片的信息流;其中,所述文字信息位于所述标记框的附近。
步骤506,对所述合成图片的信息流进行Base64编码。
为了是运维人员能够通过终端游览器方便地查看合成图片和关键字信息,服务端通过步骤505得到合成图片之后,对所述合成图片的信息流进行Base64编码,以方便传输给浏览器进行展示。
步骤507,将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中。
步骤508,将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。
终端接收到封装后的HTML字符串之后,浏览器一个标签一个标签地解析HTML字符串,解析到img标签就会对合成图片的信息流进行Base64解码,从而通过浏览器展示合成图片、识别结果和关键字信息。
另外,在本发明一个可参考实施例中图片解析方法的具体实施内容,在上面所述图片解析方法中已经详细说明了,故在此重复内容不再说明。
图6是根据本发明实施例的图片解析装置的主要模块的示意图,如图6所示,所述图片解析装置600包括接收模块601、解析模块602、合成模块603和返回模块604;其中,接收模块601用于接收终端发送的解析请求,所述解析请求携带图片信息;解析模块602用于采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;合成模块603用于将所述识别结果写入所述原始图片中,得到合成图片;返回模块604用于将所述合成图片和所述关键字信息返回至所述终端。
可选地,所述解析模块602还用于:
调用光学字符识别接口,以将所述图片信息传入所述光学字符识别接口;
接收所述光学字符识别接口返回的识别结果;
调用关键字识别接口,以将所述识别结果传入所述关键字识别接口;
接收所述关键字识别接口返回的关键字信息。
可选地,所述图片信息包括图片或者图片的唯一标识或者图片的URL地址。
可选地,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。
可选地,所述合成模块603还用于:
获取所述图片信息对应的原始图片,将所述原始图片转换成信息流;
将所述识别结果写入所述原始图片的信息流中,得到合成图片的信息流。
可选地,所述合成模块603还用于:
根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框;
将所述文字信息写入所述原始图片的信息流中,并且所述文字信息位于所述标记框的附近。
可选地,所述返回模块604还用于:
对所述合成图片的信息流进行Base64编码;
将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中;
将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。
根据上面所述的各种实施例,可以看出本发明实施例通过将识别结果写入原始图片中得到合成图片,将合成图片和识别结果中的关键字信息返回至终端的技术手段,解决了现有技术中无法直观地与图片内容进行比对的技术问题。本发明实施例将识别结果展示在图片上,运维人员可以直观地将图片内容与识别结果、关键字信息进行比对,方便判断识别结果和关键字信息是否满足要求,从而准确地定位出问题所在,还能够排除肉眼难以确认的内容信息。因此,本发明实施例对于文字识别算法和关键字识别算法的优化提供了极大的帮助。
需要说明的是,在本发明所述图片解析装置的具体实施内容,在上面所述图片解析方法中已经详细说明了,故在此重复内容不再说明。
图7示出了可以应用本发明实施例的图片解析方法或图片解析装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种客户端应用。
终端设备701、702、703可以是具有显示屏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,后台管理服务器可以对接收到数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的图片解析方法一般由服务器705执行,相应地,所述图片解析装置一般设置在服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括接收模块、解析模块、合成模块和返回模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,该设备实现如下方法:接收终端发送的解析请求,所述解析请求携带图片信息;采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;将所述识别结果写入所述原始图片中,得到合成图片;将所述合成图片和所述关键字信息返回至所述终端。
根据本发明实施例的技术方案,因为采用将识别结果写入原始图片中得到合成图片,将合成图片和识别结果中的关键字信息返回至终端的技术手段,所以克服了现有技术中无法直观地与图片内容进行比对的技术问题。本发明实施例将识别结果展示在图片上,运维人员可以直观地将图片内容与识别结果、关键字信息进行比对,方便判断识别结果和关键字信息是否满足要求,从而准确地定位出问题所在,还能够排除肉眼难以确认的内容信息。因此,本发明实施例对于文字识别算法和关键字识别算法的优化提供了极大的帮助。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种图片解析方法,其特征在于,包括:
接收终端发送的解析请求,所述解析请求携带图片信息;
采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;
将所述识别结果写入所述原始图片中,得到合成图片;
将所述合成图片和所述关键字信息返回至所述终端。
2.根据权利要求1所述的方法,其特征在于,采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息,包括:
调用光学字符识别接口,以将所述图片信息传入所述光学字符识别接口;
接收所述光学字符识别接口返回的识别结果;
调用关键字识别接口,以将所述识别结果传入所述关键字识别接口;
接收所述关键字识别接口返回的关键字信息。
3.根据权利要求1或2所述的方法,其特征在于,所述图片信息包括图片或者图片的唯一标识或者图片的URL地址。
4.根据权利要求1所述的方法,其特征在于,所述识别结果包括所述原始图片中的文字信息以及所述文字信息在所述原始图片中的位置信息。
5.根据权利要求4所述的方法,其特征在于,将所述识别结果写入所述原始图片中,得到合成图片,包括:
获取所述图片信息对应的原始图片,将所述原始图片转换成信息流;
将所述识别结果写入所述原始图片的信息流中,得到合成图片的信息流。
6.根据权利要求5所述的方法,其特征在于,将所述识别结果写入所述原始图片的信息流中,包括:
根据所述文字信息在所述原始图片中的位置信息,在所述原始图片的信息流中添加标记框;
将所述文字信息写入所述原始图片的信息流中,并且所述文字信息位于所述标记框的附近。
7.根据权利要求5所述的方法,其特征在于,将所述合成图片和所述关键字信息返回至所述终端,包括:
对所述合成图片的信息流进行Base64编码;
将Base64编码后的所述合成图片信息流、所述识别结果和所述关键字信息封装到HTML字符串中;
将封装后的HTML字符串返回至所述终端,以在所述终端的浏览器中展示所述合成图片、所述识别结果和所述关键字信息。
8.一种图片解析装置,其特征在于,包括:
接收模块,用于接收终端发送的解析请求,所述解析请求携带图片信息;
解析模块,用于采用文字识别算法和关键字识别算法对所述图片信息对应的原始图片进行解析,得到识别结果以及所述识别结果中的关键字信息;
合成模块,用于将所述识别结果写入所述原始图片中,得到合成图片;
返回模块,用于将所述合成图片和所述关键字信息返回至所述终端。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010936801.4A CN113761257A (zh) | 2020-09-08 | 2020-09-08 | 一种图片解析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010936801.4A CN113761257A (zh) | 2020-09-08 | 2020-09-08 | 一种图片解析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113761257A true CN113761257A (zh) | 2021-12-07 |
Family
ID=78785720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010936801.4A Pending CN113761257A (zh) | 2020-09-08 | 2020-09-08 | 一种图片解析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113761257A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101848303A (zh) * | 2009-03-27 | 2010-09-29 | 夏普株式会社 | 图像处理装置、图像形成装置以及图像处理方法 |
CN103631935A (zh) * | 2013-12-05 | 2014-03-12 | 用友软件股份有限公司 | 移动端图文混排展示装置和移动端图文混排展示方法 |
CN105631051A (zh) * | 2016-02-29 | 2016-06-01 | 华南理工大学 | 基于文字识别的移动增强现实阅读方法及其阅读系统 |
CN106886544A (zh) * | 2016-06-06 | 2017-06-23 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN110460877A (zh) * | 2019-08-22 | 2019-11-15 | 北京亮马手信息咨询有限公司 | 一种团队求职招聘的视频直播系统及直播方法 |
CN111126301A (zh) * | 2019-12-26 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、计算机设备和存储介质 |
-
2020
- 2020-09-08 CN CN202010936801.4A patent/CN113761257A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101848303A (zh) * | 2009-03-27 | 2010-09-29 | 夏普株式会社 | 图像处理装置、图像形成装置以及图像处理方法 |
CN103631935A (zh) * | 2013-12-05 | 2014-03-12 | 用友软件股份有限公司 | 移动端图文混排展示装置和移动端图文混排展示方法 |
CN105631051A (zh) * | 2016-02-29 | 2016-06-01 | 华南理工大学 | 基于文字识别的移动增强现实阅读方法及其阅读系统 |
CN106886544A (zh) * | 2016-06-06 | 2017-06-23 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN110460877A (zh) * | 2019-08-22 | 2019-11-15 | 北京亮马手信息咨询有限公司 | 一种团队求职招聘的视频直播系统及直播方法 |
CN111126301A (zh) * | 2019-12-26 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111274760B (zh) | 富文本数据处理方法、装置、电子设备及计算机存储介质 | |
CN110263279B (zh) | 页面生成方法、装置、电子设备和计算机可读存储介质 | |
CN115209215B (zh) | 视频处理方法、装置及设备 | |
CN109635223A (zh) | 页面显示方法和装置 | |
CN113158101A (zh) | 一种可视化页面渲染方法、装置、设备及存储介质 | |
CN113407882A (zh) | 组件生成方法、装置、计算机可读存储介质及电子设备 | |
CN104156421B (zh) | 页面的展现方法、装置及系统 | |
CN113360106B (zh) | 一种网页打印方法和装置 | |
CN113157523B (zh) | 服务监控方法、装置、计算机设备及存储介质 | |
CN110941401A (zh) | 一种打印方法和装置 | |
CN112906351A (zh) | Pdf文档的生成方法及其装置 | |
CN110224921B (zh) | 发送包含招聘信息的邮件的方法、装置、介质、电子设备 | |
CN110489326B (zh) | 基于ids的httpapi调试方法装置、介质和设备 | |
CN116781586A (zh) | 一种gRPC流量解析方法、装置、设备及介质 | |
KR20180042726A (ko) | 클라우드 서비스 기반의 빅데이터 분석 방법 및 장치 | |
CN113761257A (zh) | 一种图片解析方法和装置 | |
CN115759029A (zh) | 文档模板处理方法、装置、电子设备及存储介质 | |
CN113312568B (zh) | 一种基于HTML源代码和网页快照的Web信息抽取方法与系统 | |
CN113296771B (zh) | 页面显示方法、装置、设备和计算机可读介质 | |
CN102663063B (zh) | 基于xslt的多种用户平台通用信息展示系统及方法 | |
CN113535151B (zh) | 代码生成方法和装置 | |
CN114816382A (zh) | 一种处理页面的方法和装置 | |
KR20140093850A (ko) | 콘텐츠 통합 제공 장치 및 방법 | |
CN115292440A (zh) | 远程指导方法、装置、设备及介质 | |
CN111191974B (zh) | 药品盘点的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |