CN117475443B - 一种基于aigc的图像分割及重组系统 - Google Patents
一种基于aigc的图像分割及重组系统 Download PDFInfo
- Publication number
- CN117475443B CN117475443B CN202311812185.1A CN202311812185A CN117475443B CN 117475443 B CN117475443 B CN 117475443B CN 202311812185 A CN202311812185 A CN 202311812185A CN 117475443 B CN117475443 B CN 117475443B
- Authority
- CN
- China
- Prior art keywords
- image
- unit
- information
- pixel points
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003709 image segmentation Methods 0.000 title claims abstract description 25
- 230000006798 recombination Effects 0.000 title claims abstract description 10
- 238000005215 recombination Methods 0.000 title claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims abstract description 22
- 230000003993 interaction Effects 0.000 claims abstract description 14
- 230000009469 supplementation Effects 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 13
- 230000001502 supplementing effect Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 4
- 230000000153 supplemental effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种基于AIGC的图像分割及重组系统,涉及电数字数据处理领域,包括输入交互模块、智能文字模块和智能图像模块,所述输入交互模块用于输入信息并显示图像处理器效果,所述智能文字模块用于对输入信息中的文字进行智能处理,所述智能图像模块用于对输入信息中的图像进行智能处理;本系统通过AIGC技术对图像进行识别、分割、补充和重组处理,能够完成用户的文字描述需求,降低用户的图像处理能力门槛。
Description
技术领域
本发明涉及电数字数据处理领域,具体涉及一种基于AIGC的图像分割及重组系统。
背景技术
有许多处理图像的软件,通过对这些软件的使用能够将图像处理成需要的形式,但这对使用者有较高的能力要求,随着人工智能的发展,将AIGC技术应用于图像处理过程中能够有效地降低操作复杂度,使用户能够自由将图像按照需要的方式进行处理。
背景技术的前述论述仅意图便于理解本发明。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。
现在已经开发出了很多图像处理系统,经过大量的检索与参考,发现现有的图像处理系统有如公开号为CN112184732B所公开的系统,这些系统方法一般包括:A.通过对采集的图像进行分解,获得轮廓信息和主要信息,将轮廓信息通过阈值算法去除噪声,在与主要信息结合达到去除噪声的目的;B.将图像分割为不同的两个区块,通过压缩算法将映像区块进行压缩,对每个定义域区块寻找误差率最小的压缩区块进行替换,达到压缩效果。但该系统只能对既定事物进行分割处理并用于数据压缩,无法完成用户的通用图片处理需求。
发明内容
本发明的目的在于,针对所存在的不足,提出了一种基于AIGC的图像分割及重组系统。
本发明采用如下技术方案:
一种基于AIGC的图像分割及重组系统,包括输入交互模块、智能文字模块和智能图像模块;
所述输入交互模块用于输入信息并显示图像处理器效果,所述智能文字模块用于对输入信息中的文字进行智能处理,所述智能图像模块用于对输入信息中的图像进行智能处理;
所述输入交互模块包括图像输入单元、文字编辑单元和结果显示单元,所述图像输入单元用于输入图像文件并对文件进行分类操作,所述文字编辑单元用于编辑对图像的处理内容,所述结果显示单元用于实时显示图像的处理结果;
所述智能文字模块包括输入检测单元、需求切分单元和指令转换单元,所述输入检测单元用于检测输入交互模块中文字信息的输入状态并获取文字信息,所述需求切分单元用于将获取的文字信息切分成多个需求词条,所述指令转换单元将每个需求词条转换为指令信息发送给所述智能图像模块;
所述智能图像模块包括指令执行单元、图像分割单元、图像补充单元和图像重构单元,所述指令执行单元用于接收并执行所述指令转换单元发送的指令信息,所述图像分割单元用于从原始图像中分割出需要的图像信息,所述图像补充单元用于对分割出的图像进行补充,所述图像重构单元用于将补充后的图像进行组合得到新的图像;
进一步的,所述图像分割单元包括编码数据寄存器、特征识别处理器和分割执行处理器,所述编码数据寄存器中用于保存编码对应的特征信息,所述特征识别处理器用于从图像中识别出编码对应的区域,所述分割执行处理器根据区域信息从图像中裁剪得到分割图像;
进一步的,所述特征识别处理器识别出区域的过程包括如下步骤:
S1、根据特征信息中的灰度值范围对图像中的像素点进行检索,保留处于灰度值范围内的像素点;
S2、根据像素点的连通性将保留的像素点分为多个区域,并删除像素点数量少于阈值的区域;
S3、将每个区域内的像素点数量基于灰度值进行统计,得到灰度数列{n(g)},g表示灰度值,n(g)为灰度值为g的像素点数量;
S4、将灰度数列根据下式进行归一化处理;
;
;
其中,[gmin,gmax]表示灰度范围,N为归一总量,i为用于表示灰度的临时变量;
S5、根据下式计算出每个区域的特征向量:
;
;
其中,为平均灰度,/>为灰度标准差;
S6、将每个区域的特征向量与特征信息中的特征向量进行比较,比较结果符合要求的区域作为识别出的区域,通过下式计算出偏差值:
;
其中,(x0,y0)为特征信息中的特征向量;
偏差值小于偏差阈值时,表示符合要求;
进一步的,所述图像补充单元包括完整性检测处理器和像素生成处理器,所述完整性检测处理器用于对分割图像的完整性进行检测并补充区域,所述像素生成处理器用于在补充的区域中生成像素点;
进一步的,所述像素生成处理器在补充区域中生成像素点的过程包括如下步骤:
S21、在补充区域中生成灰度值为原有区域灰度均值的像素点;
S22、获取原有区域的纹理特征;
S23、使用纹理特征对补充区域的像素点进行灰度调整;
S24、计算出整个图像区域的融合指数;
S25、不断重复步骤S23和步骤S24,直至最终得到的融合指数小于融合阈值。
本发明所取得的有益效果是:
本系统只需要用户提供基础图片和文字需求,通过智能分析处理后得到满足用户要求的图片内容,实现人工智能生成内容效果,在对图像进行分析处理时,根据特征信息从基础图片中分割出图像,并规分割的图像进行智能化补充,大大提高了最后生成图片的质量。
为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
附图说明
图1为本发明整体结构框架示意图;
图2为本发明智能文字模块构成示意图;
图3为本发明智能图像模块构成示意图;
图4为本发明图像分割单元构成示意图;
图5为本发明图像补充单元构成示意图。
具体实施方式
以下是通过特定的具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
实施例一:一种基于AIGC的图像分割及重组系统,包括输入交互模块、智能文字模块和智能图像模块;
所述输入交互模块用于输入信息并显示图像处理器效果,所述智能文字模块用于对输入信息中的文字进行智能处理,所述智能图像模块用于对输入信息中的图像进行智能处理;
所述输入交互模块包括图像输入单元、文字编辑单元和结果显示单元,所述图像输入单元用于输入图像文件并对文件进行分类操作,所述文字编辑单元用于编辑对图像的处理内容,所述结果显示单元用于实时显示图像的处理结果;
所述智能文字模块包括输入检测单元、需求切分单元和指令转换单元,所述输入检测单元用于检测输入交互模块中文字信息的输入状态并获取文字信息,所述需求切分单元用于将获取的文字信息切分成多个需求词条,所述指令转换单元将每个需求词条转换为指令信息发送给所述智能图像模块;
所述智能图像模块包括指令执行单元、图像分割单元、图像补充单元和图像重构单元,所述指令执行单元用于接收并执行所述指令转换单元发送的指令信息,所述图像分割单元用于从原始图像中分割出需要的图像信息,所述图像补充单元用于对分割出的图像进行补充,所述图像重构单元用于将补充后的图像进行组合得到新的图像;
所述图像分割单元包括编码数据寄存器、特征识别处理器和分割执行处理器,所述编码数据寄存器中用于保存编码对应的特征信息,所述特征识别处理器用于从图像中识别出编码对应的区域,所述分割执行处理器根据区域信息从图像中裁剪得到分割图像;
所述特征识别处理器识别出区域的过程包括如下步骤:
S1、根据特征信息中的灰度值范围对图像中的像素点进行检索,保留处于灰度值范围内的像素点;
S2、根据像素点的连通性将保留的像素点分为多个区域,并删除像素点数量少于阈值的区域;
S3、将每个区域内的像素点数量基于灰度值进行统计,得到灰度数列{n(g)},g表示灰度值,n(g)为灰度值为g的像素点数量;
S4、将灰度数列根据下式进行归一化处理;
;
;
其中,[gmin,gmax]表示灰度范围,N为归一总量,i为用于表示灰度的临时变量;
S5、根据下式计算出每个区域的特征向量:
;
;
其中,为平均灰度,/>为灰度标准差;
S6、将每个区域的特征向量与特征信息中的特征向量进行比较,比较结果符合要求的区域作为识别出的区域,通过下式计算出偏差值:
;
其中,(x0,y0)为特征信息中的特征向量;
偏差值小于偏差阈值时,表示符合要求;
所述图像补充单元包括完整性检测处理器和像素生成处理器,所述完整性检测处理器用于对分割图像的完整性进行检测并补充区域,所述像素生成处理器用于在补充的区域中生成像素点;
所述像素生成处理器在补充区域中生成像素点的过程包括如下步骤:
S21、在补充区域中生成灰度值为原有区域灰度均值的像素点;
S22、获取原有区域的纹理特征;
S23、使用纹理特征对补充区域的像素点进行灰度调整;
S24、计算出整个图像区域的融合指数;
S25、不断重复步骤S23和步骤S24,直至最终得到的融合指数小于融合阈值。
实施例二:本实施例包含了实施例一中的全部内容,提供了一种基于AIGC的图像分割及重组系统,包括输入交互模块、智能文字模块和智能图像模块;
所述输入交互模块用于输入信息并显示图像处理器效果,所述智能文字模块用于对输入信息中的文字进行智能处理,所述智能图像模块用于对输入信息中的图像进行智能处理;
所述输入交互模块包括图像输入单元、文字编辑单元和结果显示单元,所述图像输入单元用于输入图像文件并对文件进行分类操作,所述文字编辑单元用于编辑对图像的处理内容,所述结果显示单元用于实时显示图像的处理结果;
结合图2,所述智能文字模块包括输入检测单元、需求切分单元和指令转换单元,所述输入检测单元用于检测输入交互模块中文字信息的输入状态并获取文字信息,所述需求切分单元用于将获取的文字信息切分成多个需求词条,所述指令转换单元将每个需求词条转换为指令信息发送给所述智能图像模块;
结合图3,所述智能图像模块包括指令执行单元、图像分割单元、图像补充单元和图像重构单元,所述指令执行单元用于接收并执行所述指令转换单元发送的指令信息,所述图像分割单元用于从原始图像中分割出需要的图像信息,所述图像补充单元用于对分割出的图像进行补充,所述图像重构单元用于将补充后的图像进行组合得到新的图像;
所述图像输入单元包括图像端口处理器、图像寄存器和分类处理器,所述图像端口处理器用于提供一个输入端口,并将输入端口与所述图像寄存器进行连接,所述图像寄存器用于存储输入的图像文件,所述分类处理器用于提供一个界面对存储的图像文件进行分类操作并对每个分类进行自定义命名作为分类名称;
所述输入检测单元包括状态检测处理器和文字传输处理器,所述状态检测处理器用于检测所述文字编辑单元的输入状态,所述文字传输处理器用于获取所述文字编辑单元中的文字信息并传输给所述需求切分单元;
所述需求切分单元包括分类命名寄存器和词条切分处理器,所述分类命名寄存器用于接收所述分类处理器中的自定义命名信息,所述词条切分处理器根据分类名称对文字信息进行切分,使得切分后得到的需求词条中包含不同的分类名称;
所述指令转换单元包括关键词提取单元、指令编码寄存器和指令生成处理器,所述关键词提取单元用于从需求词条中提取出关键词信息,所述指令编码寄存器用于保存关键词以及对应的编码信息,所述指令生成处理器将分类名称和编码信息组合得到指令信息;
所述指令执行单元在接收到指令信息后,根据指令信息中的分类名称从所述图像寄存器中获取对应的图像,然后将获取的图像和对应的编码信息发送给所述图像分割单元;
结合图4,所述图像分割单元包括编码数据寄存器、特征识别处理器和分割执行处理器,所述编码数据寄存器中用于保存编码对应的特征信息,所述特征识别处理器用于从图像中识别出编码对应的区域,所述分割执行处理器根据区域信息从图像中裁剪得到分割图像;
结合图5,所述图像补充单元包括完整性检测处理器和像素生成处理器,所述完整性检测处理器用于对分割图像的完整性进行检测并补充区域,所述像素生成处理器用于在补充的区域中生成像素点;
经过补充后具有完整性的分割图像称为单元图像;
所述图像重构单元包括图层分析处理器和图像叠加处理器,所述图层分析处理器用于对单元图像的图层位置进行分析,所述图像叠加处理器用于将单元图像根据图层位置进行叠加处理;
所述特征识别处理器识别出区域的过程包括如下步骤:
S1、根据特征信息中的灰度值范围对图像中的像素点进行检索,保留处于灰度值范围内的像素点;
S2、根据像素点的连通性将保留的像素点分为多个区域,并删除像素点数量少于阈值的区域;
S3、将每个区域内的像素点数量基于灰度值进行统计,得到灰度数列{n(g)},g表示灰度值,n(g)为灰度值为g的像素点数量;
S4、将灰度数列根据下式进行归一化处理;
;
;
其中,[gmin,gmax]表示灰度范围,N为归一总量,i为用于表示灰度的临时变量;
S5、根据下式计算出每个区域的特征向量:
;
;
其中,为平均灰度,/>为灰度标准差;
S6、将每个区域的特征向量与特征信息中的特征向量进行比较,比较结果符合要求的区域作为识别出的区域,通过下式计算出偏差值:
;
其中,(x0,y0)为特征信息中的特征向量;
偏差值小于偏差阈值时,表示符合要求;
所述完整性检测处理器获取识别出的区域边缘信息,并与边缘库中对应编码的边缘信息比较,从边缘库中筛选出最贴近的边缘信息并进行补全,将边缘信息补全后的图像区域发送给所述像素生成处理器;
所述像素生成处理器在补充区域中生成像素点的过程包括如下步骤:
S21、在补充区域中生成灰度值为原有区域灰度均值的像素点;
S22、获取原有区域的纹理特征;
S23、使用纹理特征对补充区域的像素点进行灰度调整;
S24、计算出整个图像区域的融合指数;
S25、不断重复步骤S23和步骤S24,直至最终得到的融合指数小于融合阈值;
所述纹理特征包括纹理长度和纹理间隔,通过纹理特征在补充区域中确定需要进行灰度调整的目标区域,并对目标区域内的像素点灰度值进行小幅随机调整;
所述融合指数P根据下式计算得到:
;
其中, 12为原有区域与整体区域的特征向量偏差值,/> 13为补充区域与整体区域的特征向量偏差值,/> 23为补充区域与原有区域的特征向量偏差值。
以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的保护范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的保护范围内,此外,随着技术发展其中的元素可以更新的。
Claims (3)
1.一种基于AIGC的图像分割及重组系统,其特征在于,包括输入交互模块、智能文字模块和智能图像模块;
所述输入交互模块用于输入信息并显示图像处理器效果,所述智能文字模块用于对输入信息中的文字进行智能处理,所述智能图像模块用于对输入信息中的图像进行智能处理;
所述输入交互模块包括图像输入单元、文字编辑单元和结果显示单元,所述图像输入单元用于输入图像文件并对文件进行分类操作,所述文字编辑单元用于编辑对图像的处理内容,所述结果显示单元用于实时显示图像的处理结果;
所述智能文字模块包括输入检测单元、需求切分单元和指令转换单元,所述输入检测单元用于检测输入交互模块中文字信息的输入状态并获取文字信息,所述需求切分单元用于将获取的文字信息切分成多个需求词条,所述指令转换单元将每个需求词条转换为指令信息发送给所述智能图像模块;
所述智能图像模块包括指令执行单元、图像分割单元、图像补充单元和图像重构单元,所述指令执行单元用于接收并执行所述指令转换单元发送的指令信息,所述图像分割单元用于从原始图像中分割出需要的图像信息,所述图像补充单元用于对分割出的图像进行补充,所述图像重构单元用于将补充后的图像进行组合得到新的图像;
所述图像分割单元包括编码数据寄存器、特征识别处理器和分割执行处理器,所述编码数据寄存器中用于保存编码对应的特征信息,所述特征识别处理器用于从图像中识别出编码对应的区域,所述分割执行处理器根据区域信息从图像中裁剪得到分割图像;
所述特征识别处理器识别出区域的过程包括如下步骤:
S1、根据特征信息中的灰度值范围对图像中的像素点进行检索,保留处于灰度值范围内的像素点;
S2、根据像素点的连通性将保留的像素点分为多个区域,并删除像素点数量少于阈值的区域;
S3、将每个区域内的像素点数量基于灰度值进行统计,得到灰度数列{n(g)},g表示灰度值,n(g)为灰度值为g的像素点数量;
S4、将灰度数列根据下式进行归一化处理;
;
;
其中,[gmin,gmax]表示灰度范围,N为归一总量,i为用于表示灰度的临时变量;
S5、根据下式计算出每个区域的特征向量:
;
;
其中,为平均灰度,/>为灰度标准差;
S6、将每个区域的特征向量与特征信息中的特征向量进行比较,比较结果符合要求的区域作为识别出的区域,通过下式计算出偏差值:
;
其中,(x0,y0)为特征信息中的特征向量;
偏差值小于偏差阈值时,表示符合要求。
2.如权利要求1所述的一种基于AIGC的图像分割及重组系统,其特征在于,所述图像补充单元包括完整性检测处理器和像素生成处理器,所述完整性检测处理器用于对分割图像的完整性进行检测并补充区域,所述像素生成处理器用于在补充的区域中生成像素点。
3.如权利要求2所述的一种基于AIGC的图像分割及重组系统,其特征在于,所述像素生成处理器在补充区域中生成像素点的过程包括如下步骤:
S21、在补充区域中生成灰度值为原有区域灰度均值的像素点;
S22、获取原有区域的纹理特征;
S23、使用纹理特征对补充区域的像素点进行灰度调整;
S24、计算出整个图像区域的融合指数;
S25、不断重复步骤S23和步骤S24,直至最终得到的融合指数小于融合阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311812185.1A CN117475443B (zh) | 2023-12-27 | 2023-12-27 | 一种基于aigc的图像分割及重组系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311812185.1A CN117475443B (zh) | 2023-12-27 | 2023-12-27 | 一种基于aigc的图像分割及重组系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117475443A CN117475443A (zh) | 2024-01-30 |
CN117475443B true CN117475443B (zh) | 2024-03-05 |
Family
ID=89633289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311812185.1A Active CN117475443B (zh) | 2023-12-27 | 2023-12-27 | 一种基于aigc的图像分割及重组系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117475443B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993153A (zh) * | 2019-04-18 | 2019-07-09 | 江苏曲速教育科技有限公司 | 一种基于边缘计算的人工智能阅卷系统 |
CN110580478A (zh) * | 2018-06-11 | 2019-12-17 | 通用汽车环球科技运作有限责任公司 | 基于用于ocr应用的深度强化学习的扫描图像的主动分割 |
CN111507256A (zh) * | 2020-04-16 | 2020-08-07 | 四川博源科技有限责任公司 | 一种用于柜台信息采集的人脸识别系统 |
CN116704523A (zh) * | 2023-08-07 | 2023-09-05 | 山东成信彩印有限公司 | 一种用于出版印刷设备的文字排版图像识别系统 |
-
2023
- 2023-12-27 CN CN202311812185.1A patent/CN117475443B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580478A (zh) * | 2018-06-11 | 2019-12-17 | 通用汽车环球科技运作有限责任公司 | 基于用于ocr应用的深度强化学习的扫描图像的主动分割 |
CN109993153A (zh) * | 2019-04-18 | 2019-07-09 | 江苏曲速教育科技有限公司 | 一种基于边缘计算的人工智能阅卷系统 |
CN111507256A (zh) * | 2020-04-16 | 2020-08-07 | 四川博源科技有限责任公司 | 一种用于柜台信息采集的人脸识别系统 |
CN116704523A (zh) * | 2023-08-07 | 2023-09-05 | 山东成信彩印有限公司 | 一种用于出版印刷设备的文字排版图像识别系统 |
Non-Patent Citations (1)
Title |
---|
方润 ; 王歌 ; 陈欣欣 ; 史元凯 ; 朱文强 ; 苏文同 ; .基于图像识别的文字快速录入系统.电子制作.2015,(09),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117475443A (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US20040101203A1 (en) | System and method for coding data | |
CN113408471B (zh) | 一种基于多任务深度学习的无绿幕人像实时抠图算法 | |
KR100390866B1 (ko) | 컬러 영상 처리 방법 및 그 장치 | |
CN110866529A (zh) | 字符识别方法、装置、电子设备及存储介质 | |
CN106503112B (zh) | 视频检索方法和装置 | |
Sasirekha et al. | Enhanced techniques for PDF image segmentation and text extraction | |
CN113971735A (zh) | 一种深度图像聚类方法、系统、设备、介质及终端 | |
CN114625918A (zh) | 视频推荐方法、装置、设备、存储介质及程序产品 | |
CN117475443B (zh) | 一种基于aigc的图像分割及重组系统 | |
CN111614996B (zh) | 一种视频修复方法和系统 | |
CN110490210B (zh) | 一种基于紧致通道间t采样差分的彩色纹理分类方法 | |
CN117173730A (zh) | 一种基于多模态信息的文档图像智能分析及处理方法 | |
CN111212322A (zh) | 一种基于多视频去重拼接的视频压缩方法 | |
CN115601752A (zh) | 文字识别方法、装置、电子设备及介质 | |
US20230342986A1 (en) | Autoencoder-based segmentation mask generation in an alpha channel | |
CN114820987A (zh) | 一种基于多视角图像序列的三维重建方法及系统 | |
CN114067101A (zh) | 一种基于信息互补的双流解码器的图像显著性检测方法 | |
CN114066790A (zh) | 图像生成模型的训练方法、图像生成方法、装置和设备 | |
CN112836510A (zh) | 一种产品图片文字识别方法和系统 | |
Zheng et al. | A Novel Semantic Segmentation Algorithm for RGB-D Images Based on Non-Symmetry and Anti-Packing Pattern Representation Model | |
Ramya et al. | XML based approach for object oriented medical video retrieval using neural networks | |
CN116189193B (zh) | 一种基于样本信息的数据存储可视化方法和装置 | |
CN117371533B (zh) | 一种生成数据标签规则的方法及装置 | |
Osina et al. | Text detection algorithm on real scenes images and videos on the base of discrete cosine transform and convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |