KR20210113192A - 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체 - Google Patents

이미지 처리 방법 및 장치, 전자 기기 및 기억 매체 Download PDF

Info

Publication number
KR20210113192A
KR20210113192A KR1020217020203A KR20217020203A KR20210113192A KR 20210113192 A KR20210113192 A KR 20210113192A KR 1020217020203 A KR1020217020203 A KR 1020217020203A KR 20217020203 A KR20217020203 A KR 20217020203A KR 20210113192 A KR20210113192 A KR 20210113192A
Authority
KR
South Korea
Prior art keywords
feature
text
target
extracted
determining
Prior art date
Application number
KR1020217020203A
Other languages
English (en)
Korean (ko)
Inventor
홍빈 선
시아오유 유에
장후이 쿠앙
첸하오 린
웨이 장
Original Assignee
선전 센스타임 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 선전 센스타임 테크놀로지 컴퍼니 리미티드 filed Critical 선전 센스타임 테크놀로지 컴퍼니 리미티드
Publication of KR20210113192A publication Critical patent/KR20210113192A/ko

Links

Images

Classifications

    • G06K9/6267
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • G06K9/3233
    • G06K9/4671
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
KR1020217020203A 2019-12-27 2020-02-28 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체 KR20210113192A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911387827.1A CN111191715A (zh) 2019-12-27 2019-12-27 图像处理方法及装置、电子设备和存储介质
CN201911387827.1 2019-12-27
PCT/CN2020/077247 WO2021128578A1 (zh) 2019-12-27 2020-02-28 图像处理方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
KR20210113192A true KR20210113192A (ko) 2021-09-15

Family

ID=70707802

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217020203A KR20210113192A (ko) 2019-12-27 2020-02-28 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체

Country Status (5)

Country Link
JP (1) JP7097513B2 (zh)
KR (1) KR20210113192A (zh)
CN (1) CN111191715A (zh)
TW (1) TWI736230B (zh)
WO (1) WO2021128578A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102485944B1 (ko) 2021-11-19 2023-01-10 주식회사 스탠다임 트랜스포머 신경망에서의 그래프 인코딩 방법

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801099B (zh) * 2020-06-02 2024-05-24 腾讯科技(深圳)有限公司 一种图像处理方法、装置、终端设备及介质
CN111695517B (zh) * 2020-06-12 2023-08-18 北京百度网讯科技有限公司 图像的表格提取方法、装置、电子设备及存储介质
CN112069877B (zh) * 2020-07-21 2022-05-03 北京大学 一种基于边缘信息和注意力机制的人脸信息识别方法
CN112016438B (zh) * 2020-08-26 2021-08-10 北京嘀嘀无限科技发展有限公司 一种基于图神经网络识别证件的方法及系统
CN112784720A (zh) * 2021-01-13 2021-05-11 浙江诺诺网络科技有限公司 基于银行回单的关键信息提取方法、装置、设备及介质
CN113506322B (zh) * 2021-07-15 2024-04-12 清华大学 图像处理方法及装置、电子设备和存储介质
CN113688686B (zh) * 2021-07-26 2023-10-27 厦门大学 基于图卷积神经网络的虚拟现实视频质量评价方法
CN113592817A (zh) * 2021-07-30 2021-11-02 深圳市商汤科技有限公司 检测呼吸率的方法、装置、存储介质及电子设备
CN113705559B (zh) * 2021-08-31 2024-05-10 平安银行股份有限公司 基于人工智能的文字识别方法及装置、电子设备
CN113807369B (zh) * 2021-09-26 2024-09-17 北京市商汤科技开发有限公司 目标重识别方法及装置、电子设备和存储介质
CN114037985A (zh) * 2021-11-04 2022-02-11 北京有竹居网络技术有限公司 信息提取方法、装置、设备、介质及产品
CN114283403B (zh) * 2021-12-24 2024-01-16 北京有竹居网络技术有限公司 一种图像检测方法、装置、存储介质及设备
CN114708961A (zh) * 2022-03-18 2022-07-05 北京理工大学珠海学院 个人生理和心理特性类别测评装置及方法
CN114724133B (zh) * 2022-04-18 2024-02-02 北京百度网讯科技有限公司 文字检测和模型训练方法、装置、设备及存储介质
CN114511864B (zh) * 2022-04-19 2023-01-13 腾讯科技(深圳)有限公司 文本信息提取方法、目标模型的获取方法、装置及设备
CN114863245B (zh) * 2022-05-26 2024-06-04 中国平安人寿保险股份有限公司 图像处理模型的训练方法和装置、电子设备及介质
CN116383428B (zh) * 2023-03-31 2024-04-05 北京百度网讯科技有限公司 一种图文编码器训练方法、图文匹配方法及装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132639A (ja) 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 文字抽出認識方法及び装置及びこの方法を記録した記録媒体
US7756871B2 (en) * 2004-10-13 2010-07-13 Hewlett-Packard Development Company, L.P. Article extraction
CN101894123A (zh) * 2010-05-11 2010-11-24 清华大学 基于子图的链接相似度的快速近似计算系统和方法
US9245191B2 (en) * 2013-09-05 2016-01-26 Ebay, Inc. System and method for scene text recognition
CN105786980B (zh) * 2016-02-14 2019-12-20 广州神马移动信息科技有限公司 对描述同一实体的不同实例进行合并的方法、装置及设备
CN107679153A (zh) * 2017-09-27 2018-02-09 国家电网公司信息通信分公司 一种专利分类方法及装置
JP7068570B2 (ja) 2017-12-11 2022-05-17 富士通株式会社 生成プログラム、情報処理装置及び生成方法
JP6928876B2 (ja) 2017-12-15 2021-09-01 京セラドキュメントソリューションズ株式会社 フォーム種別学習システムおよび画像処理装置
CN109977723B (zh) * 2017-12-22 2021-10-22 苏宁云商集团股份有限公司 大票据图片文字识别方法
CN108549850B (zh) * 2018-03-27 2021-07-16 联想(北京)有限公司 一种图像识别方法及电子设备
JP7063080B2 (ja) 2018-04-20 2022-05-09 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
CN109086756B (zh) * 2018-06-15 2021-08-03 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN110619325B (zh) * 2018-06-20 2024-03-08 北京搜狗科技发展有限公司 一种文本识别方法及装置
CN108921166A (zh) * 2018-06-22 2018-11-30 深源恒际科技有限公司 基于深度神经网络的医疗票据类文本检测识别方法及系统
CN109308476B (zh) * 2018-09-06 2019-08-27 邬国锐 票据信息处理方法、系统及计算机可读存储介质
WO2020113437A1 (zh) * 2018-12-04 2020-06-11 区链通网络有限公司 图结构处理方法、系统、网络设备及存储介质
CN109919014B (zh) * 2019-01-28 2023-11-03 平安科技(深圳)有限公司 Ocr识别方法及其电子设备
CN110033000B (zh) * 2019-03-21 2021-05-18 华中科技大学 一种票据图像的文本检测与识别方法
CN110276396B (zh) * 2019-06-21 2022-12-06 西安电子科技大学 基于物体显著性和跨模态融合特征的图片描述生成方法
CN110598759A (zh) * 2019-08-23 2019-12-20 天津大学 一种基于多模态融合的生成对抗网络的零样本分类方法
CN110569846A (zh) * 2019-09-16 2019-12-13 北京百度网讯科技有限公司 图像文字识别方法、装置、设备及存储介质
CN110610166B (zh) * 2019-09-18 2022-06-07 北京猎户星空科技有限公司 文本区域检测模型训练方法、装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102485944B1 (ko) 2021-11-19 2023-01-10 주식회사 스탠다임 트랜스포머 신경망에서의 그래프 인코딩 방법

Also Published As

Publication number Publication date
JP7097513B2 (ja) 2022-07-07
TW202125307A (zh) 2021-07-01
TWI736230B (zh) 2021-08-11
CN111191715A (zh) 2020-05-22
WO2021128578A1 (zh) 2021-07-01
JP2022518889A (ja) 2022-03-17

Similar Documents

Publication Publication Date Title
KR20210113192A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체
TWI728621B (zh) 圖像處理方法及其裝置、電子設備、電腦可讀儲存媒體和電腦程式
TWI749423B (zh) 圖像處理方法及裝置、電子設備和電腦可讀儲存介質
TWI724736B (zh) 圖像處理方法及裝置、電子設備、儲存媒體和電腦程式
KR102421820B1 (ko) 키포인트 검출 방법, 장치, 전자 기기 및 기억 매체
TWI747325B (zh) 目標對象匹配方法及目標對象匹配裝置、電子設備和電腦可讀儲存媒介
KR20210102180A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체
WO2021208667A1 (zh) 图像处理方法及装置、电子设备和存储介质
KR20200139229A (ko) 위치 자세 추정 방법, 장치, 전자 기기 및 기억 매체
KR102454515B1 (ko) 네트워크 최적화 방법 및 장치, 이미지 처리 방법 및 장치, 및 기억 매체
CN110532956B (zh) 图像处理方法及装置、电子设备和存储介质
CN109615006B (zh) 文字识别方法及装置、电子设备和存储介质
CN110569835B (zh) 一种图像识别方法、装置和电子设备
US12008167B2 (en) Action recognition method and device for target object, and electronic apparatus
CN115641518B (zh) 一种无人机用视图感知网络模型及目标检测方法
KR20160048708A (ko) 통신 메시지 인식 방법, 장치, 프로그램 및 저장매체
CN111259967A (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
JP2022533065A (ja) 文字認識方法及び装置、電子機器並びに記憶媒体
CN113486957B (zh) 神经网络训练和图像处理方法及装置
KR20210113242A (ko) 검출기의 배치 방법 및 장치, 전자 기기 및 기억 매체
CN111523599B (zh) 目标检测方法及装置、电子设备和存储介质
CN113283343A (zh) 人群定位方法及装置、电子设备和存储介质
CN110070046B (zh) 人脸图像识别方法及装置、电子设备和存储介质
CN113537350B (zh) 图像处理方法及装置、电子设备和存储介质
CN111178115A (zh) 对象识别网络的训练方法及系统

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application