JP7066007B2 - テキスト認識 - Google Patents
テキスト認識 Download PDFInfo
- Publication number
- JP7066007B2 JP7066007B2 JP2020560179A JP2020560179A JP7066007B2 JP 7066007 B2 JP7066007 B2 JP 7066007B2 JP 2020560179 A JP2020560179 A JP 2020560179A JP 2020560179 A JP2020560179 A JP 2020560179A JP 7066007 B2 JP7066007 B2 JP 7066007B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- network
- feature
- text image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18038—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
- G06V30/18048—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters with interaction between the responses of different filters, e.g. cortical complex cells
- G06V30/18057—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Databases & Information Systems (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得るステップS11と、
前記特徴情報に基づいて、前記テキスト画像のテキスト認識結果を取得するステップS12とを含み、
ここで、前記テキスト画像に少なくとも2つの文字が含まれ、前記特徴情報にテキスト関連特徴が含まれ、前記テキスト関連特徴は、前記テキスト画像内の文字同士間の関連性を表すためのものである。
前記テキスト画像に対してダウンサンプリング処理を行い、ダウンサンプリング結果を得ることと、
前記ダウンサンプリング結果に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることとを含む。
前記テキスト関連特徴と前記特徴情報に含まれるテキスト構造特徴とに対してフュージョン処理を行い、フュージョン特徴を得ることと、
前記フュージョン特徴に基づいて、前記テキスト画像のテキスト認識結果を取得することと、を含む。
テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得るように構成される特徴抽出モジュール41と、前記特徴情報に基づいて、前記テキスト画像のテキスト認識結果を取得するように構成される結果取得モジュール42とを備え、ここで、前記テキスト画像に少なくとも2つの文字が含まれ、前記特徴情報にテキスト関連特徴が含まれ、前記テキスト関連特徴は、前記テキスト画像内の文字同士間の関連性を表すためのものである。
Claims (13)
- テキスト認識方法であって、前記テキスト認識方法は、ニューラルネットワークにより実現され、
前記ニューラルネットワークによって、テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることであって、前記ニューラルネットワークにおける符号化ネットワークは複数のネットワークブロックを含み、各ネットワークブロックは、畳み込みカーネルのサイズがP×Qである少なくとも1つの第1畳み込み層を含み、P、Qは整数であり、且つQ>P≧1である、ことと、
前記特徴情報に基づいて、前記テキスト画像のテキスト認識結果を取得することと、を含み、
ここで、前記テキスト画像に少なくとも2つの文字が含まれ、前記特徴情報にテキスト関連特徴が含まれ、前記テキスト関連特徴は、前記テキスト画像内の文字同士間の関連性を表すためのものであり、
前記ニューラルネットワークによって、テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることは、
前記少なくとも1つの第1畳み込み層により、前記テキスト画像に対して特徴抽出処理を行い、前記テキスト画像のテキスト関連特徴を得ることを含むことを特徴とする
テキスト認識方法。 - 前記ニューラルネットワークにおける各ネットワークブロックは、畳み込みカーネルのサイズがN×Nである少なくとも1つの第2畳み込み層を更に含み、Nは1を超える整数であり、前記特徴情報にテキスト構造特徴が更に含まれ、
前記ニューラルネットワークによって、テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることは、
前記少なくとも1つの第2畳み込み層により、前記テキスト画像に対して特徴抽出処理を行い、前記テキスト画像のテキスト構造特徴を得ることを含むことを特徴とする
請求項1に記載の方法。 - 前記特徴情報に基づいて、前記テキスト画像のテキスト認識結果を取得することは、
前記テキスト関連特徴と前記特徴情報に含まれるテキスト構造特徴とに対してフュージョン処理を行い、フュージョン特徴を得ることと、
前記フュージョン特徴に基づいて、前記テキスト画像のテキスト認識結果を取得することと、を含むことを特徴とする
請求項1又は2に記載の方法。 - 前記第1畳み込み層及び前記第2畳み込み層の入力端は、それぞれ前記ネットワークブロックの入力端に接続されることを特徴とする
請求項1-3のいずれか一項に記載の方法。 - 前記方法は、ニューラルネットワークにより実現され、前記ニューラルネットワークにおける符号化ネットワークは複数のネットワークブロックを含み、
前記テキスト関連特徴と前記テキスト構造特徴とに対してフュージョン処理を行い、フュージョン特徴を得ることは、
前記複数のネットワークブロックのうちの第1ネットワークブロックの第1畳み込み層から出力されたテキスト関連特徴を、前記第1ネットワークブロックの第2畳み込み層から出力されたテキスト構造特徴とフュージョンし、前記第1ネットワークブロックのフュージョン特徴を得ることを含み、
前記フュージョン特徴に基づいて、前記テキスト画像のテキスト認識結果を取得することは、
前記第1ネットワークブロックのフュージョン特徴と前記第1ネットワークブロックの入力情報とに対して残差処理を行い、前記第1ネットワークブロックの出力情報を得ることと、
前記第1ネットワークブロックの出力情報に基づいて、前記テキスト認識結果を得ることと、を含むことを特徴とする
請求項3に記載の方法。 - 前記ニューラルネットワークにおける符号化ネットワークは、ダウンサンプリングネットワークと、前記ダウンサンプリングネットワークの出力端に接続される多階層の特徴抽出ネットワークとを含み、ここで、各階層の特徴抽出ネットワークは、少なくとも1つの前記ネットワークブロックと、前記少なくとも1つのネットワークブロックの出力端に接続されるダウンサンプリングモジュールとを含むことを特徴とする
請求項4又は5に記載の方法。 - 前記ニューラルネットワークは、畳み込みニューラルネットワークであることを特徴とする
請求項4-6のいずれか一項に記載の方法。 - テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることは、
前記テキスト画像に対してダウンサンプリング処理を行い、ダウンサンプリング結果を得ることと、
前記ダウンサンプリング結果に対して特徴抽出を行い、前記テキスト画像の特徴情報を得ることと、を含むことを特徴とする
請求項1-7のいずれか一項に記載の方法。 - テキスト認識装置であって、前記テキスト認識装置は、ニューラルネットワークにより実現され、
前記ニューラルネットワークによって、テキスト画像に対して特徴抽出を行い、前記テキスト画像の特徴情報を得るように構成される特徴抽出モジュールであって、前記ニューラルネットワークにおける符号化ネットワークは複数のネットワークブロックを含み、各ネットワークブロックは、畳み込みカーネルのサイズがP×Qである少なくとも1つの第1畳み込み層を含み、P、Qは整数であり、且つQ>P≧1である、特徴抽出モジュールと、
前記特徴情報に基づいて、前記テキスト画像のテキスト認識結果を取得するように構成される結果取得モジュールと、を備え、
ここで、前記テキスト画像に少なくとも2つの文字が含まれ、前記特徴情報にテキスト関連特徴が含まれ、前記テキスト関連特徴は、前記テキスト画像内の文字同士間の関連性を表すためのものであり、
前記特徴抽出モジュールは、
前記少なくとも1つの第1畳み込み層により、前記テキスト画像に対して特徴抽出処理を行い、前記テキスト画像のテキスト関連特徴を得るように構成される第1抽出サブモジュールを備えることを特徴とする
テキスト認識装置。 - 前記ニューラルネットワークにおける各ネットワークブロックは、畳み込みカーネルのサイズがN×Nである少なくとも1つの第2畳み込み層を更に含み、Nは1を超える整数であり、前記特徴情報にテキスト構造特徴が更に含まれ、
前記特徴抽出モジュールは、
前記少なくとも1つの第2畳み込み層により、前記テキスト画像に対して特徴抽出処理を行い、前記テキスト画像のテキスト構造特徴を得るように構成される第2抽出サブモジュールを更に備えることを特徴とする
請求項9に記載の装置。 - 前記結果取得モジュールは、
前記テキスト関連特徴と前記特徴情報に含まれるテキスト構造特徴とに対してフュージョン処理を行い、フュージョン特徴を得るように構成されるフュージョンサブモジュールと、
前記フュージョン特徴に基づいて、前記テキスト画像のテキスト認識結果を取得するように構成される結果取得サブモジュールと、を備えることを特徴とする
請求項9又は10に記載の装置。 - 電子機器であって、
プロセッサと、
プロセッサでの実行可能な命令を記憶するための記憶媒体とを備え、
前記プロセッサは、前記記憶媒体に記憶されている命令を呼び出し、請求項1から8のいずれか一項に記載の方法を実行するように構成されることを特徴とする、前記電子機器。 - 機器での実行可能な命令が記憶されている機器可読記憶媒体であって、前記機器での実行可能な命令がプロセッサにより実行される時、請求項1から8のいずれか一項に記載の方法を実現させることを特徴とする、前記機器可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910267233.0A CN111783756B (zh) | 2019-04-03 | 2019-04-03 | 文本识别方法及装置、电子设备和存储介质 |
CN201910267233.0 | 2019-04-03 | ||
PCT/CN2020/070568 WO2020199704A1 (zh) | 2019-04-03 | 2020-01-07 | 文本识别 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021520561A JP2021520561A (ja) | 2021-08-19 |
JP7066007B2 true JP7066007B2 (ja) | 2022-05-12 |
Family
ID=72664897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020560179A Active JP7066007B2 (ja) | 2019-04-03 | 2020-01-07 | テキスト認識 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210042567A1 (ja) |
JP (1) | JP7066007B2 (ja) |
CN (1) | CN111783756B (ja) |
SG (1) | SG11202010525PA (ja) |
TW (1) | TWI771645B (ja) |
WO (1) | WO2020199704A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111871B (zh) * | 2021-04-21 | 2024-04-19 | 北京金山数字娱乐科技有限公司 | 文本识别模型的训练方法及装置、文本识别方法及装置 |
CN113011132B (zh) * | 2021-04-22 | 2023-07-21 | 中国平安人寿保险股份有限公司 | 竖排文字识别方法、装置、计算机设备和存储介质 |
CN113052162B (zh) * | 2021-05-27 | 2021-09-03 | 北京世纪好未来教育科技有限公司 | 一种文本识别方法、装置、可读存储介质及计算设备 |
CN113392825B (zh) * | 2021-06-16 | 2024-04-30 | 中国科学技术大学 | 文本识别方法、装置、设备及存储介质 |
CN113269279B (zh) * | 2021-07-16 | 2021-10-15 | 腾讯科技(深圳)有限公司 | 一种多媒体内容分类方法和相关装置 |
CN113344014B (zh) * | 2021-08-03 | 2022-03-08 | 北京世纪好未来教育科技有限公司 | 文本识别方法和装置 |
CN114495938B (zh) * | 2021-12-04 | 2024-03-08 | 腾讯科技(深圳)有限公司 | 音频识别方法、装置、计算机设备及存储介质 |
CN114241467A (zh) * | 2021-12-21 | 2022-03-25 | 北京有竹居网络技术有限公司 | 一种文本识别方法及其相关设备 |
CN114550156A (zh) * | 2022-02-18 | 2022-05-27 | 支付宝(杭州)信息技术有限公司 | 图像处理方法及装置 |
CN115953771A (zh) * | 2023-01-03 | 2023-04-11 | 北京百度网讯科技有限公司 | 文本图像处理方法、装置、设备和介质 |
CN116597163A (zh) * | 2023-05-18 | 2023-08-15 | 广东省旭晟半导体股份有限公司 | 红外光学透镜及其制备方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225112A (ja) | 2009-03-25 | 2010-10-07 | Toppan Printing Co Ltd | データ生成装置およびデータ生成方法 |
JP2012093876A (ja) | 2010-10-26 | 2012-05-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2015169963A (ja) | 2014-03-04 | 2015-09-28 | 株式会社東芝 | オブジェクト検出システム、およびオブジェクト検出方法 |
CN105930842A (zh) | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
CN108764226A (zh) | 2018-04-13 | 2018-11-06 | 顺丰科技有限公司 | 图像文本识别方法、装置、设备及其存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7010166B2 (en) * | 2000-11-22 | 2006-03-07 | Lockheed Martin Corporation | Character recognition system and method using spatial and structural feature extraction |
US20140307973A1 (en) * | 2013-04-10 | 2014-10-16 | Adobe Systems Incorporated | Text Recognition Techniques |
US20140363082A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Integrating stroke-distribution information into spatial feature extraction for automatic handwriting recognition |
CN105335754A (zh) * | 2015-10-29 | 2016-02-17 | 小米科技有限责任公司 | 文字识别方法及装置 |
DE102016010910A1 (de) * | 2015-11-11 | 2017-05-11 | Adobe Systems Incorporated | Strukturiertes Modellieren und Extrahieren von Wissen aus Bildern |
CN106570521B (zh) * | 2016-10-24 | 2020-04-28 | 中国科学院自动化研究所 | 多语言场景字符识别方法及识别系统 |
CN106650721B (zh) * | 2016-12-28 | 2019-08-13 | 吴晓军 | 一种基于卷积神经网络的工业字符识别方法 |
CN109213990A (zh) * | 2017-07-05 | 2019-01-15 | 菜鸟智能物流控股有限公司 | 一种特征提取方法、装置和服务器 |
CN107688808B (zh) * | 2017-08-07 | 2021-07-06 | 电子科技大学 | 一种快速的自然场景文本检测方法 |
CN107688784A (zh) * | 2017-08-23 | 2018-02-13 | 福建六壬网安股份有限公司 | 一种基于深层特征和浅层特征融合的字符识别方法及存储介质 |
CN108304761A (zh) * | 2017-09-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、存储介质和计算机设备 |
CN107679533A (zh) * | 2017-09-27 | 2018-02-09 | 北京小米移动软件有限公司 | 文字识别方法及装置 |
CN108229299B (zh) * | 2017-10-31 | 2021-02-26 | 北京市商汤科技开发有限公司 | 证件的识别方法和装置、电子设备、计算机存储介质 |
CN108710826A (zh) * | 2018-04-13 | 2018-10-26 | 燕山大学 | 一种交通标志深度学习模式识别方法 |
CN109635810B (zh) * | 2018-11-07 | 2020-03-13 | 北京三快在线科技有限公司 | 一种确定文本信息的方法、装置、设备及存储介质 |
CN109299274B (zh) * | 2018-11-07 | 2021-12-17 | 南京大学 | 一种基于全卷积神经网络的自然场景文本检测方法 |
CN109543690B (zh) * | 2018-11-27 | 2020-04-07 | 北京百度网讯科技有限公司 | 用于提取信息的方法和装置 |
CN114693905A (zh) * | 2020-12-28 | 2022-07-01 | 北京搜狗科技发展有限公司 | 文本识别模型构建方法、文本识别方法以及装置 |
CN115187456A (zh) * | 2022-06-17 | 2022-10-14 | 平安银行股份有限公司 | 基于图像强化处理的文本识别方法、装置、设备及介质 |
-
2019
- 2019-04-03 CN CN201910267233.0A patent/CN111783756B/zh active Active
-
2020
- 2020-01-07 WO PCT/CN2020/070568 patent/WO2020199704A1/zh active Application Filing
- 2020-01-07 JP JP2020560179A patent/JP7066007B2/ja active Active
- 2020-01-07 SG SG11202010525PA patent/SG11202010525PA/en unknown
- 2020-01-21 TW TW109102097A patent/TWI771645B/zh active
- 2020-10-23 US US17/078,553 patent/US20210042567A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225112A (ja) | 2009-03-25 | 2010-10-07 | Toppan Printing Co Ltd | データ生成装置およびデータ生成方法 |
JP2012093876A (ja) | 2010-10-26 | 2012-05-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2015169963A (ja) | 2014-03-04 | 2015-09-28 | 株式会社東芝 | オブジェクト検出システム、およびオブジェクト検出方法 |
CN105930842A (zh) | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
CN108764226A (zh) | 2018-04-13 | 2018-11-06 | 顺丰科技有限公司 | 图像文本识别方法、装置、设备及其存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TW202038183A (zh) | 2020-10-16 |
JP2021520561A (ja) | 2021-08-19 |
WO2020199704A1 (zh) | 2020-10-08 |
SG11202010525PA (en) | 2020-11-27 |
CN111783756A (zh) | 2020-10-16 |
CN111783756B (zh) | 2024-04-16 |
US20210042567A1 (en) | 2021-02-11 |
TWI771645B (zh) | 2022-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7066007B2 (ja) | テキスト認識 | |
JP7262659B2 (ja) | 目標対象物マッチング方法及び装置、電子機器並びに記憶媒体 | |
JP7153088B2 (ja) | テキスト認識方法及びテキスト認識装置、電子機器、記憶媒体並びにコンピュータプログラム | |
US20210097297A1 (en) | Image processing method, electronic device and storage medium | |
JP7123255B2 (ja) | テキストシーケンス認識方法及びその装置、電子機器並びに記憶媒体 | |
JP6944051B2 (ja) | キーポイント検出方法及び装置、電子機器並びに記憶媒体 | |
JP6916970B2 (ja) | ビデオ処理方法及び装置、電子機器並びに記憶媒体 | |
JP6968270B2 (ja) | 画像の記述文位置決定方法及び装置、電子機器並びに記憶媒体 | |
US20210019562A1 (en) | Image processing method and apparatus and storage medium | |
JP7110412B2 (ja) | 生体検出方法及び装置、電子機器並びに記憶媒体 | |
KR20210019537A (ko) | 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체 | |
KR20190129826A (ko) | 생체 검측 방법 및 장치, 시스템, 전자 기기, 저장 매체 | |
CN109934275B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
KR20210058887A (ko) | 이미지 처리 방법 및 장치, 전자 기기 및 저장 매체 | |
US20200294249A1 (en) | Network module and distribution method and apparatus, electronic device, and storage medium | |
CN109615006B (zh) | 文字识别方法及装置、电子设备和存储介质 | |
CN111242303B (zh) | 网络训练方法及装置、图像处理方法及装置 | |
CN109145970B (zh) | 基于图像的问答处理方法和装置、电子设备及存储介质 | |
CN111612070A (zh) | 基于场景图的图像描述生成方法及装置 | |
JP2022533065A (ja) | 文字認識方法及び装置、電子機器並びに記憶媒体 | |
CN110633715B (zh) | 图像处理方法、网络训练方法及装置、和电子设备 | |
CN110121719A (zh) | 用于深度学习的装置、方法和计算机程序产品 | |
CN111507131B (zh) | 活体检测方法及装置、电子设备和存储介质 | |
KR20240046777A (ko) | 활동 인식 방법 및 장치, 전자 장치 및 저장 매체 | |
US12008167B2 (en) | Action recognition method and device for target object, and electronic apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7066007 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |