JP7390445B2 - 文字位置決めモデルのトレーニング方法及び文字位置決め方法 - Google Patents
文字位置決めモデルのトレーニング方法及び文字位置決め方法 Download PDFInfo
- Publication number
- JP7390445B2 JP7390445B2 JP2022130338A JP2022130338A JP7390445B2 JP 7390445 B2 JP7390445 B2 JP 7390445B2 JP 2022130338 A JP2022130338 A JP 2022130338A JP 2022130338 A JP2022130338 A JP 2022130338A JP 7390445 B2 JP7390445 B2 JP 7390445B2
- Authority
- JP
- Japan
- Prior art keywords
- sample
- character
- text box
- character positioning
- positioning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 84
- 238000012549 training Methods 0.000 title claims description 80
- 230000006870 function Effects 0.000 claims description 59
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19167—Active pattern learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19127—Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
Claims (17)
- コンピュータにより実行される文字位置決めモデルのトレーニング方法であって、
サンプル画像を取得するステップであって、前記サンプル画像にはサンプルの位置決め対象の文字及び前記サンプルの位置決め対象の文字のマーキングテキストボックスが含まれているステップと、
前記サンプル画像をトレーニング対象の文字位置決めモデルに入力し、前記サンプルの位置決め対象の文字を位置決めし、前記サンプル画像の予測テキストボックスを出力するステップと、
前記サンプル画像に対応するサンプルの事前アンカーボックスを取得するステップと、
前記サンプルの事前アンカーボックス、前記マーキングテキストボックス及び前記予測テキストボックスに基づいて、前記文字位置決めモデルのモデルパラメータを調整し、モデルトレーニングが終了して目標文字位置決めモデルを生成するまで、次のサンプル画像を利用して調整後の前記文字位置決めモデルをトレーニングし続けるステップと、
を含み、
前記サンプル画像に対応するサンプルの事前アンカーボックスを取得するステップが、
前記サンプル画像に対して特徴抽出を行い、前記サンプル画像に対応する特徴マップを取得するステップと、
前記特徴マップに基づいて、マッチングされる前記サンプルの事前アンカーボックスを取得するステップと、
を含む、文字位置決めモデルのトレーニング方法。 - 前記サンプルの事前アンカーボックス、前記マーキングテキストボックス及び前記予測テキストボックスに基づいて、前記文字位置決めモデルのモデルパラメータを調整するステップが、
前記サンプルの事前アンカーボックス及び前記マーキングテキストボックスに基づいて、第1の損失関数を取得するステップと、
前記マーキングテキストボックス及び前記予測テキストボックスに基づいて、第2の損失関数を取得するステップと、
前記第1の損失関数及び前記第2の損失関数に基づいて、前記文字位置決めモデルの損失関数を取得するステップと、
前記損失関数に基づいて前記文字位置決めモデルのモデルパラメータを調整するステップと、
を含む請求項1に記載の文字位置決めモデルのトレーニング方法。 - 前記サンプルの事前アンカーボックス及び前記マーキングテキストボックスに基づいて、第1の損失関数を取得するステップが、
前記マーキングテキストボックスの属性情報及び前記サンプルの事前アンカーボックスの属性情報に基づいて、前記第1の損失関数を取得するステップを含む請求項2に記載の文字位置決めモデルのトレーニング方法。 - 前記マーキングテキストボックスの属性情報及び前記サンプルの事前アンカーボックスの属性情報に基づいて、前記第1の損失関数を取得するステップが、
前記マーキングテキストボックスのX軸のコーナーポイントと中心点との間の第1の距離、及び前記マーキングテキストボックスのY軸のコーナーポイントと前記中心点との間の第2の距離を取得するステップと、
前記サンプルの事前アンカーボックスの長さ及び幅を取得するステップと、
前記第1の距離と前記幅との間の第1の比率、及び前記第2の距離と前記長さとの間の第2の比率をそれぞれ取得するステップと、
前記第1の比率及び前記第2の比率に基づいて、前記第1の損失関数を取得するステップと、
を含む請求項3に記載の文字位置決めモデルのトレーニング方法。 - 前記マーキングテキストボックスの前記中心点は、前記サンプルの事前アンカーボックスの中心点と重なり合っている請求項4に記載の文字位置決めモデルのトレーニング方法。
- 前記特徴マップに基づいて、マッチングされる前記サンプルの事前アンカーボックスを取得するステップが、
前記特徴マップに基づいて、少なくとも1つの前記サンプルの位置決め対象の文字を取得するステップと、
各前記サンプルの位置決め対象の文字のサイズを取得するステップと、
各前記サンプルの位置決め対象の文字に対して、前記サンプルの位置決め対象の文字のサイズに対応する前記サンプルの事前アンカーボックスを取得するステップと、
を含む請求項1に記載の文字位置決めモデルのトレーニング方法。 - 画像を取得するステップであって、前記画像には位置決め対象の文字が含まれているステップと、
前記画像を目標文字位置決めモデルに入力して前記位置決め対象の文字を位置決めし、前記画像の目標テキストボックスを出力するステップであって、前記目標文字位置決めモデルが、請求項1に記載のトレーニング方法に基づいてトレーニングされたモデルであるステップと、
を含む文字位置決め方法。 - サンプル画像を取得するように構成される第1の取得モジュールであって、前記サンプル画像にはサンプルの位置決め対象の文字及び前記サンプルの位置決め対象の文字のマーキングテキストボックスが含まれている第1の取得モジュールと、
前記サンプル画像をトレーニング対象の文字位置決めモデルに入力し、前記サンプルの位置決め対象の文字を位置決めし、前記サンプル画像の予測テキストボックスを出力するように構成される出力モジュールと、
前記サンプル画像に対応するサンプルの事前アンカーボックスを取得するように構成される第2の取得モジュールと、
前記サンプルの事前アンカーボックス、前記マーキングテキストボックス及び前記予測テキストボックスに基づいて、前記文字位置決めモデルのモデルパラメータを調整し、モデルトレーニングが終了して目標文字位置決めモデルを生成するまで、次のサンプル画像を利用して調整後の前記文字位置決めモデルをトレーニングし続けるように構成される生成モジュールと、
を備え、
前記第2の取得モジュールが、
前記サンプル画像に対して特徴抽出を行い、前記サンプル画像に対応する特徴マップを取得し、
前記特徴マップに基づいて、マッチングされる前記サンプルの事前アンカーボックスを取得するように構成される、文字位置決めモデルのトレーニング装置。 - 前記生成モジュールが、
前記サンプルの事前アンカーボックス及び前記マーキングテキストボックスに基づいて、第1の損失関数を取得し、
前記マーキングテキストボックス及び前記予測テキストボックスに基づいて、第2の損失関数を取得し、
前記第1の損失関数及び前記第2の損失関数に基づいて、前記文字位置決めモデルの損失関数を取得し、
前記損失関数に基づいて前記文字位置決めモデルのモデルパラメータを調整するように構成される請求項8に記載の文字位置決めモデルのトレーニング装置。 - 前記生成モジュールが、
前記マーキングテキストボックスの属性情報及び前記サンプルの事前アンカーボックスの属性情報に基づいて、前記第1の損失関数を取得するように構成される請求項9に記載の文字位置決めモデルのトレーニング装置。 - 前記生成モジュールが、
前記マーキングテキストボックスのX軸のコーナーポイントと中心点との間の第1の距離、及び前記マーキングテキストボックスのY軸のコーナーポイントと前記中心点との間の第2の距離を取得し、
前記サンプルの事前アンカーボックスの長さ及び幅を取得し、
前記第1の距離と前記幅との間の第1の比率、及び前記第2の距離と前記長さとの間の第2の比率をそれぞれ取得し、
前記第1の比率及び前記第2の比率に基づいて、前記第1の損失関数を取得するように構成される請求項10に記載の文字位置決めモデルのトレーニング装置。 - 前記マーキングテキストボックスの前記中心点は、前記サンプルの事前アンカーボックスの中心点と重なり合っている請求項11に記載の文字位置決めモデルのトレーニング装置。
- 前記第2の取得モジュールが、
前記特徴マップに基づいて、少なくとも1つの前記サンプルの位置決め対象の文字を取得し、
各前記サンプルの位置決め対象の文字のサイズを取得し、
各前記サンプルの位置決め対象の文字に対して、前記サンプルの位置決め対象の文字のサイズに対応する前記サンプルの事前アンカーボックスを取得するように構成される請求項8に記載の文字位置決めモデルのトレーニング装置。 - 画像を取得するように構成される取得モジュールであって、前記画像には位置決め対象の文字が含まれている取得モジュールと、
前記画像を目標文字位置決めモデルに入力して前記位置決め対象の文字を位置決めし、前記画像の目標テキストボックスを出力するように構成される出力モジュールであって、前記目標文字位置決めモデルが、請求項1から6のいずれか一項に記載のトレーニング方法に基づいてトレーニングされたモデルである出力モジュールと、
を備える文字位置決め装置。 - プロセッサとメモリとを備え、
前記プロセッサが、請求項1から7のいずれか一項に記載の方法を実現するために、前記メモリに記憶された実行可能なプログラムコードを読み取ることにより、前記実行可能なプログラムコードに対応するプログラムを実行する電子機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該プログラムがプロセッサによって実行される場合、請求項1から7のいずれか一項に記載の方法が実現されるコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される場合、請求項1から7のいずれか一項に記載の方法のステップが実現されるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110970305.5 | 2021-08-23 | ||
CN202110970305.5A CN113762109B (zh) | 2021-08-23 | 2021-08-23 | 一种文字定位模型的训练方法及文字定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022166215A JP2022166215A (ja) | 2022-11-01 |
JP7390445B2 true JP7390445B2 (ja) | 2023-12-01 |
Family
ID=78790892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022130338A Active JP7390445B2 (ja) | 2021-08-23 | 2022-08-18 | 文字位置決めモデルのトレーニング方法及び文字位置決め方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220392242A1 (ja) |
EP (1) | EP4068225A3 (ja) |
JP (1) | JP7390445B2 (ja) |
CN (1) | CN113762109B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863434B (zh) * | 2022-04-21 | 2023-05-23 | 北京百度网讯科技有限公司 | 文字分割模型的获取方法、文字分割方法及其装置 |
CN117253233B (zh) * | 2023-09-05 | 2024-05-17 | 广东奥普特科技股份有限公司 | 一种字符擦除方法、装置和设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019079347A (ja) | 2017-10-25 | 2019-05-23 | ネットスマイル株式会社 | 文字種推定システム、文字種推定方法、および文字種推定プログラム |
US20200082218A1 (en) | 2018-09-06 | 2020-03-12 | Sap Se | Optical character recognition using end-to-end deep learning |
JP2020119522A (ja) | 2019-01-25 | 2020-08-06 | 株式会社ストラドビジョンStradvision,Inc. | 物体検出器の学習方法及びテスト方法、それを利用した学習装置及びテスト装置 |
JP2020527260A (ja) | 2018-06-15 | 2020-09-03 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | テキスト検出分析方法、装置及びデバイス |
JP2021512378A (ja) | 2018-12-29 | 2021-05-13 | ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド | アンカー決定方法及び装置、電子機器並びに記憶媒体 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10074042B2 (en) * | 2015-10-06 | 2018-09-11 | Adobe Systems Incorporated | Font recognition using text localization |
US9984471B2 (en) * | 2016-07-26 | 2018-05-29 | Intuit Inc. | Label and field identification without optical character recognition (OCR) |
CN106446899A (zh) * | 2016-09-22 | 2017-02-22 | 北京市商汤科技开发有限公司 | 文字检测方法和装置、及文字检测训练方法和装置 |
US10671878B1 (en) * | 2019-01-11 | 2020-06-02 | Capital One Services, Llc | Systems and methods for text localization and recognition in an image of a document |
CN110147786B (zh) * | 2019-04-11 | 2021-06-29 | 北京百度网讯科技有限公司 | 用于检测图像中的文本区域的方法、装置、设备以及介质 |
CN110110715A (zh) * | 2019-04-30 | 2019-08-09 | 北京金山云网络技术有限公司 | 文本检测模型训练方法、文本区域、内容确定方法和装置 |
CN113159016B (zh) * | 2019-07-26 | 2024-06-18 | 第四范式(北京)技术有限公司 | 文本位置定位方法和系统以及模型训练方法和系统 |
US11138423B2 (en) * | 2019-07-29 | 2021-10-05 | Intuit Inc. | Region proposal networks for automated bounding box detection and text segmentation |
CN110674804A (zh) * | 2019-09-24 | 2020-01-10 | 上海眼控科技股份有限公司 | 文本图像的检测方法、装置、计算机设备和存储介质 |
CN111079632A (zh) * | 2019-12-12 | 2020-04-28 | 上海眼控科技股份有限公司 | 文本检测模型的训练方法、装置、计算机设备和存储介质 |
CN111275040B (zh) * | 2020-01-18 | 2023-07-25 | 北京市商汤科技开发有限公司 | 定位方法及装置、电子设备、计算机可读存储介质 |
CN111368831B (zh) * | 2020-03-03 | 2023-05-23 | 开放智能机器(上海)有限公司 | 一种竖排文字的定位系统及方法 |
CN112052853B (zh) * | 2020-09-09 | 2024-02-02 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
CN113221768A (zh) * | 2021-05-18 | 2021-08-06 | 北京百度网讯科技有限公司 | 识别模型训练方法、识别方法、装置、设备及存储介质 |
-
2021
- 2021-08-23 CN CN202110970305.5A patent/CN113762109B/zh active Active
-
2022
- 2022-08-11 EP EP22189831.5A patent/EP4068225A3/en not_active Withdrawn
- 2022-08-15 US US17/819,838 patent/US20220392242A1/en not_active Abandoned
- 2022-08-18 JP JP2022130338A patent/JP7390445B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019079347A (ja) | 2017-10-25 | 2019-05-23 | ネットスマイル株式会社 | 文字種推定システム、文字種推定方法、および文字種推定プログラム |
JP2020527260A (ja) | 2018-06-15 | 2020-09-03 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | テキスト検出分析方法、装置及びデバイス |
US20200082218A1 (en) | 2018-09-06 | 2020-03-12 | Sap Se | Optical character recognition using end-to-end deep learning |
JP2021512378A (ja) | 2018-12-29 | 2021-05-13 | ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド | アンカー決定方法及び装置、電子機器並びに記憶媒体 |
JP2020119522A (ja) | 2019-01-25 | 2020-08-06 | 株式会社ストラドビジョンStradvision,Inc. | 物体検出器の学習方法及びテスト方法、それを利用した学習装置及びテスト装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113762109B (zh) | 2023-11-07 |
EP4068225A3 (en) | 2023-01-25 |
CN113762109A (zh) | 2021-12-07 |
US20220392242A1 (en) | 2022-12-08 |
JP2022166215A (ja) | 2022-11-01 |
EP4068225A2 (en) | 2022-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7230081B2 (ja) | 帳票画像認識方法および装置、電子機器、記憶媒体並びにコンピュータプログラム | |
US11681875B2 (en) | Method for image text recognition, apparatus, device and storage medium | |
JP7390445B2 (ja) | 文字位置決めモデルのトレーニング方法及び文字位置決め方法 | |
US8749553B1 (en) | Systems and methods for accurately plotting mathematical functions | |
WO2023015922A1 (zh) | 图像识别模型的训练方法、装置、设备及存储介质 | |
JP2022172381A (ja) | テキスト抽出方法、テキスト抽出モデルのトレーニング方法、装置及び機器 | |
US20230196716A1 (en) | Training multi-target image-text matching model and image-text retrieval | |
US20210357710A1 (en) | Text recognition method and device, and electronic device | |
JP7300034B2 (ja) | テーブル生成方法、装置、電子機器、記憶媒体及びプログラム | |
EP3876197A2 (en) | Portrait extracting method and apparatus, electronic device and storage medium | |
US20230130901A1 (en) | Method for constructing three-dimensional map in high-definition map, device and storage medium | |
KR20220034075A (ko) | 폰트 생성 모델 트레이닝 방법, 폰트 라이브러리 구축 방법, 장치 및 설비 | |
JP2023533404A (ja) | 駆動可能3dキャラクター生成方法、装置、電子機器、及び記憶媒体 | |
JP2022168167A (ja) | 画像処理方法、装置、電子機器及び記憶媒体 | |
JP2022185144A (ja) | 対象検出方法、対象検出モデルのレーニング方法および装置 | |
JP2023533108A (ja) | 道路ラベルを生成するための方法、装置、デバイス及び記憶媒体 | |
US11881044B2 (en) | Method and apparatus for processing image, device and storage medium | |
US11830242B2 (en) | Method for generating a license plate defacement classification model, license plate defacement classification method, electronic device and storage medium | |
CN113837194A (zh) | 图像处理方法、图像处理装置、电子设备以及存储介质 | |
US20230048643A1 (en) | High-Precision Map Construction Method, Apparatus and Electronic Device | |
US20220382991A1 (en) | Training method and apparatus for document processing model, device, storage medium and program | |
US20220122022A1 (en) | Method of processing data, device and computer-readable storage medium | |
CN114445682A (zh) | 训练模型的方法、装置、电子设备、存储介质及产品 | |
CN112784829A (zh) | 一种票据信息的提取方法、装置、电子设备及存储介质 | |
US11835356B2 (en) | Intelligent transportation road network acquisition method and apparatus, electronic device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7390445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |