JP7384943B2 - 文字生成モデルのトレーニング方法、文字生成方法、装置、機器及び媒体 - Google Patents
文字生成モデルのトレーニング方法、文字生成方法、装置、機器及び媒体 Download PDFInfo
- Publication number
- JP7384943B2 JP7384943B2 JP2022007458A JP2022007458A JP7384943B2 JP 7384943 B2 JP7384943 B2 JP 7384943B2 JP 2022007458 A JP2022007458 A JP 2022007458A JP 2022007458 A JP2022007458 A JP 2022007458A JP 7384943 B2 JP7384943 B2 JP 7384943B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- target domain
- feature
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 78
- 238000012549 training Methods 0.000 title claims description 68
- 239000013598 vector Substances 0.000 claims description 72
- 238000013145 classification model Methods 0.000 claims description 70
- 238000004364 calculation method Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 19
- 238000009877 rendering Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 5
- 238000012800 visualization Methods 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/203—Drawing of straight lines or curves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19127—Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1916—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
- Image Processing (AREA)
- Controls And Circuits For Display Device (AREA)
Description
ソースドメインサンプル字及びターゲットドメインスタイル字を文字生成モデルに入力し、ターゲットドメイン生成字を取得することと、
前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出することと、
前記特徴ロスに基づいて前記文字生成モデルのパラメータを調整することと、を含む、
文字生成モデルのトレーニング方法を提供する。
ソースドメイン入力字及び対応するターゲットドメイン入力字を取得することと、
前記ソースドメイン入力字及び前記ターゲットドメイン入力字を、本開示のいずれかの実施例に記載の方法によるトレーニングで得られた文字生成モデルに入力し、ターゲットドメイン新字を取得することと、を含む、
文字生成方法を提供する。
ソースドメインサンプル字及びターゲットドメインスタイル字を文字生成モデルに入力し、ターゲットドメイン生成字を取得するためのターゲットドメイン生成字取得モジュールと、
前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出するための特徴ロス計算モジュールと、
前記特徴ロスに基づいて前記文字生成モデルのパラメータを調整するための第1ロス調整モジュールと、を備える、
文字生成モデルのトレーニング装置を提供する。
ソースドメイン入力字及び対応するターゲットドメイン入力字を取得するための入力字取得モジュールと、
前記ソースドメイン入力字及び前記ターゲットドメイン入力字を、本開示のいずれかの実施例に記載の文字生成モデルのトレーニング方法によって得られた文字生成モデルに入力し、ターゲットドメイン新字を取得するための文字生成モジュールと、を備える、
文字生成装置を提供する。
少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが本開示のいずれかの実施例に記載の文字生成モデルのトレーニング方法、又は本開示のいずれかの実施例に記載の文字生成方法を実行可能であるように、前記少なくとも1つのプロセッサによって実行される、
電子機器を提供する。
コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに、本開示のいずれかの実施例に記載の文字生成モデルのトレーニング方法、又は本開示のいずれかの実施例に記載の文字生成方法を実行させることに用いられる、
非一時的なコンピュータ可読記憶媒体を提供する。
プロセッサによって実行されると、本開示のいずれかの実施例に記載の文字生成モデルのトレーニング方法を実現する、又は本開示のいずれかの実施例に記載の文字生成方法を実行させる、
コンピュータプログラムを提供する。
ソースドメインサンプル字及びターゲットドメインスタイル字を文字生成モデルに入力し、ターゲットドメイン生成字を取得するためのターゲットドメイン生成字取得モジュール1101と、
前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出するための特徴ロス計算モジュール1102と、
前記特徴ロスに基づいて前記文字生成モデルのパラメータを調整するための第1ロス調整モジュール1103と、を備える。
ソースドメイン入力字及び対応するターゲットドメイン入力字を取得するための入力字取得モジュール1201と、
前記ソースドメイン入力字及び前記ターゲットドメイン入力字を文字生成モデルに入力し、ターゲットドメイン新字を取得するための文字生成モジュール1202と、を備え、
前記文字生成モデルは、本開示のいずれかの実施例に記載の文字生成モデルのトレーニング方法によるトレーニングで得られる。
Claims (17)
- ソースドメインサンプル字に含まれる少なくとも1つのコンポーネントを決定し、予め取得したターゲットドメインスタイル字の集合において、前記少なくとも1つのコンポーネントを含むターゲットドメインスタイル字を決定することと、
前記ソースドメインサンプル字及び前記ターゲットドメインスタイル字を文字生成モデルに入力し、ターゲットドメイン生成字を取得することと、
前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出することと、
前記特徴ロスに基づいて前記文字生成モデルのパラメータを調整することと、を含む、
文字生成モデルのトレーニング方法。 - 前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出することは、
前記ターゲットドメイン生成字を前記文字分類モデルに入力し、前記文字分類モデルの少なくとも1つの特徴層から出力される生成特徴図を取得することと、
前記ターゲットドメインサンプル字を前記文字分類モデルに入力し、前記文字分類モデルの前記少なくとも1つの特徴層から出力されるサンプル特徴図を取得することと、
前記少なくとも1つの特徴層の生成特徴図とサンプル特徴図との間の差異に基づいて、前記文字生成モデルの特徴ロスを算出することと、を含む、
請求項1に記載の文字生成モデルのトレーニング方法。 - 前記文字生成モデルの特徴ロスを算出することは、
前記少なくとも1つの特徴層のうちの各特徴層について、前記特徴層の生成特徴図とサンプル特徴図との間の画素差異を算出し、前記特徴層の画素ロスを取得することと、
前記少なくとも1つの特徴層の画素ロスに基づいて、前記文字生成モデルの特徴ロスを算出することと、を含む、
請求項2に記載の文字生成モデルのトレーニング方法。 - 前記特徴層の生成特徴図とサンプル特徴図との間の画素差異を算出することは、
前記特徴層の生成特徴図における各位置の画素点について、前記画素点の画素値と前記サンプル特徴図における対応する位置の画素点の画素値との間の差の絶対値を算出し、各位置の画素点の差異を取得することと、
複数の位置の画素点の差異に基づいて、前記特徴層の生成特徴図とサンプル特徴図との間の画素差異を決定することと、を含む、
請求項3に記載の文字生成モデルのトレーニング方法。 - 前記ターゲットドメインスタイル字を文字生成モデルに入力し、前記ターゲットドメインスタイル字の第1スタイル特徴ベクトルを取得することと、
前記ターゲットドメイン生成字を前記文字生成モデルに入力し、前記ターゲットドメイン生成字の第2スタイル特徴ベクトルを取得することと、
前記第2スタイル特徴ベクトル及び前記第1スタイル特徴ベクトルをコンポーネント分類モデルに入力し、コンポーネント分類ロスを算出することと、
前記ターゲットドメインサンプル字及び前記ターゲットドメイン生成字を識別モデルに入力し、文字敵対的ロス及びスタイル敵対的ロスを算出ことと、
前記ターゲットドメイン生成字を前記文字分類モデルに入力し、誤字ロスを算出することと、
前記コンポーネント分類ロス、前記文字敵対的ロス、前記スタイル敵対的ロス及び前記誤字ロスに基づいて、前記文字生成モデルのパラメータを調整することと、をさらに含む、
請求項1に記載の文字生成モデルのトレーニング方法。 - 前記ソースドメインサンプル字は、ソースドメインフォントスタイルを有する画像であり、
前記ターゲットドメインサンプル字は、ターゲットドメインフォントスタイルを有する画像である、
請求項1から5のいずれか1項に記載の文字生成モデルのトレーニング方法。 - ソースドメイン入力字及び対応するターゲットドメイン入力字を取得することと、
前記ソースドメイン入力字及び前記ターゲットドメイン入力字を、請求項1から6のいずれか1項に記載の文字生成モデルのトレーニング方法によるトレーニングで得られた文字生成モデルに入力し、ターゲットドメイン新字を取得することと、を含む、
文字生成方法。 - ソースドメインサンプル字に含まれる少なくとも1つのコンポーネントを決定し、予め取得したターゲットドメインスタイル字の集合において、前記少なくとも1つのコンポーネントを含むターゲットドメインスタイル字を決定し、前記ソースドメインサンプル字及び前記ターゲットドメインスタイル字を文字生成モデルに入力し、ターゲットドメイン生成字を取得するためのターゲットドメイン生成字取得モジュールと、
前記ターゲットドメイン生成字及びターゲットドメインサンプル字を予めトレーニングされた文字分類モデルに入力し、前記文字生成モデルの特徴ロスを算出するための特徴ロス計算モジュールと、
前記特徴ロスに基づいて前記文字生成モデルのパラメータを調整するための第1ロス調整モジュールと、を備える、
文字生成モデルのトレーニング装置。 - 前記特徴ロス計算モジュールは、
前記ターゲットドメイン生成字を前記文字分類モデルに入力し、前記文字分類モデルの少なくとも1つの特徴層から出力される生成特徴図を取得するための第1特徴図生成ユニットと、
前記ターゲットドメインサンプル字を前記文字分類モデルに入力し、前記文字分類モデルの前記少なくとも1つの特徴層から出力されるサンプル特徴図を取得するための第2特徴図生成ユニットと、
前記少なくとも1つの特徴層の生成特徴図とサンプル特徴図との間の差異に基づいて、前記文字生成モデルの特徴ロスを算出するための特徴ロス計算ユニットと、を備える、
請求項8に記載の文字生成モデルのトレーニング装置。 - 前記特徴ロス計算ユニットは、
前記少なくとも1つの特徴層のうちの各特徴層について、前記特徴層の生成特徴図とサンプル特徴図との間の画素差異を算出し、前記特徴層の画素ロスを取得するための画素ロス計算サブユニットと、
前記少なくとも1つの特徴層の画素ロスに基づいて、前記文字生成モデルの特徴ロスを算出するための特徴ロス計算サブユニットと、を備える、
請求項9に記載の文字生成モデルのトレーニング装置。 - 前記画素ロス計算サブユニットは、
前記特徴層の生成特徴図における各位置の画素点について、前記画素点の画素値と前記サンプル特徴図における対応する位置の画素点の画素値との間の差の絶対値を算出し、各位置の画素点の差異を取得して、複数の位置の画素点の差異に基づいて、前記特徴層の生成特徴図とサンプル特徴図との間の画素差異を決定することに用いられる、
請求項10に記載の文字生成モデルのトレーニング装置。 - 前記ターゲットドメインスタイル字を文字生成モデルに入力し、前記ターゲットドメインスタイル字の第1スタイル特徴ベクトルを取得するための第1特徴ベクトル計算モジュールと、
前記ターゲットドメイン生成字を前記文字生成モデルに入力し、前記ターゲットドメイン生成字の第2スタイル特徴ベクトルを取得するための第2特徴ベクトル計算モジュールと、
前記第2スタイル特徴ベクトル及び前記第1スタイル特徴ベクトルをコンポーネント分類モデルに入力し、コンポーネント分類ロスを算出するためのコンポーネント分類ロス計算モジュールと、
前記ターゲットドメインサンプル字及び前記ターゲットドメイン生成字を識別モデルに入力し、文字敵対的ロス及びスタイル敵対的ロスを算出するための敵対的ロス計算モジュールと、
前記ターゲットドメイン生成字を前記文字分類モデルに入力し、誤字ロスを算出するための誤字ロス計算モジュールと、
前記コンポーネント分類ロス、前記文字敵対的ロス、前記スタイル敵対的ロス及び前記誤字ロスに基づいて、前記文字生成モデルのパラメータを調整するための第2ロス調整モジュールと、をさらに備える、
請求項8に記載の文字生成モデルのトレーニング装置。 - 前記ソースドメインサンプル字は、ソースドメインフォントスタイルを有する画像であり、前記ターゲットドメインサンプル字は、ターゲットドメインフォントスタイルを有する画像である、
請求項8から12のいずれか1項に記載の文字生成モデルのトレーニング装置。 - ソースドメイン入力字及び対応するターゲットドメイン入力字を取得するための入力字取得モジュールと、
前記ソースドメイン入力字及び前記ターゲットドメイン入力字を、請求項1から6のいずれか1項に記載の文字生成モデルのトレーニング方法によるトレーニングで得られた文字生成モデルに入力し、ターゲットドメイン新字を取得するための文字生成モジュールと、を備える、
文字生成装置。 - 少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信接続されたメモリとを備える電子機器であって、
前記メモリに、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが請求項1から6のいずれか1項に記載の文字生成モデルのトレーニング方法、又は請求項7に記載の文字生成方法を実行可能であるように、前記少なくとも1つのプロセッサによって実行される、
電子機器。 - コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに、請求項1から6のいずれか1項に記載の文字生成モデルのトレーニング方法、又は請求項7に記載の文字生成方法を実行させることに用いられる、
非一時的なコンピュータ可読記憶媒体。 - プロセッサによって実行されると、請求項1から6のいずれか1項に記載の文字生成モデルのトレーニング方法を実現する、又は請求項7に記載の文字生成方法を実行させる、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111057838.0 | 2021-09-09 | ||
CN202111057838.0A CN113792526B (zh) | 2021-09-09 | 2021-09-09 | 字符生成模型的训练方法、字符生成方法、装置和设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023039892A JP2023039892A (ja) | 2023-03-22 |
JP7384943B2 true JP7384943B2 (ja) | 2023-11-21 |
Family
ID=78879834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022007458A Active JP7384943B2 (ja) | 2021-09-09 | 2022-01-20 | 文字生成モデルのトレーニング方法、文字生成方法、装置、機器及び媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220189083A1 (ja) |
EP (1) | EP4148685A1 (ja) |
JP (1) | JP7384943B2 (ja) |
KR (1) | KR20220032538A (ja) |
CN (1) | CN113792526B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114820867B (zh) * | 2022-04-22 | 2022-12-13 | 北京百度网讯科技有限公司 | 字形生成方法、字形生成模型的训练方法及装置 |
CN114882372A (zh) * | 2022-07-11 | 2022-08-09 | 浙江大华技术股份有限公司 | 一种目标检测的方法及设备 |
CN115661304B (zh) * | 2022-10-11 | 2024-05-03 | 北京汉仪创新科技股份有限公司 | 基于帧插值的字库生成方法、电子设备、存储介质和系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6358471B2 (ja) * | 2015-05-29 | 2018-07-18 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
CN107767328B (zh) * | 2017-10-13 | 2021-12-17 | 上海媒智科技有限公司 | 基于少量样本生成的任意风格和内容的迁移方法和系统 |
CN109165376B (zh) * | 2018-06-28 | 2023-07-18 | 西交利物浦大学 | 基于少量样本的风格字符生成方法 |
CN110443864B (zh) * | 2019-07-24 | 2021-03-02 | 北京大学 | 一种基于单阶段少量样本学习的艺术字体自动生成方法 |
CN110503598B (zh) * | 2019-07-30 | 2022-09-16 | 西安理工大学 | 基于条件循环一致性生成对抗网络的字体风格迁移方法 |
US11250252B2 (en) * | 2019-12-03 | 2022-02-15 | Adobe Inc. | Simulated handwriting image generator |
WO2021114130A1 (zh) * | 2019-12-11 | 2021-06-17 | 中国科学院深圳先进技术研究院 | 一种无监督自适应乳腺病变分割方法 |
CN111325660B (zh) * | 2020-02-20 | 2021-01-29 | 中国地质大学(武汉) | 一种基于文本数据的遥感图像风格转换方法 |
US11157693B2 (en) * | 2020-02-25 | 2021-10-26 | Adobe Inc. | Stylistic text rewriting for a target author |
CN112364860A (zh) * | 2020-11-05 | 2021-02-12 | 北京字跳网络技术有限公司 | 字符识别模型的训练方法、装置和电子设备 |
CN112861806B (zh) * | 2021-03-17 | 2023-08-22 | 网易(杭州)网络有限公司 | 基于生成对抗网络的字体数据处理方法及装置 |
CN113140017B (zh) * | 2021-04-30 | 2023-09-15 | 北京百度网讯科技有限公司 | 训练对抗网络模型的方法、建立字库的方法、装置和设备 |
CN113140018B (zh) * | 2021-04-30 | 2023-06-20 | 北京百度网讯科技有限公司 | 训练对抗网络模型的方法、建立字库的方法、装置和设备 |
CN113343683B (zh) * | 2021-06-18 | 2022-06-07 | 山东大学 | 一种融合自编码器和对抗训练的中文新词发现方法及装置 |
-
2021
- 2021-09-09 CN CN202111057838.0A patent/CN113792526B/zh active Active
-
2022
- 2022-01-20 JP JP2022007458A patent/JP7384943B2/ja active Active
- 2022-02-24 EP EP22158653.0A patent/EP4148685A1/en not_active Withdrawn
- 2022-02-25 KR KR1020220025545A patent/KR20220032538A/ko unknown
- 2022-02-28 US US17/682,232 patent/US20220189083A1/en not_active Abandoned
Non-Patent Citations (3)
Title |
---|
Song Park et al.,"Few-Shot Font Generation with Localized Style Representations and Factorization",[online],arXiv:2009.11042v2,2020年09月23日,インターネット<URL:https://arxiv.org/pdf/2009.11042.pdf> |
Xiyan Liu et al.,"FontGAN: A Unified Generative Framework for Chinese Character Stylization and De-stylization",[online],arXiv:1910.12604v1,2019年10月28日,インターネット<URL:https://arxiv.org/pdf/1910.12604.pdf> |
成沢 淳史、外2名 ,"深層学習による質感文字生成",人工知能学会第 32回全国大会論文集DVD [DVD-ROM],2018年06月,p.1-4 |
Also Published As
Publication number | Publication date |
---|---|
US20220189083A1 (en) | 2022-06-16 |
KR20220032538A (ko) | 2022-03-15 |
EP4148685A1 (en) | 2023-03-15 |
CN113792526B (zh) | 2024-02-09 |
JP2023039892A (ja) | 2023-03-22 |
CN113792526A (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7384943B2 (ja) | 文字生成モデルのトレーニング方法、文字生成方法、装置、機器及び媒体 | |
JP2023541532A (ja) | テキスト検出モデルのトレーニング方法及び装置、テキスト検出方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
JP2023541119A (ja) | 文字認識モデルのトレーニング方法、文字認識方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN112966742A (zh) | 模型训练方法、目标检测方法、装置和电子设备 | |
US20220189189A1 (en) | Method of training cycle generative networks model, and method of building character library | |
CN113792854A (zh) | 一种模型训练及字库建立方法、装置、设备及存储介质 | |
CN113792851B (zh) | 字体生成模型训练方法、字库建立方法、装置及设备 | |
CN114820871B (zh) | 字体生成方法、模型的训练方法、装置、设备和介质 | |
CN114863437B (zh) | 文本识别方法、装置、电子设备和存储介质 | |
EP4120181A2 (en) | Method and apparatus of fusing image, and method of training image fusion model | |
JP7337203B2 (ja) | 文字生成モデルのトレーニング方法、文字生成方法、装置および機器 | |
JP2023039886A (ja) | フォント生成モデルトレーニング方法、字庫作成方法、装置及び機器 | |
CN112785493A (zh) | 模型的训练方法、风格迁移方法、装置、设备及存储介质 | |
CN116152833A (zh) | 基于图像的表格还原模型的训练方法及表格还原方法 | |
CN116756564A (zh) | 面向任务解决的生成式大语言模型的训练方法和使用方法 | |
CN114792355A (zh) | 虚拟形象生成方法、装置、电子设备和存储介质 | |
US20230154077A1 (en) | Training method for character generation model, character generation method, apparatus and storage medium | |
CN116402914A (zh) | 用于确定风格化图像生成模型的方法、装置及产品 | |
CN115565186A (zh) | 文字识别模型的训练方法、装置、电子设备和存储介质 | |
CN115376137A (zh) | 一种光学字符识别处理、文本识别模型训练方法及装置 | |
CN112558810A (zh) | 检测指尖位置的方法、装置、设备和存储介质 | |
CN114973279B (zh) | 手写文本图像生成模型的训练方法、装置和存储介质 | |
CN113553863B (zh) | 文本生成方法、装置、电子设备和存储介质 | |
CN115131709B (zh) | 视频类别预测方法、视频类别预测模型的训练方法及装置 | |
CN115471840B (zh) | 生成、模型的训练、识别方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7384943 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |