JP3243700U - Syntax-driven formula identification system - Google Patents

Syntax-driven formula identification system Download PDF

Info

Publication number
JP3243700U
JP3243700U JP2023002183U JP2023002183U JP3243700U JP 3243700 U JP3243700 U JP 3243700U JP 2023002183 U JP2023002183 U JP 2023002183U JP 2023002183 U JP2023002183 U JP 2023002183U JP 3243700 U JP3243700 U JP 3243700U
Authority
JP
Japan
Prior art keywords
formula
mathematical
handwritten
formulas
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023002183U
Other languages
Japanese (ja)
Inventor
庄建明
陳頌光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sunia Pte Ltd
Original Assignee
Sunia Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sunia Pte Ltd filed Critical Sunia Pte Ltd
Application granted granted Critical
Publication of JP3243700U publication Critical patent/JP3243700U/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/171Editing, e.g. inserting or deleting by use of digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/111Mathematical or scientific formatting; Subscripts; Superscripts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • G06V30/1985Syntactic analysis, e.g. using a grammatical approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】構文主導型の数式識別システムを提供する。【解決手段】構文主導型の数式識別システムは、オンライン手書き数式の筆画及び筆画に対応する数学プログラム言語の特定のプログラムコードを保存するオンライン手書き数式ユニットと、既知のプログラムコードのオフライン手書き及び活字体数式を保存するオフライン手書き及び活字体数式ユニットと、大量の数式のプログラムコードを収集すると共に文法に基づいて多数の構造化数式を生成する構造化数式生成ユニットと、各数式を多数の数式手書き筆跡サンプルに変換し、数式識別ニューラルネットワークに入力してトレーニングを行い、予測段階において、数式識別ニューラルネットワークは文法に適合する数式の筆画を受信し、識別した後に数式に対応する少なくとも1つのプログラムコードを出力し、可能な識別結果を表示する手書き筆跡サンプル生成ユニットと、を備えている。【選択図】図2A syntax-driven mathematical expression identification system is provided. A syntax-driven formula identification system includes an online handwritten formula unit that stores strokes of online handwritten formulas and a specific program code in a mathematical programming language corresponding to the strokes, and an offline handwritten and printed version of the known program code. An offline handwritten and printed formula unit that stores formulas; a structured formula generation unit that collects a large number of program codes for formulas and generates a large number of structured formulas based on grammar; In the prediction stage, the mathematical formula identification neural network receives strokes of mathematical formulas that match the grammar, identifies them, and then outputs at least one program code corresponding to the mathematical formula. and a handwritten handwriting sample generation unit that outputs and displays possible identification results. [Selection diagram] Figure 2

Description

本考案は、数式識別システムに関し、より詳しくは、構文主導型の数式識別システムに関する。 TECHNICAL FIELD The present invention relates to a mathematical expression identification system, and more particularly to a syntax-driven mathematical expression identification system.

所謂オンライン手書き数式(Online Handwritten Mathematical Expression)とは、ユーザーが機器と接続する際に手書き入力した数学記号及び関連する文字で構成されている数式(Mathematical Expression)を指す。本考案の前記数式は広義の数学記号、数学の数式等を含む。前記数式は機器に接続された状況で入力するため、機器は筆画取得メカニズム(例えば、スタイラスペン、手書きパッド、或いはタッチパッド)により、ユーザーが数学記号または関連する文字を書く過程において筆画の軌跡を筆画座標に即時変換し、異なる数学記号または関連する文字の対応する位置座標を記録する。上述の方式により内容を識別し、即ち、オンライン識別(Online recognition)を行う。 The so-called online handwritten mathematical expression refers to a mathematical expression composed of mathematical symbols and related characters that are handwritten by a user when connecting to a device. The mathematical formula of the present invention includes a broad mathematical symbol, a mathematical formula, etc. Since the formula is entered while connected to the device, the device uses a stroke capture mechanism (e.g., stylus, handwriting pad, or touch pad) to track the stroke trajectory of the user in the process of writing the mathematical symbol or related character. Instantly convert to stroke coordinates and record the corresponding position coordinates of different mathematical symbols or related characters. The content is identified using the above-described method, that is, online recognition is performed.

所謂オフライン手書き数式または活字体数式は、上述のオンラインの状況(即ち、筆画軌跡の入力を即時取得できない)ではない状況で取得した数式であり、例えば、二次元画像に保存される或いは紙に印刷される数式であり、筆画の順序情報を含まない。このような数式の内容を識別することが、オフライン識別(Offline recognition)である。 So-called offline handwritten formulas or printed formulas are formulas obtained in a situation other than the above-mentioned online situation (i.e., where the input of stroke trajectories cannot be obtained immediately), and are, for example, saved in a two-dimensional image or printed on paper. This is a mathematical formula that does not include stroke order information. Identifying the content of such a mathematical formula is offline recognition.

従来は数式を識別するニューラルネットワークのトレーニングを行う場合、トレーニングセットに極めて大量の数式サンプルを使用する必要があり、そのサンプルの数量は10万以上に達する。これらの数式を収集するには機械的に生成するしかないが、但し、従来の数式の生成方式は非常に緩慢であり、従来の手書きサンプルの数量は相当に少なく、収集が難しかった。このため、長い時間がかかり、トレーニングの完了したニューラルネットワークの識別範囲を修正したり、拡充したりすることもできなかった。 Conventionally, when training a neural network for identifying mathematical expressions, it is necessary to use an extremely large number of mathematical expression samples in the training set, and the number of samples reaches 100,000 or more. The only way to collect these formulas is to generate them mechanically, however, the conventional formula generation method is very slow, and the number of conventional handwritten samples is quite small, making it difficult to collect. As a result, it took a long time, and it was not possible to modify or expand the classification range of a neural network that had been trained.

そこで、本考案者は上記の欠点が改善可能と考え、鋭意検討を重ねた結果、合理的設計で上記の課題を効果的に改善する本考案の提案に至った。 Therefore, the inventor of the present invention believed that the above-mentioned drawbacks could be improved, and as a result of intensive studies, he came up with the proposal of the present invention, which effectively improves the above-mentioned problems through rational design.

本考案はこうした状況に鑑みてなされたものであり、その目的は、構文主導型の数式識別システムを提供することにある。 The present invention has been made in view of these circumstances, and its purpose is to provide a syntax-driven formula identification system.

本考案の一実施態様によれば、構文主導型の数式識別システムが提供される。すなわち、本考案の一実施形態は、以下の構成を含むものである。オンライン手書き、オフライン手書き、及び活字体数式を結合し、数学プログラム言語ルールを結合して大量のサンプルを自動的に合成し、端対端学習(End-to-End Learning)方式によりニューラルネットワークをトレーニングし、学習効果を強化し、識別能力を高め、多層のニューラルネットワークモデルの過学習(Overfitting)問題を効果的に低減し、汎化(Generalization)性能を高め、テストセットの正確性を高める。本考案に係るニューラルネットワークモデルはオンライン手書き、オフライン手書き、及び活字体数式の識別に同時に適用可能であり、多種類の識別システムを別々に開発する必要がなく、コストを大幅に削減可能である。 According to one embodiment of the present invention, a syntax-driven formula identification system is provided. That is, one embodiment of the present invention includes the following configuration. Combine online handwriting, offline handwriting, and printed formulas, combine mathematical programming language rules to automatically synthesize a large number of samples, and train neural networks using an end-to-end learning method. It strengthens the learning effect, improves the discrimination ability, effectively reduces the overfitting problem of multi-layer neural network models, improves the generalization performance, and improves the accuracy of the test set. The neural network model according to the present invention can be simultaneously applied to the identification of online handwriting, offline handwriting, and printed mathematical expressions, and there is no need to develop multiple types of identification systems separately, which can significantly reduce costs.

本考案の一実施例に係る構文主導型の数式識別システムの要部組み合わせを示す概略ブロック図である。1 is a schematic block diagram showing a combination of main parts of a syntax-driven formula identification system according to an embodiment of the present invention; FIG. 本考案の一実施例に係る数式識別ニューラルネットワークのトレーニング段階を示す概略図である。FIG. 3 is a schematic diagram illustrating a training stage of a neural network for formula recognition according to an embodiment of the present invention; 本考案の他の実施例に係る数式識別ニューラルネットワークのトレーニング段階を示す概略図である。FIG. 6 is a schematic diagram illustrating a training stage of a neural network for formula recognition according to another embodiment of the present invention; 本考案の一実施例に係る数式識別ニューラルネットワークの予測段階の応用を示す概略図である。FIG. 3 is a schematic diagram illustrating the application of the prediction stage of the formula identification neural network according to an embodiment of the present invention; 本考案に係る構文主導型の数式識別システムのハードウェアを示す概略構成図である。1 is a schematic configuration diagram showing the hardware of a syntax-driven formula identification system according to the present invention; FIG.

以下、本考案の実施の形態について詳細に説明する。ただし、本考案はこれに限定されるものではなく、記述した範囲内で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本考案の技術的範囲に含まれる。 Embodiments of the present invention will be described in detail below. However, the present invention is not limited to this, and various modifications can be made within the scope described, and the present invention may also be applied to embodiments obtained by appropriately combining technical means disclosed in different embodiments. included in the technical scope of

本考案に係る構文主導型(Syntax-directed)の数式(Mathematical Expression)のトレーニング及び識別システム1は、プロセッサ2及びメモリ6を主に備えている(図5を参照)。前記プロセッサ2はシステム1に必要な操作を実行するために用いられている。前記メモリ6は前記システム1中のコンピュータープログラムのデータまたは演算プログラム、関連する操作結果、及び関連するデータを保存するために用いられている。全ての操作結果及び関連するデータは前記メモリ6に保存されている。 The syntax-directed mathematical expression training and identification system 1 according to the present invention mainly includes a processor 2 and a memory 6 (see FIG. 5). The processor 2 is used to perform the operations required by the system 1. The memory 6 is used to store data or calculation programs of computer programs in the system 1, related operation results, and related data. All operation results and related data are stored in the memory 6.

図1乃至図5は本考案に係る構文主導型(Syntax-directed)の数式(Mathematical Expression)のトレーニング及び識別システムを示し、以下の構成が主に含まれる。 1 to 5 illustrate a syntax-directed mathematical expression training and identification system according to the present invention, which mainly includes the following components.

<オンライン手書き数式ユニット10>
オンライン手書き数式(Online Handwritten Mathematical Expression)を受信するために用いられ、即ち、前記オンライン手書き数式中の数学記号及び関連する文字の筆画を受信し、前記オンライン手書き数式中の各筆画の座標及び前記オンライン手書き数式が対応するプログラムコードを獲得し、オンライン手書きサンプル12を形成する。好ましくは、前記オンライン手書きサンプル12中の各筆画の座標はInkML(Ink Markup Language、インクマークアップ言語)形式で保存される。
<Online handwritten mathematical formula unit 10>
Used to receive Online Handwritten Mathematical Expressions, that is, receive strokes of mathematical symbols and associated characters in the Online Handwritten Mathematical Expressions, and calculate the coordinates of each stroke in the Online Handwritten Mathematical Expressions and the online handwritten mathematical expressions. A program code corresponding to the handwritten formula is obtained to form an online handwritten sample 12. Preferably, the coordinates of each stroke in the online handwriting sample 12 are saved in Ink Markup Language (InkML) format.

前記プログラムコードは数学プログラム言語中の特定プログラムコードに対応し、前記数学プログラム言語はLaTeXまたはMathML(Mathematical Markup Language)であるが、実際には本考案はあらゆる数学プログラム言語を使用可能である。よって、前記プログラムコードは前記数学プログラム言語のコンパイル後に対応する数式に変換される。 The program code corresponds to a specific program code in a mathematical programming language, and the mathematical programming language is LaTeX or MathML (Mathematical Markup Language), but in reality, the present invention can use any mathematical programming language. Therefore, the program code is converted into a corresponding mathematical formula after compilation of the mathematical programming language.

前記数学プログラム言語はLaTeXを例に挙げると、例えば、プログラムコード「¥¥frac { 1 } { 3 }」をコンパイルした後に数式"\1"/"\3" を獲得する。 Taking LaTeX as an example of the mathematical programming language, for example, the formula "\1"/"\3" is obtained after compiling the program code "\\frac {1} {3}".

本考案に係る前記プログラムコードはニューラルネットワークのトレーニングに用いられている。トレーニング時には、ニューラルネットワークの出力値を前記数式が対応するプログラムコードとして設定し、前記数式の筆画座標をニューラルネットワークの入力値とする。 The program code according to the present invention is used for training a neural network. During training, the output value of the neural network is set as a program code to which the formula corresponds, and the stroke coordinates of the formula are used as input values of the neural network.

前記オンライン手書き数式ユニット10は、ニューラルネットワークのトレーニングに用いる多数の前記オンライン手書きサンプル12として保存するオンライン手書き数式サンプルライブラリ15を含む。 The online handwritten math formula unit 10 includes an online handwritten math formula sample library 15 that stores a large number of the online handwritten math samples 12 for use in training a neural network.

本実施例では、前記オンライン手書き数式ユニット10は前記オンライン手書き数式中からサブ数式を抽出し、即ち、単独の数式を構成する前記オンライン手書き数式中の一部分を指す。これらサブ数式に対し筆画及びプログラムコードを取得して対応するオンライン手書きサンプル12を生成し、前記オンライン手書き数式サンプルライブラリ15に保存する。 In this embodiment, the online handwritten formula unit 10 extracts a sub-formula from the online handwritten formula, that is, refers to a part of the online handwritten formula that constitutes a single formula. The strokes and program codes for these sub-mathematical expressions are acquired to generate corresponding online handwritten samples 12, and stored in the online handwritten mathematical expression sample library 15.

<オフライン手書き及び活字体数式ユニット20>
既知のプログラムコードのオフライン手書き及び活字体数式(Offline Handwritten and Printed Mathematical Expression)を受信し、前記オフライン手書き及び活字体数式及びそれらが対応する既知のプログラムコードによりオフライン手書き及び活字体数式サンプル22を形成すると共に、オフライン手書き及び活字体数式サンプルライブラリ25に保存するために用いられている。例えば、前記オフライン手書き及び活字体数式は二次元画像(例えば、PNG形式)であり、前記プログラムコードは数学マークアップ言語(markup language)形式で保存されている。前記数学マークアップ言語はMathML文法等である。
<Offline handwritten and printed mathematical formula unit 20>
Receiving offline handwritten and printed mathematical expressions of known program code and forming offline handwritten and printed mathematical expression samples 22 with the offline handwritten and printed mathematical expressions and their corresponding known program codes. It is also used to store in the offline handwritten and printed mathematical equation sample library 25. For example, the offline handwritten and printed formulas are two-dimensional images (eg, in PNG format), and the program code is stored in a mathematical markup language format. The mathematical markup language is MathML grammar or the like.

<構造化数式生成ユニット30>
構造化数式を生成するために用いられている。前記構造化数式生成ユニット30はコーパス34及び数学文法ベース33を含む。前記構造化数式生成ユニット30は大量の数式のプログラムコードを収集する(例えば、インターネットから収集)と共に前記コーパス34に保存する。前記数学文法ベース33には特定の数学プログラム言語の文法(grammar)が保存され、例えば、確率文脈自由文法(Stochastic context-free grammar)が保存され、前記確率文脈自由文法は数式を描写するLaTeXまたはMathMLプログラムコードを満たす文法である。前記構造化数式生成ユニット30は前記数学文法ベース33の文法に基づいて前記コーパス34中の数式のプログラムコードに対し前記数学プログラム言語の形式に適合する多数の構造化数式として組み合わせる。前記構造化数式は数学マークアップ言語(例えばMathML形式)形式で保存されている。
<Structured formula generation unit 30>
It is used to generate structured formulas. The structured formula generation unit 30 includes a corpus 34 and a mathematical grammar base 33. The structured formula generation unit 30 collects a large amount of program codes of formulas (for example, from the Internet) and stores them in the corpus 34 . The mathematical grammar base 33 stores a grammar of a specific mathematical programming language, for example, a stochastic context-free grammar, and the stochastic context-free grammar is a LaTeX or a Stochastic context-free grammar that describes a mathematical formula. This is a grammar that satisfies the MathML program code. The structured formula generation unit 30 combines the program codes of formulas in the corpus 34 into a number of structured formulas that conform to the format of the mathematical programming language based on the grammar of the mathematical grammar base 33. The structured formula is stored in a mathematical markup language (for example, MathML format).

<手書き筆跡サンプル生成ユニット40>
前記オンライン手書き数式ユニット10、前記オフライン手書き及び活字体数式ユニット20、及び前記構造化数式生成ユニット30に接続されている。前記手書き筆跡サンプル生成ユニット40は前記オンライン手書き数式ユニット10、前記オフライン手書き及び活字体数式ユニット20、及び前記構造化数式生成ユニット30の各数式を多数の数式手書き筆跡サンプル42として変換し、ニューラルネットワークのトレーニングを行うために用いられている(本考案はトレーニングを行う際に生成する数式手書き筆跡サンプル42が数十万個に達する)。前記数式手書き筆跡サンプル42の生成方式について以下に説明する。
(a)各前記オンライン手書きサンプル12中の各筆画の座標及び前記オンライン手書き数式の対応するプログラムコードにより対応する数式手書き筆跡サンプル42を形成する。
(b)各前記オフライン手書き及び活字体数式サンプル22のオフライン手書き及び活字体数式により筆画を抽出し、各筆画の座標を獲得し、前記オフライン手書き及び活字体数式の対応するプログラムコードは既知のものであるため、両者は対応する数式手書き筆跡サンプル42を形成する。
(c)前記構造化数式生成ユニット30の各前記構造化数式により対応する数式手書き筆跡サンプル42を合成し、その方式は、(1)前記構造化数式を活字体形式としてレンダリング(render)し、同時に前記活字体中の各記号のバウンディングボックスを記録する。(2)活字体形式の構造化数式を構造が同じオンライン手書き数式サンプル12を有する若干の極大部分に分解し、各部分に対し対応するオンライン手書き数式サンプル12に基づいて前記活字体中の記号に対応するバウンディングボックスの位置を調整する。(3)その後、前記活字体中の各記号をオンライン手書きサンプル12中の対応する筆画の座標にそれぞれ対応させ、軽微なランダムアフィン変換(Affine transformation)を行い、変換後の各記号が対応する筆画の座標及び前記構造化数式が対応するプログラムコードにより、対応する数式手書き筆跡サンプル42を合成する。(4)前記数式手書き筆跡サンプル42のランダムな回転または拡大縮小を行って、更に多くの数式手書き筆跡サンプル42を生成する。
<Handwritten handwriting sample generation unit 40>
It is connected to the online handwritten formula unit 10, the offline handwritten and printed formula unit 20, and the structured formula generation unit 30. The handwritten handwriting sample generating unit 40 converts each mathematical formula of the online handwritten mathematical formula unit 10, the offline handwritten and printed mathematical formula unit 20, and the structured mathematical formula generating unit 30 into a large number of mathematical handwritten handwriting samples 42, and converts each mathematical formula into a large number of mathematical handwritten handwriting samples 42, (The present invention generates hundreds of thousands of mathematical handwriting samples 42 during training). A method of generating the mathematical handwritten handwriting sample 42 will be described below.
(a) A corresponding mathematical handwritten handwriting sample 42 is formed based on the coordinates of each stroke in each online handwritten sample 12 and the corresponding program code of the online handwritten mathematical formula.
(b) Extract strokes according to the offline handwritten and printed formulas of each offline handwritten and printed formula sample 22, obtain the coordinates of each stroke, and the corresponding program code of the offline handwritten and printed formulas is a known one; Therefore, both form a corresponding mathematical handwritten handwriting sample 42.
(c) Synthesizing a corresponding mathematical handwriting sample 42 using each of the structured mathematical expressions of the structured mathematical expression generation unit 30, the method of which is as follows: (1) rendering the structured mathematical expression in a printed form; At the same time, the bounding box of each symbol in the typeface is recorded. (2) Decompose the structured mathematical formula in the printed form into some maximal parts having the same online handwritten mathematical formula samples 12, and for each part, create symbols in the printed form based on the corresponding online handwritten mathematical formula samples 12. Adjust the position of the corresponding bounding box. (3) After that, each symbol in the printed font is made to correspond to the coordinates of the corresponding stroke in the online handwritten sample 12, and a slight random affine transformation is performed, so that each symbol after the conversion corresponds to the corresponding stroke. A corresponding mathematical handwritten handwriting sample 42 is synthesized using the coordinates of and the program code to which the structured mathematical expression corresponds. (4) Randomly rotate or scale the mathematical handwritten handwriting samples 42 to generate more mathematical handwritten handwriting samples 42;

<数式識別ニューラルネットワーク50>
入力インターフェース51及び出力インターフェース55を含み、前記入力インターフェース51は複数の入力端52を備え、前記出力インターフェース55は複数の出力端56を備えている。図1と図2に示す如く、前記入力インターフェース51は前記手書き筆跡サンプル生成ユニット40に接続され、前記数式手書き筆跡サンプル42を受信するために用いられている。前記出力インターフェース55は前記数式手書き筆跡サンプル42が対応する数式のプログラムコードを出力するために用いられている。
<Formula identification neural network 50>
It includes an input interface 51 and an output interface 55, the input interface 51 having a plurality of input terminals 52, and the output interface 55 having a plurality of output terminals 56. As shown in FIGS. 1 and 2, the input interface 51 is connected to the handwritten handwriting sample generation unit 40 and is used to receive the mathematical handwritten handwriting sample 42. The output interface 55 is used to output the program code of the mathematical formula to which the mathematical handwriting sample 42 corresponds.

また、トレーニング段階において、数万或いは数十万の数式手書き筆跡サンプル42をトレーニング用として採用する。前記数式手書き筆跡サンプル42の筆画座標は前記数式識別ニューラルネットワーク50の前記複数の入力端52に入力し、前記数式識別ニューラルネットワーク50の前記出力インターフェース55の出力結果を前記数式手書き筆跡サンプル42が対応するプログラムコードとして設定する。複数回反復してトレーニングを行った後、トレーニング過程において前記数式識別ニューラルネットワーク50中の結合重み値を調整することで、前記数式識別ニューラルネットワーク50が入力された数式手書き筆跡サンプル42を識別可能になる。 Furthermore, in the training stage, tens of thousands or hundreds of thousands of mathematical handwritten handwriting samples 42 are employed for training. The stroke coordinates of the mathematical handwriting sample 42 are input to the plurality of input terminals 52 of the mathematical equation identification neural network 50, and the output result of the output interface 55 of the mathematical equation identification neural network 50 is corresponded to the mathematical handwriting sample 42. Set as the program code to be used. After training is repeated multiple times, the connection weight values in the mathematical formula identification neural network 50 are adjusted during the training process, so that the mathematical formula identification neural network 50 can identify the input mathematical handwritten handwriting sample 42. Become.

また、予測段階において、数学文法に適合する数式100の筆画座標を前記数式識別ニューラルネットワーク50の入力インターフェース51に入力し、前記数式識別ニューラルネットワーク50により識別を行い、前記出力インターフェース55から少なくとも1つのプログラムコードを出力する。各前記プログラムコードは数式に対応する。 In the prediction stage, the stroke coordinates of the formula 100 that conform to the mathematical grammar are input to the input interface 51 of the formula identification neural network 50, the formula identification neural network 50 performs identification, and the output interface 55 selects at least one stroke coordinate. Output the program code. Each said program code corresponds to a mathematical formula.

前記数式識別ニューラルネットワーク50はエンコーダーニューラルネットワーク510及びデコーダーニューラルネットワーク520を含む(図3参照)。前記入力インターフェース51は前記エンコーダーニューラルネットワーク510に位置し、前記出力インターフェース55は前記デコーダーニューラルネットワーク520に位置している。前記エンコーダーニューラルネットワーク510は入力された数式100中から特徴を発見し、前記デコーダーニューラルネットワーク520に入力して前記数式識別ニューラルネットワーク50の出力を獲得するために用いられている。前記出力は元来入力された数式100の断片及び信頼性を含み、この断片及び信頼性を前記デコーダーニューラルネットワーク520中に回帰入力して再度識別を行う。これを数回反復して実行した後、複数の可能な数式のプログラムコード及び対応する信頼性を獲得すると共に結果候補セット81に保存する。前記自動回帰方式は、LL(1)文法の予測解析法を応用している。図4に示す応用例の如く、前記結果候補セット81は3つのプログラムコード「¥¥frac { 1 } { 3 }」、「- ¥¥frac { 1 } { 3 }」「¥¥frac { 1 } { 2 }」を含み、各プログラムコードの信頼性はそれぞれ50%、30%、20%である。これは入力された前記数式100がこの3つのプログラムコードが対応する数式であることを示し、且つ「¥¥frac { 1 } { 3 }」の信頼性が最も高い。 The formula identification neural network 50 includes an encoder neural network 510 and a decoder neural network 520 (see FIG. 3). The input interface 51 is located in the encoder neural network 510 and the output interface 55 is located in the decoder neural network 520. The encoder neural network 510 is used to discover features from the input formula 100 and input them to the decoder neural network 520 to obtain the output of the formula identification neural network 50. The output includes the fragments and reliability of the originally input formula 100, and the fragments and reliability are re-inputted into the decoder neural network 520 for re-identification. After repeating this several times, the program codes and corresponding reliability of a plurality of possible formulas are obtained and stored in the result candidate set 81. The automatic regression method applies the predictive analysis method of LL(1) grammar. As shown in the application example shown in FIG. 4, the result candidate set 81 includes three program codes "\\frac { 1 } { 3 }", "-\\frac { 1 } { 3 }" and "\\frac { 1 }". The reliability of each program code is 50%, 30%, and 20%, respectively. This indicates that the input formula 100 is a formula to which these three program codes correspond, and "\\frac {1} {3}" has the highest reliability.

本考案は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ考案された技術的手段を適宜組み合わせて得られる実施形態についても本考案の技術的範囲に含まれる。 The present invention is not limited to the embodiments described above, and can be modified in various ways within the scope of the claims, and embodiments obtained by appropriately combining technical means devised in different embodiments. are also included in the technical scope of the present invention.

1 システム
2 プロセッサ
6 メモリ
10 オンライン手書き数式ユニット
12 オンライン手書きサンプル
20 オフライン手書き及び活字体数式ユニット
22 オフライン手書き及び活字体数式サンプル
30 構造化数式生成ユニット
33 数学文法ベース
34 コーパス
40 手書き筆跡サンプル生成ユニット
42 数式手書き筆跡サンプル
50 数式識別ニューラルネットワーク
51 入力インターフェース
52 入力端
55 出力インターフェース
56 出力端
100 数式
510 エンコーダーニューラルネットワーク
520 デコーダーニューラルネットワーク
81 結果候補セット
1 System 2 Processor 6 Memory 10 Online handwritten mathematical formula unit 12 Online handwritten sample 20 Offline handwritten and printed mathematical formula unit 22 Offline handwritten and printed mathematical formula sample 30 Structured mathematical formula generation unit 33 Mathematical grammar base 34 Corpus 40 Handwritten handwriting sample generation unit 42 Mathematical handwriting sample 50 Mathematical identification neural network 51 Input interface 52 Input end 55 Output interface 56 Output end 100 Mathematical formula 510 Encoder neural network 520 Decoder neural network 81 Result candidate set

Claims (11)

プロセッサ及びメモリを備え、前記プロセッサはシステムに必要な操作を実行するために用いられ、前記メモリは前記システム中のコンピュータープログラムのデータまたは演算プログラム、関連する操作結果、及び関連するデータを保存するために用いられている構文主導型の数式識別システムであって、
オンライン手書き数式を受信するために用いられ、即ち、前記オンライン手書き数式中の数学記号及び関連する文字の筆画を受信し、前記オンライン手書き数式中の各筆画の座標及び前記オンライン手書き数式の対応するプログラムコードを獲得し、オンライン手書きサンプルを形成するために用いられているオンライン手書き数式ユニットであって、前記プログラムコードは数学プログラム言語中の特定プログラムコードに対応し、前記オンライン手書き数式ユニットは、ニューラルネットワークをトレーニングするための多数の前記オンライン手書きサンプルとして保存するオンライン手書き数式サンプルライブラリを含むオンライン手書き数式ユニットと、
既知のプログラムコードのオフライン手書き及び活字体数式を受信し、前記オフライン手書き及び活字体数式並びにその対応する既知のプログラムコードによりオフライン手書き及び活字体数式サンプルを形成し、オフライン手書き及び活字体数式サンプルライブラリに保存するために用いられているオフライン手書き及び活字体数式ユニットと、
構造化数式を生成するために用いられている構造化数式生成ユニットであって、前記構造化数式生成ユニットはコーパス及び数学文法ベースを含み、前記構造化数式生成ユニットは大量の数式のプログラムコードを収集すると共に前記コーパスに保存し、前記数学文法ベースには特定の数学プログラム言語の文法(grammar)が保存され、前記構造化数式生成ユニットは前記数学文法ベースの文法に基づいて前記コーパス中の数式のプログラムコードに対し前記数学プログラム言語の形式に適合する多数の構造化数式として組み合わせる構造化数式生成ユニットと、
前記オンライン手書き数式ユニット、前記オフライン手書き及び活字体数式ユニット、及び前記構造化数式生成ユニットに接続されている手書き筆跡サンプル生成ユニットであって、前記手書き筆跡サンプル生成ユニットは前記オンライン手書き数式ユニット、前記オフライン手書き及び活字体数式ユニット、及び前記構造化数式生成ユニットの各数式をニューラルネットワークをトレーニングするための多数の数式手書き筆跡サンプルとして変換するために用いられている手書き筆跡サンプル生成ユニットと、
入力インターフェース及び出力インターフェースを含む数式識別ニューラルネットワークであって、前記入力インターフェースは複数の入力端を具備し、前記出力インターフェースは複数の出力端を具備し、前記入力インターフェースは前記手書き筆跡サンプル生成ユニットに接続され、トレーニング段階において、前記入力インターフェースは前記数式手書き筆跡サンプルを受信するために用いられ、前記出力インターフェースは前記数式手書き筆跡サンプルが対応する数式のプログラムコードを出力するために用いられ、予測段階において、前記入力インターフェースは数学文法に適合する数式の筆画座標を受信するために用いられ、前記数式識別ニューラルネットワークにより識別を行うと共に、前記出力インターフェースから少なくとも1つのプログラムコードを出力し、識別結果を表示し、各前記プログラムコードは数式に対応する数式識別ニューラルネットワークと、を更に備えていることを特徴とする構文主導型の数式識別システム。
comprising a processor and a memory, the processor is used to perform operations necessary for the system, and the memory is for storing data or calculation programs of computer programs in the system, related operation results, and related data; A syntax-driven formula identification system used in
used for receiving online handwritten formulas, that is, receiving strokes of mathematical symbols and associated characters in the online handwritten formulas, and the coordinates of each stroke in the online handwritten formulas and the corresponding program of the online handwritten formulas; an online handwritten mathematical formula unit used to acquire a code and form an online handwritten sample, the program code corresponding to a specific program code in a mathematical programming language; an online handwritten formula unit including an online handwritten formula sample library that stores a large number of said online handwritten samples for training;
receiving offline handwritten and printed mathematical formulas of known program codes, forming offline handwritten and printed mathematical formula samples with said offline handwritten and printed mathematical formulas and their corresponding known program codes; and an offline handwritten and printed mathematical formula sample library. Offline handwritten and printed math units used to store
A structured formula generation unit used to generate structured formulas, the structured formula generation unit includes a corpus and a mathematical grammar base, and the structured formula generation unit generates a large amount of program code of formulas. The mathematical grammar base stores a grammar of a specific mathematical programming language, and the structured formula generation unit generates mathematical formulas in the corpus based on the grammar of the mathematical grammar base. a structured formula generation unit that combines the program code into a large number of structured formulas that conform to the format of the mathematical programming language;
a handwritten handwriting sample generation unit connected to the online handwritten math equation unit, the offline handwritten and printed math equation unit, and the structured math equation generation unit, wherein the handwritten handwriting sample generation unit is connected to the online handwritten math equation unit, the an offline handwritten and printed math equation unit; and a handwritten handwriting sample generation unit used to convert each equation of the structured math equation generation unit into a number of mathematical handwritten handwriting samples for training a neural network;
A mathematical expression recognition neural network including an input interface and an output interface, the input interface having a plurality of input ends, the output interface having a plurality of output ends, and the input interface connecting the handwriting sample generation unit to the handwriting sample generation unit. and in a training stage, the input interface is used to receive the mathematical handwriting sample, and the output interface is used to output a program code of the mathematical formula to which the mathematical handwritten handwriting sample corresponds, and in the prediction stage. In the input interface, the input interface is used to receive stroke coordinates of a mathematical formula that conforms to a mathematical grammar, and the mathematical formula identification neural network performs identification, and outputs at least one program code from the output interface to receive the identification result. a syntax-driven equation identification system, further comprising: an equation identification neural network for displaying, each of said program codes corresponding to a math equation.
前記数式手書き筆跡サンプルの生成方式は、
(a)各前記オンライン手書きサンプル中の各筆画の座標及び前記オンライン手書き数式の対応するプログラムコードにより、対応する数式手書き筆跡サンプルを形成し、
(b)各前記オフライン手書き及び活字体数式サンプルのオフライン手書き及び活字体数式により筆画を抽出し、各筆画の座標を獲得し、前記オフライン手書き及び活字体数式の対応するプログラムコードは既知のものであるため、両者は対応する数式手書き筆跡サンプルを形成し、
(c)前記構造化数式生成ユニットの各前記構造化数式によりそれが対応する数式手書き筆跡サンプルを合成することを特徴とする請求項1に記載の構文主導型の数式識別システム。
The generation method of the mathematical handwriting sample is as follows:
(a) forming a corresponding mathematical handwritten handwriting sample according to the coordinates of each stroke in each of the online handwritten samples and the corresponding program code of the online handwritten mathematical formula;
(b) extracting strokes by the offline handwritten and printed formulas of each of said offline handwritten and printed formula samples, and obtain the coordinates of each stroke, and the corresponding program code of said offline handwritten and printed formulas is known; Therefore, the two form a corresponding mathematical handwriting sample,
2. The syntax-driven formula identification system according to claim 1, wherein each of the structured formulas of the structured formula generation unit synthesizes a corresponding formula handwriting sample.
前記数式識別ニューラルネットワークはエンコーダーニューラルネットワーク及びデコーダーニューラルネットワークを含み、前記入力インターフェースは前記エンコーダーニューラルネットワークに位置し、前記出力インターフェースは前記デコーダーニューラルネットワークに位置し、前記エンコーダーニューラルネットワークは入力した数式中から特徴を発見し、前記デコーダーニューラルネットワークに入力して前記数式識別ニューラルネットワークの出力を獲得するために用いられ、前記出力は元来入力された数式の断片及び信頼性を含み、この断片及び信頼性を前記デコーダーニューラルネットワークに回帰入力して再度識別を行い、これを数回反復して実行した後、複数の可能な数式のプログラムコード及び対応する信頼性を獲得すると共に結果候補セット中に保存することを特徴とする請求項1に記載の構文主導型の数式識別システム。 The formula identification neural network includes an encoder neural network and a decoder neural network, the input interface is located in the encoder neural network, the output interface is located in the decoder neural network, and the encoder neural network recognizes the input formula from among the input formulas. It is used to discover features and input them into the decoder neural network to obtain the output of the formula identification neural network, the output including the fragments and reliability of the formula originally input, and the fragments and the reliability. is regressively input into the decoder neural network to perform identification again, and after repeating this several times, program codes and corresponding reliability of multiple possible formulas are obtained and stored in a result candidate set. 2. The syntax-driven formula identification system of claim 1. 前記自動回帰方式は、LL(1)文法の予測解析法を応用していることを特徴とする請求項3に記載の構文主導型の数式識別システム。 4. The syntax-driven formula identification system according to claim 3, wherein the automatic regression method applies a predictive analysis method of LL(1) grammar. 前記オンライン手書き数式ユニットは前記オンライン手書き数式中からサブ数式を更に抽出し、即ち、単独の数式を構成する前記オンライン手書き数式中の一部分を指し、これらサブ数式に対し筆画及びプログラムコードを取得し、対応するオンライン手書きサンプルを生成し、前記オンライン手書き数式サンプルライブラリに保存することを特徴とする請求項1に記載の構文主導型の数式識別システム。 The online handwritten formula unit further extracts sub-formulas from the online handwritten formula, that is, refers to a part of the online handwritten formula that constitutes a single formula, and obtains strokes and program codes for these sub-formulas; The syntax-driven math equation identification system of claim 1, wherein a corresponding online handwritten math sample is generated and stored in the online handwritten math sample library. 前記数学プログラム言語はLaTeXまたはMathML(Mathematical Markup Language)であることを特徴とする請求項1に記載の構文主導型の数式識別システム。 The syntax-driven formula identification system according to claim 1, wherein the mathematical programming language is LaTeX or MathML (Mathematical Markup Language). 前記オンライン手書きサンプル中の各筆画の座標はInkML(Ink Markup Language、インクマークアップ言語)形式で保存することを特徴とする請求項1に記載の構文主導型の数式識別システム。 The syntax-driven formula identification system of claim 1, wherein the coordinates of each stroke in the online handwritten sample are stored in an Ink Markup Language (InkML) format. 前記オフライン手書き及び活字体数式は二次元画像形式で保存し、その対応するプログラムコードは数学マークアップ言語(markup language)形式で保存することを特徴とする請求項1に記載の構文主導型の数式識別システム。 The syntax-driven formula of claim 1, wherein the offline handwritten and printed formula is stored in a two-dimensional image format, and the corresponding program code is stored in a mathematical markup language format. identification system. 前記数学文法ベースに保存する数学プログラム言語の文法は確率文脈自由文法(Stochastic context-free grammar)であることを特徴とする請求項1に記載の構文主導型の数式識別システム。 The syntax-driven formula identification system of claim 1, wherein the grammar of the mathematical programming language stored in the mathematical grammar base is a stochastic context-free grammar. 前記確率文脈自由文法は数式を描写するLaTeXまたはMathMLプログラムコードを満たす文法であることを特徴とする請求項9に記載の構文主導型の数式識別システム。 10. The syntax-driven formula identification system of claim 9, wherein the probabilistic context-free grammar is a grammar that satisfies a LaTeX or MathML program code that describes a formula. 前記構造化数式は数学マークアップ言語(markup language)形式で保存することを特徴とする請求項1に記載の構文主導型の数式識別システム。 The syntax-driven formula identification system of claim 1, wherein the structured formula is stored in a mathematical markup language format.
JP2023002183U 2022-08-04 2023-06-21 Syntax-driven formula identification system Active JP3243700U (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE202022104461 2022-08-04
DE202022104461.9U DE202022104461U1 (en) 2022-08-04 2022-08-04 Syntax guided recognition system for mathematical terms

Publications (1)

Publication Number Publication Date
JP3243700U true JP3243700U (en) 2023-09-12

Family

ID=83114625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023002183U Active JP3243700U (en) 2022-08-04 2023-06-21 Syntax-driven formula identification system

Country Status (3)

Country Link
JP (1) JP3243700U (en)
DE (1) DE202022104461U1 (en)
TW (1) TWM649558U (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240021001A1 (en) * 2022-07-14 2024-01-18 Jianming Zhuang Syntax-directed mathematical expression recognition system

Also Published As

Publication number Publication date
DE202022104461U1 (en) 2022-08-16
TWM649558U (en) 2023-12-21

Similar Documents

Publication Publication Date Title
Alonso et al. Adversarial generation of handwritten text images conditioned on sequences
Shi et al. Represent, compare, and learn: A similarity-aware framework for class-agnostic counting
US20210397266A1 (en) Systems and methods for language driven gesture understanding
Bhunia et al. Handwriting transformers
JP3243700U (en) Syntax-driven formula identification system
CN113283336A (en) Text recognition method and system
CN110114776A (en) Use the system and method for the character recognition of full convolutional neural networks
WO2023050650A1 (en) Animation video generation method and apparatus, and device and storage medium
Kotani et al. Generating handwriting via decoupled style descriptors
Barz et al. Digital pen features predict task difficulty and user performance of cognitive tests
Edirisooriya et al. An empirical evaluation of end-to-end polyphonic optical music recognition
Arafat et al. Two stream deep neural network for sequence-based Urdu ligature recognition
CN114419174A (en) On-line handwritten text synthesis method, device and storage medium
CN111046751A (en) Formula identification method and device
CN114730241B (en) Gesture and stroke recognition in touch user interface input
Papaioannou et al. Mimicme: A large scale diverse 4d database for facial expression analysis
US11756244B1 (en) System and method for handwriting generation
CN110135583A (en) The generation method of markup information, the generating means of markup information and electronic equipment
Kaddoura A Primer on Generative Adversarial Networks
CN115311665A (en) Handwritten numbered musical notation recognition method and system
Wu et al. Beyond Language Models: Byte Models are Digital World Simulators
KR20200001902A (en) Method and system for generating learning data of sign language recognition artificial neural network, and system for generating modified animation
Ho Data complexity analysis: linkage between context and solution in classification
KR20240009907A (en) Syntax-directed mathematical expression recognition system
Shin et al. Japanese Sign Language Recognition by Combining Joint Skeleton-Based Handcrafted and Pixel-Based Deep Learning Features with Machine Learning Classification

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230726

R150 Certificate of patent or registration of utility model

Ref document number: 3243700

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230912