JP2020140450A - Structured data generation method and structured data generation device - Google Patents
Structured data generation method and structured data generation device Download PDFInfo
- Publication number
- JP2020140450A JP2020140450A JP2019035611A JP2019035611A JP2020140450A JP 2020140450 A JP2020140450 A JP 2020140450A JP 2019035611 A JP2019035611 A JP 2019035611A JP 2019035611 A JP2019035611 A JP 2019035611A JP 2020140450 A JP2020140450 A JP 2020140450A
- Authority
- JP
- Japan
- Prior art keywords
- information
- structured data
- text
- graphic
- data generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、手書き画像に基づいて構造化データを生成する構造化データ生成方法および構造化データ生成装置に関する。 The present invention relates to a structured data generation method and a structured data generation device that generate structured data based on a handwritten image.
従来の構造化データ生成装置は、手書きの文字や図形、記号などが混在した図に含まれる個々の要素を認識し、誤って文字や図形、記号を決定した後であっても、新たに加えられる画像とともに適切な文字や図形、記号へ動的に変換するようにしている(例えば、特許文献1参照)。 The conventional structured data generator recognizes individual elements contained in a figure in which handwritten characters, figures, symbols, etc. are mixed, and even after erroneously determining characters, figures, symbols, etc., new additions are made. It is dynamically converted into appropriate characters, figures, and symbols together with the image to be obtained (see, for example, Patent Document 1).
しかしながら、従来の技術においては、手書きの図を画像読取装置などにより電子データ化した場合、それぞれの要素(オブジェクト)の繋がりや階層構造が認識されず、手書きの図が有する情報を構造化したデータとして利用することができないという問題がある。 However, in the conventional technique, when a handwritten figure is converted into electronic data by an image reading device or the like, the connection and hierarchical structure of each element (object) are not recognized, and the information contained in the handwritten figure is structured data. There is a problem that it cannot be used as.
本発明は、このような問題を解決することを課題とし、手書きの図が有する情報を構造化したデータとして生成することを目的とする。 An object of the present invention is to solve such a problem, and an object of the present invention is to generate information contained in a handwritten figure as structured data.
そのため、本発明は、構造化データ生成装置における構造化データ生成方法であって、手書き画像から前記手書き画像内のテキストの位置情報を含むテキスト情報および図形の位置情報を含む図形情報を抽出するステップと、前記テキスト情報および前記図形情報に基づいて前記手書き画像の種別を判別する判別ステップと、抽出されたテキストの位置情報および図形の位置情報に基づいて前記テキストおよび前記図形の位置関係によりテキスト情報と図形情報とを関連付けた要素データを生成するステップと、判別された手書き画像の種別に対応する特徴情報と、生成された要素データとに基づいて構造化データを生成する構造化データ生成ステップと、を有することを特徴とする。 Therefore, the present invention is a structured data generation method in a structured data generation device, and is a step of extracting text information including position information of text in the handwritten image and graphic information including position information of a figure from a handwritten image. And the determination step of determining the type of the handwritten image based on the text information and the graphic information, and the text information based on the positional relationship between the text and the graphic based on the position information of the extracted text and the positional information of the graphic. A step of generating element data in which the data is associated with the graphic information, a step of generating structured data based on the feature information corresponding to the determined type of handwritten image, and the generated element data. It is characterized by having.
このようにした本発明は、手書きの図が有する情報を構造化したデータとして生成することができるという効果が得られる。 The present invention in this manner has the effect that the information contained in the handwritten figure can be generated as structured data.
以下、図面を参照して本発明による構造化データ生成方法および構造化データ生成装置の実施例を説明する。 Hereinafter, examples of the structured data generation method and the structured data generation apparatus according to the present invention will be described with reference to the drawings.
図1は実施例における構造化データ生成装置の構成を示すブロック図である。 FIG. 1 is a block diagram showing a configuration of a structured data generation device in an embodiment.
図1において、構造化データ生成装置100は、手書きの文字(テキスト)や図形を含む手書き画像に基づいて構造化データを生成するコンピュータ装置等であり、オブジェクト抽出部110と、画像種別判別部120と、要素データ作成部130と、構造化データ作成部140と、構造化イメージ作成部150とを有している。
In FIG. 1, the structured
また、構造化データ生成装置100は、CPU(Central Processing Unit)等の制御部およびメモリ等の記憶部を備え、記憶部に記憶された制御プログラム(ソフトウェア)に基づいて制御部により全体の動作が制御される。
Further, the structured
オブジェクト抽出部110は、手書き画像200を取得するための図示されていない手書き画像取得部が接続され、その手書き画像取得部により取得(入力)された手書き画像200から各要素(オブジェクト)の属性情報をテキスト情報および図形情報として抽出するものである。このオブジェクト抽出部110は、入力された手書き画像200から手書き画像200内のテキストの位置情報を含むテキスト情報、並びに四角形、楕円、および矢印等の図形の位置情報を含む図形情報を抽出する。
The
手書き画像取得部は、カメラ、イメージスキャナ等の撮像素子を用いて紙やホワイトボード等の被写体に描画された手書き画像200を取得したり、または、タブレットをスキャンしてタブレット上を指、ペンやレーザーポインタ等のポインティングデバイスでなぞられた手書き画像200を取得する。
The handwritten image acquisition unit acquires a
ここで、テキスト情報とは、手書き画像200に書かれた文字(テキスト)の属性情報であり、例えば文字および文字の大きさ、字体、色、位置等の文字に関する各種情報である。
Here, the text information is the attribute information of the character (text) written on the
また、図形情報とは、手書き画像200に書かれた図形の属性情報であり、例えば図形の形状および図形の大きさ、位置等の文字に関する各種情報である。
Further, the graphic information is attribute information of the graphic written on the
なお、手書き画像200はスキャナ等の画像読取装置で読取られ、生成された手書きによる図(フローチャート、線表(工程表)、シーケンス図、ステートチャート図等)の画像データである。
The
また、テキスト情報は、手書き画像200に書かれている文字の他に、手書き画像200内の文字の位置を表す座標(手書き画像200におけるXY座標)情報を含んでいる。図形情報は、図形の種別(四角形、楕円、および矢印等)や図形の位置を表す座標(手書き画像200におけるXY座標)情報、大きさなどのベクトル情報を含んでいる。
Further, the text information includes coordinates (XY coordinates in the handwritten image 200) representing the positions of the characters in the
画像種別判別部120は、入力された手書き画像200、並びにオブジェクト抽出部110で抽出されたテキスト情報および図形情報に基づいて手書き画像の種別(フローチャート、線表(工程表)、シーケンス図、ステートチャート図等)を判別するものである。
The image
画像種別判別部120は、テキスト情報および図形情報に基づいて手書き画像の種別を判別するため、AI(Artifical Interlligence:人工知能)の予測モデルを利用する。
The image
図2は実施例における予測モデルの説明図である。図2に示すように、画像の種別を判別できるようにするため、AI学習処理は、手書きの画像と、手書きの画像から抽出したテキスト情報および図形情報とを入力データとし、手書きの画像の図が示す画像の種別を教師データとしてAIの学習を実行し、AI予測モデルを生成する。 FIG. 2 is an explanatory diagram of the prediction model in the embodiment. As shown in FIG. 2, in order to be able to determine the type of image, the AI learning process uses a handwritten image and text information and graphic information extracted from the handwritten image as input data, and is a diagram of the handwritten image. AI learning is executed using the type of the image indicated by the above as teacher data, and an AI prediction model is generated.
この学習により得られたAI予測モデルは、手書きの画像と、テキスト情報および図形情報とを入力データとして、画像の種別を予測することが可能になる。そのため、画像種別判別部120は、AI予測モデルを手書き画像の種別を判別するために利用する。
The AI prediction model obtained by this learning can predict the type of an image by using a handwritten image and text information and graphic information as input data. Therefore, the image
このように、画像種別判別部120は、手書き画像と、手書き画像から抽出したテキスト情報および図形情報とを入力データとし、手書き画像の種別を教師データとしてAI学習を実行した結果として生成された予測モデルを用いる。
In this way, the image
要素データ作成部130は、オブジェクト抽出部110で抽出されたテキストの位置情報および図形の位置情報に基づいてテキストおよび図形の位置関係によりテキスト情報と図形情報とを関連付けた要素データを作成(生成)するものである。
The element
要素データとは、テキスト情報に含まれる位置情報および図形情報に含まれる位置情報に基づいて近傍に配置されたテキスト情報と図形情報とを関連付けた情報である。本実施例では、要素データは、テキストの位置と図形の位置との距離が閾値以下の場合、そのテキスト情報と図形情報とが関連付けられて生成される。 The element data is information in which the text information arranged in the vicinity and the graphic information are associated with each other based on the position information included in the text information and the position information included in the graphic information. In this embodiment, when the distance between the position of the text and the position of the graphic is equal to or less than the threshold value, the element data is generated by associating the text information with the graphic information.
なお、テキスト情報と図形情報とを関連付けられなかった場合、それぞれのテキスト情報および図形情報が1つの要素データを構成する。 When the text information and the graphic information cannot be associated with each other, the respective text information and the graphic information constitute one element data.
構造化データ作成部140は、画像種別判別部120で判別した手書き画像の種別に合わせて、手書き画像の種別に対応した特徴情報と、要素データ作成部130で作成された要素データとに基づいて構造化データを作成するものである。
The structured
ここで、構造化データとは、手書き画像200に描かれた各要素(オブジェクト)の属性を表す情報であり、各要素(オブジェクト)の繋がりや階層構造が認識されたデータである。本実施例では、構造化データをXML(Extensible Markup Language)等のマークアップ言語を使用して記述し、手書き画像200に描かれた各要素(オブジェクト)の繋がりや階層構造を認識したデータとしている。
Here, the structured data is information representing the attributes of each element (object) drawn on the
この構造化データは、文書編集ソフトウェアや表計算ソフトウェア、プロジェクト管理ツール、UMLモデリングツール等の各種ソフトウェアに入力することができるものである。 This structured data can be input to various software such as document editing software, spreadsheet software, project management tools, and UML modeling tools.
また、特徴情報は、手書き画像の特徴となる情報であり、手書き画像の種別に対応させてメモリ等の記憶部に予め記憶された情報である。 Further, the feature information is information that is characteristic of the handwritten image, and is information stored in advance in a storage unit such as a memory corresponding to the type of the handwritten image.
この特徴情報は、例えば手書き画像の種別が“フローチャート”の場合、属性情報が直線(Type=Line)または矢印(Type=Arrow)の要素データを“接続データ”、属性情報が直線(Type=Line)または矢印(Type=Arrow)以外の要素データを“構成データ”とする情報である。 For this feature information, for example, when the type of the handwritten image is "flow chart", the element data of the attribute information is a straight line (Type = Line) or the arrow (Type = Arrow) is "connection data", and the attribute information is a straight line (Type = Line). ) Or the element data other than the arrow (Type = Arrow) is the information as "configuration data".
また、手書き画像の種別が“線表”の場合、属性情報が直線(Type=Line)または矢印(Type=Arrow)の要素データを“構成データ”、属性情報が項目(Type=Item)の要素データを“項目データ”、属性情報が日付(Type=Date)の要素データを“日付データ”とする情報である。 When the type of the handwritten image is "line table", the element data of the attribute information is a straight line (Type = Line) or an arrow (Type = Arrow) is "configuration data", and the attribute information is an element of an item (Type = Item). The data is "item data", and the element data whose attribute information is date (Type = Date) is "date data".
構造化イメージ作成部150は、構造化データ作成部140により作成された構造化データから整形した画像を作成するものである。
The structured
このように構成された構造化データ生成装置100は、手書きの文字(テキスト)や図形を含む手書き画像に基づいて構造化データを生成する。
The structured
上述した構成の作用について説明する。 The operation of the above-described configuration will be described.
構造化データ生成装置が行う構造化データ生成処理を図3の実施例における構造化データ生成処理の流れを示すフローチャートの図中Sで表すステップに従って図1および図2を参照しながら説明する。 The structured data generation process performed by the structured data generation device will be described with reference to FIGS. 1 and 2 according to the steps represented by S in the flowchart showing the flow of the structured data generation process in the embodiment of FIG.
S301:構造化データ生成装置100のオブジェクト抽出部110は、入力された手書き画像200に含まれるテキスト(文字)、図形、それらの位置や大きさを認識してテキスト情報および図形情報を抽出する。オブジェクト抽出部110は、例えば図4に示すフローチャートの手書き画像200aから図6に示すテキスト情報および図形情報を抽出し、図5に示す線表(工程表)の手書き画像200bから図7に示すテキスト情報および図形情報を抽出する。
S301: The
S302:画像種別判別部120は、入力された手書き画像200、並びにS301においてオブジェクト抽出部110で抽出されたテキスト情報および図形情報に基づいて図2に示すAI予測モデルを利用して手書き画像の種別を判別する。(判別ステップ)
画像種別判別部120は、例えば図4に示す手書き画像200aを“フローチャート”、図5に示す手書き画像200bを“線表”と判別する。
S302: The image
For example, the image
S303:要素データ作成部130は、オブジェクト抽出部110で抽出されたテキスト情報と図形情報とを関連付け、要素データを作成する要素データ作成処理を行う。
S303: The element
要素データ作成部130は、例えばテキストと、そのテキストを囲む図形とを関連付けたり、テキストと、そのテキストの近傍にある線や矢印とを関連付けたりし、テキスト情報と図形情報とグループ化した要素データを作成する。
The element
要素データ作成部130は、図6に示すテキスト情報および図形情報に基づいて図8に示す要素データを作成し、また図7に示すテキスト情報および図形情報に基づいて図9に示す要素データを作成する。
The element
なお、要素データ作成部130が行う要素データ作成処理の詳細は後述する。
The details of the element data creation process performed by the element
S304:構造化データ作成部140は、S302において画像種別判別部120で判別した手書き画像の種別に基づいて構造化データの作成方法を決定する。
S304: The structured
構造化データ作成部140は、手書き画像の種別がフローチャートの場合、S305aの処理を行い、手書き画像の種別が線表の場合、S305bの処理を行い、手書き画像の種別がシーケンス図の場合、S305nの処理を行い、要素データ作成部130で作成された要素データより構造化データを作成する。
The structured
S305a:手書き画像の種別がフローチャートである場合、構造化データ作成部140は、フローチャートの特徴に合わせて要素データに基づいて構造化データを作成し、処理をS306へ移行する。(構造化データ生成ステップ)
構造化データ作成部140は、構造化データを作成するために、要素データをType=Line、またはType=Arrowの“接続データ”とそれ以外のTypeを持つ“構成データ”に分類する。
S305a: When the type of the handwritten image is a flowchart, the structured
In order to create structured data, the structured
次に、構造化データ作成部140は、それぞれの接続データの始点ポジション(始点位置座標)および終点ポジション(終点位置座標)の最近傍のデータを確認する。構造化データ作成部140は、接続データの始点ポジションまたは終点ポジションの最近傍データが異なる接続データである場合、該当する接続データの始点ポジションまたは終点ポジションを、最近傍にある別の接続データの始点ポジションまたは終点ポジションに変更する。
Next, the structured
構造化データ作成部140は、接続データの始点ポジションまたは終点ポジションに変更した後、接続データの始点ポジションまたは終点ポジションの再近傍の構成データと接続する。
After changing to the start point position or end point position of the connection data, the structured
このように、構造化データ作成部140は、要素データを直線(Line)または矢印(Arrow)を表す情報を有する図形情報を複数の接続オブジェクトの情報(接続データ)とし、それ以外の図形情報およびテキスト情報を構成オブジェクトの情報(構成データ)として分類し、第1の接続オブジェクトに最も接近している第2の接続オブジェクトの位置情報を第1の接続オブジェクトの位置情報に変更し、第1の接続オブジェクトおよび第2の接続オブジェクトと、第1の接続オブジェクトおよび第2の接続オブジェクトに最も近接した構成オブジェクトとを関連付けて構造化データを生成する。
In this way, the structured
図11は、図8に示す要素データから作成した接続後の構成データの例を示している。構造化データ作成部140は、図11に示すように、1つの構成データが、複数の接続データの始点(<From=・・・>)となっている場合、分岐タグを作成した後、図12に示す構造化データとして出力する。
FIG. 11 shows an example of the post-connection configuration data created from the element data shown in FIG. As shown in FIG. 11, the structured
その際、構造化データ作成部140は、構成データのTypeが“rhomb”(ひし形)となっているかを確認し、Typeが“rhomb”になっていない場合はエラーとする。
At that time, the structured
このように、構造化データ作成部140は、1つの構成オブジェクトが、複数の接続オブジェクトに関連付けられ、当該複数の接続オブジェクトの始点となっている場合、構成オブジェクトの属性がひし形でないとき異常と判定する。これにより、より正確な構造化データを生成することができる。
In this way, when one configuration object is associated with a plurality of connection objects and is the starting point of the plurality of connection objects, the structured
S305b:手書き画像の種別が線表である場合、構造化データ作成部140は、線表の特徴に合わせて要素データに基づいて構造化データを作成し、処理をS306へ移行する。(構造化データ生成ステップ)
構造化データ作成部140は、構造化データを作成するために、要素データをType=Line、またはType=Arrowの“構成データ”と、Type=Itemの“項目データ”と、Type=Dateの“日付データ”とに分類する。
S305b: When the type of the handwritten image is a line table, the structured
In order to create structured data, the structured
構造化データ作成部140は、要素データを分類した後、構成データと、構成データの始点および終点のX座標近傍の日付データとを関連付ける。
After classifying the element data, the structured
このように、構造化データ作成部140は、要素データを直線(Line)または矢印(Arrow)を表す情報を有する図形情報を構成オブジェクトの情報(構成データ)とし、項目を表す情報を有するテキスト情報を項目オブジェクトの情報(項目データ)とし、日付を表す情報を有するテキスト情報を日付オブジェクトの情報(日付データ)として分類し、構成オブジェクトと、構成オブジェクトに最も接近している日付オブジェクトとを関連付けて構造化データを生成する。
In this way, the structured
図13は、日付データと関連付けた構成データの例を示している。 FIG. 13 shows an example of configuration data associated with date data.
次に、構造化データ作成部140は、項目データのY座標近傍の構成データを関連付け、図14に示す構造化データとして出力する。
Next, the structured
S305n:手書き画像の種別がシーケンス図である場合、構造化データ作成部140は、シーケンス図の特徴に合わせて要素データに基づいて構造化データを作成し、処理をS306へ移行する。(構造化データ生成ステップ)
なお、シーケンス図の構造化データの作成処理の詳細の説明は省略する。
S305n: When the type of the handwritten image is a sequence diagram, the structured
The detailed description of the process of creating the structured data of the sequence diagram will be omitted.
S306:構造化データ作成部140は、S305a〜S305nで作成した構造化データをファイルとして出力する。
S306: The structured
S307:構造化イメージ作成部150は、構造化データ作成部140により作成された構造化データに基づいて手書き画像を整形して各オブジェクトの繋がりや階層構造が認識し易い構造化イメージデータ(画像)を作成して出力し、本処理を終了する。
S307: The structured
次に、構造化データ生成装置が行う要素データ作成処理を図10の実施例における要素データ作成処理の流れを示すフローチャートの図中Sで表すステップに従って図1および図2を参照しながら説明する。なお、この要素データ作成処理は、図3のS303において要素データ作成部130が行う処理である。
Next, the element data creation process performed by the structured data generation device will be described with reference to FIGS. 1 and 2 according to the steps represented by S in the flowchart showing the flow of the element data creation process in the embodiment of FIG. It should be noted that this element data creation process is a process performed by the element
S401:要素データ作成部130は、オブジェクト抽出部110で抽出されたテキスト情報(例えば、図6、図7に示すテキスト情報および図形情報)を検索し、日付に関するデータを検出すると、テキスト情報の種別を“テキスト”から“日付”に変換する。例えば、図7のID=2の情報が日付(“3/B”)に関するデータであるため、Type=TextからType=Dateに変換する。要素データ作成部130は、テキスト情報をType=TextとType=Dateに分類し、分類したテキスト情報をリスト1に登録する。
S401: The element
S402:要素データ作成部130は、日付情報を含むテキスト情報以外の情報(Type=TextとType=Date以外の情報)、即ち図形情報をリスト2に登録する。
S402: The element
S403:要素データ作成部130は、リスト2より図形情報を1つ取り出し、取り出した図形情報をリスト2から削除する。
S403: The element
S404:要素データ作成部130は、取り出した図形情報が線(Type=Line)または矢印(Type=Arrow)か否かを判定し、取り出した図形情報が線または矢印の場合、処理をS405へ移行し、取り出した図形情報が線または矢印でない場合、処理をS406へ移行する。
S404: The element
S405:要素データ作成部130は、取り出した図形情報が線または矢印の場合、その図形情報の近傍にテキスト情報がある(存在する)か否かをリスト1に登録された情報から判定し、図形情報の近傍にテキスト情報があると判定すると処理をS407へ移行し、図形情報の近傍にテキスト情報がないと判定すると処理をS409へ移行する。
S405: When the extracted graphic information is a line or an arrow, the element
要素データ作成部130は、線または矢印、およびテキスト情報の位置情報を用いて距離を算出し、その距離が特定の閾値以下である場合、図形情報の近傍にテキスト情報があると判定し、閾値より大きい場合、図形情報の近傍にテキスト情報がないと判定する。
The element
例えば、図7に示すID=3のテキスト情報(印刷・スキャン)とID=4の図形情報(矢印)が近傍にあると判定される。 For example, it is determined that the text information (print / scan) with ID = 3 and the graphic information (arrow) with ID = 4 shown in FIG. 7 are in the vicinity.
S406:要素データ作成部130は、取り出した図形情報が線または矢印でない場合、取り出した図形情報の図形内にテキスト情報がある(存在する)か否かをリスト1に登録された情報に基づいて判定し、図形内にテキスト情報があると判定すると処理をS407へ移行し、図形内にテキスト情報がないと判定すると処理をS409へ移行する。
S406: When the extracted graphic information is not a line or an arrow, the element
例えば、図6に示すID=1の図形情報で表される図形内に、ID=3のテキスト情報(スタート)が含まれていると判定される。 For example, it is determined that the text information (start) of ID = 3 is included in the graphic represented by the graphic information of ID = 1 shown in FIG.
S407:要素データ作成部130は、線または矢印の図形情報の近傍にテキスト情報がある場合、または図形情報の図形内にテキスト情報がある場合、当該テキスト情報を近傍に存在する図形情報と関連付け、要素データを作成する。
S407: When there is text information in the vicinity of the graphic information of the line or arrow, or when there is text information in the graphic of the graphic information, the element
例えば、図6におけるID=1とID=3の情報や、図7におけるID=3とID=4の情報は、本ステップにおいて関連付けられ、テキスト情報および図形情報からなる要素データとして作成する。 For example, the information of ID = 1 and ID = 3 in FIG. 6 and the information of ID = 3 and ID = 4 in FIG. 7 are related in this step and are created as element data including text information and graphic information.
S408:要素データ作成部130は、図形情報と関連付けて要素データを作成したテキスト情報をリスト1から削除し、処理をS410へ移行する。
S408: The element
S409:要素データ作成部130は、線または矢印の図形情報の近傍にテキスト情報がない場合、または図形情報の図形内にテキスト情報がない場合、当該図形情報のみで要素データを作成する。
S409: The element
S410:要素データ作成部130は、リスト2に登録されている図形情報が空になったか否か(図形情報がなくなったか否か)を判定し、空になっていないと判定すると処理をS403へ戻してS403〜S409の処理を繰り返して行い、空になったと判定すると処理をS411へ移行する。
S410: The element
S411:要素データ作成部130は、リスト2に登録されている図形情報が空になったと判定すると、リスト1に登録されているテキスト情報が空になったか否か(テキスト情報がなくなったか否か)を判定し、空になっていないと判定すると処理をS412へ移行し、空になったと判定すると本処理を終了する。
S411: When the element
S412:要素データ作成部130は、リスト1に登録されているテキスト情報が空でない場合、テキスト情報をType=Itemとし、そのテキスト情報のみで要素データを作成し、本処理を終了する。
S412: When the text information registered in the
要素データ作成部130は、S401〜S412の処理を実施することにより、例えば図6および図7のテキスト情報および図形情報に基づいてそれぞれ図8および図9の要素データを作成する。
The element
このように、本実施例では、構造化データ生成装置100において、オブジェクト抽出部110が手書き画像から手書き画像内のテキストの位置情報を含むテキスト情報および図形の位置情報を含む図形情報を抽出し(図3のS301)、画像種別判別部120がテキスト情報および図形情報に基づいて手書き画像の種別を判別し(図3のS302)、要素データ作成部130がオブジェクト抽出部110で抽出されたテキストの位置情報および図形の位置情報に基づいてテキストおよび図形の位置関係によりテキスト情報と図形情報とを関連付けた要素データを生成し(図3のS303)、構造化データ作成部140が手書き画像の種別に対応する特徴情報と、生成された要素データとに基づいて構造化データを生成する(図3のS305a、S305b、・・・、S305n)ようにしたことにより、手書きの図が有する情報を構造化したデータ(構造化データ)として生成することができる。
As described above, in the present embodiment, in the structured
手書きの図から作成した構造化データはデータ構造(データの階層構造や接続関係)を認識しているため、作成した構造化データを各種ソフトウェアに直接入力することができるようになり、各種ソフトウェアにおけるユーザによる設定情報の入力作業などを軽減することができる。 Structured data created from hand-drawn diagrams recognizes the data structure (data hierarchy and connection relationships), so the created structured data can be directly input to various software, and in various software. It is possible to reduce the work of inputting setting information by the user.
例えば、手書きのフローチャートから構造化データを生成した場合、ユーザによる詳細な設定情報の入力作業などを必要とすることなく、各オブジェクト間の繋がりが明確で見易い電子データのフローチャートを作成することができるようになる。 For example, when structured data is generated from a handwritten flowchart, it is possible to create an electronic data flowchart in which the connection between each object is clear and easy to see without requiring the user to input detailed setting information. Will be.
また、手書きの線表から構造化データを生成した場合、ユーザによる詳細な設定情報の入力作業などを必要とすることなく、生成した構造化データをプロジェクト管理ツールのガントチャートに取り込むことができるようになる。 In addition, when structured data is generated from a handwritten line chart, the generated structured data can be imported into the Gantt chart of the project management tool without the need for the user to input detailed setting information. become.
さらに、手書きのシーケンス図、ステートチャート図等から構造化データを生成した場合、UML(Unified Modeling Language)モデリングツールを通じてクラステンプレートを作成するが可能になる。 Further, when structured data is generated from a handwritten sequence diagram, state chart diagram, etc., it becomes possible to create a class template through a UML (Unified Modeling Language) modeling tool.
また、手書きで作成した図から生成した構造化データを文書編集ソフトウェアや表計算ソフトウェア等の電子文書ソフトウェアに取り込んだ場合、その電子文書が読者にとって視認しやすくなり、かつ誤解を招かないグラフィック画像に変換することができる。 In addition, when structured data generated from a hand-created diagram is imported into electronic document software such as document editing software or spreadsheet software, the electronic document becomes a graphic image that is easy for the reader to see and is not misleading. Can be converted.
以上説明したように、本実施例では、手書きの図が有する情報を構造化したデータとして生成することができるという効果が得られる。 As described above, in the present embodiment, the effect that the information contained in the handwritten figure can be generated as structured data can be obtained.
したがって、手書きの図から作成した構造化データを各種ソフトウェアに直接入力することができるようになり、各種ソフトウェアにおけるユーザによる設定情報の入力作業などを軽減することができるという効果が得られる。 Therefore, the structured data created from the handwritten figure can be directly input to various software, and it is possible to reduce the work of inputting the setting information by the user in various software.
なお、本実施例では、手書きのフローチャートおよび手書きの線表から構造化データを作成する例で説明したが、それに限られるものでなく、手書きのシーケンス図やステートチャート図などその他の手書き図形や文字を有する図から構造化データを作成するようにしても良い。 In this embodiment, the example of creating structured data from a handwritten flowchart and a handwritten line chart has been described, but the present invention is not limited to this, and other handwritten figures and characters such as handwritten sequence diagrams and state chart diagrams are used. Structured data may be created from the diagram having.
100 構造化データ生成装置
110 オブジェクト抽出部
120 画像種別判別部
130 要素データ作成部
140 構造化データ作成部
150 構造化イメージ作成部
200 手書き画像
100
Claims (8)
手書き画像から前記手書き画像内のテキストの位置情報を含むテキスト情報および図形の位置情報を含む図形情報を抽出するステップと、
前記テキスト情報および前記図形情報に基づいて前記手書き画像の種別を判別する判別ステップと、
抽出されたテキストの位置情報および図形の位置情報に基づいて前記テキストおよび前記図形の位置関係によりテキスト情報と図形情報とを関連付けた要素データを生成するステップと、
判別された手書き画像の種別に対応する特徴情報と、生成された要素データとに基づいて構造化データを生成する構造化データ生成ステップと、
を有することを特徴とする構造化データ生成方法。 It is a structured data generation method in a structured data generation device.
A step of extracting text information including the position information of the text in the handwritten image and graphic information including the position information of the graphic from the handwritten image, and
A determination step for determining the type of the handwritten image based on the text information and the graphic information, and
A step of generating element data in which text information and graphic information are associated with each other based on the positional relationship between the text and the graphic based on the extracted text position information and the graphic position information.
A structured data generation step that generates structured data based on the feature information corresponding to the determined handwritten image type and the generated element data.
A structured data generation method characterized by having.
前記要素データは、前記テキストの位置と前記図形の位置との距離が閾値以下の場合、前記テキスト情報と前記図形情報とが関連付けられて生成されることを特徴とする構造化データ生成方法。 In the structured data generation method according to claim 1,
A structured data generation method, wherein the element data is generated by associating the text information with the graphic information when the distance between the position of the text and the position of the graphic is equal to or less than a threshold value.
前記判別ステップで前記手書き画像の種別がフローチャートと判別された場合、
前記構造化データ生成ステップにおいて、前記要素データを直線または矢印を表す情報を有する図形情報を複数の接続オブジェクトの情報とし、それ以外の図形情報およびテキスト情報を構成オブジェクトの情報として分類し、第1の接続オブジェクトに最も接近している第2の接続オブジェクトの位置情報を前記第1の接続オブジェクトの位置情報に変更し、前記第1の接続オブジェクトおよび第2の接続オブジェクトと、前記第1の接続オブジェクトおよび第2の接続オブジェクトに最も近接した前記構成オブジェクトとを関連付けて前記構造化データを生成することを特徴とする構造化データ生成方法。 In the structured data generation method according to claim 2,
When the type of the handwritten image is determined to be a flowchart in the determination step,
In the structured data generation step, the element data is classified into graphic information having information representing a straight line or an arrow as information of a plurality of connected objects, and other graphic information and text information as information of constituent objects. The position information of the second connection object closest to the connection object is changed to the position information of the first connection object, and the first connection object and the second connection object are connected to the first connection. A method for generating structured data, characterized in that the structured data is generated by associating the object with the constituent object closest to the second connection object.
1つの前記構成オブジェクトが、複数の前記接続オブジェクトに関連付けられ、当該複数の接続オブジェクトの始点となっている場合、前記構成オブジェクトの属性がひし形でないとき異常と判定されることを特徴とする構造化データ生成方法。 In the structured data generation method according to claim 3,
A structure characterized in that when one configuration object is associated with a plurality of connection objects and serves as a starting point of the plurality of connection objects, it is determined to be abnormal when the attribute of the configuration object is not a rhombus. Data generation method.
前記判別ステップで前記手書き画像の種別が工程表と判別された場合、
前記構造化データ生成ステップにおいて、前記要素データを直線または矢印を表す情報を有する図形情報を構成オブジェクトの情報とし、項目を表す情報を有するテキスト情報を項目オブジェクトの情報とし、日付を表す情報を有するテキスト情報を日付オブジェクトの情報として分類し、構成オブジェクトと、前記構成オブジェクトに最も接近している日付オブジェクとを関連付けて前記構造化データを生成することを特徴とする構造化データ生成方法。 In the structured data generation method according to claim 2,
When the type of the handwritten image is determined to be a process chart in the determination step,
In the structured data generation step, the element data has graphic information having information representing a straight line or an arrow as information of a constituent object, text information having information representing items as information of an item object, and information representing a date. A structured data generation method characterized in that text information is classified as information of a date object, and the structured data is generated by associating the constituent object with the date object closest to the constituent object.
前記判別ステップでは、
前記手書き画像と、前記手書き画像から抽出したテキスト情報および図形情報とを入力データとし、前記手書き画像の種別を教師データとしてAI学習を実行した結果として生成された予測モデルを用いることを特徴とする構造化データ生成方法。 In the structured data generation method according to any one of claims 1 to 5.
In the determination step,
It is characterized in that a prediction model generated as a result of executing AI learning is used by using the handwritten image and text information and graphic information extracted from the handwritten image as input data and using the type of the handwritten image as teacher data. Structured data generation method.
前記構造化データ生成ステップにおいて生成された構造化データから各オブジェクトの繋がりや階層構造が認識し易い構造化イメージデータを生成するステップを有することを特徴とする構造化データ生成方法。 In the structured data generation method according to any one of claims 1 to 6,
A structured data generation method comprising a step of generating structured image data in which the connection of each object and the hierarchical structure are easily recognized from the structured data generated in the structured data generation step.
前記テキスト情報および前記図形情報に基づいて手書き画像の種別を判別する画像種別判別部と、
前記オブジェクト抽出部で抽出されたテキストの位置情報および図形の位置情報に基づいて前記テキストおよび前記図形の位置関係によりテキスト情報と図形情報とを関連付けた要素データを生成する要素データ作成部と、
画像種別判別部で判別された手書き画像の種別に対応する特徴情報と、前記要素データ作成部が生成した要素データとに基づいて構造化データを生成する構造化データ作成部と、
を有することを特徴とする構造化データ生成装置。 An object extraction unit that extracts text information including the position information of the text in the handwritten image and graphic information including the position information of the graphic from the input handwritten image, and an object extraction unit.
An image type determination unit that determines the type of handwritten image based on the text information and the graphic information,
An element data creation unit that generates element data in which text information and graphic information are associated with each other based on the positional relationship between the text and the graphic based on the text position information and the graphic position information extracted by the object extraction unit.
A structured data creation unit that generates structured data based on feature information corresponding to the type of handwritten image determined by the image type determination unit and element data generated by the element data creation unit.
A structured data generator characterized by having.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019035611A JP2020140450A (en) | 2019-02-28 | 2019-02-28 | Structured data generation method and structured data generation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019035611A JP2020140450A (en) | 2019-02-28 | 2019-02-28 | Structured data generation method and structured data generation device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020140450A true JP2020140450A (en) | 2020-09-03 |
Family
ID=72265094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019035611A Pending JP2020140450A (en) | 2019-02-28 | 2019-02-28 | Structured data generation method and structured data generation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020140450A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022099870A1 (en) * | 2020-11-11 | 2022-05-19 | 深圳市鹰硕教育服务有限公司 | Handwriting graphing method, apparatus, and electronic device |
CN115577688A (en) * | 2022-12-09 | 2023-01-06 | 深圳智能思创科技有限公司 | Table structuring processing method, equipment, storage medium and device |
US20230343002A1 (en) * | 2021-01-08 | 2023-10-26 | Pricewaterhousecoopers Llp | Automated flow chart generation and visualization system |
-
2019
- 2019-02-28 JP JP2019035611A patent/JP2020140450A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022099870A1 (en) * | 2020-11-11 | 2022-05-19 | 深圳市鹰硕教育服务有限公司 | Handwriting graphing method, apparatus, and electronic device |
US20230343002A1 (en) * | 2021-01-08 | 2023-10-26 | Pricewaterhousecoopers Llp | Automated flow chart generation and visualization system |
US12002134B2 (en) * | 2021-01-08 | 2024-06-04 | PwC Product Sales LLC | Automated flow chart generation and visualization system |
CN115577688A (en) * | 2022-12-09 | 2023-01-06 | 深圳智能思创科技有限公司 | Table structuring processing method, equipment, storage medium and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4820382B2 (en) | How to provide structure recognition in a node link diagram | |
JP5284662B2 (en) | Method and apparatus for generating and editing a node link diagram in a pen computer system | |
RU2357284C2 (en) | Method of processing digital hand-written notes for recognition, binding and reformatting digital hand-written notes and system to this end | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
KR20190095651A (en) | Apparatus for generating training data for character learning and method thereof | |
JP2007279828A (en) | Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format | |
US20130181995A1 (en) | Handwritten character font library | |
JP2020140450A (en) | Structured data generation method and structured data generation device | |
JP2007072528A (en) | Method, program and device for analyzing document structure | |
CN107025430A (en) | Mark of emphasis list | |
EP0654754A2 (en) | Method of analyzing data defining an image | |
JPH07200837A (en) | Picture data analysis method | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
CN116610304B (en) | Page code generation method, device, equipment and storage medium | |
Chen et al. | UI layers merger: merging UI layers via visual learning and boundary prior | |
JP5020698B2 (en) | Image processing apparatus, image processing method, and image processing program | |
CN116110051A (en) | File information processing method and device, computer equipment and storage medium | |
US11320964B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP4466241B2 (en) | Document processing method and document processing apparatus | |
JP5811435B2 (en) | Display device and display control program | |
JP2020064438A (en) | Learning data generation device and learning data generation method | |
JP4741363B2 (en) | Image processing apparatus, image processing method, and image processing program | |
US11755195B2 (en) | Ink data generation apparatus, method, and program | |
US12002134B2 (en) | Automated flow chart generation and visualization system | |
JP4651407B2 (en) | Image processing apparatus, computer program, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210520 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20210615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210619 |