JP7448132B2 - 手書きの構造分解 - Google Patents
手書きの構造分解 Download PDFInfo
- Publication number
- JP7448132B2 JP7448132B2 JP2022544683A JP2022544683A JP7448132B2 JP 7448132 B2 JP7448132 B2 JP 7448132B2 JP 2022544683 A JP2022544683 A JP 2022544683A JP 2022544683 A JP2022544683 A JP 2022544683A JP 7448132 B2 JP7448132 B2 JP 7448132B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- item
- list
- line
- text line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000354 decomposition reaction Methods 0.000 title description 11
- 238000000034 method Methods 0.000 claims description 157
- 238000000547 structure data Methods 0.000 claims description 102
- 230000008569 process Effects 0.000 claims description 82
- 238000007373 indentation Methods 0.000 claims description 74
- 230000004044 response Effects 0.000 claims description 42
- 238000001514 detection method Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 19
- 238000007726 management method Methods 0.000 claims description 8
- 238000013499 data model Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000005192 partition Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 241000360065 Ligula Species 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Description
電子文書内のデジタルインクの複数のストロークに対してテキスト手書き認識を実行することによって、テキストであって、テキストが複数の連続するテキスト行を含むテキスト、を認識することと、
最初に、各認識されたテキスト行を、リストの一部ではない別個のテキスト項目として分類することと、
a)テキスト行が、テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定し、所定のリスト記号で始まる各テキスト行をリストの一部である別個のリスト項目として分類するための、各テキスト行におけるパターン検出ステップと、
b)ステップa)に応答して、基準位置に対する各テキスト項目の項目インデントを決定し、基準位置に対するリスト項目で構成されるテキストのインデントを表すテキストインデントを各リスト項目に対して決定するステップと、
c)ステップb)に応答して、
テキストにおいて、第1のテキスト行によって、続いて第2のテキスト行によって形成される連続するテキスト行の各対を、一対の第1の及び第2のテキスト行が同じインデントを有するテキスト項目である場合、かつ、第1のテキスト行の末尾に、第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、同一のテキスト項目の一部としてマージすることと、
第1のテキスト行によって、続いて第2のテキスト行によって形成される連続したテキスト行の各対を、第1のテキスト行がリスト項目であり、第2のテキスト行が、第1のテキスト行のテキストインデントと一致する項目のインデントを有するテキスト項目である場合、かつ、第1のテキスト行の末尾に、第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、同一のリスト項目の一部としてマージすることと、を含むマージプロセスステップと、を含む分類プロセスと、
マージプロセスの結果に基づいて、各テキスト行をテキスト項目またはリスト項目の一部として定義するテキスト構造データモデルを生成することと、を含む。
認識されたテキストの少なくとも1つの項目の内容を修正することと、
認識されたテキストの少なくとも1つの項目のデジタルインクをリフローさせるリフロープロセス、のうちの少なくとも1つを含み、
コンピューティングデバイスは、テキスト構造データモデルの情報を使用して、編集を制御する。
認識されたテキストを表示することと、
テキスト構造データモデルを生成した後、表示されている認識されたテキストに変更を加えるユーザ命令を取得することと、
テキスト構造データモデルを更新して、ユーザ命令によって引き起こされた変更を反映させる、更新プロセスと、を含む。
各テキスト項目について、該テキスト項目の最初の可視文字で始まり、前方に伸びて、開始ゾーンが該テキスト項目の末尾に達した場合に、所定の数以下の連続する可視文字に達するまで、1つ以上の完全な単語を囲む該開始ゾーンと、
各リスト項目について、関連する所定のリスト記号から始まり、前方に伸びて、所定の連続した可視文字の数に達するまで、または箇条書き領域が該リスト項目の末尾に達する場合はそれ未満まで、1つ以上の完全な単語を囲む、該箇条書き領域と、を定義することを含み、
更新プロセスは、各項目について、ユーザ命令によって引き起こされた変更が開始ゾーンまたは箇条書きゾーンを変更するかどうか、及び/または、少なくとも1つの文字が該開始ゾーンまたは該箇条書きゾーンの前に追加されるかどうかを判定し、肯定の場合、変更に基づいて該開始ゾーンまたは該箇条書きゾーンを更新し、該更新後の開始ゾーンまたは箇条書きゾーンに基づいて該ステップa)、b)及びc)を繰り返して、テキスト構造データモデルを更新すること、を含む。
該ユーザ命令に応答して、テキストまたはリスト項目のテキスト行内に追加された少なくとも1つのストロークを検出することと、
該テキスト行が、テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
肯定の場合、対応するテキスト項目またはリスト項目を分割して新しいリスト項目を作成し、テキスト構造データモデルを更新して該分割を反映することと、を含む。
各テキスト項目及び各リスト項目について、最初の行を過ぎた該項目のテキスト行の最初の可視文字で始まり、前方に伸びて、開始ゾーンがテキスト項目の末尾に達した場合に、所定の数以下の連続する可視文字に達するまで、1つ以上の完全な単語を囲むそれぞれの開始ゾーン、を定義することを含み、
更新プロセスは、
各テキスト項目及び各リスト項目について、第1のテキスト行を過ぎた各テキスト行が、該ユーザ命令に応答して、該テキスト行の開始ゾーン内または開始ゾーン前に追加された任意の新しいストロークをチェックすることと、
ポジティブチェックされた各テキスト行について、該テキスト行が、該テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
肯定の場合、対応するテキスト項目またはリスト項目を分割して所定のリスト記号で始まる新しいリスト項目を作成し、テキスト構造データモデルを更新して分割を反映することと、を含む。
更新プロセスは、
各項目について、ユーザ命令によって引き起こされた変更がそのエンドゾーンを変更するかどうか、及び/または、エンドゾーンの後に少なくとも1つのストロークが追加されるかどうかを判定し、肯定の場合、変更に基づいて該エンドゾーンを更新し、該更新されたエンドゾーンに基づいて該ステップc)を繰り返して、テキスト構造データモデルを更新することを含む。
分割コマンドでテキスト行の開始位置または末尾位置に分割位置を指定した場合、該分割位置に空行が挿入し、
分割コマンドがテキスト行内に分割位置を指定する場合、更新プロセスは、
該テキスト行を、分割位置において、該既存の項目を分割して得られた第1の項目及び第2の項目にそれぞれ属する第1のテキスト行及び第2のテキスト行に分割することと、
第2のテキスト行が、該第2のテキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
肯定の場合、第2の項目をリスト項目として分類し、そうでない場合、第2の項目をテキスト項目として分類することと、を含む。
電子文書内のデジタルインクの複数のストロークに対してテキスト手書き認識を行うことによって、該テキストであって、該テキストが、それぞれがリストの一部であるリスト項目またはリストの一部ではないテキスト項目のいずれかであり得る複数の連続したテキスト行を含むテキストを認識するように構成された認識モジュールと、
認識された各テキスト行を別個のテキスト項目として最初に分類し、
a)該テキスト行が、該テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定し、所定のリスト記号で始まる各テキスト行をリスト項目として分類するための各テキスト行のパターン検出ステップと、
b)ステップa)に応答して、基準位置に対する各テキスト項目の項目インデントを決定し、基準位置に対する該リスト項目で構成されるテキストのインデントを表すテキストインデントを各リスト項目に対して決定するステップと、
c)ステップb)に応答して、
同一テキスト項目の一部として、該テキストにおいて、第1のテキスト行によって、続いて第2のテキスト行によって形成される連続したテキスト行の各対を、該対の第1及び第2のテキスト行が同一の項目インデントを有するテキスト項目であり、かつ第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するために十分な空きスペースが存在しなければ、マージすることと、
第1のテキスト行がリスト項目であり、第2のテキスト行が第1のテキスト行のテキストインデントと一致する項目のインデントを有するテキスト項目であり、第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、第2のテキスト行に続く第1のテキスト行によって形成される連続するテキスト行の各対を同じリスト項目の一部としてマージすることと、を含むマージプロセスステップと、を含む分類プロセスを実行するように構成された分類器モジュールと、
マージプロセスの結果に基づいて、各テキスト行をテキスト項目またはリスト項目の一部として定義するテキスト構造データモデルを生成するように構成されたモデル管理モジュールと、を備える。
a)該テキスト行LNが、該テキスト行LNがリストの一部であることを示す所定のリスト記号で始まるかどうかを判定し、所定のリスト記号BTで始まる各テキスト行LNをリストの一部である別個のリスト項目として分類するための、各テキスト行LNにおけるパターン検出することと、
b)ステップa)に応答して、基準位置に対する各テキスト項目TIの項目インデントを決定し、基準位置に対する該リスト項目LIで構成されるテキストのインデントを表すテキストインデントを各リスト項目LIに対して決定することと、
c)
同一テキスト項目の一部として、テキストにおいて、第1のテキスト行LNによって、続いて第2のテキスト行によって形成される連続したテキスト行LNの各対を、該対の第1及び第2のテキスト行が同一の項目インデントを有するテキスト項目であり、かつ第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するために十分な空きスペースが存在しなければ、マージすることと、
第1のテキスト行がリスト項目であり、第2のテキスト行が第1のテキスト行のテキストインデントと一致する項目のインデントを有するテキスト項目であり、第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、第2のテキスト行LNに続く第1のテキスト行LNによって形成される連続するテキスト行LNの各対を同じリスト項目LIの一部としてとしてマージすることと、を含むマージプロセスステップと、を含むマージステップと、を含む分類プロセスを実行するように構成することができる。
テキスト項目LN1-LN8、LN10-LN12、LN14及びLN16-LN24の項目インデント22、及び、
リスト項目LN9、LN13、及びLN15のテキストインデント24。
同一テキスト項目TIの一部として、第1のテキスト行LNによって、続いて第2のテキスト行LNによって形成される連続したテキスト行LNの各対PRを、該対PRの第1及び第2のテキスト行が同一の項目インデント22を有するテキスト項目TIであり、かつ第1のテキスト行LNの末尾に第2のテキスト行LNで始まる第1の単語WDを収容するために十分な空きスペースが存在しなければ(条件CD1)、マージし、
同一リスト項目TIの一部として、第1のテキスト行LNによって、続いて第2のテキスト行LNによって形成される連続したテキスト行LNの各対PRを、第1のテキスト行がリスト項目LIであり、第2のテキスト行が第1のテキスト行のテキスト行のテキストインデント24と一致する項目インデント22を有するテキスト項目TIであり、第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合(条件CD2)、マージする。
条件CD1:対PRテキスト項目TIの第1及び第2のテキスト行LNが同一項目インデント22であるか、及び第1のテキスト行LNの末尾に第2のテキスト行LNを開始する第1の単語WDを収容するのに十分な空きスペースがないか?
条件CD2:対PRの第1のテキスト行はリスト項目LIであるか、及び第2のテキスト行は、項目インデント22が第1のテキスト行のテキストインデント24と一致するテキスト項目TIを有する第2のテキスト行であるか?
テキスト行LN1~LN8によって形成されるテキスト項目TI、
2つの空行L0によって形成される仕切り項目D、
テキスト行LN9~LN12によって形成されるリスト項目LI、
テキスト行LN13~LN14によって形成されるリスト項目LI、
テキスト行LN15~LN20によって形成されるリスト項目LI、及び、
テキスト行LN21~LN24によって形成されるテキスト項目TI、の別個の項目を定義する。
認識されたテキストINの少なくとも1つのテキスト及び/またはリスト項目の内容を修正または変更すること(S20)と、
認識されたテキストINの少なくとも1つのテキスト及び/またはリスト項目のデジタルインクのリフローを引き起こすリフロープロセス(S22)、のうちの少なくとも1つを含むことができる。
各テキスト項目TIの開始時に開始部分を定義する開始ゾーンZ1、
各リスト項目LIの先頭に開始部分を定義する箇条書きゾーンZ2、及び、
各項目の末尾に末尾部分を定義するエンドゾーンZ3(リスト項目LIとテキスト項目TI)(またはそれらの任意の組み合わせ)が含まれ得る。
テキスト項目ITとして分類された項目IT10及びIT12、
リスト項目LTとして分類された項目IT14、IT16及びIT18、ならびに、
テキスト項目TIとして分類された項目IT20の項目が定義されていると想定される。
各テキスト項目TIについて、該テキスト項目TIの最初の可視文字CHで始まり、前方に伸びて、開始ゾーンがテキスト項目の末尾に達した場合に、所定の数(例えば、5の数)以下の連続する可視文字CHに達するまで、1つ以上の完全な単語WDを囲む開始ゾーンZ1、及び、
各リスト項目LIについて、該リスト項目LIの予め定義されたリスト記号BTから始まり、該箇条書きゾーンZ2がリスト項目LIの末尾に達した場合、連続した可視文字の予め定義された数(例えば、5の数)以下に達するまで1つ以上の完全な単語WDを囲むように前方に延びる箇条書きゾーンZ2、を定義する。
項目IT10:開始ゾーンZ1「Etiam」、
項目IT12:開始ゾーンZ1「Vivamus」、
項目IT14:箇条書きゾーンZ2「1. vestibulum」、
項目IT16:箇条書きゾーンZ2「・usce」など、の検出ゾーンを定義する。
テキスト項目IT30の開始ゾーンZ1の一部が削除される、
テキスト項目IT32の開始ゾーンZ1の最初の文字が上書きされてる、
新しい文字「2」がリスト項目IT34の箇条書きゾーンZ2に挿入される、
リスト項目IT36の箇条書きゾーンZ3のリスト記号BYが消去されている、及び、
テキスト項目IT38)の開始ゾーンZ1の左側に新しい文字「1)」が追加されている、である。
項目IT10:エンドゾーンZ3「Nam.」、
項目IT12:エンドゾーンZ3「donec.」、
項目IT14:エンドゾーンZ3「auctor.」、
項目IT16:エンドゾーンZ3「velit.」など、の検出ゾーンを定義する。
分割コマンドでテキスト行の先頭位置または末尾位置に分割位置を指定した場合、その分割位置に空行が挿入され、
分割コマンドがテキスト行内の分割位置を指定する場合、更新プロセスは、
分割位置でテキスト行を、該既存の項目を分割することから得られた第1の項目及び第2の項目にそれぞれ属する第1のテキスト行及び第2のテキスト行に分割することと、
第2のテキスト行が、該第2のテキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
肯定の場合、第2の項目をリスト項目として分類し、それ以外のでは、第2の項目をテキスト項目として分類することと、を含む。
Claims (15)
- 手書きでリストを処理するためのコンピューティングデバイス(100)によって実装される方法であって、
-電子文書内のデジタルインクの複数のストロークに対してテキスト手書き認識を実行することによって、テキストであって、前記テキストが複数の連続するテキスト行を含むテキスト、を認識することと、
-最初に、各認識されたテキスト行を、リストの一部ではない別個のテキスト項目として分類することと、
-以下のステップを含む分類プロセスと:
a)前記テキスト行が、前記テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定し、所定のリスト記号で始まる各テキスト行をリストの一部である別個のリスト項目として分類するための、各テキスト行におけるパターン検出ステップと、
b)前記ステップa)に応答して、基準位置に対する各テキスト項目の項目インデントを決定し、前記基準位置に対する前記リスト項目で構成されるテキストの前記インデントを表すテキストインデントを各リスト項目に対して決定するステップと、
c)前記ステップb)に応答して、
o前記テキストにおいて、第1のテキスト行によって、続いて第2のテキスト行によって形成される連続するテキスト行の各対を、前記対の前記第1の及び第2のテキスト行が同じテキストインデントを有するテキスト項目である場合、かつ、前記第1のテキスト行の末尾に、前記第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、同一のテキスト項目の一部としてマージすることと、
o第1のテキスト行によって、続いて第2のテキスト行によって形成される連続したテキスト行の各対を、前記第1のテキスト行がリスト項目であり、前記第2のテキスト行が、前記第1のテキスト行の前記テキストインデントと一致するテキストインデントを有するテキスト項目である場合、かつ、前記第1のテキスト行の末尾に、前記第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、同一のリスト項目の一部としてマージすることと、を含むマージプロセスステップと、を含む分類プロセスと、
-前記マージプロセスの結果に基づいて、各テキスト行をテキスト項目またはリスト項目の一部として定義するテキスト構造データモデルを生成することと、を含む方法。 - -ユーザ入力としてデジタルインクの複数のストロークを取得し表示することを含み、前記認識することが、前記取得されたストロークに対して前記テキスト手書き認識を実行し、認識されたテキストから前記複数の連続したテキスト行を識別することを含む、請求項1に記載の方法。
- 前記パターン検出が、各テキスト行について、前記テキスト行を開始する第1の記号を所定のリスト記号のセットと比較して、一致するかどうかを判定することを含む、請求項1または2に記載の方法。
- 前記マージプロセスが、前記第1のテキスト行がテキスト項目であり、前記第2のテキスト行がリスト項目である場合、第1のテキスト行によって、続いて第2のテキスト行によって形成される連続するテキスト行の各対を別個の項目として維持することを含む、請求項1~3のいずれか一項に記載の方法。
- 前記テキスト構造データモデルが、認識されたテキストを少なくとも1つのテキスト項目及び/または少なくとも1つのリスト項目に分解し、各項目が少なくとも1つのテキスト行及び前記少なくとも1つのテキスト行に属する各ストロークと関連付けられる、請求項1~4のいずれか一項に記載の方法。
- ユーザ命令に応答して、前記テキスト構造データモデルに基づく前記認識されたテキストの編集を含み、前記編集が、
-前記認識されたテキストの少なくとも1つの項目の内容を修正することと、
-前記認識されたテキストの少なくとも1つの項目のデジタルインクをリフローさせるリフロープロセス、のうちの少なくとも1つを含み、
前記コンピューティングデバイスが、前記テキスト構造データモデルの情報を使用して、前記編集を制御する、請求項1~5のいずれか一項に記載の方法。 - -認識されたテキストを表示することと、
-前記テキスト構造データモデルを生成した後、表示されている前記認識されたテキストに変更を加えるユーザ命令を取得することと、
-前記テキスト構造データモデルを更新して、前記ユーザ命令によって引き起こされた前記変更を反映させる、更新プロセスと、を含む、請求項1~6のいずれか一項に記載の方法。 - 前記ユーザ命令によって引き起こされた前記変更が、前記電子文書に少なくとも1つの新しいストロークを追加し、及び/または少なくとも1つの既存のストロークを削除もしくは修正することを含み、
前記更新プロセスが、前記テキスト構造データモデルから削除されたストロークを削除することと、前記テキスト構造データモデルのテキストまたはリスト項目のいずれかの既存または新規の項目に新しいストロークを割り当てることによって、前記テキスト構造データモデルを更新することと、を含む、請求項7に記載の方法。 - 前記テキスト構造データモデルを前記生成することが、
-各テキスト項目について、前記テキスト項目の最初の可視文字で始まり、前方に伸びて、開始ゾーンが前記テキスト項目の前記末尾に達した場合に、所定の数以下の連続する可視文字に達するまで、1つ以上の完全な単語を囲む前記開始ゾーンと、
-各リスト項目について、関連する所定のリスト記号から始まり、前方に伸びて、所定の連続した可視文字の数に達するまで、または箇条書き領域が前記リスト項目の終わりに達する場合はそれ未満まで、1つ以上の完全な単語を囲む、前記箇条書き領域と、を定義することを含み、
前記更新プロセスが、
-各項目について、前記ユーザ命令によって引き起こされた前記変更が前記開始ゾーンまたは箇条書きゾーンを変更するかどうか、及び/または、少なくとも1つの文字が前記開始ゾーンまたは箇条書きゾーンの前に追加されるかどうかを判定し、肯定の場合、前記変更に基づいて前記開始ゾーンまたは箇条書きゾーンを更新し、前記更新後の開始ゾーンまたは箇条書きゾーンに基づいて前記ステップa)、b)及びc)を繰り返して、前記テキスト構造データモデルを更新すること、を含む、請求項7または8に記載の方法。 - 前記更新プロセスが、
-前記ユーザ命令に応答して、テキストまたはリスト項目のテキスト行内に追加された少なくとも1つのストロークを検出することと、
-前記テキスト行が、前記テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
-肯定の場合、対応するテキスト項目またはリスト項目を分割して新しいリスト項目を作成し、前記テキスト構造データモデルを更新して前記分割を反映することと、を含む、請求項7~9のいずれか一項に記載の方法。 - 前記テキスト構造データモデルを前記生成することが、
-各テキスト項目及び各リスト項目について、最初の行を過ぎた前記項目の各テキスト行の前記最初の可視文字で始まり、前方に伸びて、各開始ゾーンが前記テキスト項目の前記末尾に達した場合に、所定の数以下の連続する可視文字に達するまで、1つ以上の完全な単語を囲む前記開始ゾーン、を定義することを含み、
前記更新プロセスが、
-各テキスト項目及び各リスト項目について、第1のテキスト行を過ぎた各テキスト行が、前記ユーザ命令に応答して、前記テキスト行の前記開始ゾーン内または前記開始ゾーン前に追加された任意の新しいストロークをチェックすることと、
-ポジティブチェックされた各テキスト行について、前記テキスト行が、前記テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
-肯定の場合、対応するテキスト項目またはリスト項目を分割して、前記所定のリスト記号で始まる新しいリスト項目を作成し、前記分割を反映するようにテキスト構造データモデルを更新することと、を含む、請求項7~10のいずれか一項に記載の方法。 - 前記テキスト構造データモデルを前記生成することが、各テキスト及びリスト項目について、前記項目の最後の可視文字から1つ以上の完全な単語を囲んで後方に延びるエンドゾーンを、前記エンドゾーンが前記項目の先頭に達する場合は所定の数以下の連続可視文字数に達するまで定義することを含み、
前記更新プロセスが、
-各項目について、前記ユーザ命令によって引き起こされた前記変更がそのエンドゾーンを変更するかどうか、及び/または、前記エンドゾーンの後に少なくとも1つのストロークが追加されるかどうかを判定し、肯定の場合、前記変更に基づいて前記エンドゾーンを更新し、前記更新されたエンドゾーンに基づいて前記ステップc)を繰り返して、前記テキスト構造データモデルを更新することを含む、請求項7~11のいずれか一項に記載の方法。 - 既存の項目を2つの別個の項目に分割するためのユーザ命令として受け取った分割コマンドに応答して、
-前記分割コマンドが、テキスト行の先頭または末尾の分割位置を指定する場合、前記分割位置に空行を挿入し、
-前記分割コマンドがテキスト行内に分割位置を指定する場合、前記更新プロセスが、
o 前記テキスト行を、前記分割位置において、前記既存の項目を分割して得られた第1の項目及び第2の項目にそれぞれ属する第1のテキスト行及び第2のテキスト行に分割することと、
o 前記第2のテキスト行が、前記第2のテキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定することと、
o 肯定の場合、前記第2の項目をリスト項目として分類し、そうでない場合、前記第2の項目をテキスト項目として分類することと、を含む、請求項7~12のいずれか一項に記載の方法。 - 2つの別個の項目を一緒に結合するためのユーザ命令に応答してのみ、2つの連続する項目が同じ項目にマージされる、請求項1~13のいずれか一項に記載の方法。
- 手書きでリストを処理するためのコンピューティングデバイスであって、
-電子文書内のデジタルインクの複数のストロークに対してテキスト手書き認識を行うことによって、テキストであって、前記テキストが、それぞれがリストの一部であるリスト項目またはリストの一部ではないテキスト項目のいずれかであり得る複数の連続したテキスト行を含む前記テキストを認識するように構成された認識モジュールと、
-認識された各テキスト行を別個のテキスト項目として最初に分類し、
a)前記テキスト行が、前記テキスト行がリストの一部であることを示す所定のリスト記号で始まるかどうかを判定し、所定のリスト記号で始まる各テキスト行をリスト項目として分類するための各テキスト行のパターン検出ステップと、
b)前記ステップa)に応答して、基準位置に対する各テキスト項目の項目インデントを決定し、前記基準位置に対する前記リスト項目を含むテキストのインデントを表すテキストインデントを各リスト項目に対して決定するステップと、
c)前記ステップb)に応答して、
o同一テキスト項目の一部として、前記テキストにおいて、第1のテキスト行によって、続いて第2のテキスト行によって形成される連続したテキスト行の各対を、前記対の前記第1及び第2のテキスト行が同一の項目インデントを有するテキスト項目であり、かつ前記第1のテキスト行の末尾に前記第2のテキスト行を開始する第1の単語を収容するために十分な空きスペースが存在しなければ、マージすることと、
o前記第1のテキスト行がリスト項目であり、前記第2のテキスト行が前記第1のテキスト行のテキストインデントと一致する項目インデントを有するテキスト項目であり、前記第1のテキスト行の末尾に第2のテキスト行を開始する第1の単語を収容するのに十分な空きスペースがない場合、第2のテキスト行に続く第1のテキスト行によって形成される連続するテキスト行の各対を同じリスト項目の一部としてマージすることと、を含むマージプロセスと、を含む分類プロセスを実行するように構成された分類器モジュールと、
-前記マージプロセスの結果に基づいて、各テキスト行をテキスト項目またはリスト項目の一部として定義するテキスト構造データモデルを生成するように構成されたモデル管理モジュールと、を備えるコンピューティングデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20305120.6A EP3862918B1 (en) | 2020-02-07 | 2020-02-07 | Structural decomposition in handwriting |
EP20305120.6 | 2020-02-07 | ||
PCT/EP2021/052432 WO2021156253A1 (en) | 2020-02-07 | 2021-02-02 | Structural decomposition in handwriting |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023512189A JP2023512189A (ja) | 2023-03-24 |
JP7448132B2 true JP7448132B2 (ja) | 2024-03-12 |
Family
ID=69784360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022544683A Active JP7448132B2 (ja) | 2020-02-07 | 2021-02-02 | 手書きの構造分解 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230054848A1 (ja) |
EP (2) | EP3862918B1 (ja) |
JP (1) | JP7448132B2 (ja) |
KR (1) | KR20220137645A (ja) |
CN (1) | CN115004262B (ja) |
WO (1) | WO2021156253A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023233204A1 (en) * | 2022-06-03 | 2023-12-07 | Apple Inc. | Automatic text recognition with layout preservation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005100416A (ja) | 2003-09-24 | 2005-04-14 | Microsoft Corp | インク入力内のリストを検出するシステムおよび方法 |
JP2014086006A (ja) | 2012-10-26 | 2014-05-12 | Toshiba Corp | 電子機器および方法 |
JP2017134822A (ja) | 2016-01-29 | 2017-08-03 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 箇条書きリスト |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2007414C (en) * | 1989-04-26 | 1994-10-25 | Clayton James Bennett Iii | Method for manipulating elements within a structured document using active intent interpretations |
US7149970B1 (en) * | 2000-06-23 | 2006-12-12 | Microsoft Corporation | Method and system for filtering and selecting from a candidate list generated by a stochastic input method |
US7836399B2 (en) * | 2006-02-09 | 2010-11-16 | Microsoft Corporation | Detection of lists in vector graphics documents |
US20120290288A1 (en) * | 2011-05-09 | 2012-11-15 | Xerox Corporation | Parsing of text using linguistic and non-linguistic list properties |
CN110162634A (zh) * | 2019-05-21 | 2019-08-23 | 北京鸿联九五信息产业有限公司 | 一种基于机器学习的文本处理方法 |
-
2020
- 2020-02-07 EP EP20305120.6A patent/EP3862918B1/en active Active
-
2021
- 2021-02-02 EP EP21702036.1A patent/EP4100868A1/en active Pending
- 2021-02-02 CN CN202180011062.0A patent/CN115004262B/zh active Active
- 2021-02-02 US US17/797,558 patent/US20230054848A1/en active Pending
- 2021-02-02 KR KR1020227026635A patent/KR20220137645A/ko not_active Application Discontinuation
- 2021-02-02 JP JP2022544683A patent/JP7448132B2/ja active Active
- 2021-02-02 WO PCT/EP2021/052432 patent/WO2021156253A1/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005100416A (ja) | 2003-09-24 | 2005-04-14 | Microsoft Corp | インク入力内のリストを検出するシステムおよび方法 |
JP2014086006A (ja) | 2012-10-26 | 2014-05-12 | Toshiba Corp | 電子機器および方法 |
JP2017134822A (ja) | 2016-01-29 | 2017-08-03 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 箇条書きリスト |
Also Published As
Publication number | Publication date |
---|---|
WO2021156253A1 (en) | 2021-08-12 |
CN115004262A (zh) | 2022-09-02 |
CN115004262B (zh) | 2024-04-02 |
JP2023512189A (ja) | 2023-03-24 |
EP3862918B1 (en) | 2023-11-01 |
EP3862918A1 (en) | 2021-08-11 |
KR20220137645A (ko) | 2022-10-12 |
US20230054848A1 (en) | 2023-02-23 |
EP4100868A1 (en) | 2022-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10664695B2 (en) | System and method for managing digital ink typesetting | |
CN114365075B (zh) | 用于选择图形对象的方法和对应装置 | |
KR20180077152A (ko) | 핸드라이팅 입력을 가이드하는 시스템 및 방법 | |
KR102576276B1 (ko) | 자유 핸드라이팅 모드에서 텍스트 핸드라이팅 입력의 처리 | |
US20140184610A1 (en) | Shaping device and shaping method | |
CN108369637B (zh) | 用于美化数字墨水的系统和方法 | |
CN108701215B (zh) | 用于识别多对象结构的系统和方法 | |
US11393231B2 (en) | System and method for text line extraction | |
US11429259B2 (en) | System and method for selecting and editing handwriting input elements | |
JP7448132B2 (ja) | 手書きの構造分解 | |
JP2015099566A (ja) | 特徴算出装置、方法及びプログラム | |
US20230096728A1 (en) | System and method for text line and text block extraction | |
EP4097630B1 (en) | Math detection in handwriting | |
CN112740201A (zh) | 墨水数据生成装置、方法及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240109 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7448132 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |