JP6505600B2 - 自動構成評価器 - Google Patents
自動構成評価器 Download PDFInfo
- Publication number
- JP6505600B2 JP6505600B2 JP2015531264A JP2015531264A JP6505600B2 JP 6505600 B2 JP6505600 B2 JP 6505600B2 JP 2015531264 A JP2015531264 A JP 2015531264A JP 2015531264 A JP2015531264 A JP 2015531264A JP 6505600 B2 JP6505600 B2 JP 6505600B2
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- text
- file
- document
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000011156 evaluation Methods 0.000 claims description 376
- 238000000034 method Methods 0.000 claims description 127
- 238000007667 floating Methods 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 11
- 238000012854 evaluation process Methods 0.000 description 98
- 230000008569 process Effects 0.000 description 66
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
この出願は、2012年9月7日に米国特許商標局に出願された、「AUTOMATED COMPOSITION EVALUATlON」と称する米国仮特許出願第61/698,437号明細書の優先権の利益を主張し、同特許は、その全体が参照により本明細書に組み込まれる。
例えば、本願発明は以下の項目を提供する。
(項目1)
評価すべき文書を表す第1のファイルの構成を評価する方法であって、1つ以上のメモリデバイスと動作可能に結合された1つ以上のプロセッサによって実行される方法であり、
前記第1のファイルを第2のファイルに変換するステップであって、前記第2のファイルは、前記第1のファイルの前記構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトを含む、ステップと、
前記複数のオブジェクトに基づいて1つ以上のパラメータを決定するステップであって、前記1つ以上のパラメータは、前記少なくとも1つのテキストオブジェクトと関連付けられた1つ以上のテキストパラメータ、前記文書の少なくとも1ページと関連付けられた1つ以上のページパラメータ、および、前記文書と関連付けられた1つ以上の文書パラメータを含む、ステップと、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップと、
評価結果を生成し、前記1つ以上のメモリデバイスに前記評価結果を格納するステップと、
前記評価結果に基づいて評価結論を生成するステップであって、前記評価結論は、前記構成ルールによる前記文書のコンプライアンスを示す、ステップと
を含む、方法。
(項目2)
前記第2のファイルは、少なくとも1つのマークアップタグを含む評価器標準拡張可能マークアップ言語(XML)ファイルにある、項目1に記載の方法。
(項目3)
前記複数のオブジェクトは、
表オブジェクト、方程式オブジェクト、グラフィックオブジェクトのうちの1つ以上を含む、少なくとも1つの非テキストオブジェクトと、
前記テキストオブジェクトおよび前記非テキストオブジェクトの少なくとも1つを含む、少なくとも1つの列と
をさらに含む、項目1に記載の方法。
(項目4)
前記複数のオブジェクトに基づいて前記1つ以上のパラメータを決定するステップは、
少なくとも1つのコールアウトと関連付けられた1つ以上のコールアウトパラメータを得るステップであって、前記少なくとも1つのコールアウトは、前記少なくとも1つの表オブジェクト、前記少なくとも1つの方程式オブジェクトまたは前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上に対応する、ステップ、および、
前記少なくとも1つの表オブジェクト、前記少なくとも1つの方程式オブジェクトまたは前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上に対応する1つ以上の浮動パラメータを得るステップ
の少なくとも1つを含む、項目3に記載の方法。
(項目5)
前記複数のオブジェクトに基づいて前記1つ以上のパラメータを決定するステップは、
前記少なくとも1つの表オブジェクトと関連付けられた1つ以上の第1の表パラメータを決定するステップであって、前記第1の表パラメータは、前記少なくとも1つの表オブジェクトの少なくとも1つの第1の寸法に対応する、ステップと、
前記少なくとも1つの表オブジェクトと関連付けられた1つ以上の第2の表パラメータを決定するステップであって、前記第2の表パラメータは、前記少なくとも1つの表オブジェクトの行および列のうちの少なくとも1つの少なくとも1つの第2の寸法に対応する、ステップと
を含む、項目3に記載の方法。
(項目6)
前記複数のオブジェクトに基づいて前記1つ以上のパラメータを決定するステップは、
前記少なくとも1つの方程式オブジェクトと関連付けられた1つ以上の方程式パラメータを決定するステップと、
前記少なくとも1つの方程式オブジェクトに対応して、少なくとも1つの分割と関連付けられた少なくとも1つの文字を決定するステップと
を含む、項目3に記載の方法。
(項目7)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記少なくとも1つのテキストオブジェクトと関連付けられた前記1つ以上のテキストパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの連続ハイフンの数が第1のテキスト閾値条件を満たすかどうか、
1つ以上の文字間間隔が第2のテキスト閾値条件を満たすかどうか、
1つ以上の単語間間隔が第3のテキスト閾値条件を満たすかどうか、および、
1つ以上の行間間隔が第4のテキスト閾値条件を満たすかどうか
の少なくとも1つを判断するステップ
を含む、項目1に記載の方法。
(項目8)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記1つ以上のコールアウトパラメータおよび前記1つ以上の浮動パラメータの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクト、少なくとも1つの方程式オブジェクトおよび少なくとも1つのグラフィックオブジェクトのうちの1つ以上の寸法が第1のコールアウト閾値条件を満たすかどうか、
前記少なくとも1つの表オブジェクト、少なくとも1つの方程式オブジェクトおよび少なくとも1つのグラフィックオブジェクトのうちの1つ以上の少なくとも1つを置くことができないかどうか、ならびに、
前記コールアウトパラメータおよび前記浮動パラメータに基づいて計算される少なくとも1つのコールアウト距離が第2のコールアウト閾値条件および第3のコールアウト閾値条件を満たすかどうか
の少なくとも1つを判断するステップ
を含む、項目4に記載の方法。
(項目9)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記1つ以上の第1の表パラメータおよび前記1つ以上の第2の表パラメータの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクトの寸法が第1の表閾値条件を満たすかどうか、ならびに、
列データ幅が第2の表閾値条件および第3の表閾値条件を満たすかどうか
の少なくとも1つを判断するステップと、
前記少なくとも1つの表オブジェクトが積み重なっているかどうかを判断するステップと
を含む、項目5に記載の方法。
(項目10)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記1つ以上の方程式パラメータに基づいて、前記少なくとも1つの方程式オブジェクトの寸法が第1の方程式閾値条件を満たすかどうかを判断するステップ、および、
前記少なくとも1つの分割と関連付けられた前記少なくとも1つの文字に基づいて、前記少なくとも1つの文字が第2の方程式閾値条件を満たすかどうかを判断するステップの少なくとも1つを含む、項目6に記載の方法。
(項目11)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記少なくとも1つのグラフィックオブジェクトの寸法が第1のグラフィック閾値条件を満たすかどうかを判断するステップ、および、
前記少なくとも1つのグラフィックオブジェクトが回転されているかどうかを判断するステップ
の少なくとも1つを含む、項目3に記載の方法。
(項目12)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
空白ブロックが第1の列閾値条件を満たすかどうかを判断するステップ、ならびに、
終了位置が第2の列閾値条件および第3の列閾値条件を満たすかどうかを判断するステップ
の少なくとも1つを含む、項目3に記載の方法。
(項目13)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、前記1つ以上のページパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの行間間隔の1つ以上の差が第1のページ閾値条件を満たすかどうか、および、
列終了位置の1つ以上の差が第2のページ閾値条件を満たすかどうか
の少なくとも1つを判断するステップを含む、項目3に記載の方法。
(項目14)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、前記1つ以上の文書パラメータに基づいて、
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価する際に少なくとも1つのエラーが発生したかどうか、
前記少なくとも1つの非テキストオブジェクトに対する前記少なくとも1つのテキストオブジェクトの領域比が第1および第2のファイル閾値条件を満たすかどうか、ならびに、
前記文書の最後のページ上の列終了位置が第3のファイル閾値条件を満たすかどうか
の少なくとも1つを判断するステップを含む、項目3に記載の方法。
(項目15)
前記評価結果を生成するステップは、
前記少なくとも1つのテキストオブジェクト、前記少なくとも1つの非テキストオブジェクト、前記少なくとも1つの列、前記少なくとも1ページおよび前記第1のファイルのうちの1つ以上に対応して前記評価結果を生成するステップと、
前記評価結果に対する優先データを決定するステップであって、前記優先データは、決定的な優先および非決定的な優先の少なくとも1つを含む、ステップと
を含む、項目3に記載の方法。
(項目16)
前記評価結果に基づいて前記評価結論を生成するステップは、前記優先データに基づいて前記文書が前記構成ルールに準拠するかどうかを判断するステップを含む、項目15に記載の方法。
(項目17)
コンピュータによって実行されると、評価すべき文書を表す第1のファイルの構成を評価する方法をコンピュータに実行させる命令を格納する、非一時的なコンピュータ可読記憶媒体であって、前記方法は、1つ以上のメモリデバイスと動作可能に結合された1つ以上のプロセッサによって実行され、
前記第1のファイルを第2のファイルに変換するステップであって、前記第2のファイルは、前記第1のファイルの前記構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトを含む、ステップと、
前記複数のオブジェクトに基づいて1つ以上のパラメータを決定するステップであって、前記1つ以上のパラメータは、前記少なくとも1つのテキストオブジェクトと関連付けられた1つ以上のテキストパラメータ、前記文書の少なくとも1ページと関連付けられた1つ以上のページパラメータ、および、前記文書と関連付けられた1つ以上の文書パラメータを含む、ステップと、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップと、
評価結果を生成し、前記1つ以上のメモリデバイスに前記評価結果を格納するステップと、
前記評価結果に基づいて評価結論を生成するステップであって、前記評価結論は、前記構成ルールによる前記文書のコンプライアンスを示す、ステップと
を含む、コンピュータ可読記憶媒体。
(項目18)
前記複数のオブジェクトは、
表オブジェクト、方程式オブジェクト、グラフィックオブジェクトのうちの1つ以上を含む、少なくとも1つの非テキストオブジェクトと、
前記テキストオブジェクトおよび前記非テキストオブジェクトの少なくとも1つを含む、少なくとも1つの列と
をさらに含む、項目17に記載のコンピュータ可読記憶媒体。
(項目19)
前記複数のオブジェクトに基づいて前記1つ以上のパラメータを決定するステップは、
前記少なくとも1つの表オブジェクトと関連付けられた1つ以上の第1の表パラメータを決定するステップであって、前記第1の表パラメータは、前記少なくとも1つの表オブジェクトの少なくとも1つの第1の寸法に対応する、ステップと、
前記少なくとも1つの表オブジェクトと関連付けられた1つ以上の第2の表パラメータを決定するステップであって、前記第2の表パラメータは、前記少なくとも1つの表オブジェクトの行および列のうちの少なくとも1つの少なくとも1つの第2の寸法に対応する、ステップと
を含む、項目18に記載のコンピュータ可読記憶媒体。
(項目20)
前記複数のオブジェクトに基づいて前記1つ以上のパラメータを決定するステップは、
前記少なくとも1つの方程式オブジェクトと関連付けられた1つ以上の方程式パラメータを決定するステップと、
前記少なくとも1つの方程式オブジェクトに対応して、少なくとも1つの分割と関連付けられた少なくとも1つの文字を決定するステップと
を含む、項目18に記載のコンピュータ可読記憶媒体。
(項目21)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記少なくとも1つのテキストオブジェクトと関連付けられた前記1つ以上のテキストパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの連続ハイフンの数が第1のテキスト閾値条件を満たすかどうか、
1つ以上の文字間間隔が第2のテキスト閾値条件を満たすかどうか、
1つ以上の単語間間隔が第3のテキスト閾値条件を満たすかどうか、および、
1つ以上の行間間隔が第4のテキスト閾値条件を満たすかどうか
の少なくとも1つを判断するステップ
を含む、項目17に記載のコンピュータ可読記憶媒体。
(項目22)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記1つ以上の第1の表パラメータおよび前記1つ以上の第2の表パラメータの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクトの寸法が第1の表閾値条件を満たすかどうか、ならびに、
列データ幅が第2の表閾値条件および第3の表閾値条件を満たすかどうか
の少なくとも1つを判断するステップと、
前記少なくとも1つの表オブジェクトが積み重なっているかどうかを判断するステップと
を含む、項目19に記載のコンピュータ可読記憶媒体。
(項目23)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記1つ以上の方程式パラメータに基づいて、前記少なくとも1つの方程式オブジェクトの寸法が第1の方程式閾値条件を満たすかどうかを判断するステップ、および、
前記少なくとも1つの分割と関連付けられた前記少なくとも1つの文字に基づいて、前記少なくとも1つの文字が第2の方程式閾値条件を満たすかどうかを判断するステップ
の少なくとも1つを含む、項目20に記載のコンピュータ可読記憶媒体。
(項目24)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
前記少なくとも1つのグラフィックオブジェクトの寸法が第1のグラフィック閾値条件を満たすかどうかを判断するステップ、および、
前記少なくとも1つのグラフィックオブジェクトが回転されているかどうかを判断するステップ
の少なくとも1つを含む、項目18に記載のコンピュータ可読記憶媒体。
(項目25)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、
空白ブロックが第1の列閾値条件を満たすかどうかを判断するステップ、ならびに、
終了位置が第2の列閾値条件および第3の列閾値条件を満たすかどうかを判断するステップ
の少なくとも1つを含む、項目18に記載のコンピュータ可読記憶媒体。
(項目26)
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価するステップは、前記1つ以上のページパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの行間間隔の1つ以上の差が第1のページ閾値条件を満たすかどうか、および、
列終了位置の1つ以上の差が第2のページ閾値条件を満たすかどうか
の少なくとも1つを判断するステップを含む、項目18に記載のコンピュータ可読記憶媒体。
(項目27)
前記複数の構成ルールに基づいて前記1つ以上の文書パラメータを評価するステップは、前記1つ以上の文書パラメータに基づいて、
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価する際に少なくとも1つのエラーが発生したかどうか、
前記少なくとも1つの非テキストオブジェクトに対する前記少なくとも1つのテキストオブジェクトの領域比が第1および第2のファイル閾値条件を満たすかどうか、ならびに、
前記文書の最後のページ上の列終了位置が第3のファイル閾値条件を満たすかどうか
の少なくとも1つを判断するステップを含む、項目18に記載のコンピュータ可読記憶媒体。
(項目28)
前記評価結果を生成するステップは、
前記少なくとも1つのテキストオブジェクト、前記少なくとも1つの非テキストオブジェクト、前記少なくとも1つの列、前記少なくとも1ページおよび前記第1のファイルのうちの1つ以上に対応して前記評価結果を生成するステップと、
前記評価結果に対する優先データを決定するステップであって、前記優先データは、決定的な優先および非決定的な優先の少なくとも1つを含む、ステップと
を含む、項目18に記載のコンピュータ可読記憶媒体。
(項目29)
前記評価結果に基づいて前記評価結論を生成するステップは、前記優先データに基づいて前記文書が前記構成ルールに準拠するかどうかを判断するステップを含む、項目28に記載のコンピュータ可読記憶媒体。
(項目30)
評価すべき文書を表す第1のファイルの構成を評価するためのシステムであって、
前記第1のファイルを第2のファイルに変換するように構成されたプロセッサであって、前記第2のファイルは、前記第1のファイルの前記構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトを含む、プロセッサと、
前記複数のオブジェクトに基づいて1つ以上のパラメータを決定するように構成されたインタプリタであって、前記1つ以上のパラメータは、前記少なくとも1つのテキストオブジェクトと関連付けられた1つ以上のテキストパラメータ、前記文書の少なくとも1ページと関連付けられた1つ以上のページパラメータ、および、前記文書と関連付けられた1つ以上の文書パラメータを含む、インタプリタと、
評価器であって、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価し、
評価結果を生成し、1つ以上のメモリデバイスに前記評価結果を格納し、
前記評価結果に基づいて、前記構成ルールによる前記文書のコンプライアンスを示す評価結論を生成する
ように構成された、評価器と
を備える、システム。
Claims (30)
- 評価すべき文書を表す第1のファイルの構成を評価する方法であって、前記方法は、1つ以上のメモリデバイスに動作可能に結合された1つ以上のプロセッサによって実行され、前記方法は、
前記第1のファイルを第2のファイルに変換することであって、前記第2のファイルは、前記第1のファイルの構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトと、前記文書の少なくとも1つのページに関連付けられた少なくとも1つのページオブジェクトと、前記文書に関連付けられた少なくとも1つの文書オブジェクトとを含む、ことと、
前記複数のオブジェクトに関連付けられた1つ以上のパラメータを決定することであって、前記1つ以上のパラメータは、前記複数のオブジェクトの特性を表し、前記1つ以上のパラメータは、1つ以上のテキストパラメータと、1つ以上のページパラメータと、1つ以上の文書パラメータとを含み、前記1つ以上のテキストパラメータは、前記少なくとも1つのテキストオブジェクトに関連付けられており、前記1つ以上のページパラメータは、前記少なくとも1つのページオブジェクトに関連付けられており、前記1つ以上の文書パラメータは、前記少なくとも1つの文書オブジェクトに関連付けられており、
前記少なくとも1つのテキストオブジェクトは、文字、文字列、行、パラグラフ、セクション、列のうちの少なくとも1つを含み、
前記1つ以上のテキストパラメータは、文字間の間隔、単語間の間隔、テキストブロック間の行送り幅の変動、物理的ハイフンまたは任意のハイフンのいずれかで終わる連続行の数のうちの少なくとも1つを含み、
前記少なくとも1つのページオブジェクトは、テキストの行、パラグラフ、表を含む列およびフレームのうちの少なくとも1つを含み、
前記1つ以上のページパラメータは、行間間隔の差、列終了位置の差、重複フレームのうちの少なくとも1つを含み、
前記少なくとも1つの文書オブジェクトは、全文書、列、セクション、パラグラフのトピックを要約する複数のレベルの見出しのうちの少なくとも1つを含み、
前記1つ以上の文書パラメータは、エラー発生の数、テキスト領域の領域比、文書の最後のページ上の列終了位置のうちの少なくとも1つを含む、ことと、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価することと、
評価結果を生成し、前記評価結果を前記1つ以上のメモリデバイスに格納することと、
前記評価結果に基づいて評価結論を生成することであって、前記評価結論は、前記複数の構成ルールによる前記文書のコンプライアンスを示す、ことと、
前記第1のファイルを前記第2のファイルに変換するステップの後に、前記第2のファイルが評価のための所望の情報を含むかどうかを決定することと、前記第2のファイルが前記所望の情報を含まないと決定された場合には、前記第1のファイルから前記所望の情報を取得することと
を含み、
前記1つ以上のパラメータを決定するステップは、前記所望の情報から前記1つ以上のパラメータを決定することを含む、方法。 - 前記第2のファイルは、少なくとも1つのマークアップタグを含む評価器標準拡張可能マークアップ言語(XML)ファイル内にある、請求項1に記載の方法。
- 前記複数のオブジェクトは、
少なくとも1つの非テキストオブジェクトであって、前記少なくとも1つの非テキストオブジェクトは、表オブジェクト、方程式オブジェクト、グラフィックオブジェクトのうちの1つ以上を含む、少なくとも1つの非テキストオブジェクトと、
少なくとも1つの列であって、前記少なくとも1つの列は、前記テキストオブジェクトおよび前記非テキストオブジェクトのうちの少なくとも1つを含む、少なくとも1つの列と
をさらに含む、請求項1に記載の方法。 - 前記複数のオブジェクトに関連付けられた前記1つ以上のパラメータを決定することは、
少なくとも1つのコールアウトに関連付けられた1つ以上のコールアウトパラメータを取得することであって、前記少なくとも1つのコールアウトは、前記少なくとも1つの表オブジェクト、前記少なくとも1つの方程式オブジェクト、または、前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上に対応する、ことと、
(i)前記少なくとも1つの表オブジェクト、(ii)前記少なくとも1つの方程式オブジェクト、または、(iii)前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上に関連付けられた1つ以上の浮動パラメータを取得することと
のうちの少なくとも1つを含み、
前記1つ以上の浮動パラメータは、(i)前記少なくとも1つの表オブジェクト、(ii)前記少なくとも1つの方程式オブジェクト、または、(iii)前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上の位置を含む、請求項3に記載の方法。 - 前記複数のオブジェクトに関連付けられた前記1つ以上のパラメータを決定することは、
前記少なくとも1つの表オブジェクトに関連付けられた1つ以上の第1の表パラメータを決定することであって、前記第1の表パラメータは、前記少なくとも1つの表オブジェクトの少なくとも1つの第1の寸法に対応する、ことと、
前記少なくとも1つの表オブジェクトに関連付けられた1つ以上の第2の表パラメータを決定することであって、前記第2の表パラメータは、前記少なくとも1つの表オブジェクトの行および列のうちの少なくとも1つの少なくとも1つの第2の寸法に対応する、ことと
を含む、請求項3に記載の方法。 - 前記複数のオブジェクトに関連付けられた前記1つ以上のパラメータを決定することは、前記少なくとも1つの方程式オブジェクトに関連付けられた1つ以上の方程式パラメータを決定することを含む、請求項3に記載の方法。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上のテキストパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの連続ハイフンの数が第1のテキスト閾値条件を満たすかどうか、
1つ以上の文字間間隔が第2のテキスト閾値条件を満たすかどうか、
1つ以上の単語間間隔が第3のテキスト閾値条件を満たすかどうか、
1つ以上の行間間隔が第4のテキスト閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項1に記載の方法。 - 前記1つ以上のコールアウトパラメータは、(i)少なくとも1つの非テキストオブジェクトの寸法と、(ii)少なくとも1つのコールアウト距離とを含み、前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上のコールアウトパラメータおよび前記1つ以上の浮動パラメータの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクト、前記少なくとも1つの方程式オブジェクト、前記少なくとも1つのグラフィックオブジェクトのうちの1つ以上の寸法が第1のコールアウト閾値条件を満たすかどうか、
少なくとも1つのコールアウト距離が第2のコールアウト閾値条件および第3のコールアウト閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含み、
前記少なくとも1つのコールアウト距離は、前記少なくとも1つのコールアウトのうちの1つのコールアウトの位置と前記コールアウトに対応するオブジェクトの位置との間の距離であり、
前記コールアウトの位置および前記オブジェクトの位置は、インタプリタによって決定される、請求項4に記載の方法。 - 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上の第1の表パラメータおよび前記1つ以上の第2の表パラメータのうちの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクトの寸法が第1の表閾値条件を満たすかどうか、
列データ幅が第2の表閾値条件および第3の表閾値条件を満たすかどうか
のうちの少なくとも1つを決定することと、
前記少なくとも1つの表オブジェクトの行が、分離されており、かつ、前記少なくとも1つの表の分離されていない行の横に置かれているかどうかを決定することによって、前記少なくとも1つの表オブジェクトが並べられているかどうかを決定することと
を含む、請求項5に記載の方法。 - 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、前記1つ以上の方程式パラメータに基づいて、前記少なくとも1つの方程式オブジェクトの寸法が方程式閾値条件を満たすかどうかを決定することを含む、請求項6に記載の方法。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、前記少なくとも1つのグラフィックオブジェクトの寸法が第1のグラフィック閾値条件を満たすかどうかを決定することを含む、請求項3に記載の方法。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、終了位置が第1の列閾値条件および第2の列閾値条件を満たすかどうかを決定することを含む、請求項3に記載の方法。
- 前記複数のオブジェクトは、複数のテキストオブジェクトを含み、前記表オブジェクトは、複数の列を含み、前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上のページパラメータに基づいて、
前記複数のテキストオブジェクトの間での行間間隔の1つ以上の差が第1のページ閾値条件を満たすかどうか、
前記複数の列の列終了位置の1つ以上の差が第2のページ閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項3に記載の方法。 - 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上の文書パラメータに基づいて、
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価する際に少なくとも1つのエラーが発生したかどうか、
前記少なくとも1つの非テキストオブジェクトに対する前記少なくとも1つのテキストオブジェクトの領域比が第1のファイル閾値条件および第2のファイル閾値条件を満たすかどうか、
前記文書の最後のページ上の列終了位置が第3のファイル閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項3に記載の方法。 - 前記評価結果を生成することは、
前記少なくとも1つのテキストオブジェクト、前記少なくとも1つの非テキストオブジェクト、前記少なくとも1つの列、前記少なくとも1ページ、前記第1のファイルのうちの1つ以上に対応する前記評価結果を生成することと、
前記評価結果に対する優先データを決定することであって、前記優先データは、決定的な優先および非決定的な優先のうちの少なくとも1つを含む、ことと
を含む、請求項3に記載の方法。 - 前記評価結果に基づいて前記評価結論を生成することは、前記優先データに基づいて前記文書が前記複数の構成ルールに準拠するかどうかを決定することを含む、請求項15に記載の方法。
- 命令を格納する非一時的なコンピュータ読み取り可能な記憶媒体であって、前記命令は、コンピュータによって実行されると、評価すべき文書を表す第1のファイルの構成を評価する方法を実行することをコンピュータに行わせ、前記方法は、1つ以上のメモリデバイスに動作可能に結合された1つ以上のプロセッサによって実行され、前記方法は、
前記第1のファイルを第2のファイルに変換することであって、前記第2のファイルは、前記第1のファイルの構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトと、前記文書の少なくとも1つのページに関連付けられた少なくとも1つのページオブジェクトと、前記文書に関連付けられた少なくとも1つの文書オブジェクトとを含む、ことと、
前記複数のオブジェクトに関連付けられた1つ以上のパラメータを決定することであって、前記1つ以上のパラメータは、前記複数のオブジェクトの特性を表し、前記1つ以上のパラメータは、1つ以上のテキストパラメータと、1つ以上のページパラメータと、1つ以上の文書パラメータとを含み、前記1つ以上のテキストパラメータは、前記少なくとも1つのテキストオブジェクトに関連付けられており、前記1つ以上のページパラメータは、前記少なくとも1つのページオブジェクトに関連付けられており、前記1つ以上の文書パラメータは、前記少なくとも1つの文書オブジェクトに関連付けられており、
前記少なくとも1つのテキストオブジェクトは、文字、文字列、行、パラグラフ、セクション、列のうちの少なくとも1つを含み、
前記1つ以上のテキストパラメータは、文字間の間隔、単語間の間隔、テキストブロック間の行送り幅の変動、物理的ハイフンまたは任意のハイフンのいずれかで終わる連続行の数のうちの少なくとも1つを含み、
前記少なくとも1つのページオブジェクトは、テキストの行、パラグラフ、表を含む列およびフレームのうちの少なくとも1つを含み、
前記1つ以上のページパラメータは、行間間隔の差、列終了位置の差、重複フレームのうちの少なくとも1つを含み、
前記少なくとも1つの文書オブジェクトは、全文書、列、セクション、パラグラフのトピックを要約する複数のレベルの見出しのうちの少なくとも1つを含み、
前記1つ以上の文書パラメータは、エラー発生の数、テキスト領域の領域比、文書の最後のページ上の列終了位置のうちの少なくとも1つを含む、ことと、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価することと、
評価結果を生成し、前記評価結果を前記1つ以上のメモリデバイスに格納することと、
前記評価結果に基づいて評価結論を生成することであって、前記評価結論は、前記複数の構成ルールによる前記文書のコンプライアンスを示す、ことと、
前記第1のファイルを第2のファイルに変換するステップの後に、前記第2のファイルが評価のための所望の情報を含むかどうかを決定することと、
前記第2のファイルが前記所望の情報を含まないと決定された場合には、前記第1のファイルから前記所望の情報を取得することと
を含み、
前記1つ以上のパラメータを決定するステップは、前記所望の情報から前記1つ以上のパラメータを決定することを含む、コンピュータ読み取り可能な記憶媒体。 - 前記複数のオブジェクトは、
少なくとも1つの非テキストオブジェクトであって、前記少なくとも1つの非テキストオブジェクトは、表オブジェクト、方程式オブジェクト、グラフィックオブジェクトのうちの1つ以上を含む、少なくとも1つの非テキストオブジェクトと、
少なくとも1つの列であって、前記少なくとも1つの列は、前記テキストオブジェクトおよび前記非テキストオブジェクトのうちの少なくとも1つを含む、少なくとも1つの列と
をさらに含む、請求項17に記載のコンピュータ読み取り可能な記憶媒体。 - 前記複数のオブジェクトに関連付けられた前記1つ以上のパラメータを決定することは、
前記少なくとも1つの表オブジェクトに関連付けられた1つ以上の第1の表パラメータを決定することであって、前記第1の表パラメータは、前記少なくとも1つの表オブジェクトの少なくとも1つの第1の寸法に対応する、ことと、
前記少なくとも1つの表オブジェクトに関連付けられた1つ以上の第2の表パラメータを決定することであって、前記第2の表パラメータは、前記少なくとも1つの表オブジェクトの行および列のうちの少なくとも1つの少なくとも1つの第2の寸法に対応する、ことと
を含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。 - 前記複数のオブジェクトに関連付けられた前記1つ以上のパラメータを決定することは、前記少なくとも1つの方程式オブジェクトに関連付けられた1つ以上の方程式パラメータを決定することを含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上のテキストパラメータに基づいて、
前記少なくとも1つのテキストオブジェクトの連続ハイフンの数が第1のテキスト閾値条件を満たすかどうか、
1つ以上の文字間間隔が第2のテキスト閾値条件を満たすかどうか、
1つ以上の単語間間隔が第3のテキスト閾値条件を満たすかどうか、
1つ以上の行間間隔が第4のテキスト閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項17に記載のコンピュータ読み取り可能な記憶媒体。 - 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上の第1の表パラメータおよび前記1つ以上の第2の表パラメータの少なくとも1つに基づいて、
前記少なくとも1つの表オブジェクトの寸法が第1の表閾値条件を満たすかどうか、
列データ幅が第2の表閾値条件および第3の表閾値条件を満たすかどうか
のうちの少なくとも1つを決定することと、
前記少なくとも1つの表オブジェクトの行が、分離されており、かつ、前記少なくとも1つの表の分離されていない行の横に置かれているかどうかを決定することによって、前記少なくとも1つの表オブジェクトが並べられているかどうかを決定することと
を含む、請求項19に記載のコンピュータ読み取り可能な記憶媒体。 - 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、前記1つ以上の方程式パラメータに基づいて、前記少なくとも1つの方程式オブジェクトの寸法が第1の方程式閾値条件を満たすかどうかを決定することを含む、請求項20に記載のコンピュータ読み取り可能な記憶媒体。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、前記少なくとも1つのグラフィックオブジェクトの寸法が第1のグラフィック閾値条件を満たすかどうかを決定することを含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。
- 前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、終了位置が第1の列閾値条件および第2の列閾値条件を満たすかどうかを決定することを含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。
- 前記複数のオブジェクトは、複数のテキストオブジェクトを含み、前記表オブジェクトは、複数の列を含み、前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価することは、
前記1つ以上のページパラメータに基づいて、
前記複数のテキストオブジェクトの間での行間間隔の1つ以上の差が第1のページ閾値条件を満たすかどうか、
前記複数の列の列終了位置の1つ以上の差が第2のページ閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。 - 前記複数の構成ルールに基づいて前記1つ以上の文書パラメータを評価することは、
前記1つ以上の文書パラメータに基づいて、
前記複数の構成ルールに基づいて前記1つ以上のパラメータを評価する際に少なくとも1つのエラーが発生したかどうか、
前記少なくとも1つの非テキストオブジェクトに対する前記少なくとも1つのテキストオブジェクトの領域比が第1のファイル閾値条件および第2のファイル閾値条件を満たすかどうか、
前記文書の最後のページ上の列終了位置が第3のファイル閾値条件を満たすかどうか
のうちの少なくとも1つを決定することを含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。 - 前記評価結果を生成することは、
前記少なくとも1つのテキストオブジェクト、前記少なくとも1つの非テキストオブジェクト、前記少なくとも1つの列、前記少なくとも1ページ、前記第1のファイルのうちの1つ以上に対応する前記評価結果を生成することと、
前記評価結果に対する優先データを決定することであって、前記優先データは、決定的な優先および非決定的な優先のうちの少なくとも1つを含む、ことと
を含む、請求項18に記載のコンピュータ読み取り可能な記憶媒体。 - 前記評価結果に基づいて前記評価結論を生成することは、前記優先データに基づいて前記文書が前記複数の構成ルールに準拠するかどうかを決定することを含む、請求項28に記載のコンピュータ読み取り可能な記憶媒体。
- 評価すべき文書を表す第1のファイルの構成を評価するためのシステムであって、前記システムは、
プロセッサと、
インタプリタと、
評価器と
を備え、
前記プロセッサは、前記第1のファイルを第2のファイルに変換するように構成されており、前記第2のファイルは、前記第1のファイルの構成に対応する複数のオブジェクトを含み、前記複数のオブジェクトは、少なくとも1つのテキストオブジェクトと、前記文書の少なくとも1つのページに関連付けられた少なくとも1つのページオブジェクトと、前記文書に関連付けられた少なくとも1つの文書オブジェクトとを含み、
前記インタプリタは、前記複数のオブジェクトに関連付けられた1つ以上のパラメータを決定するように構成されており、前記1つ以上のパラメータは、前記複数のオブジェクトの特性を表し、前記1つ以上のパラメータは、1つ以上のテキストパラメータと、1つ以上のページパラメータと、1つ以上の文書パラメータとを含み、前記1つ以上のテキストパラメータは、前記少なくとも1つのテキストオブジェクトに関連付けられており、前記1つ以上のページパラメータは、前記少なくとも1つのページオブジェクトに関連付けられており、前記1つ以上の文書パラメータは、前記少なくとも1つの文書オブジェクトに関連付けられており、
前記少なくとも1つのテキストオブジェクトは、文字、文字列、行、パラグラフ、セクション、列のうちの少なくとも1つを含み、
前記1つ以上のテキストパラメータは、文字間の間隔、単語間の間隔、テキストブロック間の行送り幅の変動、物理的ハイフンまたは任意のハイフンのいずれかで終わる連続行の数のうちの少なくとも1つを含み、
前記少なくとも1つのページオブジェクトは、テキストの行、パラグラフ、表を含む列およびフレームのうちの少なくとも1つを含み、
前記1つ以上のページパラメータは、行間間隔の差、列終了位置の差、重複フレームのうちの少なくとも1つを含み、
前記少なくとも1つの文書オブジェクトは、全文書、列、セクション、パラグラフのトピックを要約する複数のレベルの見出しのうちの少なくとも1つを含み、
前記1つ以上の文書パラメータは、エラー発生の数、テキスト領域の領域比、文書の最後のページ上の列終了位置のうちの少なくとも1つを含み、
前記評価器は、
ルールエンジンによって提供された複数の構成ルールに基づいて前記1つ以上のパラメータを評価することと、
評価結果を生成し、前記評価結果を1つ以上のメモリデバイスに格納することと、
前記評価結果に基づいて評価結論を生成することであって、前記評価結論は、前記複数の構成ルールによる前記文書のコンプライアンスを示す、ことと
を行うように構成されており、
前記第1のファイルが第2のファイルに変換された後に、前記インタプリタは、前記第2のファイルが評価のための所望の情報を含むかどうかを決定するように構成されており、前記第2のファイルが前記所望の情報を含まないと決定された場合には、前記インタプリタは、前記第1のファイルから前記所望の情報を取得し、前記インタプリタは、前記所望の情報から前記1つ以上のパラメータを決定するように構成されている、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261698437P | 2012-09-07 | 2012-09-07 | |
US61/698,437 | 2012-09-07 | ||
PCT/US2013/058629 WO2014039911A2 (en) | 2012-09-07 | 2013-09-06 | Automated composition evaluator |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015531513A JP2015531513A (ja) | 2015-11-02 |
JP6505600B2 true JP6505600B2 (ja) | 2019-04-24 |
Family
ID=50234656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015531264A Expired - Fee Related JP6505600B2 (ja) | 2012-09-07 | 2013-09-06 | 自動構成評価器 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9384179B2 (ja) |
EP (1) | EP2893463A4 (ja) |
JP (1) | JP6505600B2 (ja) |
KR (1) | KR102110281B1 (ja) |
CN (1) | CN105190596B (ja) |
BR (1) | BR112015005059A2 (ja) |
CA (1) | CA2884242C (ja) |
HK (1) | HK1212484A1 (ja) |
MX (1) | MX344637B (ja) |
WO (1) | WO2014039911A2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6262708B2 (ja) * | 2014-12-31 | 2018-01-17 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法 |
WO2017002130A1 (en) * | 2015-07-01 | 2017-01-05 | Tnq Books And Journals Private Limited | Transformation of marked-up content to a reversible file format for automated browser based pagination |
US10318614B2 (en) * | 2015-07-01 | 2019-06-11 | Tnq Books And Journals Private Limited | Transformation of marked-up content into a file format that enables automated browser based pagination |
US10453014B2 (en) * | 2015-07-14 | 2019-10-22 | Bank Of America Corporation | Systems and methods for utilizing compliance drivers to conserve system resources and reduce compliance violations |
CN112216337B (zh) * | 2020-09-11 | 2024-03-29 | 深圳市金泰克半导体有限公司 | 固件参数检测方法、装置及固件设置方法 |
KR20220118037A (ko) * | 2021-02-18 | 2022-08-25 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07262192A (ja) * | 1994-03-25 | 1995-10-13 | Fuji Xerox Co Ltd | 構造化文書検査装置 |
US5893123A (en) * | 1995-06-22 | 1999-04-06 | Tuinenga; Paul W. | System and method of integrating a spreadsheet and external program having output data calculated automatically in response to input data from the spreadsheet |
US6006240A (en) * | 1997-03-31 | 1999-12-21 | Xerox Corporation | Cell identification in table analysis |
AU5615000A (en) * | 1999-06-14 | 2001-01-02 | Thomson Corporation, The | System for converting data to a markup language |
JP3701197B2 (ja) * | 2000-12-28 | 2005-09-28 | 松下電器産業株式会社 | 分類への帰属度計算基準作成方法及び装置 |
AU2002334721B2 (en) * | 2001-09-28 | 2008-10-23 | Oracle International Corporation | An index structure to access hierarchical data in a relational database system |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7308643B1 (en) * | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
KR20060061790A (ko) * | 2003-07-08 | 2006-06-08 | 유에스 링크스 엘엘씨 | 가상 문서 아키텍쳐를 통해 공동 편집과 어카운트빌리티를용이하게 하는 자동 출판 시스템 |
US20050050298A1 (en) * | 2003-08-25 | 2005-03-03 | International Business Machines Corporation | Method and system for mapping open grid services architecture service data to native resource representation |
GB2424103A (en) * | 2003-11-21 | 2006-09-13 | Agency Science Tech & Res | Method and system for validating the content of technical documents |
US7448022B1 (en) * | 2004-02-10 | 2008-11-04 | Prasad Ram | Dynamic software composition in a component-based software system |
US20050257201A1 (en) * | 2004-05-17 | 2005-11-17 | International Business Machines Corporation | Optimization of XPath expressions for evaluation upon streaming XML data |
ATE510259T1 (de) * | 2005-01-31 | 2011-06-15 | Ontoprise Gmbh | Abbilden von web-diensten auf ontologien |
US20060288015A1 (en) * | 2005-06-15 | 2006-12-21 | Schirripa Steven R | Electronic content classification |
US7827484B2 (en) * | 2005-09-02 | 2010-11-02 | Xerox Corporation | Text correction for PDF converters |
US20070079236A1 (en) * | 2005-10-04 | 2007-04-05 | Microsoft Corporation | Multi-form design with harmonic composition for dynamically aggregated documents |
CN101383838B (zh) * | 2007-09-06 | 2012-01-18 | 阿里巴巴集团控股有限公司 | 一种Web界面在线评估的方法、系统和装置 |
US20090198488A1 (en) * | 2008-02-05 | 2009-08-06 | Eric Arno Vigen | System and method for analyzing communications using multi-placement hierarchical structures |
GB2471432A (en) * | 2008-04-03 | 2010-12-29 | Icurrent Inc | Information display system based on user profile data with assisted and explicit profile modification |
US8261186B2 (en) * | 2009-01-02 | 2012-09-04 | Apple Inc. | Methods for efficient cluster analysis |
US8610761B2 (en) * | 2009-11-09 | 2013-12-17 | Prohectionworks, Inc. | Systems and methods for optically projecting three-dimensional text, images and/or symbols onto three-dimensional objects |
US20130205202A1 (en) * | 2010-10-26 | 2013-08-08 | Jun Xiao | Transformation of a Document into Interactive Media Content |
US8645819B2 (en) | 2011-06-17 | 2014-02-04 | Xerox Corporation | Detection and extraction of elements constituting images in unstructured document files |
SG11201402943WA (en) * | 2011-12-06 | 2014-07-30 | Perception Partners Inc | Text mining analysis and output system |
US9098471B2 (en) * | 2011-12-29 | 2015-08-04 | Chegg, Inc. | Document content reconstruction |
US20130227397A1 (en) * | 2012-02-24 | 2013-08-29 | Microsoft Corporation | Forming an instrumented text source document for generating a live web page |
-
2013
- 2013-09-06 BR BR112015005059A patent/BR112015005059A2/pt not_active Application Discontinuation
- 2013-09-06 WO PCT/US2013/058629 patent/WO2014039911A2/en active Application Filing
- 2013-09-06 KR KR1020157008837A patent/KR102110281B1/ko active IP Right Grant
- 2013-09-06 JP JP2015531264A patent/JP6505600B2/ja not_active Expired - Fee Related
- 2013-09-06 US US14/020,724 patent/US9384179B2/en active Active
- 2013-09-06 CN CN201380058371.9A patent/CN105190596B/zh active Active
- 2013-09-06 EP EP13835322.2A patent/EP2893463A4/en not_active Withdrawn
- 2013-09-06 CA CA2884242A patent/CA2884242C/en active Active
- 2013-09-06 MX MX2015002953A patent/MX344637B/es active IP Right Grant
-
2016
- 2016-01-08 HK HK16100178.6A patent/HK1212484A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
EP2893463A2 (en) | 2015-07-15 |
HK1212484A1 (en) | 2016-06-10 |
US20140075273A1 (en) | 2014-03-13 |
CA2884242C (en) | 2023-09-05 |
WO2014039911A3 (en) | 2014-05-08 |
CN105190596A (zh) | 2015-12-23 |
KR20150081256A (ko) | 2015-07-13 |
CN105190596B (zh) | 2018-03-27 |
BR112015005059A2 (pt) | 2017-07-04 |
CA2884242A1 (en) | 2014-03-13 |
MX344637B (es) | 2017-01-04 |
US9384179B2 (en) | 2016-07-05 |
MX2015002953A (es) | 2015-09-24 |
KR102110281B1 (ko) | 2020-05-13 |
WO2014039911A2 (en) | 2014-03-13 |
EP2893463A4 (en) | 2016-06-15 |
JP2015531513A (ja) | 2015-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10067931B2 (en) | Analysis of documents using rules | |
JP6505600B2 (ja) | 自動構成評価器 | |
US11244203B2 (en) | Automated generation of structured training data from unstructured documents | |
JP5144940B2 (ja) | 目次抽出におけるロバスト性向上 | |
US9135249B2 (en) | Number sequences detection systems and methods | |
US20070294614A1 (en) | Visualizing document annotations in the context of the source document | |
JP2005526314A (ja) | 文書構造識別器 | |
JP2003150586A (ja) | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR20120051419A (ko) | 종속형 스타일 시트 규칙 추출 장치 및 방법 | |
US11763588B2 (en) | Computing system for extraction of textual elements from a document | |
US8914378B2 (en) | Specification document check method, program, and system | |
US20130124684A1 (en) | Visual separator detection in web pages using code analysis | |
US20210174013A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
US9280528B2 (en) | Method and system for processing and learning rules for extracting information from incoming web pages | |
US20080168036A1 (en) | System and Method for Locating and Extracting Tabular Data | |
US8983980B2 (en) | Domain constraint based data record extraction | |
WO2006046665A1 (ja) | 文書処理装置及び文書処理方法 | |
WO2006001392A1 (ja) | 文書処理方法および装置 | |
CN113779218B (zh) | 问答对构建方法、装置、计算机设备和存储介质 | |
KR102467096B1 (ko) | 논문 메타데이터 영역 분류 모델을 학습하기 위한 데이터셋의 검수 방법 및 장치 | |
Thomas et al. | A framework for corpus-based analysis of the graphic signalling of discourse structure | |
CN114637505A (zh) | 一种页面内容提取方法和装置 | |
US9251228B1 (en) | Eliminating noise in periodicals | |
Frey et al. | Efficient table annotation for digital articles | |
JP6528763B2 (ja) | 整合チェック箇所推定装置、整合チェックシステム、整合チェック箇所推定方法、および、整合チェック箇所推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170809 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180208 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181130 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20181213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6505600 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |