JP2009506394A5 - - Google Patents

Download PDF

Info

Publication number
JP2009506394A5
JP2009506394A5 JP2008510935A JP2008510935A JP2009506394A5 JP 2009506394 A5 JP2009506394 A5 JP 2009506394A5 JP 2008510935 A JP2008510935 A JP 2008510935A JP 2008510935 A JP2008510935 A JP 2008510935A JP 2009506394 A5 JP2009506394 A5 JP 2009506394A5
Authority
JP
Japan
Prior art keywords
document
location
identifying
paper document
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008510935A
Other languages
Japanese (ja)
Other versions
JP2009506394A (en
JP4897795B2 (en
Filing date
Publication date
Priority claimed from US11/461,164 external-priority patent/US9405751B2/en
Priority claimed from US11/461,147 external-priority patent/US9171202B2/en
Application filed filed Critical
Priority claimed from PCT/JP2006/316812 external-priority patent/WO2007023993A1/en
Publication of JP2009506394A publication Critical patent/JP2009506394A/en
Publication of JP2009506394A5 publication Critical patent/JP2009506394A5/ja
Application granted granted Critical
Publication of JP4897795B2 publication Critical patent/JP4897795B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (10)

混合メディア書類システムで情報を組織化し及び情報にアクセスするためにコンピュータで実行される方法であって、
紙書類の電子表現を生成するステップと、
前記紙書類上の特徴を特定し、該紙書類の2次元的形態を捕捉するステップと、
前記特徴のロケーションを特定するステップと、
前記ロケーションにより前記特徴を索引付けし、インデックステーブルを生成するステップと、
を有する方法。
A computer-implemented method for organizing and accessing information in a mixed media document system comprising:
Generating an electronic representation of the paper document;
Identifying features on the paper document and capturing a two-dimensional form of the paper document;
Identifying the location of the feature;
Indexing the features by the location and generating an index table;
Having a method.
前記1つ以上の特徴は、テキスト情報の抽出、図形情報の抽出、プロセスの実行、コマンドの実行、ある順序に並べること、ビデオを抽出すること、音を抽出すること、情報を格納すること、新たな書類を作成すること、書類を印刷すること及び書類を表示することの内の少なくとも1つを含む1つ以上のアクションを含む請求項記載の方法。 The one or more features include: extraction of text information, extraction of graphic information, execution of processes, execution of commands, arranging in a certain order, extracting video, extracting sound, storing information; creating a new document, the method of claim 1 further comprising one or more actions including at least one of displaying the and documents to print documents. 前記紙書類上の特徴を特定し、該紙書類の2次元的形態を捕捉するステップは、水平方向に並ぶオブジェクト及び垂直方向に並ぶオブジェクトを特定するステップを含む請求項1記載の方法。   The method of claim 1, wherein identifying features on the paper document and capturing a two-dimensional form of the paper document includes identifying horizontally aligned objects and vertically aligned objects. 前記紙書類上の特徴を特定し、該紙書類の2次元的形態を捕捉するステップは、水平方向のワードペア及び垂直方向のワードペアを特定するステップを含む請求項1記載の方法。   The method of claim 1, wherein identifying features on the paper document and capturing a two-dimensional form of the paper document includes identifying a horizontal word pair and a vertical word pair. 前記紙書類上の特徴を特定し、該紙書類の2次元的形態を捕捉するステップは、2つの連続するシーケンス間の垂直方向の重畳量を検査することで、テキストのシーケンスを論理的なラインにグループ化するステップを含む請求項1記載の方法。   The step of identifying features on the paper document and capturing the two-dimensional form of the paper document is to examine the amount of vertical overlap between two successive sequences, thereby converting the sequence of text into logical lines. The method of claim 1 including the step of grouping into: 前記検索対象書類を受信するステップと、
検索対象書類の少なくともパッチの画像を作成するステップと、
前記画像に基づいて1つ以上の問い合わせ語句を生成するステップと、
1つ以上の問い合わせ語句を受信し、検索対象書類中のオブジェクト間の2次元的な位置関係を捕捉するステップと、
前記インデックステーブルからのデータに基づいて、前記問い合わせ語句に応じる可能性のある少なくとも1つの混合メディア書類及びロケーション候補を算出するステップと、
を更に有する請求項1記載の方法。
Receiving the search object document; and
Creating at least a patch image of the document to be searched;
Generating one or more query terms based on the image;
Receiving one or more query terms and capturing a two-dimensional positional relationship between objects in the search target document;
Calculating at least one mixed media document and location candidates that may be responsive to the query terms based on data from the index table;
The method of claim 1 further comprising:
命令と共にエンコードされるコンピュータ読み取り可能な媒体であって、該命令は1つ以上のプロセッサで実行される場合、混合メディア書類システムで情報を組織化し及び情報にアクセスするためのプロセスを前記1つ以上のプロセッサに実行させ、該プロセスは、
紙書類の電子表現を生成すること、
前記紙書類上の特徴を特定し、該紙書類の2次元的形態を捕捉すること、
前記特徴のロケーションを特定すること、
前記ロケーションにより前記特徴を索引付けし、インデックステーブルを生成すること、
を含むコンピュータ読み取り可能な媒体。
A computer readable medium encoded with instructions, wherein the instructions, when executed on one or more processors, include a process for organizing and accessing information in a mixed media document system. Of the processor, the process
Generating an electronic representation of a paper document,
Identifying features on the paper document and capturing a two-dimensional form of the paper document;
Identifying the location of the feature;
Indexing the features by the location and generating an index table;
A computer readable medium including
混合メディア書類システムで情報にアクセスするためにコンピュータで実行される方法であって、
1つ以上の問い合わせ語句を受信し、検索対象書類中のオブジェクト間の2次元的な位置関係を捕捉するステップと、
インデックステーブルからのデータに基づいて、前記問い合わせ語句に応じる可能性のある少なくとも1つの混合メディア書類及びロケーション候補を算出するステップと、
を含み、前記インデックステーブルは、書類特徴及び混合メディア書類の特徴ロケーションを索引付けているようにした方法。
A computer-implemented method for accessing information in a mixed media document system, comprising:
Receiving one or more query terms and capturing a two-dimensional positional relationship between objects in the search target document;
Calculating at least one mixed media document and location candidate that may respond to the query terms based on data from an index table;
And wherein the index table indexes document features and feature locations of mixed media documents.
少なくとも1つの混合メディア書類及びロケーション候補を算出するステップが、
各問い合わせ語句に関連する1つ以上のロケーションを検索するためのインデックステーブルの中で1つ以上の問い合わせ語句各々を調べるステップと、
特定された各ロケーションについて、該ロケーションを含む候補領域の1つ以上を特定するステップと、
を含むようにした請求項記載の方法。
Calculating at least one mixed media document and location candidates;
Looking up each of the one or more query terms in an index table for searching one or more locations associated with each query term;
Identifying, for each identified location, one or more candidate regions that include the location;
The method according to claim 8 , comprising:
少なくとも1つの混合メディア書類及びロケーション候補を算出するステップが、
前記1つ以上の問い合わせ語句の全てに最も合致する、1つ以上の候補領域の1つを特定するステップと、
前記1つ以上の候補領域の前記1つのものが所定の合致基準を満たすことを確認したことに応じて、該領域を前記検索対象書類に合致するものとして確定するステップと、
を含むようにした請求項記載の方法。
Calculating at least one mixed media document and location candidates;
Identifying one of the one or more candidate regions that best matches all of the one or more query terms;
Confirming that the one of the one or more candidate regions meets a predetermined match criterion, and determining the region as matching the search target document;
10. A method according to claim 9 , comprising:
JP2008510935A 2005-08-23 2006-08-22 Processing apparatus, index table creation method, and computer program Active JP4897795B2 (en)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US71076705P 2005-08-23 2005-08-23
US60/710,767 2005-08-23
US79291206P 2006-04-17 2006-04-17
US60/792,912 2006-04-17
US80765406P 2006-07-18 2006-07-18
US60/807,654 2006-07-18
US11/461,164 US9405751B2 (en) 2005-08-23 2006-07-31 Database for mixed media document system
US11/461,147 2006-07-31
US11/461,164 2006-07-31
US11/461,147 US9171202B2 (en) 2005-08-23 2006-07-31 Data organization and access for mixed media document system
PCT/JP2006/316812 WO2007023993A1 (en) 2005-08-23 2006-08-22 Data organization and access for mixed media document system

Publications (3)

Publication Number Publication Date
JP2009506394A JP2009506394A (en) 2009-02-12
JP2009506394A5 true JP2009506394A5 (en) 2009-09-24
JP4897795B2 JP4897795B2 (en) 2012-03-14

Family

ID=37771725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008510935A Active JP4897795B2 (en) 2005-08-23 2006-08-22 Processing apparatus, index table creation method, and computer program

Country Status (4)

Country Link
EP (1) EP1917637A4 (en)
JP (1) JP4897795B2 (en)
KR (1) KR100960639B1 (en)
WO (1) WO2007023993A1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245043B2 (en) * 2009-12-23 2016-01-26 Fuji Xerox Co., Ltd. Embedded media markers and systems and methods for generating and using them
US8332424B2 (en) * 2011-05-13 2012-12-11 Google Inc. Method and apparatus for enabling virtual tags
US8423881B2 (en) * 2011-08-05 2013-04-16 Fuji Xerox Co., Ltd. Systems and methods for placing visual links to digital media on physical media
CN104603833B (en) * 2012-08-09 2018-12-14 温克应用程序有限公司 Method and system for linking printing object with digital content
WO2014061222A1 (en) 2012-10-18 2014-04-24 日本電気株式会社 Information processing device, information processing method and information processing program
JP2022096379A (en) * 2020-12-17 2022-06-29 富士通株式会社 Image output program, image output method, and image output device
CN112651215B (en) * 2020-12-31 2023-11-03 中国农业银行股份有限公司 Method and device for determining document map, electronic equipment and storage medium
CN113822521A (en) * 2021-06-15 2021-12-21 腾讯云计算(北京)有限责任公司 Method and device for detecting quality of question library questions and storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3634099B2 (en) * 1997-02-17 2005-03-30 株式会社リコー Document information management system, media sheet information creation device, and document information management device
US6408257B1 (en) * 1999-08-31 2002-06-18 Xerox Corporation Augmented-reality display method and system
US7239747B2 (en) * 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7475061B2 (en) * 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval

Similar Documents

Publication Publication Date Title
AU2017272149B2 (en) Identifying matching canonical documents in response to a visual query
CN104685501B (en) Text vocabulary is identified in response to visual query
US8805079B2 (en) Identifying matching canonical documents in response to a visual query and in accordance with geographic information
JP2009506394A5 (en)
US8811742B2 (en) Identifying matching canonical documents consistent with visual query structural information
US9176986B2 (en) Generating a combination of a visual query and matching canonical document
US8577882B2 (en) Method and system for searching multilingual documents
US9384389B1 (en) Detecting errors in recognized text
JP2011516989A5 (en)
US10152540B2 (en) Linking thumbnail of image to web page
CN110263792B (en) Image recognizing and reading and data processing method, intelligent pen, system and storage medium
Marinai et al. Table of contents recognition for converting PDF documents in e-book formats
US20190258629A1 (en) Data mining method based on mixed-type data
Böschen et al. Multi-oriented text extraction from information graphics
JP2006301712A5 (en)
CN104516941A (en) Related document search apparatus and method, and program
JP2008134954A5 (en)
JP6707410B2 (en) Document search device, document search method, and computer program
CN105320716A (en) Automatic labeling method for digital publication
CN110717091B (en) Entry data expansion method and device based on face recognition
CN102855291A (en) Method and device for adding vocabulary entry into input method word library
Marinai et al. PDF Documents in E-book Formats
JP2008234226A (en) Retrieval device and retrieval method
TW201516711A (en) Computing device, system and method for verifying content consistency of files
RU2012117557A (en) EXTRACTION OF RADIOLOGICAL RESEARCH DATA USING THE REQUEST ON THE BASIS OF IMAGES