JP2020123233A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2020123233A JP2020123233A JP2019015799A JP2019015799A JP2020123233A JP 2020123233 A JP2020123233 A JP 2020123233A JP 2019015799 A JP2019015799 A JP 2019015799A JP 2019015799 A JP2019015799 A JP 2019015799A JP 2020123233 A JP2020123233 A JP 2020123233A
- Authority
- JP
- Japan
- Prior art keywords
- cells
- cell
- header
- unit
- header range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9017—Indexing; Data structures therefor; Storage structures using directory or table look-up
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、第1の実施形態に係る画像形成装置10Aの電気的な構成の一例を示すブロック図である。
図1に示すように、本実施形態に係る画像形成装置10Aは、制御部12と、記憶部14と、表示部16と、操作部18と、画像形成部20と、原稿読取部22と、通信部24と、を備えている。
図2に示すように、本実施形態に係る画像形成装置10AのCPU12Aは、解析部30、取得部32、検索部34、特定部36、及び抽出部38として機能する。
図4に示す入力表50におけるヘッダ範囲には、列A、列-A1、列-AA1、列-AA2、列-A2、列-A3、列-A4、行A、行-A1、行-AA1、行-AA2、行-A2、行-A3、行-A4の各セル、及び「表」セルが含まれている。なお、「表」セルは、単なる項目を表す文字列セルの一例である。
図6に示すグレーの部分は、ヘッダ範囲となり得る行及び列の組み合わせを表している。
図7に示すグレーの部分は、上述の図6と同様に、ヘッダ範囲となり得る行及び列の組み合わせを表している。
図8に示すグレーの部分は、上述の図6と同様に、ヘッダ範囲となり得る行及び列の組み合わせを表している。また、図8に示す範囲R1は、値候補となる値範囲を示している。
図9に示すグレーの部分は、上述の図6と同様に、ヘッダ範囲となり得る行及び列の組み合わせを表している。
図10に示すグレーの部分は、上述の図6と同様に、ヘッダ範囲となり得る行及び列の組み合わせを表している。
図11に示すグレーの部分は、ヘッダ範囲として特定された行及び列の組み合わせを表している。
上記第1の実施形態では、ユーザによりキーとして入力された文字列の少なくとも一部と合致する文字列を含む複数のセルを含む範囲からヘッダ範囲を特定する場合について説明した。本実施形態では、ユーザによりキーとして入力された文字列の少なくとも一部と合致する文字列を含む複数のセルを含まない矩形領域からヘッダ範囲を特定する場合について説明する。
図12に示すように、本実施形態に係る画像形成装置10BのCPU12Aは、解析部30、取得部32、検索部34、特定部40、及び抽出部38として機能する。なお、第1の実施形態に示す画像形成装置10Aと同一の機能を有する構成要素には同一の符号を付し、ここでの繰り返しの説明は省略する。
図14に示す入力表56は、検索部34により検索された複数のセルとして、「キーB1」セル、「キーC1」セル、及び「キーD1」セルを含んでいる。
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 抽出処理プログラム
16 表示部
18 操作部
20 画像形成部
22 原稿読取部
24 通信部
30 解析部
32 取得部
34 検索部
36、40特定部
38 抽出部
50、52、56入力表
54 ヘッダ範囲
Claims (9)
- セルが行列状に配置された表から、ユーザによりキーとして入力された文字列の少なくとも一部と合致する文字列を含む複数のセルを検索する検索部と、
前記検索部により検索された複数のセルの分布状態に基づいて、前記表におけるヘッダ行及びヘッダ列を表すヘッダ範囲を特定する特定部と、
前記特定部により特定されたヘッダ範囲に含まれる複数のセルをキーセルとして、各キーセルに対応する値を抽出する抽出部と、
を備えた情報処理装置。 - 前記特定部は、
前記表におけるヘッダ範囲となり得る行及び列の全ての組み合わせから、前記検索部により検索された複数のセルを含む組み合わせとして表される第1ヘッダ範囲候補を特定し、
特定した第1ヘッダ範囲候補から、前記検索部により検索された複数のセルのいずれかである第1セルが存在する行及び列の少なくとも一方を含む組み合わせとして表される第2ヘッダ範囲候補を特定し、
特定した第2ヘッダ範囲候補から、セル数が最小となる第3ヘッダ範囲候補が1つの組み合わせとして特定された場合に、前記第3ヘッダ範囲候補を前記ヘッダ範囲とする請求項1に記載の情報処理装置。 - 前記特定部は、前記第3ヘッダ範囲候補が一次元表及び二次元表の複数の組み合わせとして特定された場合に、前記二次元表の第3ヘッダ範囲候補を前記ヘッダ範囲とする請求項2に記載の情報処理装置。
- 前記第1セルは、2つ以上のセルが結合された結合セルである請求項2又は3に記載の情報処理装置。
- 前記特定部は、前記表から、前記表の予め定められた基準セル及び前記基準セルの対角に位置する対角セルを含み、かつ、行方向及び列方向において前記検索部により検索された複数のセルを含まない矩形領域のうち、セル数が最大となる矩形領域を除いた範囲を前記ヘッダ範囲として特定する請求項1に記載の情報処理装置。
- 前記基準セルは、前記表の右下端に位置するセルであり、
前記対角セルは、前記右下端に位置するセルの左上の対角に位置するセルである請求項5に記載の情報処理装置。 - 前記検索部により検索された複数のセルは、前記ヘッダ範囲の行方向及び列方向の各々に分布している請求項1〜6のいずれか1項に記載の情報処理装置。
- 前記検索部により検索された複数のセルの数は、前記ヘッダ範囲に含まれるキーセルの数よりも少ない請求項7に記載の情報処理装置。
- コンピュータを、請求項1〜8のいずれか1項に記載の情報処理装置が備える各部として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019015799A JP7180420B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及びプログラム |
US16/551,734 US20200250238A1 (en) | 2019-01-31 | 2019-08-27 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019015799A JP7180420B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020123233A true JP2020123233A (ja) | 2020-08-13 |
JP7180420B2 JP7180420B2 (ja) | 2022-11-30 |
Family
ID=71837691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019015799A Active JP7180420B2 (ja) | 2019-01-31 | 2019-01-31 | 情報処理装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200250238A1 (ja) |
JP (1) | JP7180420B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023020030A (ja) * | 2021-07-30 | 2023-02-09 | キヤノン株式会社 | サーバー、制御方法、およびそのプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086650A (ja) * | 2002-08-28 | 2004-03-18 | Fujitsu Ltd | データ読出プログラム、データ読出方法、及びデータ読出装置 |
JP2016091081A (ja) * | 2014-10-30 | 2016-05-23 | 株式会社日立システムズ | 帳票フォーマットインポートシステム及び帳票フォーマットインポート方法 |
JP2017525033A (ja) * | 2014-06-30 | 2017-08-31 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 検索のためのテーブルの理解 |
US20190278853A1 (en) * | 2018-03-09 | 2019-09-12 | International Business Machines Corporation | Extracting Structure and Semantics from Tabular Data |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9600461B2 (en) * | 2013-07-01 | 2017-03-21 | International Business Machines Corporation | Discovering relationships in tabular data |
US9607039B2 (en) * | 2013-07-18 | 2017-03-28 | International Business Machines Corporation | Subject-matter analysis of tabular data |
US9286290B2 (en) * | 2014-04-25 | 2016-03-15 | International Business Machines Corporation | Producing insight information from tables using natural language processing |
-
2019
- 2019-01-31 JP JP2019015799A patent/JP7180420B2/ja active Active
- 2019-08-27 US US16/551,734 patent/US20200250238A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086650A (ja) * | 2002-08-28 | 2004-03-18 | Fujitsu Ltd | データ読出プログラム、データ読出方法、及びデータ読出装置 |
JP2017525033A (ja) * | 2014-06-30 | 2017-08-31 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 検索のためのテーブルの理解 |
JP2016091081A (ja) * | 2014-10-30 | 2016-05-23 | 株式会社日立システムズ | 帳票フォーマットインポートシステム及び帳票フォーマットインポート方法 |
US20190278853A1 (en) * | 2018-03-09 | 2019-09-12 | International Business Machines Corporation | Extracting Structure and Semantics from Tabular Data |
Also Published As
Publication number | Publication date |
---|---|
JP7180420B2 (ja) | 2022-11-30 |
US20200250238A1 (en) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4926004B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
JP4780169B2 (ja) | データ生成装置、スキャナ、及びコンピュータプログラム | |
CN101178725A (zh) | 用于信息检索的设备、方法和计算机程序产品 | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP7131137B2 (ja) | 画像処理装置および画像処理プログラム | |
US20200334328A1 (en) | Information processing device and non-transitory computer readable medium | |
JP7180420B2 (ja) | 情報処理装置及びプログラム | |
CN111580758B (zh) | 图像形成装置 | |
US8301637B2 (en) | File search system, file search device and file search method | |
US7756872B2 (en) | Searching device and program product | |
JP2019114193A (ja) | 画像処理装置および画像処理プログラム | |
JP2021144565A (ja) | 情報処理装置及び情報処理プログラム | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2020123925A (ja) | 情報処理装置及びプログラム | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP4823049B2 (ja) | 文書画像検索装置及びプログラム | |
CN112396046A (zh) | 信息处理装置及记录媒体 | |
JP2022048899A (ja) | 情報処理装置及び情報処理プログラム | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP2019160213A (ja) | 情報処理システム、情報処理方法及びプログラム | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP7504674B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6028905B2 (ja) | 帳票管理装置及び帳票管理方法並びに帳票管理プログラム | |
US20230108505A1 (en) | Information processing apparatus | |
US20230083959A1 (en) | Information processing apparatus, information processing method, storage medium, and learning apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7180420 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |