JP7298248B2 - 文書処理装置及びプログラム - Google Patents
文書処理装置及びプログラム Download PDFInfo
- Publication number
- JP7298248B2 JP7298248B2 JP2019072366A JP2019072366A JP7298248B2 JP 7298248 B2 JP7298248 B2 JP 7298248B2 JP 2019072366 A JP2019072366 A JP 2019072366A JP 2019072366 A JP2019072366 A JP 2019072366A JP 7298248 B2 JP7298248 B2 JP 7298248B2
- Authority
- JP
- Japan
- Prior art keywords
- range
- data
- document
- character string
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/328—Management therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
- G06F16/3323—Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
このデータを受け取ったWebUI200では、イメージビューアー204が、そのデータが示す文書画像をユーザの端末の画面に表示する(S18)。
図2の手順のS18では、イメージビューアー204は、図4に例示する様に、インデキシング範囲がハイライト表示1002で強調された文書画像1000を表示した。これに対する変形例として、S18でイメージビューアー204が、インデキシング範囲のハイライト表示1002に加え、そのインデキシング範囲内の個々のインデックスを強調表示1010で示した文書画像1000を表示してもよい(図10参照)。この強調表示1010は、インデキシング範囲のハイライト表示1002、図6に例示した、追加する範囲の強調表示1004、図8に例示した、削除する範囲の強調表示1008、のいずれとも異なる表示態様のものとする。
Claims (24)
- 文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列、が存在する場合に、前記内容の中から、前記第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲、の特定を受け付ける受付部と、
前記第二の範囲から生成される前記第二の文字列のデータ量が、前記第一の文字列のデータ量によって定まる前記第二の文字列のデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下、となるよう前記受付部による前記第二の範囲の特定の受付を制御する制御部と、
を含む文書処理装置。 - 文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列、が存在する場合に、前記内容の中から、前記第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲、の特定を受け付ける受付部と、
前記第二の範囲のデータ量が、前記第一の文字列のデータ量によって定まる前記第二の範囲についてのデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下となるように、前記受付部による前記特定の受付を制御する制御部と、
を含む文書処理装置。 - 文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲の特定を受け付ける受付部と、
前記受付部が受け付けた前記第二の範囲から生成される前記第二の文字列のデータ量が前記第一の文字列のデータ量によって定まる前記第二の文字列のデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下となるよう、前記第二の範囲からの前記第二の文字列の生成を制御する制御部と、
を含む文書処理装置。 - 前記制御部は、前記第二の文字列の前記データ量が、前記第一の文字列のデータ量によって定まる前記第二の文字列の前記データ容量、又は前記第二の範囲を特定する際に定められた前記データ容量、を超えた場合に、前記第二の範囲から削除する範囲の指定を求める削除要請の表示を行う、請求項1に記載の文書処理装置。
- 前記制御部は、前記第二の範囲の前記データ量が、前記第一の文字列のデータ量によって定まる前記第二の範囲についての前記データ容量、又は前記第二の範囲を特定する際に定められた前記データ容量、を超えた場合に、前記第二の範囲から削除する範囲の指定を求める削除要請の表示を行う、請求項2に記載の文書処理装置。
- 前記制御部は、前記削除要請の表示に応じて指定された範囲を前記第二の範囲から削除し、この削除後の前記第二の範囲から生成される前記第二の文字列の前記データ量が、依然として前記第一の文字列のデータ量によって定まる前記第二の文字列の前記データ容量、又は前記第二の範囲を特定する際に定められた前記データ容量、を超えている場合は、前記削除要請の表示を続行する、請求項4に記載の文書処理装置。
- 前記制御部は、前記削除要請の表示に応じて指定された範囲を前記第二の範囲から削除し、この削除後の前記第二の範囲についての前記データ量が、依然として、前記第一の文字列のデータ量によって定まる前記第二の範囲についての前記データ容量、又は前記第二の範囲を特定する際に定められた前記データ容量、を超えている場合は、前記削除要請の表示を続行する、請求項5に記載の文書処理装置。
- 前記制御部は、前記受付部による前記特定の受付のために前記文書の内容を表示する画面において、前記第一の範囲のうち、前記第一の範囲から生成された前記一以上の文字列に該当する部分、を強調表示する、請求項1~7のいずれか1項に記載の文書処理装置。
- 前記制御部は、前記画面において、前記文書の内容のうち前記第二の範囲以外の範囲から生成される前記文書の特徴を示す一以上の文字列のうち、前記第二の範囲から生成される前記一以上の文字列に含まれない文字列を強調表示する、請求項8に記載の文書処理装置。
- 前記制御部は、前記受付部による前記特定の受付のために前記文書の内容を表示する画面において、前記第二の範囲のうち前記第一の範囲と重複する重複範囲に含まれる前記一以上の文字列と、前記第二の範囲のうち前記第一の範囲と重複しない非重複範囲について生成される前記一以上の文字列と、を互いに区別可能に表示する、請求項1~9のいずれか1項に記載の文書処理装置。
- 前記制御部は、前記画面において、前記文書の内容のうち前記第二の範囲以外の範囲から生成される前記文書の特徴を示す一以上の文字列のうち、前記第二の文字列に含まれない文字列が強調表示されるよう制御する、請求項10に記載の文書処理装置。
- 前記制御部は、前記受付部による前記特定の受付のために前記文書の内容を表示する画面において、前記第一の範囲以外の範囲から生成される前記文書の特徴を示す一以上の文字列のうち、前記第一の文字列に含まれない文字列が強調表示されるよう制御する、請求項1~11のいずれか1項に記載の文書処理装置。
- 前記データ容量は、複数の文書の各々について前記文書の特徴を示す一以上の文字列を記憶する記憶装置、に記憶されている前記一以上の文字列の総データ量、又は前記複数の文書の文書数に応じて変化する、ことを特徴とする請求項1~12のいずれか1項に記載の文書処理装置。
- 前記総データ量が多いほど前記データ容量は少なくなる、請求項13に記載の文書処理装置。
- 前記複数の文書の文書数が多いほど、前記データ容量は少なくなる、請求項13又は14に記載の文書処理装置。
- 前記第一の範囲から前記第一の文字列を生成する生成部を更に含み、
前記制御部は、前記生成部が前記第一の範囲から生成する前記第一の文字列のデータ量がその生成の時点の状況により定まるデータ容量以下となるよう制御する、請求項1~15のいずれか1項に記載の文書処理装置。 - 前記データ容量は、前記受付部が前記第二の範囲の特定を受け付ける時点で許容される容量である、請求項1~16のいずれか1項に記載の文書処理装置。
- 前記データ容量は、前記第一の範囲から生成された前記一以上の文字列のデータ量と異なる場合がある、請求項17に記載の文書処理装置。
- 前記制御部は、前記受付部が受け付けた前記第二の範囲から生成される前記第二の文字列のデータ量が、前記データ容量を超える場合に、受け付けた前記第二の範囲を取り消す、請求項1に記載の文書処理装置。
- 前記制御部は、前記受付部による前記特定の受付のために前記文書の内容を表示する画面において、前記第二の範囲から生成される前記第二の文字列に含まれる前記一以上の文字列のうち、前記第一の範囲から生成された前記第一の文字列に含まれない文字列を表示する、請求項1~3のいずれか1項に記載の文書処理装置。
- 前記制御部は、前記第二の文字列のデータ量が前記第一の文字列のデータ量によって定まる前記第二の文字列のデータ容量未満、又は前記第二の範囲を特定する際に定められたデータ容量未満である場合に、前記第二の範囲を更に広げることが可能である旨を通知する、請求項1に記載の文書処理装置。
- コンピュータを、
文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列、が存在する場合に、前記内容の中から、前記第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲、の特定を受け付ける受付部、
前記第二の範囲から生成される前記第二の文字列のデータ量が、前記第一の文字列のデータ量によって定まる前記第二の文字列のデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下、となるよう前記受付部による前記第二の範囲の特定の受付を制御する制御部、
として機能させるためのプログラム。 - コンピュータを、
文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列、が存在する場合に、前記内容の中から、前記第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲、の特定を受け付ける受付部、
前記第二の範囲のデータ量が、前記第一の文字列のデータ量によって定まる前記第二の範囲についてのデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下となるように、前記受付部による前記特定の受付を制御する制御部、
として機能させるためのプログラム。 - コンピュータを、
文書の内容の一部の範囲である第一の範囲から生成された、前記文書の特徴を示す一以上の文字列である第一の文字列とは少なくとも一部が異なる一以上の文字列である第二の文字列が生成される範囲である第二の範囲の特定を受け付ける受付部、
前記受付部が受け付けた前記第二の範囲から生成される前記第二の文字列のデータ量が前記第一の文字列のデータ量によって定まる前記第二の文字列のデータ容量以下、又は前記文書における前記第一の範囲の決定後前記第二の範囲を特定する迄に定められたデータ容量以下となるよう、前記第二の範囲からの前記第二の文字列の生成を制御する制御部、
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019072366A JP7298248B2 (ja) | 2019-04-05 | 2019-04-05 | 文書処理装置及びプログラム |
US16/731,051 US20200320110A1 (en) | 2019-04-05 | 2019-12-31 | Document processing apparatus and non-transitory computer readable medium storing program |
CN202010080544.9A CN111797055A (zh) | 2019-04-05 | 2020-02-05 | 文档处理装置、记录媒体及文档处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019072366A JP7298248B2 (ja) | 2019-04-05 | 2019-04-05 | 文書処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020170413A JP2020170413A (ja) | 2020-10-15 |
JP7298248B2 true JP7298248B2 (ja) | 2023-06-27 |
Family
ID=72661892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019072366A Active JP7298248B2 (ja) | 2019-04-05 | 2019-04-05 | 文書処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200320110A1 (ja) |
JP (1) | JP7298248B2 (ja) |
CN (1) | CN111797055A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115841096A (zh) * | 2021-09-18 | 2023-03-24 | 北京字跳网络技术有限公司 | 文档处理方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005020256A (ja) | 2003-06-25 | 2005-01-20 | Minolta Co Ltd | 画像読取装置およびデータ管理装置 |
JP2005267057A (ja) | 2004-03-17 | 2005-09-29 | Seiko Epson Corp | テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム |
JP2008158993A (ja) | 2006-12-26 | 2008-07-10 | Hitachi Ltd | ストレージシステム |
US20120210213A1 (en) | 2009-09-24 | 2012-08-16 | Kabushiki Kaisha Toshiba | Keyword extraction apparatus and program |
US20140095673A1 (en) | 2012-09-25 | 2014-04-03 | Tencent Technology (Shenzhen) Company Limited | Systems and methods for transmitting and receiving data |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1083404A (ja) * | 1996-07-15 | 1998-03-31 | Toshiba Corp | 全文検索システム及びプログラムを記録した記録媒体 |
US20140379814A1 (en) * | 2013-06-21 | 2014-12-25 | Parlant Technology, Inc. | System and method for optimized message creation and delivery |
US9971770B2 (en) * | 2014-11-25 | 2018-05-15 | Sap Se | Inverted indexing |
-
2019
- 2019-04-05 JP JP2019072366A patent/JP7298248B2/ja active Active
- 2019-12-31 US US16/731,051 patent/US20200320110A1/en not_active Abandoned
-
2020
- 2020-02-05 CN CN202010080544.9A patent/CN111797055A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005020256A (ja) | 2003-06-25 | 2005-01-20 | Minolta Co Ltd | 画像読取装置およびデータ管理装置 |
JP2005267057A (ja) | 2004-03-17 | 2005-09-29 | Seiko Epson Corp | テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム |
JP2008158993A (ja) | 2006-12-26 | 2008-07-10 | Hitachi Ltd | ストレージシステム |
US20120210213A1 (en) | 2009-09-24 | 2012-08-16 | Kabushiki Kaisha Toshiba | Keyword extraction apparatus and program |
US20140095673A1 (en) | 2012-09-25 | 2014-04-03 | Tencent Technology (Shenzhen) Company Limited | Systems and methods for transmitting and receiving data |
Also Published As
Publication number | Publication date |
---|---|
CN111797055A (zh) | 2020-10-20 |
JP2020170413A (ja) | 2020-10-15 |
US20200320110A1 (en) | 2020-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6791963B2 (ja) | モバイルデバイス上での擬似ハイパーリンク | |
KR102310648B1 (ko) | 상황 정보 탐색 및 내비게이션 기법 | |
US8645812B1 (en) | Methods and apparatus for automated redaction of content in a document | |
RU2581840C2 (ru) | Регистрация для поискового интерфейса пользователя системного уровня | |
KR102038962B1 (ko) | 클라우드 서버를 이용하여 단말 장치에서 웹 인텐트 메시지 및 이벤트를 처리하는 방법 및 장치 | |
KR20150087200A (ko) | 웹 브라우저에 있는 정보 관리 및 디스플레이 | |
US20090150787A1 (en) | Data processing device | |
JP6032138B2 (ja) | プログラム、文書提供装置及び文書表示システム | |
JP7298248B2 (ja) | 文書処理装置及びプログラム | |
JP6232736B2 (ja) | 文書読解支援装置、文書読解支援システム、文書読解支援方法およびプログラム | |
US8456489B2 (en) | Method of displaying document with image | |
CN117112124A (zh) | Kubernetes对象的参数校验方法、服务器及终端 | |
CN116956825A (zh) | 表单转换方法及服务器 | |
US11640502B2 (en) | Word registration device, word registration method, and word registration program stored on computer-readable storage | |
JP6307933B2 (ja) | 情報処理装置およびプログラム | |
KR101999340B1 (ko) | 웹 브라우징 인터페이스 제공 방법 및 장치 | |
JP6282051B2 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP5201541B2 (ja) | 表示箇所抽出装置及び表示箇所抽出方法 | |
JP6620730B2 (ja) | 情報処理装置及び画像形成装置 | |
JP5729196B2 (ja) | 情報閲覧方法、情報閲覧システムおよびサーバ装置 | |
US20130031146A1 (en) | Integrated management apparatus, document management method, and storage medium | |
JP2008021031A (ja) | 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体 | |
JP2017068307A (ja) | 情報検索装置及びその制御方法、情報検索用プログラム | |
JP5342737B2 (ja) | 文字処理装置、文字処理方法およびプログラムならびに文字処理装置を使用する情報処理システム | |
JP2005293111A (ja) | 情報表示制御装置、サーバ及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7298248 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |