JP7379987B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7379987B2 JP7379987B2 JP2019171439A JP2019171439A JP7379987B2 JP 7379987 B2 JP7379987 B2 JP 7379987B2 JP 2019171439 A JP2019171439 A JP 2019171439A JP 2019171439 A JP2019171439 A JP 2019171439A JP 7379987 B2 JP7379987 B2 JP 7379987B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- proper noun
- provider
- attribute
- company
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 14
- 239000000284 extract Substances 0.000 claims description 13
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 7
- 238000010191 image analysis Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000008247 Echinochloa frumentacea Nutrition 0.000 description 1
- 240000004072 Panicum sumatrense Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Character Input (AREA)
Description
本発明に係るプログラムは、コンピュータに、文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出する機能、前記文書上において、前記固有名詞の周辺から得られる情報を参照して当該固有名詞が提供元か提供先かの属性を特定する場合において、印影が前記固有名詞の周辺に存在する場合、当該固有名詞の属性は提供元と特定する機能、抽出した固有名詞と特定した属性とを対応付ける機能、を実現させる。
本発明に係るプログラムは、コンピュータに、文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出する機能、前記文書上において、前記固有名詞を表す文字に関する属性情報を参照して当該固有名詞が提供元か提供先かの属性を特定する機能、抽出した固有名詞と特定した属性とを対応付ける機能、を実現させる。
Claims (9)
- プロセッサを備え、
前記プロセッサは、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出し、
前記文書上において、宛名に付帯させる語が前記固有名詞に付加されている場合、当該固有名詞の属性は提供先と特定し、
宛名に付帯させる語が前記固有名詞に付加されている場合であっても、当該宛名に付帯させる語に当該語を取り消す記号が付加されている場合、当該固有名詞の属性は提供元と特定する、
ことを特徴とする情報処理装置。 - プロセッサを備え、
前記プロセッサは、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出し、
前記文書上において、前記固有名詞の周辺から得られる情報を参照して当該固有名詞が提供元か提供先かの属性を特定する場合において、印影が前記固有名詞の周辺に存在する場合、当該固有名詞の属性は提供元と特定する、
ことを特徴とする情報処理装置。 - プロセッサを備え、
前記プロセッサは、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出し、
前記文書上において、前記固有名詞を表す文字に関する属性情報を参照して当該固有名詞が提供元か提供先かの属性を特定する、
ことを特徴とする情報処理装置。 - 前記プロセッサは、
前記固有名詞を表す文字に関する属性情報と、前記文書上の少なくとも前記固有名詞の周辺に位置する文字に関する属性情報との異同によって当該固有名詞が提供元か提供先かの属性を特定する、
ことを特徴とする請求項3に記載の情報処理装置。 - 前記プロセッサは、
前記固有名詞を表す文字に関する属性情報が前記固有名詞の周辺に位置する文字に関する属性情報と異なる場合、当該固有名詞の属性は提供先と特定する、
ことを特徴とする請求項4に記載の情報処理装置。 - 前記プロセッサは、
前記固有名詞を表す文字に関する属性情報が前記文書上の前記固有名詞の周辺の文字に関する属性情報と同じ場合、当該固有名詞の属性は提供元と特定する、
ことを特徴とする請求項4に記載の情報処理装置。 - コンピュータに、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出する機能、
前記文書上において、宛名に付帯させる語が前記固有名詞に付加されている場合、当該固有名詞の属性は提供先と特定する機能、
宛名に付帯させる語が前記固有名詞に付加されている場合であっても、当該宛名に付帯させる語に当該語を取り消す記号が付加されている場合、当該固有名詞の属性は提供元と特定する機能、
抽出した固有名詞と特定した属性とを対応付ける機能、
を実現させるためのプログラム。 - コンピュータに、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出する機能、
前記文書上において、前記固有名詞の周辺から得られる情報を参照して当該固有名詞が提供元か提供先かの属性を特定する場合において、印影が前記固有名詞の周辺に存在する場合、当該固有名詞の属性は提供元と特定する機能、
抽出した固有名詞と特定した属性とを対応付ける機能、
を実現させるためのプログラム。 - コンピュータに、
文書から、当該文書の提供元又は提供先となりうる固有名詞を抽出する機能、
前記文書上において、前記固有名詞を表す文字に関する属性情報を参照して当該固有名詞が提供元か提供先かの属性を特定する機能、
抽出した固有名詞と特定した属性とを対応付ける機能、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171439A JP7379987B2 (ja) | 2019-09-20 | 2019-09-20 | 情報処理装置及びプログラム |
CN202010158614.8A CN112541498A (zh) | 2019-09-20 | 2020-03-09 | 信息处理装置以及记录媒体 |
US16/831,066 US11631268B2 (en) | 2019-09-20 | 2020-03-26 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171439A JP7379987B2 (ja) | 2019-09-20 | 2019-09-20 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021047792A JP2021047792A (ja) | 2021-03-25 |
JP7379987B2 true JP7379987B2 (ja) | 2023-11-15 |
Family
ID=74876431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019171439A Active JP7379987B2 (ja) | 2019-09-20 | 2019-09-20 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11631268B2 (ja) |
JP (1) | JP7379987B2 (ja) |
CN (1) | CN112541498A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022030150A (ja) * | 2020-08-06 | 2022-02-18 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
JP7426634B1 (ja) | 2022-11-30 | 2024-02-02 | 株式会社Tokium | プログラム、コンピュータおよび情報処理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122661A (ja) | 2005-10-31 | 2007-05-17 | Toshiba Corp | 文書データ処理装置および文書データ処理プログラム |
JP2016192223A (ja) | 2016-06-17 | 2016-11-10 | 弘明 小野 | 会計情報読取りシステム及びプログラム |
US20170124037A1 (en) | 2015-11-03 | 2017-05-04 | International Business Machines Corporation | Technique used in text analysis in a safe manner |
JP2019023793A (ja) | 2017-07-24 | 2019-02-14 | 株式会社オービックビジネスコンサルタント | 仕訳情報処理装置、仕訳情報処理方法、およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001051997A (ja) * | 1999-08-11 | 2001-02-23 | Sony Corp | 文書データ作成装置、文書データ作成方法、及び記録媒体 |
JP4320491B2 (ja) * | 1999-11-18 | 2009-08-26 | ソニー株式会社 | 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体 |
JP2001202466A (ja) | 2000-01-18 | 2001-07-27 | Hitachi Ltd | 帳票種別判別装置 |
US7478089B2 (en) * | 2003-10-29 | 2009-01-13 | Kontera Technologies, Inc. | System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content |
JP4569327B2 (ja) * | 2005-03-09 | 2010-10-27 | 富士ゼロックス株式会社 | カラー画像形成装置 |
US10019708B2 (en) * | 2006-08-25 | 2018-07-10 | Amazon Technologies, Inc. | Utilizing phrase tokens in transactions |
US9449080B1 (en) * | 2010-05-18 | 2016-09-20 | Guangsheng Zhang | System, methods, and user interface for information searching, tagging, organization, and display |
JP5880052B2 (ja) | 2012-01-10 | 2016-03-08 | 富士ゼロックス株式会社 | 文書処理装置及びプログラム |
US10120844B2 (en) * | 2014-10-23 | 2018-11-06 | International Business Machines Corporation | Determining the likelihood that an input descriptor and associated text content match a target field using natural language processing techniques in preparation for an extract, transform and load process |
US20190056911A1 (en) * | 2017-08-18 | 2019-02-21 | International Business Machines Corporation | Sorting of Numeric Values Using an Identification of Superlative Adjectives |
US11424020B2 (en) * | 2017-12-08 | 2022-08-23 | Actual Healthcare Solutions | Cloud-based interactive digital medical imaging and patient health information exchange platform |
-
2019
- 2019-09-20 JP JP2019171439A patent/JP7379987B2/ja active Active
-
2020
- 2020-03-09 CN CN202010158614.8A patent/CN112541498A/zh active Pending
- 2020-03-26 US US16/831,066 patent/US11631268B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122661A (ja) | 2005-10-31 | 2007-05-17 | Toshiba Corp | 文書データ処理装置および文書データ処理プログラム |
US20170124037A1 (en) | 2015-11-03 | 2017-05-04 | International Business Machines Corporation | Technique used in text analysis in a safe manner |
JP2016192223A (ja) | 2016-06-17 | 2016-11-10 | 弘明 小野 | 会計情報読取りシステム及びプログラム |
JP2019023793A (ja) | 2017-07-24 | 2019-02-14 | 株式会社オービックビジネスコンサルタント | 仕訳情報処理装置、仕訳情報処理方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021047792A (ja) | 2021-03-25 |
US11631268B2 (en) | 2023-04-18 |
US20210089766A1 (en) | 2021-03-25 |
CN112541498A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
JP5387124B2 (ja) | コンテンツタイプ検索を行う方法及びシステム | |
US8792141B2 (en) | Embedded form extraction definition to enable automatic workflow configuration | |
KR20090069300A (ko) | 페이퍼 및 전자 문서내의 주석의 캡처 및 디스플레이 | |
JP2007116469A (ja) | 媒体処理方法、複写装置、及びデータファイリング装置 | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP6694587B2 (ja) | 画像読込み装置及びプログラム | |
JP2007183754A (ja) | 名刺情報の管理方法及び名刺情報の管理システム並びに名刺情報読取用フォルダ | |
JP6262708B2 (ja) | 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法 | |
JP7439435B2 (ja) | 情報処理装置及びプログラム | |
US20180330156A1 (en) | Detection of caption elements in documents | |
JP5113238B2 (ja) | Faxocr装置およびfaxocrプログラム | |
JP6190549B1 (ja) | 文書処理システム | |
JP5198130B2 (ja) | 可変画像形成ジョブの自動検査 | |
JP7287510B2 (ja) | 文書処理のための方法及び装置 | |
US20220201130A1 (en) | Information processing device and non-transitory computer readable medium | |
WO2023062798A1 (ja) | 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム | |
US20170371864A1 (en) | System and method for device filtered translation | |
JP5569367B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US11410441B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7484176B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
JP6461646B2 (ja) | 印刷データ生成装置、印刷データ生成方法、および印刷データ生成プログラム | |
JP2021039494A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7379987 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |