JP5315368B2 - 文書処理装置 - Google Patents
文書処理装置 Download PDFInfo
- Publication number
- JP5315368B2 JP5315368B2 JP2011041117A JP2011041117A JP5315368B2 JP 5315368 B2 JP5315368 B2 JP 5315368B2 JP 2011041117 A JP2011041117 A JP 2011041117A JP 2011041117 A JP2011041117 A JP 2011041117A JP 5315368 B2 JP5315368 B2 JP 5315368B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- network data
- words
- text document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 65
- 238000000034 method Methods 0.000 claims description 41
- 238000011156 evaluation Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 11
- 238000000605 extraction Methods 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000000547 structure data Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
102 ナレッジDB
103 標準項目構造化データ
104 回答文データ
105 文書構造解析部
106 構造的差分抽出部
107 定型文
108 回答文選択部
109 回答書作成部
110 編集HMI
111 回答書
1806 構造的合致情報抽出部
Claims (9)
- テキスト文書の記述内容から特定の記述を抽出する処理装置において、
評価対象である評価対象テキスト文書の記述内容が含まれる知識分野を構成する語句群における、相互の関連性が高い語句どうしをネットワーク接続した標準知識ネットワークデータを保持し、
前記テキスト文書を構成する語句群について関連性の高い語句どうしをネットワーク接続した評価対象文書知識ネットワークデータを作成する文書知識作成機能を有し、
評価対象文書知識ネットワークデータの構造と標準知識ネットワークデータの構造に対し、それらを構成する特定語句に着目し、当該特定語句にネットワーク接続している語句群の情報が相互に異なる場合に、当該特定語句の情報を含む差異情報を出力する処理手段を有することを特徴とするテキスト文書処理装置。 - 請求項1において、
前記差異情報とは、前記標準知識ネットワークデータに存在し前記評価対象文書知識ネットワークデータに存在しない第1の差異情報,前記評価対象文書知識ネットワークデータに存在し前記標準知識ネットワークデータに存在しない第2の差異情報の少なくとも一方であることを特徴とするテキスト文書処理装置。 - 請求項2において、
前記標準知識ネットワークデータを構成する語句群に関連付けられた文を保持する文データベースを有し、前記文データベースから前記第1の差異情報に含まれる語句をキーに文を検索し前記第1の差異情報とともに出力する機能と、定型文データを前記第2の差異情報とともに出力する機能を有する処理手段を有することを特徴とするテキスト文書処理装置。 - 請求項2ないし請求項3のいずれかにおいて、
前記評価対象テキスト文書を表示する際に、前記第2の差異情報に含まれる語句を、異なる字体で表示することを特徴とするテキスト文書処理装置。 - 請求項2ないし請求項4のいずれかにおいて、
前記第2の差異情報に含まれる語句を、前記標準知識ネットワークデータの前記特定語句にネットワーク接続するか否かを決定するための入力手段を有することを特徴とするテキスト文書処理装置。 - テキスト文書の記述内容から特定の記述を抽出する処理装置において、
評価対象である評価対象テキスト文書の記述内容が含まれる知識分野を構成する語句群における、相互の関連性が高い語句どうしをネットワーク接続した標準知識ネットワークデータを保持し、
前記テキスト文書を構成する語句群について関連性の高い語句どうしをネットワーク接続した評価対象文書知識ネットワークデータを作成する文書知識作成機能を有し、
評価対象文書知識ネットワークデータの構造と標準知識ネットワークデータの構造に対し、それらを構成する特定語句に着目し、当該特定語句にネットワーク接続している語句群の情報のうち相互に合致する語句群情報を合致情報として出力する処理手段を有することを特徴とするテキスト文書処理装置。 - 請求項6において、
前記評価対象テキスト文書を表示する際に、前記合致情報に含まれる語句を、異なる字体で表示することを特徴とするテキスト文書処理装置。 - テキスト文書の記述内容から特定の記述を抽出する文書処理装置の表示方法において、
評価対象である評価対象テキスト文書の記述内容が含まれる知識分野を構成する語句群における、相互の関連性が高い語句どうしをネットワーク接続した標準知識ネットワークデータをデータベースに保持し、
前記テキスト文書を構成する語句群について関連性の高い語句どうしをネットワーク接続した評価対象文書知識ネットワークデータをデータベースに保持し、
評価対象文書知識ネットワークデータの構造と標準知識ネットワークデータの構造に対し、それらを構成する特定語句に着目し、当該特定語句にネットワーク接続している語句群の情報が相互に異なる又は合致する場合に、当該特定語句の情報を含む、差異情報又は合致情報とを表示手段に強調表示することを特徴とする文書処理装置の表示方法。 - 請求項8において、前記差異情報及び前記合致情報を異なる表示で強調表示することを特徴とする文書処理装置の表示方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011041117A JP5315368B2 (ja) | 2011-02-28 | 2011-02-28 | 文書処理装置 |
US13/397,497 US20120221324A1 (en) | 2011-02-28 | 2012-02-15 | Document Processing Apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011041117A JP5315368B2 (ja) | 2011-02-28 | 2011-02-28 | 文書処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012178078A JP2012178078A (ja) | 2012-09-13 |
JP5315368B2 true JP5315368B2 (ja) | 2013-10-16 |
Family
ID=46719608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011041117A Expired - Fee Related JP5315368B2 (ja) | 2011-02-28 | 2011-02-28 | 文書処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120221324A1 (ja) |
JP (1) | JP5315368B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9229930B2 (en) * | 2012-08-27 | 2016-01-05 | Oracle International Corporation | Normalized ranking of semantic query search results |
JPWO2014064777A1 (ja) * | 2012-10-24 | 2016-09-05 | 株式会社日立製作所 | 文書評価支援システム、及び文書評価支援方法 |
US10325106B1 (en) * | 2013-04-04 | 2019-06-18 | Marklogic Corporation | Apparatus and method for operating a triple store database with document based triple access security |
US10108697B1 (en) * | 2013-06-17 | 2018-10-23 | The Boeing Company | Event matching by analysis of text characteristics (e-match) |
US20150127323A1 (en) * | 2013-11-04 | 2015-05-07 | Xerox Corporation | Refining inference rules with temporal event clustering |
CN104102738B (zh) * | 2014-07-28 | 2018-04-27 | 百度在线网络技术(北京)有限公司 | 一种扩充实体库的方法及装置 |
CN104573028B (zh) * | 2015-01-14 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
WO2017212553A1 (ja) * | 2016-06-07 | 2017-12-14 | 三菱電機株式会社 | 仲介装置、仲介方法及び仲介プログラム |
US10783138B2 (en) * | 2017-10-23 | 2020-09-22 | Google Llc | Verifying structured data |
JP2022182212A (ja) * | 2021-05-27 | 2022-12-08 | 有限会社アクアプラネット | 記録整理プログラム、記録整理方法、記録整理装置、および、記録媒体 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3887867B2 (ja) * | 1997-02-26 | 2007-02-28 | 株式会社日立製作所 | 構造化文書の登録方法 |
US10515374B2 (en) * | 2005-03-10 | 2019-12-24 | Adobe Inc. | Keyword generation method and apparatus |
JP4803709B2 (ja) * | 2005-07-12 | 2011-10-26 | 独立行政法人情報通信研究機構 | 単語用法差異情報取得プログラム及び同装置 |
US20070073745A1 (en) * | 2005-09-23 | 2007-03-29 | Applied Linguistics, Llc | Similarity metric for semantic profiling |
JP2007172260A (ja) * | 2005-12-21 | 2007-07-05 | Mitsubishi Electric Corp | 文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム |
JP5044236B2 (ja) * | 2007-01-12 | 2012-10-10 | 富士フイルム株式会社 | コンテンツ検索装置、およびコンテンツ検索方法 |
US20090119572A1 (en) * | 2007-11-02 | 2009-05-07 | Marja-Riitta Koivunen | Systems and methods for finding information resources |
JP5156456B2 (ja) * | 2008-03-31 | 2013-03-06 | 株式会社日立製作所 | 文書評価支援方法及びシステム |
JP2010128559A (ja) * | 2008-11-25 | 2010-06-10 | Seiko Epson Corp | 情報処理方法、そのプログラム及び情報処理装置 |
US8335754B2 (en) * | 2009-03-06 | 2012-12-18 | Tagged, Inc. | Representing a document using a semantic structure |
JP5302759B2 (ja) * | 2009-04-28 | 2013-10-02 | 株式会社日立製作所 | 文書作成支援装置、文書作成支援方法及び文書作成支援プログラム |
US8793208B2 (en) * | 2009-12-17 | 2014-07-29 | International Business Machines Corporation | Identifying common data objects representing solutions to a problem in different disciplines |
KR100963885B1 (ko) * | 2010-03-30 | 2010-06-17 | 한국과학기술정보연구원 | Rdf 네트워크 기반 연관검색 서비스 시스템 및 방법 |
US10496714B2 (en) * | 2010-08-06 | 2019-12-03 | Google Llc | State-dependent query response |
-
2011
- 2011-02-28 JP JP2011041117A patent/JP5315368B2/ja not_active Expired - Fee Related
-
2012
- 2012-02-15 US US13/397,497 patent/US20120221324A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20120221324A1 (en) | 2012-08-30 |
JP2012178078A (ja) | 2012-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5315368B2 (ja) | 文書処理装置 | |
US8484238B2 (en) | Automatically generating regular expressions for relaxed matching of text patterns | |
JP5392077B2 (ja) | オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム | |
JP6176017B2 (ja) | 検索装置、検索方法、およびプログラム | |
JP5370159B2 (ja) | 情報抽出装置及び情報抽出システム | |
JP2007287134A (ja) | 情報抽出装置、及び情報抽出方法 | |
JP2002297605A (ja) | 構造化文書検索方法および構造化文書検索装置およびプログラム | |
US20100241645A1 (en) | Method and system for integrating personal information search and interaction on web/desktop applications | |
US10606903B2 (en) | Multi-dimensional query based extraction of polarity-aware content | |
JP2007304796A (ja) | データベース解析システム及びデータベース解析方法及びプログラム | |
US11301441B2 (en) | Information processing system and information processing method | |
JP2010250439A (ja) | 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体 | |
US20110270862A1 (en) | Information processing apparatus and information processing method | |
JP4954674B2 (ja) | ソフトウェア開発支援方法、ソフトウェア開発支援装置、ソフトウェア開発支援プログラム、及び計算機システム | |
KR102518843B1 (ko) | Lda를 이용한 기업 컨텐츠 관리 시스템 | |
JP2008003656A (ja) | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 | |
CN112699642B (zh) | 复杂医疗文书的索引提取方法及装置、介质及电子设备 | |
JP2010191851A (ja) | 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム | |
JP5187187B2 (ja) | 体験情報検索システム | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
US20230409620A1 (en) | Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system | |
JP2003223461A (ja) | 知的労働者の知的創造支援のための検索システム | |
JP7116940B2 (ja) | オープンデータを効率的に構造化し補正する方法及びプログラム | |
JP7004123B1 (ja) | 情報検索システム | |
WO2022215433A1 (ja) | 情報表現構造解析装置、および情報表現構造解析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130708 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5315368 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |