JP5106155B2 - 文書処理装置、方法及びプログラム - Google Patents
文書処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5106155B2 JP5106155B2 JP2008017441A JP2008017441A JP5106155B2 JP 5106155 B2 JP5106155 B2 JP 5106155B2 JP 2008017441 A JP2008017441 A JP 2008017441A JP 2008017441 A JP2008017441 A JP 2008017441A JP 5106155 B2 JP5106155 B2 JP 5106155B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- character string
- unit
- information
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
図1に示すように、第1の実施の形態にかかる文書処理装置100は、形態素辞書101と、構造化ルール記憶部102と、文書論理構造化ルール記憶部103と、ファイル内容判定ルール記憶部104と、ファイル名解析ルール記憶部105と、文書記憶部106と、入力部107と、テキスト文書抽出部108と、形態素解析部109と、構文解析部110と、論理構造埋込部111と、文書構造埋込部112と、ファイルタイプ判定部113と、リンク情報埋込部114と、表示部115と、ユーザ入力受付部116と、検索部117と、文書取得部118と、登録部119と、候補生成部120と、判断部121と、を備える。
上述した第1の実施の形態にかかる文書処理装置100においては、文書データの絞込検索を行う場合に、図14に示した検索画面から、特定の文書データ内に含まれている係り受け関係から文書データの絞込を行った。しかしながら、上述した実施の形態は、XML文書内のタグ<object>が指し示すXML文書の絞込に制限するものではない。
52 ROM
53 RAM
54 表示装置
55 HDD
56 通信I/F
62 バス
100 文書処理装置
101 形態素辞書
102 構造化ルール記憶部
103 文書論理構造化ルール記憶部
104 ファイル内容判定ルール記憶部
105 ファイル名解析ルール記憶部
106 文書記憶部
107 入力部
108 テキスト文書抽出部
109 形態素解析部
110 構文解析部
111 論理構造埋込部
112 文書構造埋込部
113 ファイルタイプ判定部
114 リンク情報埋込部
115 表示部
116 ユーザ入力受付部
117 検索部
118 文書取得部
119 登録部
120 候補生成部
121 判断部
131 本文内容判定部
132 ファイル名判定部
141 文書タグ埋込部
Claims (10)
- テキスト文書情報を取得するテキスト文書取得部と、
前記テキスト文書情報に含まれている文字列の係り受け関係を解析する構文解析部と、
前記係り受け関係の内容を示す属性を、当該係り受け関係が示す文字列に割り当て、前記テキスト文書情報に埋め込む属性埋込部と、
前記属性埋込部により前記属性が埋め込まれた前記テキスト文書情報から、他のテキスト文書情報を特定する文字列を示す文書特定文字列を特定する文書特定部と、
前記文書特定部により特定された前記文書特定文字列に対して、当該文書特定文字列を識別する文書識別情報を割り当て、前記テキスト文書情報に埋め込む文書識別情報埋込部と、
文字列の入力を受け付ける入力受付部と、
前記テキスト文書情報に埋め込まれた前記属性及び前記文書識別情報に基づいて、前記文字列と係り受け関係を有する文書特定文字列を含む文字列が存在するか否か判断する判断部と、
前記文書特定文字列が存在すると判断された場合、当該文書特定文字列で示されたテキスト文書情報を特定する特定部と、
を備えることを特徴とする文書処理装置。 - 前記特定部により特定された前記テキスト文書情報を取得する文書取得部をさらに備えることを特徴する請求項1に記載の文書処理装置。
- 前記文書取得部は、さらに前記入力受付部により入力された前記文字列を含む前記テキスト文書情報を指し示す前記文書特定文字列が記載されているテキスト文書情報、及び前記入力受付部により入力を受け付けた前記文字列を含むテキスト文書情報を取得すること、
を特徴とする請求項2に記載の文書処理装置。 - 前記テキスト文書情報について、前記テキスト文書情報の種別を判定し、当該種別を前記テキスト文書情報に埋め込む種別判定部と、
前記文書取得部が取得した前記テキスト文書情報を、当該テキスト文書情報に埋め込まれた種別毎に分類して表示する表示部と、
をさらに備えることを特徴とする請求項2又は3に記載に文書処理装置。 - 前記属性が割り当てられた前記文字列を表示する候補表示部と、
前記候補表示部により表示された前記文字列の選択を受け付ける選択受付部と、
前記選択受付部により選択された前記文字列を含む前記テキスト文書情報を検索する検索部と、
をさらに備えることを特徴とする請求項1に記載の文書処理装置。 - 前記検索部により検索された複数の前記テキスト文書情報のそれぞれから、前記選択受付部により選択を受け付けた前記文字列と係り受け関係を有する前記文字列を、選択候補として抽出する候補抽出部と、をさらに備え、
前記候補表示部は、さらに、前記選択候補として抽出された前記文字列を表示すること、
を特徴とする請求項5に記載の文書処理装置。 - 他の文書情報を示しているか否かを示すリンク識別情報を、前記テキスト文書情報に埋め込むリンク名情報埋込部をさらに備え、
前記特定部は、前記文書名が存在すると判断された場合、前記リンク識別情報に基づいて、当該文書名で示された文書情報を特定すること、
を特徴とする請求項1に記載の文書処理装置。 - 前記文書特定部が特定する前記文書特定文字列は、文書名、文書を識別する文書識別情報、及び文書の節又は句、のうちいずれか一方であること、
を特徴とする請求項1に記載の文書処理装置。 - テキスト文書取得部が、テキスト文書情報を取得するテキスト文書取得ステップと、
構文解析部が、前記テキスト文書情報に含まれている文字列の係り受け関係を解析する構文解析ステップと、
属性埋込部が、前記係り受け関係の内容を示す属性を、当該係り受け関係が示す文字列に割り当て、前記テキスト文書情報に埋め込む属性埋込ステップと、
文書特定部が、前記属性埋込ステップにより前記属性が埋め込まれた前記テキスト文書情報から、他のテキスト文書情報を特定する文字列を示す文書特定文字列を特定する文書特定ステップと、
文書識別情報埋込部が、前記文書特定ステップにより特定された前記文書特定文字列に対して、当該文書特定文字列を識別する文書識別情報を割り当て、前記テキスト文書情報に埋め込む文書識別情報埋込ステップと、
入力受付部が、文字列の入力を受け付ける入力受付ステップと、
判断部が、前記テキスト文書情報に埋め込まれた前記属性及び前記文書識別情報に基づいて、前記文字列と係り受け関係を有する文書特定文字列を含む文字列が存在するか否か判断する判断ステップと、
特定部が、前記文書特定文字列が存在すると判断された場合、当該文書特定文字列で示されたテキスト文書情報を特定する特定ステップと、
を有することを特徴とする文書処理方法。 - テキスト情報について処理を行う手段として、コンピュータを機能させるプログラムであって、
テキスト文書情報を取得するテキスト文書取得手段と、
前記テキスト文書情報に含まれている文字列の係り受け関係を解析する構文解析手段と、
前記係り受け関係の内容を示す属性を、当該係り受け関係が示す文字列に割り当て、前記テキスト文書情報に埋め込む属性埋込手段と、
前記属性埋込手段により前記属性が埋め込まれた前記テキスト文書情報から、他のテキスト文書情報を特定する文字列を示す文書特定文字列を特定する文書特定手段と、
前記文書特定手段により特定された前記文書特定文字列に対して、当該文書特定文字列を識別する文書識別情報を割り当て、前記テキスト文書情報に埋め込む文書識別情報埋込手段と、
文字列の入力を受け付ける入力受付手段と、
前記テキスト文書情報に埋め込まれた前記属性及び前記文書識別情報に基づいて、前記文字列と係り受け関係を有する文書特定文字列を含む文字列が存在するか否か判断する判断手段と、
前記文書特定文字列が存在すると判断された場合、当該文書特定文字列で示されたテキスト文書情報を特定する特定手段、
としてコンピュータを機能させることを特徴とする文書処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008017441A JP5106155B2 (ja) | 2008-01-29 | 2008-01-29 | 文書処理装置、方法及びプログラム |
US12/357,469 US8275781B2 (en) | 2008-01-29 | 2009-01-22 | Processing documents by modification relation analysis and embedding related document information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008017441A JP5106155B2 (ja) | 2008-01-29 | 2008-01-29 | 文書処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009181166A JP2009181166A (ja) | 2009-08-13 |
JP5106155B2 true JP5106155B2 (ja) | 2012-12-26 |
Family
ID=40900465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008017441A Active JP5106155B2 (ja) | 2008-01-29 | 2008-01-29 | 文書処理装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8275781B2 (ja) |
JP (1) | JP5106155B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5498101B2 (ja) * | 2009-08-31 | 2014-05-21 | 株式会社東芝 | 文書処理装置および文書処理プログラム |
KR20110095612A (ko) * | 2010-02-19 | 2011-08-25 | 삼성전자주식회사 | 링크 제공 방법 및 이를 적용한 전자장치 |
JP5017405B2 (ja) * | 2010-03-19 | 2012-09-05 | 株式会社東芝 | 規程管理装置及びプログラム |
US9081767B2 (en) * | 2010-07-26 | 2015-07-14 | Radiant Logic, Inc. | Browsing of contextual information |
JP2012198277A (ja) | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
KR101204039B1 (ko) * | 2012-06-28 | 2012-11-23 | (주) 사이냅소프트 | 문자열 추출 시스템 및 그 방법 |
JP6018932B2 (ja) * | 2013-01-23 | 2016-11-02 | 株式会社エヌ・ティ・ティ・データ | 用例検索装置、用例検索方法、および用例検索プログラム |
JP6203091B2 (ja) * | 2014-03-17 | 2017-09-27 | 三菱電機株式会社 | 文書表示装置及び文書表示プログラム |
US9436676B1 (en) | 2014-11-25 | 2016-09-06 | Truthful Speaking, Inc. | Written word refinement system and method |
JP6414967B2 (ja) * | 2014-11-25 | 2018-10-31 | 日本放送協会 | 文書処理装置およびプログラム |
US11068644B1 (en) * | 2015-03-30 | 2021-07-20 | Insurance Services Office, Inc. | System and method for creating customized insurance-related forms using computing devices |
WO2017045186A1 (zh) * | 2015-09-17 | 2017-03-23 | 深圳市世强先进科技有限公司 | 一种关键词定义方法及系统 |
JP6668948B2 (ja) * | 2016-05-27 | 2020-03-18 | 富士通株式会社 | ファイル判定プログラム、ファイル判定装置およびファイル判定方法 |
CN109325123B (zh) * | 2018-09-29 | 2020-10-16 | 武汉斗鱼网络科技有限公司 | 基于补集特征的贝叶斯文档分类方法、装置、设备及介质 |
RU2721414C1 (ru) * | 2019-10-08 | 2020-05-19 | Публичное акционерное общество "Аэрофлот - российские авиалинии" | Способ учета изменений содержания нормативных документов при обеспечении безопасности полетов |
JP2021064143A (ja) * | 2019-10-11 | 2021-04-22 | 株式会社Legalscape | 文作成装置、文作成方法および文作成プログラム |
US11243989B1 (en) * | 2021-07-02 | 2022-02-08 | Noragh Analytics, Inc. | Configurable, streaming hybrid-analytics platform |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5170349A (en) * | 1989-03-14 | 1992-12-08 | Canon Kabushiki Kaisha | Text processing apparatus using modification relation analysis |
US6026388A (en) * | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US6081774A (en) * | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
JP4183311B2 (ja) * | 1997-12-22 | 2008-11-19 | 株式会社リコー | 文書の注釈方法、注釈装置および記録媒体 |
JP3625054B2 (ja) * | 2000-11-29 | 2005-03-02 | 松下電器産業株式会社 | 技術文書検索装置 |
JP2003108598A (ja) | 2001-09-26 | 2003-04-11 | Daiwa Securities Group Inc | 法律類データベース閲覧方法およびそのシステム、並びにデータ記録媒体およびプログラム |
JP2003178055A (ja) * | 2001-12-11 | 2003-06-27 | Hitachi Ltd | 文書データの関連性抽出装置及び抽出プログラム |
US20040073531A1 (en) * | 2002-10-09 | 2004-04-15 | International Business Machines Corporation | Method, system and program product for automatically linking web documents |
JP4525224B2 (ja) * | 2004-07-26 | 2010-08-18 | 富士ゼロックス株式会社 | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 |
JP4185500B2 (ja) * | 2005-03-14 | 2008-11-26 | 株式会社東芝 | 文書検索システム、文書検索方法及びプログラム |
JP2007047989A (ja) * | 2005-08-09 | 2007-02-22 | Mitsubishi Electric Corp | ガイダンス情報提供装置 |
JP2007287134A (ja) * | 2006-03-20 | 2007-11-01 | Ricoh Co Ltd | 情報抽出装置、及び情報抽出方法 |
JP2008083856A (ja) | 2006-09-26 | 2008-04-10 | Toshiba Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
US9582804B2 (en) * | 2006-12-22 | 2017-02-28 | Excalibur Ip, Llc | Link retrofitting of digital media objects |
JP2009075733A (ja) | 2007-09-19 | 2009-04-09 | Toshiba Corp | 候補表示装置及び方法 |
-
2008
- 2008-01-29 JP JP2008017441A patent/JP5106155B2/ja active Active
-
2009
- 2009-01-22 US US12/357,469 patent/US8275781B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009181166A (ja) | 2009-08-13 |
US20090193325A1 (en) | 2009-07-30 |
US8275781B2 (en) | 2012-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5106155B2 (ja) | 文書処理装置、方法及びプログラム | |
KR102158352B1 (ko) | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 | |
Zuccala et al. | Can we rank scholarly book publishers? A bibliometric experiment with the field of history | |
Harman | Information retrieval evaluation | |
CN114616572A (zh) | 跨文档智能写作和处理助手 | |
WO2009154153A1 (ja) | 文書検索システム | |
Calzolari et al. | The LRE Map. Harmonising Community Descriptions of Resources. | |
Candela et al. | A linked open data framework to enhance the discoverability and impact of culture heritage | |
JP2006073012A (ja) | 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法 | |
Humbel et al. | Named-entity recognition for early modern textual documents: a review of capabilities and challenges with strategies for the future | |
Avgerinos Loutsaris et al. | Legal Text Processing: Combing two legal ontological approaches through text mining | |
King et al. | Managing usability for people with disabilities in a large web presence | |
Bryl et al. | Interlinking and knowledge fusion | |
Candela | An automatic data quality approach to assess semantic data from cultural heritage institutions | |
US8612431B2 (en) | Multi-part record searches | |
Qumsiyeh et al. | Searching web documents using a summarization approach | |
Broughton | A faceted classification as the basis of a faceted terminology: conversion of a classified structure to thesaurus format in the Bliss Bibliographic Classification | |
US10755047B2 (en) | Automatic application of reviewer feedback in data files | |
De Luca et al. | Digital infrastructures for digital humanities in international textbook research | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
Cunningham et al. | Knowledge management and human language: crossing the chasm | |
Embury et al. | On the Feasibility of Crawling Linked Data Sets for Reusable Defect Corrections. | |
Jou | Deep web query interface integration based on incremental schema matching and merging | |
Sturgeon | Constructing a crowdsourced linked open knowledge base of Chinese history | |
Bol | Introduction to the Utilities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101014 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121002 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5106155 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |