JP2009199192A - Document information presentation method, document information presentation program and document information presentation apparatus - Google Patents

Document information presentation method, document information presentation program and document information presentation apparatus Download PDF

Info

Publication number
JP2009199192A
JP2009199192A JP2008038056A JP2008038056A JP2009199192A JP 2009199192 A JP2009199192 A JP 2009199192A JP 2008038056 A JP2008038056 A JP 2008038056A JP 2008038056 A JP2008038056 A JP 2008038056A JP 2009199192 A JP2009199192 A JP 2009199192A
Authority
JP
Japan
Prior art keywords
attribute
document
information presentation
phrase
document information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008038056A
Other languages
Japanese (ja)
Inventor
Hiroyuki Ota
洋行 太田
Masaaki Uno
昌明 宇野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Obayashi Corp
JustSystems Corp
Original Assignee
Obayashi Corp
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Obayashi Corp, JustSystems Corp filed Critical Obayashi Corp
Priority to JP2008038056A priority Critical patent/JP2009199192A/en
Publication of JP2009199192A publication Critical patent/JP2009199192A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To facilitate the assignment of attributes to new documents including new terms and existing documents by facilitating the assignment of attributes to new terms with no attributes assigned. <P>SOLUTION: A document information presentation apparatus includes an attribute assignment part 221 for assigning corresponding attributes to terms, a registration part for registering information on the attributes and terms associated by the attribute assignment part 221 in a glossary database 203, an output part 204 for displaying a new document for view and displaying the attributes corresponding to terms in the displayed document by reference to the glossary database 203, and an additional attribute detection part 222 for detecting terms included in the document displayed by the output part 204 to which attributes have not been assigned. The attribute assignment part 221 assigns new attributes to the terms detected by the additional attribute detection part 222 to construct the glossary database 203. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

この発明は、文書に対し、語句単位で属性を付与し、語句に対する属性の提示を行うことにより、文書の情報の把握を支援する文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置に関する。   The present invention relates to a document information presenting method, a document information presenting program, and a document information presenting apparatus that support grasping of document information by assigning attributes to a document in units of words and presenting attributes for the words.

従来、ユーザが検索装置等を用いて技術文書の内容を参照する際に、あらかじめ語句毎に定めた属性別に語句を振り分けることにより、語句に付された属性が判るとともに、属性別の語句を抽出でき、技術文書の参照を支援することができるようになっている。   Conventionally, when a user refers to the contents of a technical document using a search device or the like, the attributes assigned to the phrases can be identified and the phrases for each attribute can be extracted by sorting the phrases according to the attributes determined in advance for each phrase. It is possible to support reference of technical documents.

たとえば、建築用の技術文書を例に取ると、あらかじめ属性として、建物、工程等の各属性を定めることができ、これらの属性が付与された語句を技術文書のなかから抽出できる。技術文書のなかからユーザが属性を指定することにより、この属性に対応する語句を提示するため、ユーザは、長文の技術文書に記載されたなかから必要な情報を属性を基に簡単に把握できるようになる。このように、文書に付加情報を付与する方法としてアノテーションが用いられ、表示処理システム等に適用されている(たとえば、下記特許文献1参照。)。   For example, taking a technical document for construction as an example, each attribute such as a building and a process can be defined in advance as attributes, and a phrase to which these attributes are assigned can be extracted from the technical document. When the user specifies an attribute from the technical document, a word corresponding to this attribute is presented, so that the user can easily grasp the necessary information from the long technical document based on the attribute. become. As described above, annotation is used as a method of adding additional information to a document, and is applied to a display processing system or the like (see, for example, Patent Document 1 below).

特開2004−151898号公報JP 2004-151898 A

しかしながら、語句に付与された属性は、一度付与されたまま運用されていた。この場合、技術の進歩等で文書の内容に変化が生じ使用される語句が異なってきた場合、特に、新たな文書に新たな語句が登場してもこの新たな語句に対して適切な属性の付与が行えず、文書閲覧時における属性の提示を適切に行えなかった。   However, the attribute assigned to the phrase has been used once assigned. In this case, due to changes in the content of the document due to technological progress, etc., the words and phrases used will differ. In particular, even if a new word appears in a new document, an appropriate attribute for the new word will be displayed. Assignment was not possible, and attributes were not properly presented when viewing documents.

また、新たな語句が生じたとき、この語句が記載されている文書に対して新たな属性を付与するだけでは、関連する他の文書に記載された同様の語句に対する属性についてもそれぞれ個別に付与する作業が必要となった。   In addition, when a new word or phrase is generated, simply assigning a new attribute to the document in which this word is described, the attributes for similar words and phrases described in other related documents are also individually assigned. It was necessary to work.

この発明は、上述した従来技術による問題点を解消するため、属性が付与されていない新たな語句に対する属性を容易に付与することができ、新規の語句を含む新たな文書および既存の文書における属性付与を容易に行うことができる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置を提供することを目的とする。   In order to solve the above-described problems caused by the prior art, the present invention can easily give an attribute to a new word / phrase to which no attribute is given, and a new document including a new word / phrase and an attribute in an existing document. It is an object of the present invention to provide a document information presentation method, a document information presentation program, and a document information presentation device that can be given easily.

上述した課題を解決し、目的を達成するため、この発明にかかる文書情報提示方法は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示方法において、前記語句に対応する前記属性を付与する属性付与工程と、前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。   In order to solve the above-described problems and achieve the object, the document information presentation method according to the present invention provides document information presentation that displays a predetermined word with a predetermined attribute for a predetermined word or phrase constituting the document when searching for the document. In the method, an attribute assigning step for assigning the attribute corresponding to the word, and registration for registering the attribute and the phrase information associated by the attribute assigning step in a glossary database referred to as a search condition at the time of search A display step for displaying a new document and displaying an attribute corresponding to the phrase of the document displayed with reference to the glossary database; and the document displayed by the display step. And an additional attribute detection step of detecting a phrase to which no attribute is given among the included words, wherein the attribute addition step is performed in the additional attribute detection step. By applying a new attribute for the detected words, characterized by constructing the lexicon database.

この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。   According to this invention, a phrase to which no attribute is assigned can be detected by the additional attribute detection process, and the attribute assignment process gives a new attribute for the detected phrase. As a result, a glossary database can be constructed, and it becomes possible to cope with changes in terms included in a new document.

また、前記属性付与工程は、前記新たな文書の閲覧表示の際に表示された語句に対して前記属性を付与することを特徴とする。   Further, the attribute assigning step is characterized in that the attribute is assigned to a word displayed when the new document is browsed and displayed.

この発明によれば、新規文書の語句に対する属性の付与を容易に行うことができるようになる。   According to the present invention, it is possible to easily assign an attribute to a phrase of a new document.

また、前記属性付与工程は、複数の前記属性別に所定の重み付けを設定し、前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする。   Further, the attribute assigning step sets a predetermined weight for each of the plurality of attributes, and the registration step registers the attribute to which the weight is given in the glossary database.

この発明によれば、属性に重みを付与できるため、検索時に指定した属性に対応する語句が多く含まれる文書を優先的に検索結果として得ることができるようになる。   According to the present invention, since a weight can be given to an attribute, a document containing many words corresponding to the attribute specified at the time of search can be obtained as a search result preferentially.

また、入力された複数の前記文書を保存する文書保存工程を含み、前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする。   In addition, the document storing step of storing the plurality of input documents, the attribute assigning step, for the other stored document, the attribute for the word or phrase included in the other document It is characterized by reflecting the provision of.

この発明によれば、新規の文書の語句に対する属性の付与を行うと、この新規の文書だけに限らず、保存されている他の文書の語句に対しても属性を付与でき、保存されている文書全体に対して一括して属性の変更が行える。   According to the present invention, when an attribute is assigned to a word / phrase of a new document, the attribute can be assigned not only to the new document but also to a word / phrase of another saved document. You can change attributes for the entire document at once.

また、前記表示工程は、前記検索時に、前記重み付けされた前記属性に対応する語句が含まれる割合が高い前記文書を優先的に表示させることを特徴とする。   The display step may preferentially display the document having a high ratio of words / phrases corresponding to the weighted attributes at the time of the search.

この発明によれば、検索時の検索結果として適切な文書が優先的に表示されるため、ユーザが所望する文書を提示できるようになる。   According to the present invention, since an appropriate document is preferentially displayed as a search result at the time of search, a user's desired document can be presented.

また、前記表示工程は、前記文書を構成する語句のうち前記属性が付与された語句を、当該属性別に強調表示させることを特徴とする。   Further, the display step is characterized in that words / phrases to which the attribute is given among words / phrases constituting the document are highlighted for each attribute.

この発明によれば、検索後の文書閲覧時において、文書中に記載されている語句の属性を容易に把握することができ、文書中における属性の割合についても容易に把握できるようになる。   According to the present invention, at the time of browsing a document after retrieval, it is possible to easily grasp the attributes of words and phrases described in the document, and to easily grasp the ratio of the attributes in the document.

また、この発明にかかる文書情報提示プログラムによれば、上記の文書情報提示方法をコンピュータに実行させることができる。   Moreover, according to the document information presentation program concerning this invention, a computer can perform said document information presentation method.

また、この発明の文書情報提供装置は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示装置において、前記語句に対応する前記属性を付与する属性付与手段と、前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。   Further, the document information providing apparatus of the present invention provides the attribute corresponding to the word / phrase in the document information presenting apparatus for displaying a predetermined word / phrase constituting the document with a predetermined attribute when searching for the document. Attribute assigning means, registration means for registering attribute and phrase information associated with the attribute assigning means in the glossary database, browsing and displaying a new document, and displaying with reference to the glossary database Display means for displaying an attribute corresponding to a word of the document being added, and additional attribute detection means for detecting a word to which no attribute is given among words contained in the document displayed by the display means And the attribute assigning means assigns a new attribute to the phrase detected by the additional attribute detecting means, thereby providing the glossary database. Characterized in that it build.

この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。   According to this invention, a phrase to which no attribute is assigned can be detected by the additional attribute detection process, and the attribute assignment process gives a new attribute for the detected phrase. As a result, a glossary database can be constructed, and it becomes possible to cope with changes in terms included in a new document.

本発明によれば、属性が付与されていない新たな語句に対する属性を容易に付与することができ、検索時に参照される用語集データベースを構築していくことができ、適切な文書を検索でき、閲覧用として適切な情報を提示できるという効果を奏する。   According to the present invention, it is possible to easily give an attribute to a new phrase that has not been given an attribute, to build a glossary database that is referred to at the time of searching, and to search for an appropriate document, There is an effect that appropriate information can be presented for browsing.

以下に添付図面を参照して、この発明にかかる文書情報提示装置、文書情報提示方法お
よび文書情報提示プログラムの好適な実施の形態を詳細に説明する。
Exemplary embodiments of a document information presentation device, a document information presentation method, and a document information presentation program according to the present invention will be explained below in detail with reference to the accompanying drawings.

(文書情報提示装置のハードウェア構成)
まず、この発明の実施の形態にかかる文書情報提示装置のハードウェア構成について説明する。図1は、本実施の形態にかかる文書情報提示装置のハードウェア構成を示すブロック図である。図1のように、文書情報提示装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、FD(フレキシブルディスク)107と、CD−RWD(CD−RWドライブ)108と、CD−RW109と、ディスプレイ110と、キーボード111と、マウス112と、ネットワークI/F113とを含んで構成されている。なお、上記の各構成101〜113は、それぞれバス120に接続されている。また、ネットワークI/F(インターフェース)113には、NET(ネットワーク)に接続するための通信ケーブル114が備えられている。
(Hardware configuration of document information presentation device)
First, the hardware configuration of the document information presentation apparatus according to the embodiment of the present invention will be described. FIG. 1 is a block diagram showing a hardware configuration of the document information presentation apparatus according to the present embodiment. As shown in FIG. 1, a document information presentation apparatus 100 includes a CPU 101, a ROM 102, a RAM 103, an HDD (hard disk drive) 104, an HD (hard disk) 105, an FDD (flexible disk drive) 106, and an FD (flexible disk). ) 107, CD-RWD (CD-RW drive) 108, CD-RW 109, display 110, keyboard 111, mouse 112, and network I / F 113. Each of the above-described configurations 101 to 113 is connected to the bus 120. Further, the network I / F (interface) 113 is provided with a communication cable 114 for connecting to the NET (network).

上述のような構成の文書情報提示装置100において、CPU101は、文書情報提示装置100全体を制御する。また、ROM102は、基本入出力プログラムや、本発明にかかる文書情報提示プログラムを記憶している。ROM102に記憶されたCPU101からの制御に応じて読み出しされ実行される。また、RAM103は、CPU101のワークエリアとして使用される。   In the document information presentation apparatus 100 configured as described above, the CPU 101 controls the entire document information presentation apparatus 100. The ROM 102 stores a basic input / output program and a document information presentation program according to the present invention. It is read and executed according to the control from the CPU 101 stored in the ROM 102. The RAM 103 is used as a work area for the CPU 101.

HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御にしたがって書き込まれたデータを記憶する記憶媒体である。また、HD105に記憶されたデータは、HDD104の制御に応じて適宜読み出される。   The HDD 104 controls reading / writing of data with respect to the HD 105 according to the control of the CPU 101. The HD 105 is a storage medium that stores data written according to the control of the HDD 104. Further, the data stored in the HD 105 is appropriately read according to the control of the HDD 104.

FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御にしたがって書き込まれたデータを記憶する着脱自在の記憶媒体である。また、FD107に記録されたデータは、FDD106の制御に応じて適宜読み出される。   The FDD 106 controls reading / writing of data with respect to the FD 107 according to the control of the CPU 101. The FD 107 is a detachable storage medium that stores data written according to the control of the FDD 106. Further, the data recorded on the FD 107 is appropriately read according to the control of the FDD 106.

CD−RWD108は、CPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御する。CD−RW109は、CD−RWD108の制御にしたがって書き込まれたデータを記憶する着脱自在な記憶媒体である。また、CD−RW109に記録されたデータは、CD−RWD108の制御に応じて適宜読み出される。   The CD-RWD 108 controls reading / writing of data with respect to the CD-RW 109 according to the control of the CPU 101. The CD-RW 109 is a removable storage medium that stores data written according to the control of the CD-RWD 108. The data recorded on the CD-RW 109 is appropriately read according to the control of the CD-RWD 108.

ディスプレイ110は、CPU101の制御によって、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。また、キーボード111は、文字、数値、各種指示などの入力のための複数のキーを備えた入力ディバイスであり、マウス112は、各種指示の選択や実行、処理対象の選択、マウスポインタの移動などを行うポインティングディバイスである。   The display 110 displays various data such as a cursor, a menu, a window, or characters and images under the control of the CPU 101. The keyboard 111 is an input device having a plurality of keys for inputting characters, numerical values, and various instructions. The mouse 112 selects and executes various instructions, selects a processing target, moves a mouse pointer, and the like. Is a pointing device.

ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。   A network I / F 113 is connected to a network such as a LAN or a WAN via a communication cable 114 and functions as an interface between the network and the CPU 101.

本実施の形態にかかる文書情報提示装置100は、上述したようなハードウェアを備えており、CPU101の制御によりROM102に記憶された文書情報提示プログラムを実行することにより、ユーザが検索により閲覧した文書の内容と、文書把握のための情報を提示する。   The document information presentation device 100 according to the present embodiment includes the hardware described above, and a document browsed by a user by searching by executing a document information presentation program stored in the ROM 102 under the control of the CPU 101. Information and information for grasping documents.

(文書情報提示装置の機能的構成)
次に、文書情報提示装置100の機能的構成について説明する。図2は、本実施の形態にかかる文書情報提示装置の機能的構成を示すブロック図である。図2に示す文書情報提示装置100は、入力部201aと、操作部201bと、検索部202と、用語集データベース(DB)203と、出力部204とを備えている。
(Functional configuration of document information presentation device)
Next, a functional configuration of the document information presentation apparatus 100 will be described. FIG. 2 is a block diagram showing a functional configuration of the document information presentation apparatus according to the present embodiment. The document information presentation apparatus 100 illustrated in FIG. 2 includes an input unit 201a, an operation unit 201b, a search unit 202, a glossary database (DB) 203, and an output unit 204.

入力部201aには、対象となる文書のデータが入力される。文書のデータは、たとえば汎用のワープロにより作成されたものが入力され、この文書のデータは、複数の語句(単語)によって構成されている。この入力部201aを介して複数の文書のデータが文書情報提示装置100に保存されていく。操作部201bは、一般ユーザによる文書のデータの検索と閲覧時、および特権ユーザによる用語集DB203の構築時の操作用として設けられる。   Data of the target document is input to the input unit 201a. Document data, for example, created by a general-purpose word processor is input, and the document data is composed of a plurality of words (words). Data of a plurality of documents is stored in the document information presentation apparatus 100 via the input unit 201a. The operation unit 201b is provided for operations performed when a general user searches and browses document data and when a glossary DB 203 is constructed by a privileged user.

検索部202は、検索時の検索要求を受けて検索条件に適合した文書の検索を行う。この検索の際、文書に含まれた語句が、用語集DB203に設定、登録されている属性のどれに属するかを併せて提示する。検索部202は、不図示の検索エンジンと、用語集の構築に用いる用語集構築部211と、検索結果を提示するとともに、語句と属性の対応関係を提示する属性提示部212によって構成されている。   The search unit 202 receives a search request at the time of search and searches for a document that meets the search conditions. At the time of this search, it is also shown which of the attributes included in the glossary DB 203 the registered phrase belongs to. The search unit 202 includes a search engine (not shown), a glossary construction unit 211 used for construction of a glossary, and an attribute presentation unit 212 that presents search results and presents the correspondence between words and attributes. .

用語集構築部211は、文書に記述されている語句に対応した属性を付与(追加、修正削除を含む)し、用語集DB203を構築していくための機能部である。この用語集構築部211は、属性付与部221と、追加属性検出部222と、重み設定部223と、検索条件作成部224とによって構成されている。属性付与部221は、既に用語集DB203に登録されている属性があればこの属性を用いて、文書の語句単位でこの語句に対応した属性を付与する。語句に対する属性の付与はアノテーションの技術が利用される。   The glossary construction unit 211 is a functional unit for constructing the glossary DB 203 by assigning attributes (including addition and correction deletion) corresponding to the words and phrases described in the document. The glossary construction unit 211 includes an attribute assignment unit 221, an additional attribute detection unit 222, a weight setting unit 223, and a search condition creation unit 224. If there is an attribute already registered in the glossary DB 203, the attribute assigning unit 221 uses this attribute to assign an attribute corresponding to the word / phrase in the word / phrase unit of the document. Annotation technology is used to assign attributes to words.

追加属性検出部222は、属性付与部221のアノテーション実行により付与されなかった属性の語句を検出する。用語集DB203がまだ構築されていない初期時には、アノテーションを行うと、文書に含まれる大部分の語句について、追加属性検出部222が属性未付与の語句を検出することになる。検出された新たな属性の語句は、属性付与部221によって新たな属性として付与することができる。属性付与の具体例については後述する。   The additional attribute detection unit 222 detects an attribute word / phrase that has not been assigned by the annotation execution of the attribute addition unit 221. At the initial stage when the glossary DB 203 has not yet been constructed, when an annotation is performed, the additional attribute detection unit 222 detects a word / phrase to which no attribute is assigned for most words / phrases included in the document. The detected new attribute word / phrase can be assigned as a new attribute by the attribute assigning unit 221. A specific example of attribute assignment will be described later.

重み設定部223は、属性付与部221が有する属性別に、文書の検索時における重要度の重み付けを行う。検索条件作成部224は、用語集DB203に対し、重み付け後の各属性別の語句を登録する。この登録により、用語集DB203が構築されていく。   The weight setting unit 223 performs weighting of importance when searching for a document for each attribute of the attribute assigning unit 221. The search condition creating unit 224 registers the weighted phrases for each attribute in the glossary DB 203. By this registration, the glossary DB 203 is constructed.

属性提示部212は、文書の閲覧時に機能する。この際、用語集DB203を参照して、文書のデータに含まれる語句に対する属性に基づいて、検索条件に適合した文書から順に優先的に表示する等の処理が行える。また、選択された文書の情報と、この文書に含まれる語句のうち、検索条件として設定された属性に該当する語句、および属性は、出力部204を介して検索要求したユーザに提示される。これらの内容の詳細は後述する。   The attribute presentation unit 212 functions when browsing a document. At this time, referring to the glossary DB 203, based on the attribute for the phrase included in the document data, processing such as preferential display from the document that matches the search condition can be performed. In addition, information on the selected document and phrases and attributes corresponding to the attributes set as search conditions among the phrases included in the document are presented to the user who requested the search via the output unit 204. Details of these contents will be described later.

上記構成の検索部202の機能は、図1に記載のROM102、RAM103、HDD104等に記憶されたプログラムをCPU101が実行することによってその機能を実現する。入力部201aによる、文書のデータの入力は、図1に記載のFDD106、CD−RW109、ネットワークI/F113を介して入力して機能を実現できる。また、操作部201bの機能は、キーボード111、マウス112により実現できる。この際、属性付与部221において新たに付与する属性名の入力と、重み設定部223における属性別の重み付け設定、属性付与部221において提示する文書と属性の設定は、キーボード111、マウス112の操作により行うことができる。出力部204の機能は、図1に記載のディスプレイ110によってその機能を実現する。用語集DB203は、図1に記載のHDD104等によってその機能を実現する。   The function of the search unit 202 having the above configuration is realized by the CPU 101 executing a program stored in the ROM 102, the RAM 103, the HDD 104, or the like illustrated in FIG. The input of document data by the input unit 201a can be realized by inputting via the FDD 106, the CD-RW 109, and the network I / F 113 shown in FIG. The function of the operation unit 201b can be realized by the keyboard 111 and the mouse 112. At this time, input of an attribute name newly given by the attribute assigning unit 221, weight setting for each attribute in the weight setting unit 223, and setting of a document and an attribute presented in the attribute assigning unit 221 are performed by operating the keyboard 111 and the mouse 112. Can be performed. The function of the output unit 204 is realized by the display 110 shown in FIG. The glossary DB 203 realizes its function by the HDD 104 or the like shown in FIG.

(文書情報提示の手順について)
図3−1は、本発明による文書情報提示の全体の流れを示す概要図である。以下の説明では、上記説明の文書として、建築現場における不具合を記載した不具合文書を例に説明する。この不具合文書は、一般ユーザである生産支援部門Cや、工事事務所A,Dが行う現場での施工に有効な情報である。
(About document information presentation procedure)
FIG. 3A is a schematic diagram showing the overall flow of document information presentation according to the present invention. In the following description, a defect document that describes a defect at a building site will be described as an example of the document described above. This defect document is information that is effective for construction on site performed by the production support department C, which is a general user, and the construction offices A and D.

まず、工事事務所Aの担当者が工事中に発生した不具合を特権ユーザである品質管理部門Bに報告する(ステップS301)。この不具合報告は、工事事務所Aの担当者あるいは品質管理部門Bの担当者が汎用のワープロ等を用いて文書データ310として作成する。品質管理部門Bでは、この文書データ310を、文書検索時における文書情報(属性)提示のための処理に有用なデータ形式に変換して不具合改善シート311を作成する(ステップS302)。この不具合改善シート311は、作成される都度、文書情報提示装置100に入力される(ステップS303)。この作業を繰り返すことにより、文書情報提示装置100には、多数の不具合改善シートが文書のデータベース(DB)として保存される(不図示)。   First, a person in charge at the construction office A reports a defect occurring during construction to the quality control department B, which is a privileged user (step S301). This trouble report is created as document data 310 by a person in charge at the construction office A or a person in charge in the quality control department B using a general-purpose word processor or the like. In the quality control department B, the document data 310 is converted into a data format useful for processing for presenting document information (attribute) at the time of document search, and a defect improvement sheet 311 is created (step S302). This defect improvement sheet 311 is input to the document information presentation device 100 every time it is created (step S303). By repeating this operation, the document information presentation apparatus 100 stores a large number of defect improvement sheets as a document database (DB) (not shown).

一般ユーザである生産支援部門Cあるいは工事事務所Dの担当者は、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる(ステップS304)。この際、文書情報提示装置100は、用語集DB203を参照して、不具合改善シート311に含まれている語句毎に検索用の属性を付与して提示する。この属性は、不具合に関連する語句に対し付与されている。   A person in charge of the production support department C or the construction office D who is a general user can operate the document information presentation apparatus 100 to search the registered defect improvement sheet 311 and browse the contents (step S304). . At this time, the document information presentation device 100 refers to the glossary DB 203 and provides a search attribute for each word included in the defect improvement sheet 311. This attribute is given to a word / phrase related to a defect.

この閲覧時に不具合改善シート311の語句に付与された属性を把握することができる。すなわち、工事事務所Dの担当者は、この不具合改善シート311を読む際に、不具合に関する語句の提示を受け、以降の工事作業時の参考にできる。   It is possible to grasp the attribute given to the word / phrase of the defect improvement sheet 311 at the time of browsing. In other words, the person in charge of the construction office D can receive a phrase related to a defect when reading the defect improvement sheet 311 and can refer to it during subsequent construction work.

また、特権ユーザである品質管理部門Bの担当者についても、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる。この閲覧時に、不具合改善シート311の語句に対し属性を付与することができる(ステップS305)。語句に対する属性の付与を行うことにより用語集DB203を構築することができる(ステップS305)。   Further, the person in charge of the quality control department B who is a privileged user can also operate the document information presentation apparatus 100 to search the registered defect improvement sheet 311 and browse the contents. At the time of browsing, an attribute can be given to the word / phrase of the defect improvement sheet 311 (step S305). The glossary DB 203 can be constructed by assigning attributes to phrases (step S305).

図3−2は、本発明による文書情報提示装置が行う内部処理を示すフローチャートである。文書情報提示装置100は、文書である不具合改善シート311を多数保持しており、一般ユーザ(上述の工事事務所Dの担当者)が検索および閲覧できる。また、特権ユーザ(上述の品質管理部門Bの担当者)による用語集DB203の構築が行われる。文書情報提示装置100は、ログイン時に一般ユーザであるか、特権ユーザであるかを判断し、それぞれ個別の処理を行う。   FIG. 3-2 is a flowchart showing internal processing performed by the document information presentation apparatus according to the present invention. The document information presentation apparatus 100 holds a number of defect improvement sheets 311 that are documents, and can be searched and viewed by a general user (a person in charge of the construction office D described above). Further, the glossary DB 203 is constructed by a privileged user (a person in charge of the above-described quality control department B). The document information presentation apparatus 100 determines whether the user is a general user or a privileged user at the time of login, and performs individual processing.

まず、一般ユーザ(上述の工事事務所Dの担当者等)に対する処理の流れを説明する。一般ユーザは、検索クエリを作成する(ステップS321)。具体的には、必要な属性を入力し、文書情報提示装置100に入力する。文書情報提示装置100は、この属性に該当する語句が含まれる不具合改善シート311を検索し、用語集DB203を参照して検索結果として適しているものを検索結果一覧として出力する(ステップS322)。この際、複数の不具合改善シート311を後述するランキングコントロールを行ったスコア値の高いものから優先的に出力することができる。   First, a flow of processing for a general user (a person in charge of the construction office D described above) will be described. The general user creates a search query (step S321). Specifically, necessary attributes are input and input to the document information presentation apparatus 100. The document information presentation apparatus 100 searches for the defect improvement sheet 311 including the phrase corresponding to this attribute, and refers to the glossary DB 203 and outputs a search result list that is suitable as a search result (step S322). At this time, a plurality of defect improvement sheets 311 can be preferentially output from those having a high score value obtained by ranking control described later.

そして、一覧のなかから選択した文書について閲覧のための表示を行う(ステップS323)。この閲覧の際、所望する属性の語句が記載された不具合改善シート311を閲覧することができるようになり、この不具合の内容を確認して以降の作業に有効利用できるようになる。   Then, display for browsing the document selected from the list is performed (step S323). At the time of browsing, it becomes possible to browse the defect improvement sheet 311 in which a phrase of a desired attribute is described, and the contents of this defect can be confirmed and used effectively for the subsequent work.

次に、特権ユーザ(上述の品質管理部門Bの担当者)に対する処理の流れを説明する。特権ユーザにおいても、ステップS321〜ステップS323までの処理の流れは同じである。そして、閲覧した、ある一つの文書(不具合改善シート311)に対し、上述したアノテーションを加える(ステップS324)。このアノテーションの際に、用語集DB203を参照し、この用語集DB203に登録されている、語句と属性の関係を表示することができる。そして、特権ユーザにより、表示されている語句と属性の関係を追加、修正することにより、検索結果のチューニングが行える。   Next, a processing flow for a privileged user (a person in charge of the above-described quality control department B) will be described. Even for privileged users, the flow of processing from step S321 to step S323 is the same. And the annotation mentioned above is added with respect to one document (defect improvement sheet 311) browsed (step S324). At the time of this annotation, the glossary DB 203 can be referred to, and the relationship between words and attributes registered in the glossary DB 203 can be displayed. The search result can be tuned by the privileged user by adding or modifying the relationship between the displayed word and attribute.

たとえば、追加属性検出部222により、語句に対する属性の設定が登録されていない場合、新たな属性が検出され、属性付与部221により任意の属性を追加して付与することができる。修正の場合、語句に対する属性自体の変更、および後述する重み付けの変更等が行える。   For example, when the attribute setting for the phrase is not registered by the additional attribute detection unit 222, a new attribute is detected, and an arbitrary attribute can be added and added by the attribute adding unit 221. In the case of correction, it is possible to change the attribute itself with respect to the phrase and change the weighting described later.

これら語句と属性の関係を設定することにより、アノテーション内容を文書情報提示装置100に格納されている文書DB全体(複数の不具合改善シート311)における語句と属性の関係の変更に反映させる(ステップS325)。この処理は、複数の不具合改善シート311に記述されている文字列一致を判断して処理できる。そして、用語集DB203に保存される語句と属性の関係についても設定され、用語集DB203が生成される(ステップS326)。特権ユーザによる次回以降の文書閲覧時には、この新たな用語集DB203を用いたアノテーションが行われることになる。以上説明した特権ユーザによる処理を何度も重ねていくほど、用語集DB203の語句と属性の関係を生成していくことができ、用語集DB203の構築できる。   By setting the relationship between the phrase and the attribute, the annotation content is reflected in the change in the relationship between the phrase and the attribute in the entire document DB (a plurality of defect improvement sheets 311) stored in the document information presentation apparatus 100 (step S325). ). This process can be performed by determining matching of character strings described in the plurality of defect improvement sheets 311. Then, the relationship between phrases and attributes stored in the glossary DB 203 is also set, and the glossary DB 203 is generated (step S326). When the privileged user browses the document next time or later, annotation using the new glossary DB 203 is performed. As the processing by the privileged user described above is repeated many times, the relationship between the phrase and the attribute of the glossary DB 203 can be generated, and the glossary DB 203 can be constructed.

(用語集DBの構築の具体例)
次に、用語集DB203の構築について説明する。用語集DB203には、不具合情報として複数の属性が登録される。図4は、用語集DBに登録される不具合情報の内容を属性別に分類した図である。
(Specific example of glossary database construction)
Next, the construction of the glossary DB 203 will be described. A plurality of attributes are registered in the glossary DB 203 as defect information. FIG. 4 is a diagram in which the content of defect information registered in the glossary DB is classified by attribute.

図示のように、建築の工事に関する不具合情報は、大きく分けて建物、工程、不具合、評価の各分類項目401〜404に分類される。各分類項目401〜404は、それぞれ上記の属性を有している。   As shown in the drawing, defect information related to construction work is roughly classified into building, process, defect, and evaluation classification items 401 to 404. Each of the classification items 401 to 404 has the attribute described above.

建物の分類項目401には、構造411、延床面積412、用途413等が属性としてそれぞれ設定されている。工程の分類項目402には、工種421、部位422、材料423等が属性としてそれぞれ設定されている。不具合の分類項目403には、現象431、概要432、原因433、処置434、対策435等が属性としてそれぞれ設定されている。評価の分類項目404には、重要指定441等が属性として設定されている。図4の記載では、便宜上、分類項目別の表記としてあるが、XML等の階層データ形式で記述されている。   In the building classification item 401, a structure 411, a total floor area 412, a use 413, and the like are set as attributes. In the process classification item 402, a work type 421, a part 422, a material 423, and the like are set as attributes. In the defect classification item 403, a phenomenon 431, an outline 432, a cause 433, a treatment 434, a countermeasure 435, and the like are set as attributes. In the evaluation classification item 404, an important designation 441 or the like is set as an attribute. In the description of FIG. 4, for convenience, it is described by classification item, but is described in a hierarchical data format such as XML.

図5は、文書情報提示装置に入力される文書のデータを示す図である。図示のように、入力される文書のデータである不具合改善シート311には、過去の建築作業時に発生した不具合に関する情報として、ある不具合の原因、について記述されている。   FIG. 5 is a diagram showing document data input to the document information presentation apparatus. As shown in the figure, the defect improvement sheet 311 that is the data of the input document describes the cause of a certain defect as information related to a defect that has occurred during past construction work.

図6は、文書情報提示装置が属性を付与した状態の内部データを示す図である。文書の情報は、図5と同様であるが(一部省略)、アノテーションにより、不具合を示す語句と、この語句の属性とが対応付けられた状態が示されている。たとえば、「外壁」という語句601については、用語集DB203にあらかじめ属性が「部位」(図4の符号422)として登録されているため、この属性「部位」に語句「外壁」が属すると判断処理されている。この処理は、図2に記載の属性付与部221が実行する。   FIG. 6 is a diagram illustrating internal data in a state where the document information presentation device has attributes. The document information is the same as in FIG. 5 (partially omitted), but the annotation indicates a state in which a word indicating a defect is associated with an attribute of the word. For example, since the attribute 601 for the word “outer wall” is registered in advance in the glossary DB 203 as “part” (reference numeral 422 in FIG. 4), it is determined that the word “outer wall” belongs to this attribute “part”. Has been. This processing is executed by the attribute assigning unit 221 shown in FIG.

なお、図示の例では、属性「ピックアップ」610とは、用語集DB203に登録されていない属性である。アノテーションの実行により、どの属性にも属していない新たな用語のうち、不具合に関する語句である「拘束」602は、適当な仮の属性(上記例では「」ピックアップ」610)に属するものと判断され、提示される。この処理は、図2に記載の追加属性検出部222が実行する。この後、この「拘束」602について、新たな属性として設定するかどうかは、不具合改善シート311を管理する品質管理部門Bの担当者が決定する。この「拘束」602について、新たな属性として設定する場合には、属性付与部221に対し、「拘束」602に該当する属性を新たに設定することにより、用語集DB203に新たな属性が登録される。   In the illustrated example, the attribute “pickup” 610 is an attribute that is not registered in the glossary DB 203. By executing the annotation, among the new terms that do not belong to any attribute, the “constraint” 602 that is a word related to the defect is determined to belong to an appropriate temporary attribute (“” pickup ”610 in the above example). Presented. This process is executed by the additional attribute detection unit 222 shown in FIG. Thereafter, the person in charge of the quality management department B that manages the defect improvement sheet 311 determines whether or not to set this “restraint” 602 as a new attribute. In the case of setting this “restraint” 602 as a new attribute, a new attribute is registered in the glossary DB 203 by newly setting an attribute corresponding to the “restraint” 602 in the attribute assigning unit 221. The

図7は、用語集DB構築時に表示される検索条件設定画面を示す図である。用語集の構築は、特権ユーザ(品質管理部門Bの担当者)が不具合改善シート311を閲覧しながら行う。この担当者に対して図7に示す設定画面701が表示される。図示の左上には、検索条件702が表示される。この検索条件702は、用語集DB203に既に登録されている属性(既存属性)と、用語集DB203に登録されていない属性(追加属性)とからなる。   FIG. 7 is a diagram showing a search condition setting screen displayed when the glossary DB is constructed. The glossary is constructed while a privileged user (person in charge of the quality control department B) browses the defect improvement sheet 311. A setting screen 701 shown in FIG. 7 is displayed for this person in charge. In the upper left of the figure, a search condition 702 is displayed. The search condition 702 includes attributes already registered in the glossary DB 203 (existing attributes) and attributes not registered in the glossary DB 203 (additional attributes).

たとえば、既存属性としては、工種421の属性に属する語句として、閲覧している不具合改善シート311に記載されている「鉄筋」が表示されている。追加属性としては、たとえば、図6を用いて説明した仮属性の「ピックアップ」610に属する語句「誘発目地」がある。図示のように、不具合改善シート311に記載されている語句のうち、各属性に対応する語句が表示部703に表示されるようになっている。   For example, as the existing attribute, “rebar” described in the currently viewed defect improvement sheet 311 is displayed as a phrase belonging to the attribute of the work type 421. As an additional attribute, for example, there is a phrase “induced joint” belonging to the temporary attribute “pickup” 610 described with reference to FIG. As shown in the drawing, among the words / phrases described in the defect improvement sheet 311, words / phrases corresponding to each attribute are displayed on the display unit 703.

これらの属性一覧は、一般ユーザ(工事事務所Dの担当者)が文書である不具合改善シート311の検索時に適した文書(必要とする不具合が記載されている文書)を検索する際の検索処理に用いられる。検索後においては、語句毎に付与された属性がこの一般ユーザに情報提示される。   These attribute lists are searched when a general user (person in charge of the construction office D) searches for a document suitable for searching the defect improvement sheet 311 (document in which a necessary defect is described). Used for. After the search, the attribute given to each word is presented to the general user as information.

加えて、この検索条件702に表示されている属性別に重み付けの係数704を設定することができる(ランキングコントロール)。重み付けを重く設定した属性ほど該当する語句の重要度を高くできる。図示の例では、属性「工種」421の語句「鉄筋」に対して40、属性「現象」431の語句「ひびわれ」に対しては50、属性「自然現象」(仮の属性設定状態)の語句「乾燥収縮」に対して50、属性未定状態(追加属性)「長い建物」、「誘発目地」に対して50という重み付けを行った状態である。この重み付け(0〜100までの任意の数値)は、文書である不具合改善シート311を検索する際に、重み付けが重い属性に該当する語句が多く含まれる不具合改善シート311を優先的に一般ユーザに提示するために行われる。   In addition, a weighting coefficient 704 can be set for each attribute displayed in the search condition 702 (ranking control). The higher the weight of the attribute, the higher the importance of the corresponding word. In the illustrated example, 40 for the phrase “rebar” of the attribute “work type” 421, 50 for the phrase “crack” of the attribute “phenomenon” 431, and the phrase of the attribute “natural phenomenon” (provisional attribute setting state). This is a state in which 50 is assigned to “dry shrinkage”, 50 is assigned to the attribute undecided state (additional attribute) “long building”, and “induced joint” is weighted. This weighting (arbitrary numerical value from 0 to 100) is preferentially given to the general user the defect improvement sheet 311 including many words / phrases corresponding to heavy weight attributes when searching the defect improvement sheet 311 which is a document. Done to present.

図7の右上には、属性スコア内訳712が表示される。この属性スコア内訳712は、検索条件702によって重み付けされた属性別のスコアである。この属性スコア内訳712の左半部の数値表示部713には、各属性と重み付け後における全体に占める割合(%)が数値表示される。たとえば、属性の「工種」421は28%、「現象」431および「自然現象」はそれぞれ35%である。属性スコア内訳712の右半部のグラフ表示部714には、左半部の数値がグラフ化して表示される。図示の例では円グラフとしたが、グラフの形態はこれに限らずバーグラフ等他の形態であってもよい。   An attribute score breakdown 712 is displayed on the upper right of FIG. The attribute score breakdown 712 is a score for each attribute weighted by the search condition 702. In the numerical display section 713 in the left half of the attribute score breakdown 712, each attribute and the ratio (%) to the whole after weighting are numerically displayed. For example, the attribute “work type” 421 is 28%, and the “phenomenon” 431 and the “natural phenomenon” are each 35%. In the graph display portion 714 in the right half of the attribute score breakdown 712, the numerical values in the left half are displayed as a graph. In the illustrated example, a pie chart is used. However, the form of the graph is not limited to this and may be other forms such as a bar graph.

図7の下半部には、複数の不具合改善シート311の情報一覧715が表示される。図示の例では、3タイトル分の不具合改善シート311だけしか表示されていないが、スクロールバーの操作により、ランキングが低い他の不具合改善シート311を表示させることもできる。うち、ランキングが高い最上部の不具合改善シート311{タイトル:デッキ合成床のひびわれ(施工中)}がスコア15であり、最も高いスコアである。以下スコア順に下方に表示される。このように、検索結果として、ランキングが高い属性に対応する語句が含まれる割合が高い文書(不具合改善シート311)を優先的(上部位置)に表示させることができる。   In the lower half of FIG. 7, an information list 715 of a plurality of defect improvement sheets 311 is displayed. In the illustrated example, only the defect improvement sheet 311 for three titles is displayed, but another defect improvement sheet 311 having a lower ranking can be displayed by operating the scroll bar. Among them, the highest defect improvement sheet 311 with the highest ranking is {Title: Cracked deck composite floor (under construction)}, which is score 15 and is the highest score. Below, they are displayed below in order of score. As described above, as a search result, a document (defect improvement sheet 311) having a high ratio that includes a phrase corresponding to an attribute with a high ranking can be displayed preferentially (upper position).

2番目に表示されている不具合改善シート311{タイトル:長い建物の外壁のひびわれ、スコア14}は、選択されてチェックマーク716が付いており、この不具合改善シート311の記載における属性(現象、部位、工種、用途、タイトル等)毎の語句が抽出して表示されている。なお、図7の上半部に表示されている検索条件702と、属性スコア内訳712のそれぞれの内容は、この選択された2番目の不具合改善シート311に関する情報である。   The second defect improvement sheet 311 {Title: Crack of outer wall of long building, score 14} is selected and has a check mark 716, and the attribute (phenomenon, part) in the description of this defect improvement sheet 311 is selected. , Work type, application, title, etc.) are extracted and displayed. The contents of the search condition 702 and the attribute score breakdown 712 displayed in the upper half of FIG. 7 are information regarding the selected second defect improvement sheet 311.

たとえば、この情報一覧715の属性「現象」431の語句「ひびわれ」と、属性「工種」421の語句「鉄筋」は上記の既存属性に相当する。また、タイトルについても属性として扱い、上述したアノテーションにより語句「長い建物」が追加属性として検出される。このスコア14が情報の属性スコア内訳712に表示されている。図7の検索条件702の表示枠において表示部703に表示される語句は、用語集DB203から適宜選択することができる。   For example, the phrase “crack” of the attribute “phenomenon” 431 in the information list 715 and the phrase “rebar” of the attribute “work type” 421 correspond to the above existing attributes. The title is also treated as an attribute, and the phrase “long building” is detected as an additional attribute by the annotation described above. This score 14 is displayed in the attribute score breakdown 712 of the information. Words displayed on the display unit 703 in the display frame of the search condition 702 in FIG. 7 can be appropriately selected from the glossary DB 203.

図8は、属性に対する語句の選択状態を示す図である。たとえば、属性の「工種」421としての語句は、表示部703に表示されている「鉄筋」だけではなく、ほかに「コンクリート」、「タイル仕上げ」などもある。これらの語句は用語集DB203場内部に、属性「工種」421に関連付けて保存されており、図示のように、属性「工種」421に関連するこれらの語句が用語集DB203から読み出され、この表示部703に、ドロップダウン表示部703aにより一覧表示可能である。特権ユーザは、属性毎に必要な語句をこのドロップダウン表示された語句のなかから一つ、あるいは複数選択して表示部703に設定することができる。これにより属性に対応する語句を間違いなく、簡単に設定することができる。   FIG. 8 is a diagram showing a selection state of words for attributes. For example, the phrase “work type” 421 of the attribute includes not only “rebar” displayed on the display unit 703 but also “concrete”, “tile finish”, and the like. These phrases are stored in the glossary DB 203 in association with the attribute “craft type” 421. As shown in the figure, these phrases related to the attribute “craft type” 421 are read from the glossary DB 203, A list can be displayed on the display unit 703 by a drop-down display unit 703a. The privileged user can select one or more words / phrases required for each attribute from the drop-down words and set them on the display unit 703. This makes it possible to easily and easily set a word or phrase corresponding to the attribute.

図9は、文書情報の提示画面を示す図である。一般ユーザ(工事事務所Dの担当者)が文書の検索を行い、不具合改善シート311を閲覧した際に表示される閲覧画面901である。図の左半部には、検索後の文書表示部902が設けられ、不具合改善シート311の内容が表示される。また、右半部には、属性一覧表示部903が設けられる。   FIG. 9 is a diagram illustrating a document information presentation screen. This is a browsing screen 901 displayed when a general user (a person in charge of the construction office D) searches for a document and browses the defect improvement sheet 311. In the left half of the figure, a post-search document display portion 902 is provided, and the contents of the defect improvement sheet 311 are displayed. An attribute list display unit 903 is provided on the right half.

属性一覧表示部903には、属性の一覧が表示される。各属性は選択可能であり、たとえば、図の例では、属性「工種」903aを選択した状態である。そして下部には、この属性「工種」に対応付けられている語句の一覧903cが表示される。この一覧903cには、文書表示部902に表示されている不具合改善シート311に含まれる語句と、カウント数が表示される。たとえば、語句「鉄筋、コンクリート」は、不具合改善シート311中で2個カウントされている。   The attribute list display unit 903 displays a list of attributes. Each attribute can be selected. For example, in the example shown in the figure, the attribute “work type” 903a is selected. In the lower part, a list 903c of words / phrases associated with the attribute “type of work” is displayed. In this list 903c, the words and counts included in the defect improvement sheet 311 displayed in the document display unit 902 and the count number are displayed. For example, the phrase “rebar, concrete” is counted twice in the defect improvement sheet 311.

また、文書表示部902に表示されている不具合改善シート311上には、この属性「工種」に対応する語句の部分が強調表示される(図中902a〜902cの部分)。強調表示は、図示の例では所定色のマーカーを用いて強調表示されているが、これに限らず、アンダーラインや、文字色を変更して強調表示することもできる。これにより、一般ユーザが文書表示部902の内容を読むとき、文書全体における不具合の語句の割合を容易に把握できるようになる。   In addition, on the defect improvement sheet 311 displayed in the document display unit 902, the word / phrase portion corresponding to the attribute “work type” is highlighted (portions 902a to 902c in the drawing). The highlighted display is highlighted using a marker of a predetermined color in the illustrated example. However, the highlighted display is not limited to this, and can be highlighted by changing the underline or the character color. As a result, when the general user reads the contents of the document display unit 902, the proportion of defective words in the entire document can be easily grasped.

また、属性一覧表示部903に表示されたほかの属性、たとえば「部位」を選択したときにおいても、この部位に対応する語句の一覧が属性一覧表示部903にカウント付けで表示され、また、文書表示部902の不具合改善シート311上では、属性「部位」に対応する語句の部分が強調表示される。このように、属性を変更することにより、同一の文書に対して異なる属性の語句を抽出して表示させることができる。この際、この「部位」の強調表示は、「工種」の強調表示に用いた色と異なる配色にしてもよい。さらには、属性一覧表示部903において属性として「すべて」903dを選択したときには、文書表示部902の不具合改善シート311上に、各属性別に異なる配色で強調表示することができる。   Even when another attribute displayed on the attribute list display unit 903, for example, “part” is selected, a list of words corresponding to this part is displayed on the attribute list display unit 903 with counting, and the document On the defect improvement sheet 311 of the display unit 902, the word / phrase portion corresponding to the attribute “part” is highlighted. In this way, by changing the attributes, it is possible to extract and display words with different attributes for the same document. At this time, the highlighting of the “part” may be a color scheme different from the color used for the highlighting of the “work type”. Furthermore, when “all” 903d is selected as the attribute in the attribute list display unit 903, it can be highlighted on the defect improvement sheet 311 of the document display unit 902 with a different color scheme for each attribute.

上記の説明では、文書情報提示装置100に既に格納されている文書(不具合改善シート311)を読み出して閲覧する際に、属性と語句を対応付け、用語集DB203を構築する構成とした。これに限らず、新たな文書が文書情報提示装置100に入力される都度、アノテーションを自動実行し、追加属性を自動検出する構成とし、複数回の文書入力毎に追加属性に対する属性と語句の割り当てを促す報知を行う構成としてもよい。   In the above description, when the document (defect improvement sheet 311) already stored in the document information presentation apparatus 100 is read and browsed, the terminology DB 203 is constructed by associating attributes and phrases. Not limited to this, each time a new document is input to the document information presentation apparatus 100, an annotation is automatically executed and an additional attribute is automatically detected, and an attribute and a phrase are assigned to the additional attribute every time a document is input a plurality of times. It is good also as a structure which performs alerting | reporting which prompts.

また、技術分野別等に文書の格納先を別領域に保存し、これら各文書DB毎に対応した複数の用語集DBを有する構成にもできる。これにより、単一の文書情報提示装置100を用いて複数の技術文書に対する上記の情報提示を切り替えて行えるようになる。   In addition, the document storage destination may be stored in a separate area for each technical field, and a plurality of glossary DBs corresponding to each document DB may be provided. As a result, the information presentation for a plurality of technical documents can be switched using the single document information presentation apparatus 100.

以上説明した実施の形態では、文書として建築現場における不具合を記載した不具合文書を例に説明したが他の業種における文書に対しても同様に用いることができる。たとえば、自動車、機械、電気機器、電子部品等の製造時における不具合文書にも適用できる他、技術文献等に適用して同様に文書内容の把握を容易に行えるようになる。   In the embodiment described above, the defect document describing the defect at the construction site is described as an example as a document. However, the document can be similarly used for documents in other industries. For example, the present invention can be applied to a defect document at the time of manufacturing an automobile, a machine, an electric device, an electronic component, and the like, and can be easily grasped similarly by applying to a technical document.

また、上記実施の形態では、単一の文書情報提示装置100を一般ユーザおよび特権ユーザが操作する構成例について説明したが、文書情報提示装置100はネットワークを介して一般ユーザおよび特権ユーザの端末装置に接続され、端末装置の操作に基づいて上述した文書情報の提示を行う構成とすることができる。   In the above embodiment, a configuration example in which a general user and a privileged user operate the single document information presentation device 100 has been described. However, the document information presentation device 100 is a terminal device for general users and privileged users via a network. The document information can be presented based on the operation of the terminal device.

なお、本実施の形態で説明した文書情報提示方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。   The document information presentation method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.

以上のように、本発明にかかる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置は、文書を構成する語句に属性を付与して検索時の条件とするコンピュータ装置により構成される検索装置に適している。   As described above, the document information presenting method, document information presenting program, and document information presenting apparatus according to the present invention include a search device configured by a computer device that assigns an attribute to a word constituting a document and uses it as a search condition. Suitable for

本実施の形態にかかる文書情報提示装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the document information presentation apparatus concerning this Embodiment. 本実施の形態にかかる文書情報提示装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the document information presentation apparatus concerning this Embodiment. 本発明による文書情報提示の全体の流れを示す概要図である。It is a schematic diagram which shows the whole flow of the document information presentation by this invention. 本発明による文書情報提示装置が行う内部処理を示すフローチャートである。It is a flowchart which shows the internal process which the document information presentation apparatus by this invention performs. 用語集DBに登録される不具合情報の内容を属性別に分類した図である。It is the figure which classified the content of the defect information registered into glossary DB according to the attribute. 文書情報提示装置に入力される文書のデータを示す図である。It is a figure which shows the data of the document input into a document information presentation apparatus. 文書情報提示装置が属性を付与した状態の内部データを示す図である。It is a figure which shows the internal data of the state to which the document information presentation apparatus provided the attribute. 用語集DB構築時に表示される検索条件設定画面を示す図である。It is a figure which shows the search condition setting screen displayed at the time of glossary DB construction. 属性に対する語句の選択状態を示す図である。It is a figure which shows the selection state of the phrase with respect to an attribute. 文書情報の提示画面を示す図である。It is a figure which shows the presentation screen of document information.

符号の説明Explanation of symbols

100 文書情報提示装置
101 CPU
102 ROM
103 RAM
201a 入力部
201b 操作部
202 検索部
203 用語集データベース
204 出力部
211 用語集構築部
221 属性付与部
222 追加属性検出部
223 重み設定部
224 検索条件作成部
100 Document Information Presentation Device 101 CPU
102 ROM
103 RAM
201a Input unit 201b Operation unit 202 Search unit 203 Glossary database 204 Output unit 211 Glossary construction unit 221 Attribute assignment unit 222 Additional attribute detection unit 223 Weight setting unit 224 Search condition creation unit

Claims (8)

文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示方法において、
前記語句に対応する前記属性を付与する属性付与工程と、
前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、
前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、
前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示方法。
In a document information presentation method for displaying a predetermined word constituting a document with a predetermined attribute when searching for the document,
An attribute assigning step for assigning the attribute corresponding to the word;
A registration step of registering the attribute and phrase information associated by the attribute assignment step in a glossary database referred to as a search condition at the time of search;
A display step for browsing and displaying a new document and displaying attributes corresponding to the words of the document displayed with reference to the glossary database;
An additional attribute detection step of detecting a word or phrase to which no attribute is given among the words included in the document displayed by the display step;
The document information presentation method characterized in that the attribute assigning step constructs the glossary database by assigning a new attribute to the phrase detected in the additional attribute detecting step.
前記属性付与工程は、前記新たな文書の閲覧表示の際に表示された語句に対して前記属性を付与することを特徴とする請求項1に記載の文書情報提示方法。   The document information presenting method according to claim 1, wherein the attribute assigning step assigns the attribute to a word displayed when the new document is browsed and displayed. 前記属性付与工程は、複数の前記属性別に所定の重み付けを設定し、
前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする請求項1または2に記載の文書情報提示方法。
The attribute assigning step sets a predetermined weight for each of the plurality of attributes,
3. The document information presentation method according to claim 1, wherein the registration step registers the attribute to which the weight is given in the glossary database.
入力された複数の前記文書を保存する文書保存工程を含み、
前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする請求項1〜3のいずれか一つに記載の文書情報提示方法。
Including a document storage step of storing a plurality of the input documents,
The attribute assignment step reflects the addition of the attribute to the word / phrase included in the other document with respect to the other stored document. The document information presentation method according to one.
前記表示工程は、前記検索時に、前記重み付けされた前記属性に対応する語句が含まれる割合が高い前記文書を優先的に表示させることを特徴とする請求項1〜4のいずれか一つに記載の文書情報提示方法。   5. The display step according to claim 1, wherein at the time of the search, the document having a high ratio including a word / phrase corresponding to the weighted attribute is preferentially displayed. Document information presentation method. 前記表示工程は、前記文書を構成する語句のうち前記属性が付与された語句を、当該属性別に強調表示させることを特徴とする請求項1〜4のいずれか一つに記載の文書情報提示方法。   5. The document information presentation method according to claim 1, wherein, in the display step, a word / phrase to which the attribute is given among words / phrases constituting the document is highlighted for each attribute. . 請求項1〜6のいずれか一つに記載の方法をコンピュータに実行させることを特徴とする文書情報提示プログラム。   A document information presentation program for causing a computer to execute the method according to any one of claims 1 to 6. 文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示装置において、
前記語句に対応する前記属性を付与する属性付与手段と、
前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、
前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、
前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示装置。
In a document information presentation device for displaying a predetermined word constituting a document with a predetermined attribute when searching for the document,
Attribute assigning means for assigning the attribute corresponding to the word;
Registration means for registering attribute and phrase information associated with the attribute assigning means in a glossary database;
Display means for displaying a new document and displaying attributes corresponding to the words of the document displayed with reference to the glossary database;
An additional attribute detecting means for detecting a word / phrase to which no attribute is given among words / phrases included in the document displayed by the display means;
The document information presentation apparatus, wherein the attribute assigning unit constructs the glossary database by adding a new attribute to the phrase detected by the additional attribute detecting unit.
JP2008038056A 2008-02-19 2008-02-19 Document information presentation method, document information presentation program and document information presentation apparatus Pending JP2009199192A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008038056A JP2009199192A (en) 2008-02-19 2008-02-19 Document information presentation method, document information presentation program and document information presentation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008038056A JP2009199192A (en) 2008-02-19 2008-02-19 Document information presentation method, document information presentation program and document information presentation apparatus

Publications (1)

Publication Number Publication Date
JP2009199192A true JP2009199192A (en) 2009-09-03

Family

ID=41142643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008038056A Pending JP2009199192A (en) 2008-02-19 2008-02-19 Document information presentation method, document information presentation program and document information presentation apparatus

Country Status (1)

Country Link
JP (1) JP2009199192A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543999A (en) * 2010-10-08 2013-12-09 エムモーダル アイピー エルエルシー Structured search of dynamic structured document corpus
US9659055B2 (en) 2010-10-08 2017-05-23 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
JP2022000772A (en) * 2017-11-28 2022-01-04 富士フイルムビジネスイノベーション株式会社 Document processing apparatus and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090110A (en) * 1998-09-11 2000-03-31 Nippon Telegr & Teleph Corp <Ntt> Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program
JP2004362451A (en) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> Method and system for displaying retrieving keyword information, and retrieving keyword information display program
WO2005096182A1 (en) * 2004-03-31 2005-10-13 Matsushita Electric Industrial Co., Ltd. Information extraction system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090110A (en) * 1998-09-11 2000-03-31 Nippon Telegr & Teleph Corp <Ntt> Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program
JP2004362451A (en) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> Method and system for displaying retrieving keyword information, and retrieving keyword information display program
WO2005096182A1 (en) * 2004-03-31 2005-10-13 Matsushita Electric Industrial Co., Ltd. Information extraction system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543999A (en) * 2010-10-08 2013-12-09 エムモーダル アイピー エルエルシー Structured search of dynamic structured document corpus
US9659055B2 (en) 2010-10-08 2017-05-23 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
JP2022000772A (en) * 2017-11-28 2022-01-04 富士フイルムビジネスイノベーション株式会社 Document processing apparatus and program

Similar Documents

Publication Publication Date Title
US8615716B2 (en) Content display control apparatus and content display control method
JP2006344010A (en) Document retrieval device
JP2007317034A (en) Image processing apparatus, image processing method, program, and recording medium
JP5494493B2 (en) Information search apparatus, information search method, and program
JP5448412B2 (en) Information processing apparatus and method, program, and recording medium
JP2009140361A (en) Data-managing device and data-processing method
US7346673B1 (en) Method and apparatus for selecting a device and a computer product
JP5950357B2 (en) Information management apparatus, information management method and program
WO2016124097A1 (en) Text retrieval method and apparatus
JP2008310514A (en) User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program
JP4084647B2 (en) Information search system, information search method, and information search program
JP2009199192A (en) Document information presentation method, document information presentation program and document information presentation apparatus
JP2005267597A (en) Taxonomy display device, taxonomy displaying method, and taxonomy display program
WO2009136529A1 (en) Work process management device, work process management method, and work process management program
US20050144179A1 (en) Method and apparatus for document-analysis, and computer product
JPWO2004031956A1 (en) Related information management method, program, and apparatus
JP4406028B2 (en) Data presentation device, data presentation program, and data presentation method
JP3016691B2 (en) Data search condition setting method
JP4423385B2 (en) Document classification support apparatus and computer program
JP2007233752A (en) Retrieval device, computer program and recording medium
JP4713098B2 (en) Selection item display device, selection item display method, and selection item display program
JP2009199164A (en) Document management device, document management method and recording medium
JP4446715B2 (en) Document search device, document search method, and document search program
JP2000163439A (en) Device and method for electronic file retrieval
JPH10162011A (en) Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130205