JP2009199192A - Document information presentation method, document information presentation program and document information presentation apparatus - Google Patents
Document information presentation method, document information presentation program and document information presentation apparatus Download PDFInfo
- Publication number
- JP2009199192A JP2009199192A JP2008038056A JP2008038056A JP2009199192A JP 2009199192 A JP2009199192 A JP 2009199192A JP 2008038056 A JP2008038056 A JP 2008038056A JP 2008038056 A JP2008038056 A JP 2008038056A JP 2009199192 A JP2009199192 A JP 2009199192A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- document
- information presentation
- phrase
- document information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
この発明は、文書に対し、語句単位で属性を付与し、語句に対する属性の提示を行うことにより、文書の情報の把握を支援する文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置に関する。 The present invention relates to a document information presenting method, a document information presenting program, and a document information presenting apparatus that support grasping of document information by assigning attributes to a document in units of words and presenting attributes for the words.
従来、ユーザが検索装置等を用いて技術文書の内容を参照する際に、あらかじめ語句毎に定めた属性別に語句を振り分けることにより、語句に付された属性が判るとともに、属性別の語句を抽出でき、技術文書の参照を支援することができるようになっている。 Conventionally, when a user refers to the contents of a technical document using a search device or the like, the attributes assigned to the phrases can be identified and the phrases for each attribute can be extracted by sorting the phrases according to the attributes determined in advance for each phrase. It is possible to support reference of technical documents.
たとえば、建築用の技術文書を例に取ると、あらかじめ属性として、建物、工程等の各属性を定めることができ、これらの属性が付与された語句を技術文書のなかから抽出できる。技術文書のなかからユーザが属性を指定することにより、この属性に対応する語句を提示するため、ユーザは、長文の技術文書に記載されたなかから必要な情報を属性を基に簡単に把握できるようになる。このように、文書に付加情報を付与する方法としてアノテーションが用いられ、表示処理システム等に適用されている(たとえば、下記特許文献1参照。)。 For example, taking a technical document for construction as an example, each attribute such as a building and a process can be defined in advance as attributes, and a phrase to which these attributes are assigned can be extracted from the technical document. When the user specifies an attribute from the technical document, a word corresponding to this attribute is presented, so that the user can easily grasp the necessary information from the long technical document based on the attribute. become. As described above, annotation is used as a method of adding additional information to a document, and is applied to a display processing system or the like (see, for example, Patent Document 1 below).
しかしながら、語句に付与された属性は、一度付与されたまま運用されていた。この場合、技術の進歩等で文書の内容に変化が生じ使用される語句が異なってきた場合、特に、新たな文書に新たな語句が登場してもこの新たな語句に対して適切な属性の付与が行えず、文書閲覧時における属性の提示を適切に行えなかった。 However, the attribute assigned to the phrase has been used once assigned. In this case, due to changes in the content of the document due to technological progress, etc., the words and phrases used will differ. In particular, even if a new word appears in a new document, an appropriate attribute for the new word will be displayed. Assignment was not possible, and attributes were not properly presented when viewing documents.
また、新たな語句が生じたとき、この語句が記載されている文書に対して新たな属性を付与するだけでは、関連する他の文書に記載された同様の語句に対する属性についてもそれぞれ個別に付与する作業が必要となった。 In addition, when a new word or phrase is generated, simply assigning a new attribute to the document in which this word is described, the attributes for similar words and phrases described in other related documents are also individually assigned. It was necessary to work.
この発明は、上述した従来技術による問題点を解消するため、属性が付与されていない新たな語句に対する属性を容易に付与することができ、新規の語句を含む新たな文書および既存の文書における属性付与を容易に行うことができる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置を提供することを目的とする。 In order to solve the above-described problems caused by the prior art, the present invention can easily give an attribute to a new word / phrase to which no attribute is given, and a new document including a new word / phrase and an attribute in an existing document. It is an object of the present invention to provide a document information presentation method, a document information presentation program, and a document information presentation device that can be given easily.
上述した課題を解決し、目的を達成するため、この発明にかかる文書情報提示方法は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示方法において、前記語句に対応する前記属性を付与する属性付与工程と、前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。 In order to solve the above-described problems and achieve the object, the document information presentation method according to the present invention provides document information presentation that displays a predetermined word with a predetermined attribute for a predetermined word or phrase constituting the document when searching for the document. In the method, an attribute assigning step for assigning the attribute corresponding to the word, and registration for registering the attribute and the phrase information associated by the attribute assigning step in a glossary database referred to as a search condition at the time of search A display step for displaying a new document and displaying an attribute corresponding to the phrase of the document displayed with reference to the glossary database; and the document displayed by the display step. And an additional attribute detection step of detecting a phrase to which no attribute is given among the included words, wherein the attribute addition step is performed in the additional attribute detection step. By applying a new attribute for the detected words, characterized by constructing the lexicon database.
この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。 According to this invention, a phrase to which no attribute is assigned can be detected by the additional attribute detection process, and the attribute assignment process gives a new attribute for the detected phrase. As a result, a glossary database can be constructed, and it becomes possible to cope with changes in terms included in a new document.
また、前記属性付与工程は、前記新たな文書の閲覧表示の際に表示された語句に対して前記属性を付与することを特徴とする。 Further, the attribute assigning step is characterized in that the attribute is assigned to a word displayed when the new document is browsed and displayed.
この発明によれば、新規文書の語句に対する属性の付与を容易に行うことができるようになる。 According to the present invention, it is possible to easily assign an attribute to a phrase of a new document.
また、前記属性付与工程は、複数の前記属性別に所定の重み付けを設定し、前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする。 Further, the attribute assigning step sets a predetermined weight for each of the plurality of attributes, and the registration step registers the attribute to which the weight is given in the glossary database.
この発明によれば、属性に重みを付与できるため、検索時に指定した属性に対応する語句が多く含まれる文書を優先的に検索結果として得ることができるようになる。 According to the present invention, since a weight can be given to an attribute, a document containing many words corresponding to the attribute specified at the time of search can be obtained as a search result preferentially.
また、入力された複数の前記文書を保存する文書保存工程を含み、前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする。 In addition, the document storing step of storing the plurality of input documents, the attribute assigning step, for the other stored document, the attribute for the word or phrase included in the other document It is characterized by reflecting the provision of.
この発明によれば、新規の文書の語句に対する属性の付与を行うと、この新規の文書だけに限らず、保存されている他の文書の語句に対しても属性を付与でき、保存されている文書全体に対して一括して属性の変更が行える。 According to the present invention, when an attribute is assigned to a word / phrase of a new document, the attribute can be assigned not only to the new document but also to a word / phrase of another saved document. You can change attributes for the entire document at once.
また、前記表示工程は、前記検索時に、前記重み付けされた前記属性に対応する語句が含まれる割合が高い前記文書を優先的に表示させることを特徴とする。 The display step may preferentially display the document having a high ratio of words / phrases corresponding to the weighted attributes at the time of the search.
この発明によれば、検索時の検索結果として適切な文書が優先的に表示されるため、ユーザが所望する文書を提示できるようになる。 According to the present invention, since an appropriate document is preferentially displayed as a search result at the time of search, a user's desired document can be presented.
また、前記表示工程は、前記文書を構成する語句のうち前記属性が付与された語句を、当該属性別に強調表示させることを特徴とする。 Further, the display step is characterized in that words / phrases to which the attribute is given among words / phrases constituting the document are highlighted for each attribute.
この発明によれば、検索後の文書閲覧時において、文書中に記載されている語句の属性を容易に把握することができ、文書中における属性の割合についても容易に把握できるようになる。 According to the present invention, at the time of browsing a document after retrieval, it is possible to easily grasp the attributes of words and phrases described in the document, and to easily grasp the ratio of the attributes in the document.
また、この発明にかかる文書情報提示プログラムによれば、上記の文書情報提示方法をコンピュータに実行させることができる。 Moreover, according to the document information presentation program concerning this invention, a computer can perform said document information presentation method.
また、この発明の文書情報提供装置は、文書の検索時に当該文書を構成する所定の語句に対し、所定の属性を付与して表示する文書情報提示装置において、前記語句に対応する前記属性を付与する属性付与手段と、前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする。 Further, the document information providing apparatus of the present invention provides the attribute corresponding to the word / phrase in the document information presenting apparatus for displaying a predetermined word / phrase constituting the document with a predetermined attribute when searching for the document. Attribute assigning means, registration means for registering attribute and phrase information associated with the attribute assigning means in the glossary database, browsing and displaying a new document, and displaying with reference to the glossary database Display means for displaying an attribute corresponding to a word of the document being added, and additional attribute detection means for detecting a word to which no attribute is given among words contained in the document displayed by the display means And the attribute assigning means assigns a new attribute to the phrase detected by the additional attribute detecting means, thereby providing the glossary database. Characterized in that it build.
この発明によれば、属性が付与されていない語句が追加属性検出工程により検出でき、この検出された語句に対する新たな属性を属性付与工程が付与する。これにより、用語集データベースを構築していくことができ、新規文書に含まれる語句の変化に対応できるようになる。 According to this invention, a phrase to which no attribute is assigned can be detected by the additional attribute detection process, and the attribute assignment process gives a new attribute for the detected phrase. As a result, a glossary database can be constructed, and it becomes possible to cope with changes in terms included in a new document.
本発明によれば、属性が付与されていない新たな語句に対する属性を容易に付与することができ、検索時に参照される用語集データベースを構築していくことができ、適切な文書を検索でき、閲覧用として適切な情報を提示できるという効果を奏する。 According to the present invention, it is possible to easily give an attribute to a new phrase that has not been given an attribute, to build a glossary database that is referred to at the time of searching, and to search for an appropriate document, There is an effect that appropriate information can be presented for browsing.
以下に添付図面を参照して、この発明にかかる文書情報提示装置、文書情報提示方法お
よび文書情報提示プログラムの好適な実施の形態を詳細に説明する。
Exemplary embodiments of a document information presentation device, a document information presentation method, and a document information presentation program according to the present invention will be explained below in detail with reference to the accompanying drawings.
(文書情報提示装置のハードウェア構成)
まず、この発明の実施の形態にかかる文書情報提示装置のハードウェア構成について説明する。図1は、本実施の形態にかかる文書情報提示装置のハードウェア構成を示すブロック図である。図1のように、文書情報提示装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、FD(フレキシブルディスク)107と、CD−RWD(CD−RWドライブ)108と、CD−RW109と、ディスプレイ110と、キーボード111と、マウス112と、ネットワークI/F113とを含んで構成されている。なお、上記の各構成101〜113は、それぞれバス120に接続されている。また、ネットワークI/F(インターフェース)113には、NET(ネットワーク)に接続するための通信ケーブル114が備えられている。
(Hardware configuration of document information presentation device)
First, the hardware configuration of the document information presentation apparatus according to the embodiment of the present invention will be described. FIG. 1 is a block diagram showing a hardware configuration of the document information presentation apparatus according to the present embodiment. As shown in FIG. 1, a document
上述のような構成の文書情報提示装置100において、CPU101は、文書情報提示装置100全体を制御する。また、ROM102は、基本入出力プログラムや、本発明にかかる文書情報提示プログラムを記憶している。ROM102に記憶されたCPU101からの制御に応じて読み出しされ実行される。また、RAM103は、CPU101のワークエリアとして使用される。
In the document
HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御にしたがって書き込まれたデータを記憶する記憶媒体である。また、HD105に記憶されたデータは、HDD104の制御に応じて適宜読み出される。
The
FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御にしたがって書き込まれたデータを記憶する着脱自在の記憶媒体である。また、FD107に記録されたデータは、FDD106の制御に応じて適宜読み出される。
The FDD 106 controls reading / writing of data with respect to the
CD−RWD108は、CPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御する。CD−RW109は、CD−RWD108の制御にしたがって書き込まれたデータを記憶する着脱自在な記憶媒体である。また、CD−RW109に記録されたデータは、CD−RWD108の制御に応じて適宜読み出される。
The CD-
ディスプレイ110は、CPU101の制御によって、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。また、キーボード111は、文字、数値、各種指示などの入力のための複数のキーを備えた入力ディバイスであり、マウス112は、各種指示の選択や実行、処理対象の選択、マウスポインタの移動などを行うポインティングディバイスである。
The
ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。
A network I /
本実施の形態にかかる文書情報提示装置100は、上述したようなハードウェアを備えており、CPU101の制御によりROM102に記憶された文書情報提示プログラムを実行することにより、ユーザが検索により閲覧した文書の内容と、文書把握のための情報を提示する。
The document
(文書情報提示装置の機能的構成)
次に、文書情報提示装置100の機能的構成について説明する。図2は、本実施の形態にかかる文書情報提示装置の機能的構成を示すブロック図である。図2に示す文書情報提示装置100は、入力部201aと、操作部201bと、検索部202と、用語集データベース(DB)203と、出力部204とを備えている。
(Functional configuration of document information presentation device)
Next, a functional configuration of the document
入力部201aには、対象となる文書のデータが入力される。文書のデータは、たとえば汎用のワープロにより作成されたものが入力され、この文書のデータは、複数の語句(単語)によって構成されている。この入力部201aを介して複数の文書のデータが文書情報提示装置100に保存されていく。操作部201bは、一般ユーザによる文書のデータの検索と閲覧時、および特権ユーザによる用語集DB203の構築時の操作用として設けられる。
Data of the target document is input to the
検索部202は、検索時の検索要求を受けて検索条件に適合した文書の検索を行う。この検索の際、文書に含まれた語句が、用語集DB203に設定、登録されている属性のどれに属するかを併せて提示する。検索部202は、不図示の検索エンジンと、用語集の構築に用いる用語集構築部211と、検索結果を提示するとともに、語句と属性の対応関係を提示する属性提示部212によって構成されている。
The
用語集構築部211は、文書に記述されている語句に対応した属性を付与(追加、修正削除を含む)し、用語集DB203を構築していくための機能部である。この用語集構築部211は、属性付与部221と、追加属性検出部222と、重み設定部223と、検索条件作成部224とによって構成されている。属性付与部221は、既に用語集DB203に登録されている属性があればこの属性を用いて、文書の語句単位でこの語句に対応した属性を付与する。語句に対する属性の付与はアノテーションの技術が利用される。
The
追加属性検出部222は、属性付与部221のアノテーション実行により付与されなかった属性の語句を検出する。用語集DB203がまだ構築されていない初期時には、アノテーションを行うと、文書に含まれる大部分の語句について、追加属性検出部222が属性未付与の語句を検出することになる。検出された新たな属性の語句は、属性付与部221によって新たな属性として付与することができる。属性付与の具体例については後述する。
The additional
重み設定部223は、属性付与部221が有する属性別に、文書の検索時における重要度の重み付けを行う。検索条件作成部224は、用語集DB203に対し、重み付け後の各属性別の語句を登録する。この登録により、用語集DB203が構築されていく。
The
属性提示部212は、文書の閲覧時に機能する。この際、用語集DB203を参照して、文書のデータに含まれる語句に対する属性に基づいて、検索条件に適合した文書から順に優先的に表示する等の処理が行える。また、選択された文書の情報と、この文書に含まれる語句のうち、検索条件として設定された属性に該当する語句、および属性は、出力部204を介して検索要求したユーザに提示される。これらの内容の詳細は後述する。
The
上記構成の検索部202の機能は、図1に記載のROM102、RAM103、HDD104等に記憶されたプログラムをCPU101が実行することによってその機能を実現する。入力部201aによる、文書のデータの入力は、図1に記載のFDD106、CD−RW109、ネットワークI/F113を介して入力して機能を実現できる。また、操作部201bの機能は、キーボード111、マウス112により実現できる。この際、属性付与部221において新たに付与する属性名の入力と、重み設定部223における属性別の重み付け設定、属性付与部221において提示する文書と属性の設定は、キーボード111、マウス112の操作により行うことができる。出力部204の機能は、図1に記載のディスプレイ110によってその機能を実現する。用語集DB203は、図1に記載のHDD104等によってその機能を実現する。
The function of the
(文書情報提示の手順について)
図3−1は、本発明による文書情報提示の全体の流れを示す概要図である。以下の説明では、上記説明の文書として、建築現場における不具合を記載した不具合文書を例に説明する。この不具合文書は、一般ユーザである生産支援部門Cや、工事事務所A,Dが行う現場での施工に有効な情報である。
(About document information presentation procedure)
FIG. 3A is a schematic diagram showing the overall flow of document information presentation according to the present invention. In the following description, a defect document that describes a defect at a building site will be described as an example of the document described above. This defect document is information that is effective for construction on site performed by the production support department C, which is a general user, and the construction offices A and D.
まず、工事事務所Aの担当者が工事中に発生した不具合を特権ユーザである品質管理部門Bに報告する(ステップS301)。この不具合報告は、工事事務所Aの担当者あるいは品質管理部門Bの担当者が汎用のワープロ等を用いて文書データ310として作成する。品質管理部門Bでは、この文書データ310を、文書検索時における文書情報(属性)提示のための処理に有用なデータ形式に変換して不具合改善シート311を作成する(ステップS302)。この不具合改善シート311は、作成される都度、文書情報提示装置100に入力される(ステップS303)。この作業を繰り返すことにより、文書情報提示装置100には、多数の不具合改善シートが文書のデータベース(DB)として保存される(不図示)。
First, a person in charge at the construction office A reports a defect occurring during construction to the quality control department B, which is a privileged user (step S301). This trouble report is created as
一般ユーザである生産支援部門Cあるいは工事事務所Dの担当者は、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる(ステップS304)。この際、文書情報提示装置100は、用語集DB203を参照して、不具合改善シート311に含まれている語句毎に検索用の属性を付与して提示する。この属性は、不具合に関連する語句に対し付与されている。
A person in charge of the production support department C or the construction office D who is a general user can operate the document
この閲覧時に不具合改善シート311の語句に付与された属性を把握することができる。すなわち、工事事務所Dの担当者は、この不具合改善シート311を読む際に、不具合に関する語句の提示を受け、以降の工事作業時の参考にできる。
It is possible to grasp the attribute given to the word / phrase of the
また、特権ユーザである品質管理部門Bの担当者についても、文書情報提示装置100を操作し、登録されている不具合改善シート311を検索し、内容を閲覧することができる。この閲覧時に、不具合改善シート311の語句に対し属性を付与することができる(ステップS305)。語句に対する属性の付与を行うことにより用語集DB203を構築することができる(ステップS305)。
Further, the person in charge of the quality control department B who is a privileged user can also operate the document
図3−2は、本発明による文書情報提示装置が行う内部処理を示すフローチャートである。文書情報提示装置100は、文書である不具合改善シート311を多数保持しており、一般ユーザ(上述の工事事務所Dの担当者)が検索および閲覧できる。また、特権ユーザ(上述の品質管理部門Bの担当者)による用語集DB203の構築が行われる。文書情報提示装置100は、ログイン時に一般ユーザであるか、特権ユーザであるかを判断し、それぞれ個別の処理を行う。
FIG. 3-2 is a flowchart showing internal processing performed by the document information presentation apparatus according to the present invention. The document
まず、一般ユーザ(上述の工事事務所Dの担当者等)に対する処理の流れを説明する。一般ユーザは、検索クエリを作成する(ステップS321)。具体的には、必要な属性を入力し、文書情報提示装置100に入力する。文書情報提示装置100は、この属性に該当する語句が含まれる不具合改善シート311を検索し、用語集DB203を参照して検索結果として適しているものを検索結果一覧として出力する(ステップS322)。この際、複数の不具合改善シート311を後述するランキングコントロールを行ったスコア値の高いものから優先的に出力することができる。
First, a flow of processing for a general user (a person in charge of the construction office D described above) will be described. The general user creates a search query (step S321). Specifically, necessary attributes are input and input to the document
そして、一覧のなかから選択した文書について閲覧のための表示を行う(ステップS323)。この閲覧の際、所望する属性の語句が記載された不具合改善シート311を閲覧することができるようになり、この不具合の内容を確認して以降の作業に有効利用できるようになる。
Then, display for browsing the document selected from the list is performed (step S323). At the time of browsing, it becomes possible to browse the
次に、特権ユーザ(上述の品質管理部門Bの担当者)に対する処理の流れを説明する。特権ユーザにおいても、ステップS321〜ステップS323までの処理の流れは同じである。そして、閲覧した、ある一つの文書(不具合改善シート311)に対し、上述したアノテーションを加える(ステップS324)。このアノテーションの際に、用語集DB203を参照し、この用語集DB203に登録されている、語句と属性の関係を表示することができる。そして、特権ユーザにより、表示されている語句と属性の関係を追加、修正することにより、検索結果のチューニングが行える。
Next, a processing flow for a privileged user (a person in charge of the above-described quality control department B) will be described. Even for privileged users, the flow of processing from step S321 to step S323 is the same. And the annotation mentioned above is added with respect to one document (defect improvement sheet 311) browsed (step S324). At the time of this annotation, the
たとえば、追加属性検出部222により、語句に対する属性の設定が登録されていない場合、新たな属性が検出され、属性付与部221により任意の属性を追加して付与することができる。修正の場合、語句に対する属性自体の変更、および後述する重み付けの変更等が行える。
For example, when the attribute setting for the phrase is not registered by the additional
これら語句と属性の関係を設定することにより、アノテーション内容を文書情報提示装置100に格納されている文書DB全体(複数の不具合改善シート311)における語句と属性の関係の変更に反映させる(ステップS325)。この処理は、複数の不具合改善シート311に記述されている文字列一致を判断して処理できる。そして、用語集DB203に保存される語句と属性の関係についても設定され、用語集DB203が生成される(ステップS326)。特権ユーザによる次回以降の文書閲覧時には、この新たな用語集DB203を用いたアノテーションが行われることになる。以上説明した特権ユーザによる処理を何度も重ねていくほど、用語集DB203の語句と属性の関係を生成していくことができ、用語集DB203の構築できる。
By setting the relationship between the phrase and the attribute, the annotation content is reflected in the change in the relationship between the phrase and the attribute in the entire document DB (a plurality of defect improvement sheets 311) stored in the document information presentation apparatus 100 (step S325). ). This process can be performed by determining matching of character strings described in the plurality of
(用語集DBの構築の具体例)
次に、用語集DB203の構築について説明する。用語集DB203には、不具合情報として複数の属性が登録される。図4は、用語集DBに登録される不具合情報の内容を属性別に分類した図である。
(Specific example of glossary database construction)
Next, the construction of the
図示のように、建築の工事に関する不具合情報は、大きく分けて建物、工程、不具合、評価の各分類項目401〜404に分類される。各分類項目401〜404は、それぞれ上記の属性を有している。
As shown in the drawing, defect information related to construction work is roughly classified into building, process, defect, and
建物の分類項目401には、構造411、延床面積412、用途413等が属性としてそれぞれ設定されている。工程の分類項目402には、工種421、部位422、材料423等が属性としてそれぞれ設定されている。不具合の分類項目403には、現象431、概要432、原因433、処置434、対策435等が属性としてそれぞれ設定されている。評価の分類項目404には、重要指定441等が属性として設定されている。図4の記載では、便宜上、分類項目別の表記としてあるが、XML等の階層データ形式で記述されている。
In the
図5は、文書情報提示装置に入力される文書のデータを示す図である。図示のように、入力される文書のデータである不具合改善シート311には、過去の建築作業時に発生した不具合に関する情報として、ある不具合の原因、について記述されている。
FIG. 5 is a diagram showing document data input to the document information presentation apparatus. As shown in the figure, the
図6は、文書情報提示装置が属性を付与した状態の内部データを示す図である。文書の情報は、図5と同様であるが(一部省略)、アノテーションにより、不具合を示す語句と、この語句の属性とが対応付けられた状態が示されている。たとえば、「外壁」という語句601については、用語集DB203にあらかじめ属性が「部位」(図4の符号422)として登録されているため、この属性「部位」に語句「外壁」が属すると判断処理されている。この処理は、図2に記載の属性付与部221が実行する。
FIG. 6 is a diagram illustrating internal data in a state where the document information presentation device has attributes. The document information is the same as in FIG. 5 (partially omitted), but the annotation indicates a state in which a word indicating a defect is associated with an attribute of the word. For example, since the
なお、図示の例では、属性「ピックアップ」610とは、用語集DB203に登録されていない属性である。アノテーションの実行により、どの属性にも属していない新たな用語のうち、不具合に関する語句である「拘束」602は、適当な仮の属性(上記例では「」ピックアップ」610)に属するものと判断され、提示される。この処理は、図2に記載の追加属性検出部222が実行する。この後、この「拘束」602について、新たな属性として設定するかどうかは、不具合改善シート311を管理する品質管理部門Bの担当者が決定する。この「拘束」602について、新たな属性として設定する場合には、属性付与部221に対し、「拘束」602に該当する属性を新たに設定することにより、用語集DB203に新たな属性が登録される。
In the illustrated example, the attribute “pickup” 610 is an attribute that is not registered in the
図7は、用語集DB構築時に表示される検索条件設定画面を示す図である。用語集の構築は、特権ユーザ(品質管理部門Bの担当者)が不具合改善シート311を閲覧しながら行う。この担当者に対して図7に示す設定画面701が表示される。図示の左上には、検索条件702が表示される。この検索条件702は、用語集DB203に既に登録されている属性(既存属性)と、用語集DB203に登録されていない属性(追加属性)とからなる。
FIG. 7 is a diagram showing a search condition setting screen displayed when the glossary DB is constructed. The glossary is constructed while a privileged user (person in charge of the quality control department B) browses the
たとえば、既存属性としては、工種421の属性に属する語句として、閲覧している不具合改善シート311に記載されている「鉄筋」が表示されている。追加属性としては、たとえば、図6を用いて説明した仮属性の「ピックアップ」610に属する語句「誘発目地」がある。図示のように、不具合改善シート311に記載されている語句のうち、各属性に対応する語句が表示部703に表示されるようになっている。
For example, as the existing attribute, “rebar” described in the currently viewed
これらの属性一覧は、一般ユーザ(工事事務所Dの担当者)が文書である不具合改善シート311の検索時に適した文書(必要とする不具合が記載されている文書)を検索する際の検索処理に用いられる。検索後においては、語句毎に付与された属性がこの一般ユーザに情報提示される。 These attribute lists are searched when a general user (person in charge of the construction office D) searches for a document suitable for searching the defect improvement sheet 311 (document in which a necessary defect is described). Used for. After the search, the attribute given to each word is presented to the general user as information.
加えて、この検索条件702に表示されている属性別に重み付けの係数704を設定することができる(ランキングコントロール)。重み付けを重く設定した属性ほど該当する語句の重要度を高くできる。図示の例では、属性「工種」421の語句「鉄筋」に対して40、属性「現象」431の語句「ひびわれ」に対しては50、属性「自然現象」(仮の属性設定状態)の語句「乾燥収縮」に対して50、属性未定状態(追加属性)「長い建物」、「誘発目地」に対して50という重み付けを行った状態である。この重み付け(0〜100までの任意の数値)は、文書である不具合改善シート311を検索する際に、重み付けが重い属性に該当する語句が多く含まれる不具合改善シート311を優先的に一般ユーザに提示するために行われる。
In addition, a
図7の右上には、属性スコア内訳712が表示される。この属性スコア内訳712は、検索条件702によって重み付けされた属性別のスコアである。この属性スコア内訳712の左半部の数値表示部713には、各属性と重み付け後における全体に占める割合(%)が数値表示される。たとえば、属性の「工種」421は28%、「現象」431および「自然現象」はそれぞれ35%である。属性スコア内訳712の右半部のグラフ表示部714には、左半部の数値がグラフ化して表示される。図示の例では円グラフとしたが、グラフの形態はこれに限らずバーグラフ等他の形態であってもよい。
An
図7の下半部には、複数の不具合改善シート311の情報一覧715が表示される。図示の例では、3タイトル分の不具合改善シート311だけしか表示されていないが、スクロールバーの操作により、ランキングが低い他の不具合改善シート311を表示させることもできる。うち、ランキングが高い最上部の不具合改善シート311{タイトル:デッキ合成床のひびわれ(施工中)}がスコア15であり、最も高いスコアである。以下スコア順に下方に表示される。このように、検索結果として、ランキングが高い属性に対応する語句が含まれる割合が高い文書(不具合改善シート311)を優先的(上部位置)に表示させることができる。
In the lower half of FIG. 7, an
2番目に表示されている不具合改善シート311{タイトル:長い建物の外壁のひびわれ、スコア14}は、選択されてチェックマーク716が付いており、この不具合改善シート311の記載における属性(現象、部位、工種、用途、タイトル等)毎の語句が抽出して表示されている。なお、図7の上半部に表示されている検索条件702と、属性スコア内訳712のそれぞれの内容は、この選択された2番目の不具合改善シート311に関する情報である。
The second defect improvement sheet 311 {Title: Crack of outer wall of long building, score 14} is selected and has a
たとえば、この情報一覧715の属性「現象」431の語句「ひびわれ」と、属性「工種」421の語句「鉄筋」は上記の既存属性に相当する。また、タイトルについても属性として扱い、上述したアノテーションにより語句「長い建物」が追加属性として検出される。このスコア14が情報の属性スコア内訳712に表示されている。図7の検索条件702の表示枠において表示部703に表示される語句は、用語集DB203から適宜選択することができる。
For example, the phrase “crack” of the attribute “phenomenon” 431 in the
図8は、属性に対する語句の選択状態を示す図である。たとえば、属性の「工種」421としての語句は、表示部703に表示されている「鉄筋」だけではなく、ほかに「コンクリート」、「タイル仕上げ」などもある。これらの語句は用語集DB203場内部に、属性「工種」421に関連付けて保存されており、図示のように、属性「工種」421に関連するこれらの語句が用語集DB203から読み出され、この表示部703に、ドロップダウン表示部703aにより一覧表示可能である。特権ユーザは、属性毎に必要な語句をこのドロップダウン表示された語句のなかから一つ、あるいは複数選択して表示部703に設定することができる。これにより属性に対応する語句を間違いなく、簡単に設定することができる。
FIG. 8 is a diagram showing a selection state of words for attributes. For example, the phrase “work type” 421 of the attribute includes not only “rebar” displayed on the
図9は、文書情報の提示画面を示す図である。一般ユーザ(工事事務所Dの担当者)が文書の検索を行い、不具合改善シート311を閲覧した際に表示される閲覧画面901である。図の左半部には、検索後の文書表示部902が設けられ、不具合改善シート311の内容が表示される。また、右半部には、属性一覧表示部903が設けられる。
FIG. 9 is a diagram illustrating a document information presentation screen. This is a
属性一覧表示部903には、属性の一覧が表示される。各属性は選択可能であり、たとえば、図の例では、属性「工種」903aを選択した状態である。そして下部には、この属性「工種」に対応付けられている語句の一覧903cが表示される。この一覧903cには、文書表示部902に表示されている不具合改善シート311に含まれる語句と、カウント数が表示される。たとえば、語句「鉄筋、コンクリート」は、不具合改善シート311中で2個カウントされている。
The attribute
また、文書表示部902に表示されている不具合改善シート311上には、この属性「工種」に対応する語句の部分が強調表示される(図中902a〜902cの部分)。強調表示は、図示の例では所定色のマーカーを用いて強調表示されているが、これに限らず、アンダーラインや、文字色を変更して強調表示することもできる。これにより、一般ユーザが文書表示部902の内容を読むとき、文書全体における不具合の語句の割合を容易に把握できるようになる。
In addition, on the
また、属性一覧表示部903に表示されたほかの属性、たとえば「部位」を選択したときにおいても、この部位に対応する語句の一覧が属性一覧表示部903にカウント付けで表示され、また、文書表示部902の不具合改善シート311上では、属性「部位」に対応する語句の部分が強調表示される。このように、属性を変更することにより、同一の文書に対して異なる属性の語句を抽出して表示させることができる。この際、この「部位」の強調表示は、「工種」の強調表示に用いた色と異なる配色にしてもよい。さらには、属性一覧表示部903において属性として「すべて」903dを選択したときには、文書表示部902の不具合改善シート311上に、各属性別に異なる配色で強調表示することができる。
Even when another attribute displayed on the attribute
上記の説明では、文書情報提示装置100に既に格納されている文書(不具合改善シート311)を読み出して閲覧する際に、属性と語句を対応付け、用語集DB203を構築する構成とした。これに限らず、新たな文書が文書情報提示装置100に入力される都度、アノテーションを自動実行し、追加属性を自動検出する構成とし、複数回の文書入力毎に追加属性に対する属性と語句の割り当てを促す報知を行う構成としてもよい。
In the above description, when the document (defect improvement sheet 311) already stored in the document
また、技術分野別等に文書の格納先を別領域に保存し、これら各文書DB毎に対応した複数の用語集DBを有する構成にもできる。これにより、単一の文書情報提示装置100を用いて複数の技術文書に対する上記の情報提示を切り替えて行えるようになる。
In addition, the document storage destination may be stored in a separate area for each technical field, and a plurality of glossary DBs corresponding to each document DB may be provided. As a result, the information presentation for a plurality of technical documents can be switched using the single document
以上説明した実施の形態では、文書として建築現場における不具合を記載した不具合文書を例に説明したが他の業種における文書に対しても同様に用いることができる。たとえば、自動車、機械、電気機器、電子部品等の製造時における不具合文書にも適用できる他、技術文献等に適用して同様に文書内容の把握を容易に行えるようになる。 In the embodiment described above, the defect document describing the defect at the construction site is described as an example as a document. However, the document can be similarly used for documents in other industries. For example, the present invention can be applied to a defect document at the time of manufacturing an automobile, a machine, an electric device, an electronic component, and the like, and can be easily grasped similarly by applying to a technical document.
また、上記実施の形態では、単一の文書情報提示装置100を一般ユーザおよび特権ユーザが操作する構成例について説明したが、文書情報提示装置100はネットワークを介して一般ユーザおよび特権ユーザの端末装置に接続され、端末装置の操作に基づいて上述した文書情報の提示を行う構成とすることができる。
In the above embodiment, a configuration example in which a general user and a privileged user operate the single document
なお、本実施の形態で説明した文書情報提示方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。 The document information presentation method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.
以上のように、本発明にかかる文書情報提示方法、文書情報提示プログラムおよび文書情報提示装置は、文書を構成する語句に属性を付与して検索時の条件とするコンピュータ装置により構成される検索装置に適している。 As described above, the document information presenting method, document information presenting program, and document information presenting apparatus according to the present invention include a search device configured by a computer device that assigns an attribute to a word constituting a document and uses it as a search condition. Suitable for
100 文書情報提示装置
101 CPU
102 ROM
103 RAM
201a 入力部
201b 操作部
202 検索部
203 用語集データベース
204 出力部
211 用語集構築部
221 属性付与部
222 追加属性検出部
223 重み設定部
224 検索条件作成部
100 Document
102 ROM
103 RAM
201a Input unit
Claims (8)
前記語句に対応する前記属性を付与する属性付与工程と、
前記属性付与工程により対応づけられた属性と語句の情報を、検索時の検索条件として参照される用語集データベースに登録する登録工程と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示工程と、
前記表示工程により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出工程とを含み、
前記属性付与工程は、前記追加属性検出工程において検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示方法。 In a document information presentation method for displaying a predetermined word constituting a document with a predetermined attribute when searching for the document,
An attribute assigning step for assigning the attribute corresponding to the word;
A registration step of registering the attribute and phrase information associated by the attribute assignment step in a glossary database referred to as a search condition at the time of search;
A display step for browsing and displaying a new document and displaying attributes corresponding to the words of the document displayed with reference to the glossary database;
An additional attribute detection step of detecting a word or phrase to which no attribute is given among the words included in the document displayed by the display step;
The document information presentation method characterized in that the attribute assigning step constructs the glossary database by assigning a new attribute to the phrase detected in the additional attribute detecting step.
前記登録工程は、前記重み付けを付与した前記属性を前記用語集データベースに登録することを特徴とする請求項1または2に記載の文書情報提示方法。 The attribute assigning step sets a predetermined weight for each of the plurality of attributes,
3. The document information presentation method according to claim 1, wherein the registration step registers the attribute to which the weight is given in the glossary database.
前記属性付与工程は、前記保存された他の前記文書に対し、当該他の文書に含まれる前記語句に対しても前記属性の付与を反映させることを特徴とする請求項1〜3のいずれか一つに記載の文書情報提示方法。 Including a document storage step of storing a plurality of the input documents,
The attribute assignment step reflects the addition of the attribute to the word / phrase included in the other document with respect to the other stored document. The document information presentation method according to one.
前記語句に対応する前記属性を付与する属性付与手段と、
前記属性付与手段により対応づけられた属性と語句の情報を用語集データベースに登録する登録手段と、
新たな文書の閲覧表示をおこなうとともに、前記用語集データベースを参照して表示されている前記文書の語句に対応する属性を表示させる表示手段と、
前記表示手段により表示された前記文書に含まれる語句のうち、属性が付与されていない語句を検出する追加属性検出手段とを備え、
前記属性付与手段は、前記追加属性検出手段によって検出された語句に対する新たな属性を付与することにより、前記用語集データベースを構築することを特徴とする文書情報提示装置。 In a document information presentation device for displaying a predetermined word constituting a document with a predetermined attribute when searching for the document,
Attribute assigning means for assigning the attribute corresponding to the word;
Registration means for registering attribute and phrase information associated with the attribute assigning means in a glossary database;
Display means for displaying a new document and displaying attributes corresponding to the words of the document displayed with reference to the glossary database;
An additional attribute detecting means for detecting a word / phrase to which no attribute is given among words / phrases included in the document displayed by the display means;
The document information presentation apparatus, wherein the attribute assigning unit constructs the glossary database by adding a new attribute to the phrase detected by the additional attribute detecting unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008038056A JP2009199192A (en) | 2008-02-19 | 2008-02-19 | Document information presentation method, document information presentation program and document information presentation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008038056A JP2009199192A (en) | 2008-02-19 | 2008-02-19 | Document information presentation method, document information presentation program and document information presentation apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009199192A true JP2009199192A (en) | 2009-09-03 |
Family
ID=41142643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008038056A Pending JP2009199192A (en) | 2008-02-19 | 2008-02-19 | Document information presentation method, document information presentation program and document information presentation apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009199192A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013543999A (en) * | 2010-10-08 | 2013-12-09 | エムモーダル アイピー エルエルシー | Structured search of dynamic structured document corpus |
US9659055B2 (en) | 2010-10-08 | 2017-05-23 | Mmodal Ip Llc | Structured searching of dynamic structured document corpuses |
JP2022000772A (en) * | 2017-11-28 | 2022-01-04 | 富士フイルムビジネスイノベーション株式会社 | Document processing apparatus and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090110A (en) * | 1998-09-11 | 2000-03-31 | Nippon Telegr & Teleph Corp <Ntt> | Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program |
JP2004362451A (en) * | 2003-06-06 | 2004-12-24 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for displaying retrieving keyword information, and retrieving keyword information display program |
WO2005096182A1 (en) * | 2004-03-31 | 2005-10-13 | Matsushita Electric Industrial Co., Ltd. | Information extraction system |
-
2008
- 2008-02-19 JP JP2008038056A patent/JP2009199192A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090110A (en) * | 1998-09-11 | 2000-03-31 | Nippon Telegr & Teleph Corp <Ntt> | Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program |
JP2004362451A (en) * | 2003-06-06 | 2004-12-24 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for displaying retrieving keyword information, and retrieving keyword information display program |
WO2005096182A1 (en) * | 2004-03-31 | 2005-10-13 | Matsushita Electric Industrial Co., Ltd. | Information extraction system |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013543999A (en) * | 2010-10-08 | 2013-12-09 | エムモーダル アイピー エルエルシー | Structured search of dynamic structured document corpus |
US9659055B2 (en) | 2010-10-08 | 2017-05-23 | Mmodal Ip Llc | Structured searching of dynamic structured document corpuses |
JP2022000772A (en) * | 2017-11-28 | 2022-01-04 | 富士フイルムビジネスイノベーション株式会社 | Document processing apparatus and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8615716B2 (en) | Content display control apparatus and content display control method | |
JP2006344010A (en) | Document retrieval device | |
JP5448412B2 (en) | Information processing apparatus and method, program, and recording medium | |
JP5494493B2 (en) | Information search apparatus, information search method, and program | |
JP2009140361A (en) | Data-managing device and data-processing method | |
WO2016124097A1 (en) | Text retrieval method and apparatus | |
JP2008310514A (en) | User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program | |
JP4084647B2 (en) | Information search system, information search method, and information search program | |
JP2009199192A (en) | Document information presentation method, document information presentation program and document information presentation apparatus | |
JP2005267597A (en) | Taxonomy display device, taxonomy displaying method, and taxonomy display program | |
WO2009136529A1 (en) | Work process management device, work process management method, and work process management program | |
US20050144179A1 (en) | Method and apparatus for document-analysis, and computer product | |
JPWO2004031956A1 (en) | Related information management method, program, and apparatus | |
JP4406028B2 (en) | Data presentation device, data presentation program, and data presentation method | |
JP4423385B2 (en) | Document classification support apparatus and computer program | |
JP3016691B2 (en) | Data search condition setting method | |
WO2016190444A1 (en) | Information management device, and file management method | |
JP4981723B2 (en) | Display processing apparatus, display processing method, display processing program, and recording medium | |
JP2007233752A (en) | Retrieval device, computer program and recording medium | |
JP4713098B2 (en) | Selection item display device, selection item display method, and selection item display program | |
JP2009199164A (en) | Document management device, document management method and recording medium | |
JPH01152527A (en) | Retrieval data input method for data retrieving device | |
JP4446715B2 (en) | Document search device, document search method, and document search program | |
JP2009098829A (en) | Frame retrieval device for cartoon | |
JP2000163439A (en) | Device and method for electronic file retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130205 |