JP2014038565A - Document management device and program - Google Patents
Document management device and program Download PDFInfo
- Publication number
- JP2014038565A JP2014038565A JP2012181881A JP2012181881A JP2014038565A JP 2014038565 A JP2014038565 A JP 2014038565A JP 2012181881 A JP2012181881 A JP 2012181881A JP 2012181881 A JP2012181881 A JP 2012181881A JP 2014038565 A JP2014038565 A JP 2014038565A
- Authority
- JP
- Japan
- Prior art keywords
- report
- document
- item
- ambiguity
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Description
本発明は、文書管理装置及びプログラムに関する。 The present invention relates to a document management apparatus and a program.
文書を用いた情報伝達において不正確な情報が伝わる可能性を低減するために、文書中に曖昧な文が含まれているか否かを判定する技術がある(例えば下記の特許文献1を参照)。 In order to reduce the possibility of inaccurate information being transmitted in information transmission using a document, there is a technique for determining whether or not an ambiguous sentence is included in the document (see, for example, Patent Document 1 below). .
一方で、複数の担当者を管理する中間管理者が、各担当者から上がってきた報告書に基づき作成した報告書を上級管理者に伝達するビジネスプロセスがある。ここで、担当者や中間管理者の中に正確な情報を表現しない者がいると、最終的に上級管理者が受け取る報告書には正確な情報とそうでない情報とが混在している可能性が生じ、報告書の信頼性が低くなり、上級管理者が報告事項に対する判断を誤る可能性もある。 On the other hand, there is a business process in which an intermediate manager who manages a plurality of persons in charge transmits a report created based on a report received from each person in charge to a senior manager. Here, if there is a person who does not express accurate information among the person in charge or the intermediate manager, the report that the senior manager will eventually receive may contain a mixture of accurate information and information that is not. , The reliability of the report may be reduced, and senior management may misjudge the report.
本発明の目的は、報告事項を含む複数の文書と複数の文書のそれぞれの内容に基づき編集された文書との中から、正確な情報を表現していない報告事項を特定できる文書管理装置及びプログラムを提供することにある。 An object of the present invention is to provide a document management apparatus and program capable of specifying a report item that does not represent accurate information from among a plurality of documents including report items and a document edited based on the contents of each of the plurality of documents. Is to provide.
上記目的を達成するため、請求項1に係る発明は、それぞれ1又は複数の文により記述された報告事項を含む複数の第1文書と、該複数の第1文書に基づき編集された1又は複数の文により記述された報告事項を含む第2文書とを取得する手段と、前記複数の第1文書に含まれる報告事項と、前記第2文書に含まれる報告事項のそれぞれについて、各報告事項を記述する文の解析結果に基づいて各報告事項の曖昧度を評価する評価手段と、前記第1文書に含まれる報告事項の曖昧度に対して、前記第2文書に含まれる報告事項の曖昧度が変化しているか否かに基づいて、注意対象の報告事項を特定する特定手段と、を含むことを特徴とする文書管理装置である。 To achieve the above object, the invention according to claim 1 includes a plurality of first documents each including a report item described by one or more sentences, and one or more edited based on the plurality of first documents. Each report item for each of the report item included in the plurality of first documents, and the report item included in the second document. Evaluation means for evaluating the ambiguity of each report item based on the analysis result of the sentence to be described, and the ambiguity of the report item included in the second document with respect to the ambiguity of the report item included in the first document A document management apparatus comprising: a specifying unit that specifies a report item to be noted based on whether or not a change has occurred.
請求項2に係る発明は、請求項1に記載の文書管理装置において、前記評価手段は、前記複数の第1文書に含まれる報告事項と、前記第2文書に含まれる報告事項のそれぞれについて、各報告事項を記述する文の格構造の不備、係り受けの不備、特定の語の有無の少なくともいずれかに基づいて各報告事項の曖昧度を評価することを特徴とする。
The invention according to
請求項3に係る発明は、請求項1又は2に記載の文書管理装置において、それぞれ作成者及び報告先が定められた複数の文書を格納した格納手段と、前記格納手段に格納された複数の文書の中から、前記第2文書の作成者が報告先に定められ、且つ該第2文書に含まれる報告事項に対応する報告事項を含む文書を前記複数の第1文書として特定する文書特定手段をさらに含むことを特徴とする。
The invention according to
請求項4に係る発明は、請求項1乃至3のいずれかに記載の文書管理装置において、前記第1文書に含まれる報告事項の曖昧度に対して、前記第2文書に含まれる報告事項の曖昧度が変化している場合に、該曖昧度が変化した報告事項を含む第1文書と第2文書にそれぞれ定められた作成者と報告先のうち少なくとも1つに、前記注意対象の報告事項についての注意情報を通知する通知手段をさらに含むことを特徴とする。 The invention according to claim 4 is the document management apparatus according to any one of claims 1 to 3, wherein the report matter included in the second document is compared with the ambiguity of the report matter included in the first document. When the ambiguity has changed, at least one of the creator and the report destination respectively defined in the first document and the second document including the report item having the changed ambiguity, the report item to be noted The information processing device further includes notification means for notifying the attention information.
請求項5に係る発明は、それぞれ1又は複数の文により記述された報告事項を含む複数の第1文書と、該複数の第1文書に基づき編集された1又は複数の文により記述された報告事項を含む第2文書とを取得する手段と、前記複数の第1文書に含まれる報告事項と、前記第2文書に含まれる報告事項のそれぞれについて、各報告事項を記述する文の解析結果に基づいて各報告事項の曖昧度を評価する評価手段と、前記第1文書に含まれる報告事項の曖昧度に対して、前記第2文書に含まれる報告事項の曖昧度が変化しているか否かに基づいて、注意対象の報告事項を特定する特定手段としてコンピュータを機能させるためのプログラムである。 The invention according to claim 5 includes a plurality of first documents each including a report item described by one or more sentences, and a report described by one or more sentences edited based on the plurality of first documents. The analysis result of the statement describing each report item for each of the means for obtaining the second document including the item, the report item included in the plurality of first documents, and the report item included in the second document Evaluation means for evaluating the ambiguity of each report item based on whether or not the ambiguity of the report item included in the second document has changed with respect to the ambiguity of the report item included in the first document Is a program for causing a computer to function as specifying means for specifying a report item to be noted.
請求項1及び5に記載の発明によれば、報告事項を含む複数の文書と複数の文書のそれぞれの内容に基づき編集された文書との中から、正確な情報を表現していない報告事項を特定でき、注意を促すことができる。 According to the inventions described in claims 1 and 5, a report item that does not represent accurate information is selected from a plurality of documents including a report item and a document edited based on the contents of each of the plurality of documents. Can identify and call attention.
請求項2に記載の発明によれば、報告事項を表現する文ごとの格構造、係り受け、特定語の有無に基づいて報告事項の曖昧度を評価できる。
According to the invention described in
請求項3に記載の発明によれば、報告事項を含む複数の文書と複数の文書のそれぞれの内容に基づき編集された文書との組を特定できる。
According to the invention described in
請求項4に記載の発明によれば、曖昧度が変化した報告事項の情報を、該報告事項に係る者に対して通知できる。 According to the invention described in claim 4, it is possible to notify the information related to the report item whose fuzziness has changed to the person related to the report item.
以下、本発明を実施するための実施の形態(以下、実施形態という)を、図面に従って説明する。 Hereinafter, embodiments for carrying out the present invention (hereinafter referred to as embodiments) will be described with reference to the drawings.
[システム構成例]
図1には、本実施形態に係る文書管理システム1のシステム構成図を示した。図1に示されるように、文書管理システム1は、文書管理装置2と複数の情報処理端末とを備え、文書管理装置2と複数の情報処理端末3とはそれぞれネットワークを介して相互にデータ通信する。以下、本実施形態に係る文書管理システム1において行われる処理の概要を説明する。
[System configuration example]
FIG. 1 shows a system configuration diagram of a document management system 1 according to the present embodiment. As shown in FIG. 1, the document management system 1 includes a
本実施形態に係る文書管理システム1は、複数の担当者と、当該複数の担当者を管理する中間管理者と、当該中間管理者を管理する上級管理者とを含むグループにおいて行われる、電子文書による報告のフローを処理の対象とする。以下、報告のフローの一例について説明する。 The document management system 1 according to the present embodiment is an electronic document performed in a group including a plurality of persons in charge, an intermediate administrator who manages the persons in charge, and a senior administrator who manages the intermediate administrator. The report flow by is subject to processing. An example of the report flow will be described below.
まず、複数の各担当者は、情報処理端末3で作成した報告書(電子文書)の報告先を中間管理者に設定して、作成した報告書を文書管理装置2に登録する。文書管理装置2は、登録された報告書の報告先である中間管理者の情報処理端末3に、各担当者が作成した報告書を提供する。中間管理者は、各担当者が作成した報告書に基づいてまとめ報告書(電子文書)を作成後、作成したまとめ報告書の報告先を上級管理者に設定して、まとめ報告書を文書管理装置2に登録する。
First, each of a plurality of persons in charge sets a report destination of a report (electronic document) created by the
文書管理装置2は、各担当者が作成した報告書(担当者報告書)と、それらの担当者報告書に基づいて作成されたまとめ報告書とのそれぞれの曖昧性を評価、比較し、曖昧性が変化しているか否かを判断する。ここで、文書管理装置2は、担当者報告書とまとめ報告書との間で曖昧性が変化していると判断する場合には、正確な情報の開示が行われていない可能性があるため、曖昧性が変化した事項について、例えば、報告書とともに、まとめ報告書の報告先である上級管理者に通知するようにする。
The
以下、上記処理を実現するために、文書管理システム1に備えられる構成及び当該構成において実行される処理の詳細について説明する。 Hereinafter, in order to implement | achieve the said process, the detail with which the structure with which the document management system 1 is equipped and the process performed in the said structure is demonstrated.
[ハードウェア構成例]
図2には、文書管理装置2と情報処理端末3のそれぞれのハードウェア構成の一例を示した。
[Hardware configuration example]
FIG. 2 shows an example of the hardware configuration of each of the
[文書管理装置2の構成]
図2に示されるように、文書管理装置2は、制御部20、記憶部21、通信部22を備える。
[Configuration of Document Management Device 2]
As shown in FIG. 2, the
制御部20は、CPU(Central Processing Unit)を含み、記憶部21に記憶されたプログラムに基づいて、各種の演算処理を実行するとともに文書管理装置2の各部を制御する。
The
記憶部21は、文書管理装置2のオペレーティングシステム等の制御プログラムやデータを記憶するほか、制御部20のワークメモリとしても用いられる。プログラムは、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等の情報記憶媒体に格納された状態で文書管理装置2に供給されてもよいし、インターネット等のデータ通信手段を介して文書管理装置2に供給されてもよい。以下、記憶部21に記憶されるデータの一例を説明する。
The
図6には、記憶部21に記憶されるユーザ情報管理テーブルの一例を示した。図6に示されるユーザ情報管理テーブルの例では、ユーザID、ユーザ名、ユーザの所属、ユーザの役職、勤務地、メールアドレスが関連づけて記憶される。
FIG. 6 shows an example of a user information management table stored in the
また、記憶部21には、ユーザ情報管理テーブル以外にも図7〜図9に示す各種テーブルが記憶されるが、これらのテーブルの詳細については後述する。
The
通信部22は、例えばネットワークインターフェースカードを含み、ネットワークインターフェースカードを介してネットワークに接続し、ネットワークを介して、それぞれの情報処理端末3とデータ通信する。
The
[情報処理端末3の構成]
次に、情報処理端末3のハードウェア構成例について説明する。図2に示されるように、情報処理端末3は、制御部30、記憶部31、通信部32、入力部33、表示部34を備える。
[Configuration of Information Processing Terminal 3]
Next, a hardware configuration example of the
制御部30は、CPU(Central Processing Unit)を含み、記憶部31に記憶されたプログラムに基づいて、各種の演算処理を実行するとともに情報処理端末3の各部を制御する。
The
記憶部31は、情報処理端末3のオペレーティングシステム等の制御プログラムやデータを記憶するほか、制御部30のワークメモリとしても用いられる。プログラムは、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等の情報記憶媒体に格納された状態で情報処理端末3に供給されてもよいし、インターネット等のデータ通信手段を介して情報処理端末3に供給されてもよい。
The
通信部32は、例えばネットワークインターフェースカードを含み、ネットワークインターフェースカードを介して文書管理装置2と通信する。
The
入力部33は、タッチパネル、キーボード等の入力装置により実現され、ユーザからの操作入力を受け付ける。
The
表示部34は、液晶ディスプレイ等の表示装置により実現され、制御部30による情報処理の結果(画面)を表示させる。
The
[フローチャート]
次に、文書管理装置2において行われる処理の詳細を、図3〜5に示したフローチャートを参照しながら説明する。
[flowchart]
Next, details of processing performed in the
[報告書の登録処理]
図3には、文書管理装置2による報告書の登録処理のフローチャートを示した。
[Report registration process]
FIG. 3 shows a flowchart of report registration processing by the
図3に示されるように、文書管理装置2は、情報処理端末3から未登録の報告書を取得すると(S101)、取得した報告書を解析する(S102)。
As shown in FIG. 3, when the
例えば、文書管理装置2は、取得した報告書を解析し、報告書のタイトル、報告書に含まれる報告事項、報告書を作成した作成者のユーザID(作成者ID)、報告書の報告先のユーザID(報告先ID)、報告書の作成の元となった報告書のID(作成元報告書ID)、報告日時等の情報を取得するようにしてよい。なお、報告書のタイトル、作成者ID、報告先ID、作成元報告書ID、報告日時は、報告書に属性情報として設定されていることとしてもよい。以下、報告書に含まれる報告事項の特定処理の一例について説明する。
For example, the
例えば、文書管理装置2は、報告書が、報告事項ごとに構造化されている場合(例えばXMLにより記述されている場合や、予め定められたレイアウト(表構造等)に従って記述されている場合)には、報告書の構造化された部分を特定し、各部分における単語の頻出関係に基づいて、報告事項を特定することとしてよい。また、文書管理装置2は、報告書が、報告事項ごとに構造化されていない場合であっても、話題構造を認識する公知技術や、意味的なまとまりを抽出する公知技術に基づいて、報告書に含まれる報告事項を特定することとしてもよい。話題構造の認識処理については、例えば特開平8−110906号公報に示すような技術が知られており、報告書中の話題構造の認識特定の単語(話題語)とその単語に関する記述の継続範囲(話題スコープ)を認識することで、報告事項を抽出し、複数の報告書で同じ報告事項が存在するか否かが判定できる。また、意味的なまとまりを抽出する技術としては、例えば特開2006−72483号公報が知られており、単語の共起関係と句読点を利用することで意味的にまとまっている複数の文を抽出するものである。以上の処理に基づいて、文書管理装置2は、報告書に含まれる報告事項を特定後、各報告事項に対応する文(テキストデータ)を関連付けて取得する。
For example, the
また、対象の報告書に属性情報として作成元報告書IDが含まれていない場合には、既に登録された報告書の作成者と報告先の情報に基づいて、対象の報告書についての作成元報告書IDを特定することとしてもよい。この場合には、文書管理装置2は、対象の報告書の作成者IDと一致する報告先IDが定められた複数の報告書であって、予め定められた時間範囲内に登録された報告書を抽出するとともに、抽出した報告書のうち報告事項が対象の報告書と対応する報告書のIDを作成元報告書IDとして得ることとしてもよい。
In addition, if the report originator report ID is not included as attribute information in the subject report, the originator of the subject report based on the information of the creator and reportee of the already registered report It is good also as specifying report ID. In this case, the
文書管理装置2は、上記の解析結果に基づいて得た報告書の情報を報告書登録テーブル(図7参照)に登録する(S103)。もちろん、文書管理装置2は、報告書自体も記憶部21に格納することとしてよい。
The
図7には、報告書登録テーブルの一例を示した。図7に示されるように、報告書登録テーブルには、報告書の識別情報(報告書ID)、報告書のタイトル、報告書に含まれる報告事項の識別情報(報告事項ID)、作成者のユーザID(作成者ID)、報告先のユーザID(報告先ID)、報告日時の情報が関連づけて記憶される。 FIG. 7 shows an example of the report registration table. As shown in FIG. 7, the report registration table includes report identification information (report ID), report title, report item identification information (report item ID) included in the report, The user ID (creator ID), the report destination user ID (report destination ID), and the report date and time information are stored in association with each other.
次に、文書管理装置2は、報告書に含まれる報告事項のうち、未処理の報告事項を選択し(S104)、選択した報告事項に係るテキストデータに基づいて、報告事項の曖昧性を評価する(S105)。以下、報告事項の曖昧性評価の一例について説明する。
Next, the
本実施形態では、文書管理装置2は、報告事項に係るテキストデータに含まれる1又は複数の文を取得し、取得した各文に基づいて曖昧性を評価する。例えば、文書管理装置2は、報告事項に係る文ごとに、当該文の格構造(詳細については後述する)の不備、係り受けの不備、曖昧性を含む特定の(形容)語(詳細については後述する)の有無に基づいて、報告事項の曖昧性を評価する。例えば、文書管理装置2は、報告事項に係る文の格構造に不備がある(判定条件A)、文の係り受けに不備がある(判定条件B)、文に曖昧性を含む特定の語が含まれる(判定条件C)、のうちいずれかが満たされた場合に、報告事項が曖昧である(例えば真偽値のT)と評価することとしてもよいし、判定条件A〜Cが満足された回数又は、一文当たりの回数が閾値以上又は超えた場合に報告事項が曖昧であると評価することとしてもよい。それ以外にも、文書管理装置2は、報告事項に係るテキストデータについての判定条件A〜Cが満足された回数に基づいて曖昧性を数値化して評価してもよい(例えば格構造に不備が1つあれば1ポイント等)。この場合において、文書管理装置2は、報告事項に係るテキストデータにおける判定条件A〜Cが満足された回数の合計を報告事項の曖昧度としてもよいし、報告事項に係るテキストデータにおける一文当たりに判定条件A〜Cが満足された回数を報告事項の曖昧度としてもよい。
In the present embodiment, the
ここで、格構造について説明する。まず、格文法とは語と語の間の意味関係を、動詞を中心にとらえたものであり、文中の動詞に対して他の単語がどのような役割(深層格)をもつかを次のような格として分類している(フィルモアの深層格(チャールズJ.フィルモア(田中春美、船城道雄訳):格文法の原理、三省堂、1975)を参照)。
(1)動作主格:ある動作を引き起こす者の役割。
(2)経験者格:ある心理事象を体験する者の役割。
(3)道具格:ある出来事の直接原因となったり、ある心理事象と関係して反応を起こさせる刺激となったりする役割。
(4)対象格:移動する対象物や変化する対象物、あるいは、判断、想像のような心理事象の内容を表す役割。
(5)源泉格:対象物の移動における起点、および状態変化と形状変化における最初の状態や形状を表す役割。
(6)目標格:対象物の移動における終点、および状態変化と形状変化における最終的な状態、結果を表す役割。
(7)場所格:ある出来事が起こる場所および位置を表す役割。
(8)時間格:ある出来事が起こる時間を表す役割。
ここで、一つの文は、一つの動詞と複数の格から成る構造(これを格構造と呼ぶ)を形成する。なお、計算機を用いた格構造の解析は、例えば文献「岡田著:自然言語処理入門、共立出版(1991)」に示される言語理論と言語処理技術に基づいており、形態素解析、構文解析、意味解析を順次行うことで格構造の解析を行う。なお、同種の解析処理機能としては、例えば特開昭63−091776号公報や特許第2765618号に示されるような従来技術が既に知られている。そして、格構造の不備とは、例えば主格や対象格の欠如があるか否かにより判定することとしてよい。具体的には、例えば「山田太郎が進捗を報告する」という文では、動作主格と目的格が存在するが、いつ報告するのかという「時間格」や誰に報告するのかという「目標格」が欠けている、ということを検出することで不備の有無を判定する。また、報告書の文章で用いられる動詞と必須の格との組合せをあらかじめ記憶し、これを用いて格構造の解析を行うこととしてもよい。
Here, the case structure will be described. First of all, case grammar is a semantic relationship between words centered on verbs. The role of other words (deep case) for the verbs in a sentence is as follows. (See Charles J. Fillmore (translated by Harumi Tanaka, Michio Funagi): Principles of Case Grammar, Sanseido, 1975).
(1) Action principal: The role of a person who causes a certain action.
(2) Experienced personality: The role of a person experiencing a psychological event.
(3) Tools: A role that directly causes a certain event or acts as a stimulus that causes a reaction in relation to a certain psychological event.
(4) Object case: A role representing the content of a moving object, a changing object, or the contents of a psychological event such as judgment or imagination.
(5) Source case: A role that represents the starting point of movement of an object and the initial state and shape of the state change and shape change.
(6) Target case: A role that represents an end point in movement of an object, a final state in a state change and a shape change, and a result.
(7) Location: A role that represents the location and location where an event occurs.
(8) Time case: A role that represents the time at which a certain event occurs.
Here, one sentence forms a structure composed of one verb and a plurality of cases (this is called a case structure). Case structure analysis using a computer is based on the language theory and language processing technology described in, for example, the literature “Okada: Introduction to Natural Language Processing, Kyoritsu Publishing (1991)”. Morphological analysis, syntax analysis, meaning The case structure is analyzed by sequentially performing the analysis. As an analysis processing function of the same type, for example, conventional techniques as shown in, for example, Japanese Patent Laid-Open No. 63-097176 and Japanese Patent No. 2765618 are already known. The deficiency of the case structure may be determined based on, for example, whether there is a lack of a main case or a target case. Specifically, for example, in the sentence “Taro Yamada reports progress”, there are behavioral and objective cases, but there is a “time case” for when to report and a “target case” for who to report. The presence or absence of deficiencies is determined by detecting the lack. Moreover, it is good also as memorize | storing beforehand the combination of the verb used by the sentence of a report, and an essential case, and analyzing a case structure using this.
次に、曖昧性を含む特定の語の例について説明する。曖昧性を含む特定の語は、例えば「おおむね」、「かなり」、「ほとんど」といった特定の形容語を予め辞書として設定しておき、文中にそれらの特定語が含まれるか否かに基づいて文が曖昧か否かを判定することとしてよい。 Next, an example of a specific word including ambiguity will be described. Specific words that include ambiguity are based on whether specific adjectives such as “generally”, “pretty”, and “mostly” are set as a dictionary in advance, and whether these specific words are included in the sentence. It may be determined whether or not the sentence is ambiguous.
ここで図3のフローチャートに戻り説明を続ける。文書管理装置2は、報告書に含まれる報告事項ごとの曖昧性評価の結果に基づいて、報告事項の情報を報告事項情報テーブルに登録する(S106)。
Returning to the flowchart of FIG. The
図8には、報告事項情報テーブルの一例を示した。図8に示されるように、報告事項情報テーブルには、報告事項の識別情報(報告事項ID)、報告事項のタイトル、報告事項の内容、曖昧度が関連づけて記憶される。 FIG. 8 shows an example of the report item information table. As shown in FIG. 8, the report item information table stores report item identification information (report item ID), report item title, report item content, and ambiguity in association with each other.
文書管理装置2は、登録対象の報告書に関し、未処理の報告事項がある場合には(S107:Y)、S104に戻り、未処理の報告事項がない場合には(S107:N)、さらに未登録の報告書があるか否かを判断する(S108)。文書管理装置2は、未登録の報告書がある場合には(S108:Y)、S101戻り、未登録の報告書がない場合には(S108:N)、登録処理を終了する。
When there is an unprocessed report item regarding the report to be registered (S107: Y), the
以上の登録処理は、文書管理装置2が情報処理端末3から新たな報告書を受信するごとに実行することとしてもよいし、予め定められた時間間隔ごとに記憶部21に記憶された未登録の報告書に対して実行することとしてもよい。
The above registration process may be executed each time the
[注意対象の報告事項の特定処理]
次に、図4に示されたフローチャートを参照しながら、報告書に含まれる報告事項のうち注意喚起の対象とする報告事項の特定処理の一例について説明する。
[Identification processing of report items subject to attention]
Next, with reference to the flowchart shown in FIG. 4, an example of a process for identifying a report item to be alerted among report items included in the report will be described.
図4に示されるように、文書管理装置2は、報告書登録テーブルを参照し、まとめ報告書のうち未処理のものを1つ選択して(S201)、以下の処理を実行する。
As shown in FIG. 4, the
文書管理装置2は、選択したまとめ報告書に含まれる報告事項の中から未処理の報告事項ISを1つ選択し(S202)、選択した報告事項ISの曖昧度を報告事項情報テーブルから取得する(S203)。なお、まとめ報告書の報告事項の選択は、報告書登録テーブルにおいて、まとめ報告書の報告書IDに紐付けて記憶される報告事項IDを順次選択することで行うこととしてよい。また、選択した報告事項ISについての曖昧度は、報告事項ISの識別情報(報告事項ID)に関連付けて、報告事項情報テーブルに記憶される曖昧度(Vs)を取得することとしてよい。
The
次に、文書管理装置2は、処理対象とするまとめ報告書の作成の元となった作成元の報告書群を特定する(S204)。なお、作成元の報告書群の報告書IDは、まとめ報告書の報告書IDに関連付けて、報告書登録テーブルの作成元報告書IDの欄に格納されている。
Next, the
文書管理装置2は、作成元の報告書群G{R1,・・・,RM}の中から未処理の報告書Ri(i=1〜Mで初期値は1)を1つ選択し(S205)、選択した報告書Riの中に報告事項ISに対応する報告事項が含まれている場合には(S206:Y)、その報告事項について報告事項情報テーブルに記憶される曖昧度を取得する(S207)。また、文書管理装置2は、S207の後、又は、選択した報告書Riの中に報告事項ISに対応する報告事項が含まれていない場合には(S206:N)、S208に進む。ここで、文書管理装置2は、作成元の報告書群の中に未処理の報告書があるときには(S208:Y)、S205に戻り、作成元の報告書群Gの中に未処理の報告書がないときには(S208:N)、S209に進む。
The
ここで、文書管理装置2は、まとめ報告書の報告事項ISの曖昧度Vsと、作成元の報告書群において報告事項ISに対応する報告事項Ij(j=1〜N)の曖昧度Vj(j=1〜N)とを比較し(S209)、その結果、作成元の報告書群に含まれる報告事項Ijと、まとめ報告書に含まれる報告事項ISとの間で曖昧度が変化したか否かを判断する(S210)。
Here, the
例えば、文書管理装置2は、曖昧度が真偽値で表される場合に、曖昧度Vsと、曖昧度Vj(j=1〜N)とをそれぞれ比較し値が異なるものの数(A)又は割合(A/N)が、閾値以上又は超えるか否かに基づいて、曖昧度が変化したか否かを判断することとしてもよい。また、文書管理装置2は、曖昧度が数値で表される場合に、曖昧度Vsと、曖昧度Vj(j=1〜N)との差分が第1の閾値以上又は超えるものの数又は割合が、第2の閾値以上又は超えるか否かに基づいて、曖昧度が変化したか否かを判断することとしてもよい。
For example, when the ambiguity is represented by a true / false value, the
ここで、文書管理装置2は、曖昧度が変化したと判断された場合に(S210:Y)、曖昧度が変化した報告事項の情報(少なくとも曖昧度が変化した報告事項ISと報告事項Ijの組の情報を含む)を、注意情報記録テーブル(図9参照)に記録する(S211)。
Here, when it is determined that the ambiguity has changed (S210: Y), the
図9には、注意情報記録テーブルの一例を示した。図9に示される注意情報記録テーブルの例では、まとめ報告書の報告書ID、まとめ報告書に含まれる報告事項の報告事項ID、まとめ報告書の報告事項IDに対して曖昧度が変化した作成元報告書の報告事項ID、まとめ報告書の報告事項IDに対して曖昧度が変化していない作成元報告書の報告事項IDの情報が関連づけて記憶される。図9に示した例では、曖昧度が変化した場合と、曖昧度が変化しない場合の両方について報告事項の情報を記録するようにしたが、曖昧度が変化した場合にのみ報告事項の情報を記録するようにしても構わない。 FIG. 9 shows an example of the caution information recording table. In the example of the caution information recording table shown in FIG. 9, the report ID of the summary report, the report item ID of the report item included in the summary report, and the ambiguity change with respect to the report item ID of the summary report Information of the report item ID of the original report whose ambiguity has not changed is stored in association with the report item ID of the former report and the report item ID of the summary report. In the example shown in FIG. 9, the report item information is recorded for both the case where the ambiguity changes and the case where the ambiguity does not change, but the report item information is recorded only when the ambiguity changes. You may make it record.
文書管理装置2は、S211の後、又は曖昧度が変化したと判断されなかった場合に(S210:N)、S212に進む。ここで、文書管理装置2は、処理対象のまとめ報告書について未処理の報告事項がある場合には(S212:Y)、S202に戻り、未処理の報告事項がない場合には(S212:N)、処理対象のまとめ報告書を処理済みに設定する(S213)。
The
次に、文書管理装置2は、未処理のまとめ報告書がある場合には(S214:Y)、S201に戻り、未処理のまとめ報告書がない場合には(S214:N)、処理を終了する。
Next, when there is an unprocessed summary report (S214: Y), the
以上の処理は、文書管理装置2がまとめ報告書を取得したタイミングや、情報処理端末3からまとめ報告書の転送要求や処理要求を受け付けたタイミングで実行することとしてもよいし、予め定められた時間間隔ごとに記憶部21に記憶されたまとめ報告書に対して実行することとしてもよい。
The above processing may be executed at the timing when the
[注意情報の通知処理]
次に、図5に示されるフローチャートを参照しながら、文書管理装置2により行われる注意対象の報告事項をユーザに通知する処理について説明する。
[Notice Information Notification]
Next, referring to the flowchart shown in FIG. 5, a process for notifying the user of a report item to be noted, which is performed by the
図5に示されるように、文書管理装置2は、情報処理端末3への通知対象のまとめ報告書を特定する(S301)。例えば、文書管理装置2は、情報処理端末3から受け付けた転送要求に係るまとめ報告書を通知対象として特定することとしてもよい。
As shown in FIG. 5, the
文書管理装置2は、注意情報記録テーブルを参照し、特定したまとめ報告書に含まれる報告事項IDのうち、曖昧度が変化した報告事項がある場合には(S302:Y)、曖昧度が変化した報告事項についての注意情報を生成する(S303)。例えば、注意情報は、曖昧度が変化した、まとめ報告書の報告事項と作成元報告書の報告事項との組を含む情報としてよい。例えば、まとめ報告書の作成元となった報告書群の中で曖昧度が変化した報告書の割合が閾値以下又は未満である場合には、その曖昧度が変化した作成元の報告書において情報が正確に報告されていない可能性がある旨の注意情報を生成してもよいし、まとめ報告書の作成元となった報告書群の中で曖昧度が変化した報告書の割合が閾値以上又はより大きい場合には、まとめ報告書において情報が正確に報告されていない可能性がある旨の注意情報を生成してもよい。
The
次に、文書管理装置2は、注意情報を通知する通知先を決定する(S304)。文書管理装置2は、例えば、まとめ報告書について定められた報告先、作成者、まとめ報告書の作成元となった報告書について定められた報告先、作成者のうち、少なくともいずれかを通知先に選択することとしてよい。
Next, the
そして、文書管理装置2は、特定した通知先に対して、注意情報を通知する(S305)。例えば、文書管理装置2は、上記決定した通知先(ユーザ)のメールアドレスをユーザ情報管理テーブルから取得し、取得したメールアドレスに対して注意情報を送信することとしてよい。また、文書管理装置2は、注意情報とともに、まとめ報告書、まとめ報告書の作成元となった報告書を合わせて送信することとしても構わない。
Then, the
文書管理装置2は、注意情報を通知した後、又はまとめ報告書について曖昧度が変化した報告事項がない場合には(S302:N)、処理を終了する。
After notifying the attention information or when there is no report item whose ambiguity has changed for the summary report (S302: N), the
以上説明した文書管理装置によれば、情報処理端末3から登録された報告書のうち、報告者が曖昧な表現を使うことで情報が正確に開示されていない報告事項が特定される。
According to the document management apparatus described above, among the reports registered from the
また、本発明は上記の実施形態に限定されるものではない。例えば、文書管理装置2は、情報処理端末3から登録されたまとめ報告書と、まとめ報告書の元となった作成元報告書のいずれにおいても報告事項が曖昧であると判定された場合には、その旨記録し、まとめ報告書と作成元報告書との少なくともいずれかに定められた作成者と報告先の少なくともいずれかに対して通知してもよい。
Further, the present invention is not limited to the above embodiment. For example, if the
1 文書管理システム、2 文書管理装置、3 情報処理端末、20 制御部、21 記憶部、22 通信部、30 制御部、31 記憶部、32 通信部、33 入力部、34 表示部。 DESCRIPTION OF SYMBOLS 1 Document management system, 2 Document management apparatus, 3 Information processing terminal, 20 Control part, 21 Storage part, 22 Communication part, 30 Control part, 31 Storage part, 32 Communication part, 33 Input part, 34 Display part
Claims (5)
前記複数の第1文書に含まれる報告事項と、前記第2文書に含まれる報告事項のそれぞれについて、各報告事項を記述する文の解析結果に基づいて各報告事項の曖昧度を評価する評価手段と、
前記第1文書に含まれる報告事項の曖昧度に対して、前記第2文書に含まれる報告事項の曖昧度が変化しているか否かに基づいて、注意対象の報告事項を特定する特定手段と、を含む
ことを特徴とする文書管理装置。 A plurality of first documents each including report items described by one or more sentences, and a second document including report items described by one or more sentences edited based on the plurality of first documents. Means to obtain,
Evaluation means for evaluating the degree of ambiguity of each report item based on the analysis result of the sentence describing each report item for each of the report items included in the plurality of first documents and the report items included in the second document When,
Specifying means for identifying a report item to be noted based on whether or not the ambiguity of the report item included in the second document is changed with respect to the ambiguity of the report item included in the first document; A document management apparatus characterized by including:
ことを特徴とする請求項1に記載の文書管理装置。 The evaluation means includes, for each of the report items included in the plurality of first documents and the report items included in the second document, an incomplete case structure of a sentence describing each report item, an incomplete dependency, and a specification. The document management apparatus according to claim 1, wherein the ambiguity of each report item is evaluated based on at least one of the presence or absence of a word.
前記格納手段に格納された複数の文書の中から、前記第2文書の作成者が報告先に定められ、且つ該第2文書に含まれる報告事項に対応する報告事項を含む文書を前記複数の第1文書として特定する文書特定手段をさらに含む
ことを特徴とする請求項1又は2に記載の文書管理装置。 A storage means for storing a plurality of documents each having a creator and a report destination;
Among the plurality of documents stored in the storage unit, a document including a report item corresponding to a report item corresponding to a report item included in the second document, the creator of the second document being determined as a report destination The document management apparatus according to claim 1, further comprising a document specifying unit that specifies the first document.
ことを特徴とする請求項1乃至3のいずれかに記載の文書管理装置。 A first document including a report item whose ambiguity has changed when the ambiguity of the report item included in the second document has changed with respect to the ambiguity of the report item included in the first document; 4. The information processing apparatus according to claim 1, further comprising notification means for notifying at least one of a creator and a report destination respectively defined in the second document of the attention information about the report item to be noted. Document management device according to the above.
前記複数の第1文書に含まれる報告事項と、前記第2文書に含まれる報告事項のそれぞれについて、各報告事項を記述する文の解析結果に基づいて各報告事項の曖昧度を評価する評価手段と、
前記第1文書に含まれる報告事項の曖昧度に対して、前記第2文書に含まれる報告事項の曖昧度が変化しているか否かに基づいて、注意対象の報告事項を特定する特定手段
としてコンピュータを機能させるためのプログラム。 A plurality of first documents each including report items described by one or more sentences, and a second document including report items described by one or more sentences edited based on the plurality of first documents. Means to obtain,
Evaluation means for evaluating the degree of ambiguity of each report item based on the analysis result of the sentence describing each report item for each of the report items included in the plurality of first documents and the report items included in the second document When,
As a specifying means for identifying a report item to be noted based on whether or not the ambiguity of the report item included in the second document has changed with respect to the ambiguity of the report item included in the first document A program that allows a computer to function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012181881A JP5888182B2 (en) | 2012-08-20 | 2012-08-20 | Document management apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012181881A JP5888182B2 (en) | 2012-08-20 | 2012-08-20 | Document management apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014038565A true JP2014038565A (en) | 2014-02-27 |
JP5888182B2 JP5888182B2 (en) | 2016-03-16 |
Family
ID=50286640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012181881A Expired - Fee Related JP5888182B2 (en) | 2012-08-20 | 2012-08-20 | Document management apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5888182B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10783321B2 (en) | 2018-03-28 | 2020-09-22 | Konica Minolta, Inc. | Document creation support device and program |
JP2021114120A (en) * | 2020-01-17 | 2021-08-05 | 株式会社日立製作所 | Ambiguous part correction support device and method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004110524A (en) * | 2002-09-19 | 2004-04-08 | Nippon Telegr & Teleph Corp <Ntt> | Sentence ambiguity calculating method and system and program, answering dialogue sentence producing method and system and program answering dialogue method and system and program, and recording media recording their programs |
JP2008083753A (en) * | 2006-09-25 | 2008-04-10 | Toshiba Corp | Dialogue support device and its method |
JP2010102691A (en) * | 2008-09-29 | 2010-05-06 | Sanyo Electric Co Ltd | Document preparation support device and document preparation support program |
JP2012146046A (en) * | 2011-01-11 | 2012-08-02 | Nec Corp | Request acquisition support apparatus, request acquisition support method and program |
-
2012
- 2012-08-20 JP JP2012181881A patent/JP5888182B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004110524A (en) * | 2002-09-19 | 2004-04-08 | Nippon Telegr & Teleph Corp <Ntt> | Sentence ambiguity calculating method and system and program, answering dialogue sentence producing method and system and program answering dialogue method and system and program, and recording media recording their programs |
JP2008083753A (en) * | 2006-09-25 | 2008-04-10 | Toshiba Corp | Dialogue support device and its method |
JP2010102691A (en) * | 2008-09-29 | 2010-05-06 | Sanyo Electric Co Ltd | Document preparation support device and document preparation support program |
JP2012146046A (en) * | 2011-01-11 | 2012-08-02 | Nec Corp | Request acquisition support apparatus, request acquisition support method and program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10783321B2 (en) | 2018-03-28 | 2020-09-22 | Konica Minolta, Inc. | Document creation support device and program |
JP2021114120A (en) * | 2020-01-17 | 2021-08-05 | 株式会社日立製作所 | Ambiguous part correction support device and method |
JP7074785B2 (en) | 2020-01-17 | 2022-05-24 | 株式会社日立製作所 | Ambiguous part correction support device and method |
Also Published As
Publication number | Publication date |
---|---|
JP5888182B2 (en) | 2016-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kern et al. | Gaining insights from social media language: Methodologies and challenges. | |
CN108647205B (en) | Fine-grained emotion analysis model construction method and device and readable storage medium | |
Derczynski et al. | Analysis of named entity recognition and linking for tweets | |
CN109196496B (en) | Unknown word predictor and content integrated translator | |
US8370278B2 (en) | Ontological categorization of question concepts from document summaries | |
US20160299955A1 (en) | Text mining system and tool | |
US11354501B2 (en) | Definition retrieval and display | |
Chen et al. | Emoji-powered sentiment and emotion detection from software developers’ communication data | |
CN107077640B (en) | System and process for analyzing, qualifying, and ingesting unstructured data sources via empirical attribution | |
Borsje et al. | Semi-automatic financial events discovery based on lexico-semantic patterns | |
WO2012096388A1 (en) | Unexpectedness determination system, unexpectedness determination method, and program | |
Small et al. | Identifying scientific breakthroughs by combining co-citation analysis and citation context | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
CN115017303A (en) | Method, computing device and medium for enterprise risk assessment based on news text | |
Caicedo et al. | Bootstrapping semi-supervised annotation method for potential suicidal messages | |
Patel et al. | Approaches of anonymisation of an SMS corpus | |
Sarkar et al. | NLP algorithm based question and answering system | |
JP5888182B2 (en) | Document management apparatus and program | |
CN111046168A (en) | Method, apparatus, electronic device, and medium for generating patent summary information | |
Baldwin et al. | Beyond normalization: Pragmatics of word form in text messages | |
Kaur et al. | A roadmap of sentiment analysis and its research directions | |
Miratrix et al. | Conducting sparse feature selection on arbitrarily long phrases in text corpora with a focus on interpretability | |
Fabo | Concept-based and relation-based corpus navigation: applications of natural language processing in digital humanities | |
Lipka | Modeling Non-Standard Text Classification Tasks | |
Dwivedi et al. | Mental Health in Messages: Unravelling Emotional Patterns Through Advanced Text Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5888182 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |