JP5683428B2 - 文書管理装置 - Google Patents
文書管理装置 Download PDFInfo
- Publication number
- JP5683428B2 JP5683428B2 JP2011224716A JP2011224716A JP5683428B2 JP 5683428 B2 JP5683428 B2 JP 5683428B2 JP 2011224716 A JP2011224716 A JP 2011224716A JP 2011224716 A JP2011224716 A JP 2011224716A JP 5683428 B2 JP5683428 B2 JP 5683428B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- correction
- document
- determination
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 claims description 148
- 238000004458 analytical method Methods 0.000 claims description 54
- 238000003860 storage Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 19
- 230000000877 morphologic effect Effects 0.000 claims description 14
- 239000000470 constituent Substances 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000007726 management method Methods 0.000 description 43
- 230000008520 organization Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000006378 damage Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ディスカバリー制度は、前述した知的財産関連の訴訟の他、金融税金といった事件における訴訟において用いられる制度である。
電子化された書類は、タイムスタンプといった認証技術を併用しない限り、作成日時や改訂日時を変更することは容易であるものの、作成日時や改訂日時を改ざん等したことが発覚したとすれば、裁判において不利な状況に追い込まれる可能性がある。 したがって、「イー・ディスカバリー(e-Discovery)」を意識した適切な書類管理が、多くの企業で求められる。
たとえば、特許文献1に開示された技術では、各企業における機密文書を、それら企業と契約を締結した外部の事業者が管理するサーバ装置を用いることによって一括して保管するシステムが提案されている。
開示要求があってから当該組織にとってこのような不都合な文書ファイルを削除したり改訂したりすれば、裁判において不利になる可能性がある。 不都合な文書ファイルの削除はその証跡が残る可能性がある。改訂した文書ファイルに改訂の日時データが残り、その日時データが裁判準備の開始後であれば、改訂前の文書ファイルを破棄したことに等しい。 そうした事実が裁判上で明らかになれば、関係者の心証は悪くなり、裁判が不利に進行する可能性がある。
しかし、出願人が先行技術調査のため、民間の特許情報サービスを使用してキーワード検索などを試みたが、文書ファイルを組織で利用するサーバやデータベースへ格納する前段階で事前チェックするシステムは見あたらなかった。
第一の発明は、 NGワードを格納するNG判定用辞書記憶手段と、 検閲対象となる文書データを所定の端末から受信する対象文書受信手段と、 その対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、 その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、を備えた文書管理装置 に係る。
公共放送における禁止用語集などを用いることで、NG判定用辞書記憶手段への入力の手間を軽減してもよい。
NG判定用辞書記憶手段には、NGワードを予め格納する。
検閲対象となる文書データを、所定の端末から対象文書受信手段が受信する。 その受信した文書データに対して形態素解析手段が形態素解析をし、当該文書データを単語ごとに分割する。
NG判断手段は、形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断する。 そして、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断する。
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、格納されるNGワード毎に危険度ランクデータを含み、前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点の危険度ランクデータによって修正候補であるか否かを判断することとしてもよい。
他の請求項にて特定する「処理結果出力手段」においては、修正候補に対してランク表示を実行する。 ここで「ランク表示」とは、NGワードとして抽出された際に、そのNGワードの危険度のランク(危険度ランクデータ)を赤や黄の色で着色表現される表示、ハイライトの色や濃さ、網掛けの種類や濃さ、下線の種類や太さ、イタリックの角度、フォントの変更、文字の大小、文字の太さ、で表現される表示、当該ランクがカーソルを当てると吹き出しなどで危険度が表現される表示、あるいはこれらを組み合わせた表示である。
なお、NGワードの登録時に危険度ランクデータが入力されていない場合には、後に入力することとしてもよい。また、入力されていた危険度ランクデータがふさわしくない場合には、改訂して入力し直してもよい。
NG判定用辞書記憶手段は、格納されるNGワード毎に危険度ランクデータを含んで登録されている。
NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は、当該NGワードを起点として当該起点の危険度ランクデータによって修正候補であるか否かを判断する。
修正候補を出力された作業者は、危険度ランクデータを意識しながら修正作業が行える。
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、 前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、 前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとしてもよい。
たとえば、「主語−述語」の関係において「当社−侵害」をNG係り受けとして登録しておく。 「当社」について、「弊社」、「我が社」、「うちの会社」、正式な社名などは、シソーラスとして登録すると効果的である。
係り受けにおける目的節の「A社(競合他社の正式名や俗称としての社名)−特許権」をNG係り受けとして登録しておくと、「他社の特許に抵触するおそれ」という趣旨の表現を抽出しやすくなるので、効果的である。
NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納している。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析する。 そして、前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断する。NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断する。
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、 前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとしてもよい。
また、前記NG判断手段による判断結果として修正候補と判断した部位を表示させる処理結果出力手段と、 その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、を備え、
その修正入力手段には、当該修正入力手段の操作者が修正の必要の有無を判断不能な場合に保留を選択入力可能としており、 その保留を選択入力した場合におけるその保留に係る文書データを前記の操作者に係る端末以外の別端末へ送信する別端末送信手段を備え、 前記の別端末には、前記の修正入力手段と同じ修正入力手段を備えることとしてもよい。
NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納しておく。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析する。そして、NG判定用辞書記憶部を参照し、NG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断する。
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判断手段による判断結果として修正候補と判断された部位を表示させる処理結果出力手段と、 その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、 その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、を備えることとしてもよい。
「修正入力手段」は、検閲対象となる文書ファイルを作成した端末(被管理部門端末)であってもよいし(図13参照)、検閲対象となる文書ファイルを作成した端末(被管理部門端末)以外の端末(管理部門端末)であってもよい(図1参照)。前者の場合は、検閲対象となる文書ファイルを作成した作成者が自ら「管理者」となる場合が含まれる。
NG判断手段による判断結果として修正候補と判断された部位を処理結果出力手段が表示させる。
所定の端末操作者(たとえば文書データの管理者)は表示された修正候補と判断された部位を閲覧し、それに対して修正入力手段を用いて修正データを入力する。その修正入力手段によって修正された文書データを適正文書データ受信手段が受信する。
以上により、本願に係る文書管理装置を導入する組織内で保管すべき文書ファイルを保管前に事前チェックをする体制が、その組織へ提供されることとなる。
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、 前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することしてもよい。
NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを、推奨ワード辞書記憶手段が予め格納しておく。
処理結果出力手段は、修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力する。
前記した第一の発明のバリエーション4または5に係る文書管理装置においては、修正入力手段による修正の結果をNG判定用辞書記憶手段へ登録することとしてもよい。
ここで、「修正の結果」とは、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。 また、修正候補と判断された部位、修正入力手段によって入力された修正データ、修正データを入力した主体に関するデータ、修正データの入力日時などのデータを含む。
修正入力手段によって入力された修正の結果がNG判定用辞書記憶手段へ登録されるので、NG判定用辞書記憶手段は修正データが入力されるたびに進化する。
本願発明に係る文書管理装置を備えることとした組織に適合したNG判定能力に修正される。 これによって、本願に係る文書管理装置の徐々に解析能力が向上し、修正を担当する者の負担が軽減される。
前記した第一の発明のバリエーション4から6に係る文書管理装置においては、前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えることとしてもよい。
なお、保存日時を特定するための時計は、本願に係る文書管理装置を導入しているイントラネットの外部であることが望ましく、公的または準公的な第三者機関であることがより好ましい。日時データの客観性が高まるからである。
前述した第一の発明のバリエーション4に係る文書管理装置は、以下のように形成してもよい。
すなわち、前記の修正入力手段を複数備えることとし、 一の修正入力手段から入力された修正データは、他の修正入力手段における出力において前記の解析結果表示手段による解析結果とは識別が可能な表示としてもよい。
ある修正を担当する者は、一の修正手段にて修正する。 「修正文書ファイル送信手段」が送信する「所定の端末」は、一の修正手段にて修正作業をした者とは別の者に係る端末となる。
その別の者に係る端末において出力された出力結果は、一の修正入力手段から入力された修正データが、解析結果表示手段による解析結果とは識別が可能な表示となっている。 したがって、別の修正者は、解析結果と修正データとを識別しながら、修正内容を検討することができる。
本願は、コンピュータプログラムに係る第二の発明を提供することもできる。
その第二の発明は、 NGワードをNG判定用辞書記憶手段へ格納するNG判定用辞書記憶手順と、 検閲対象となる文書データを所定の端末から受信する対象文書受信手順と、 その対象文書受信手順にて受信した文書データの文書を形態素解析して単語を抽出する形態素解析手順と、 その形態素解析手順にて抽出された単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断するNGワード判断手順と、 そのNGワード判断手順にてNGワードが存在すると判断された場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手順とを、コンピュータに実行させるためのコンピュータプログラムに係る。
第二の発明は、第一の発明のバリエーション1から8に対応したバリエーションを実現可能な各手順を含んだコンピュータプログラムとしてもよい。
以下の説明に使用する図面は、図1から図13である。
図1では、本願発明の主要な構成を概念的にブロック図で示したものである。
管理部門に係る端末(図中では「管理部門端末」と表記)、NG文言サーバ、および管理される部門に係る端末(図中では「被管理部門端末」と表記)が、社内のイントラネットで接続されている。 事業者がインターネットなどを通じたASP形態によって必要な構成を提供してもよい。
管理部門とは、社内の各部門(「被管理部門」)にて作成されたり改訂されたりする文書に対して、法律的なチェックや必要な修正を行う部署であり、一般的には法務部門や総務部門である。
「NG文例」とは、NGワードを含む一文のほか、NGワードではない特定のワードの組み合わせを所定の組織において文書中に用いたとすると相応しくない、と判断すべき文例(NG文章構成)である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」といった文である。
ここで、「検閲対象文書ファイル」とは、たとえば、技術担当者らにメール回覧予定の電子回覧板のような文書を含むファイルであり、文書データとして「Y社の特許abcd号は、当社の製品Aの障害となるおそれあり。」という一文のデータを含むものであったとする。
形態素解析処理は、自然言語文を形態素に分割し単語辞書を参照して単語を抽出し文章を単語単位に分割する自然言語処理であり、形態素解析手段は公知の形態素解析ツールで構成できる。
NGワードであると判断した単語を起点として修正候補であるか否かを判断する方法としては、第一に、NG判定用辞書記録部に格納されたNGワードの危険度ランクデータを参照し、最高ランクのNGワードを起点とし、その起点のランクが所定値以上である場合に修正候補と判断する方法が挙げられる。
第二に、検閲対象における一文中の起点の数(すなわちNGワードの数)が所定数以上である場合に修正候補と判断する方法、検閲対象の一文中のNGワードの全てを起点とし、それぞれの起点におけるランクの合計値が所定値以上の場合に修正候補と判断する方法が挙げられる。
第三に、一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する方法が挙げられる。
構文解析処理は、形態素解析処理の結果(形態素列)を入力とし、単語同士の係り受け関係や格関係を表す構文木を出力する処理であり、公知の構文解析ツールで構成できる。構文解析処理を実行することによって、NGとして抽出する部位に対する精度が向上する。そのため、構文解析の手順が無い場合に比べて、修正候補として出力される箇所が減ったり、抽出し損なう箇所が減ったりするので、修正入力の手間を軽減することに寄与する。
用語間の対応関係を分析するために抽出するシステムも併用してもよい。用語間の対応関係抽出システムとしては、たとえば、特開2011−103038号に開示された手法である。
修正後の文書ファイルは、検閲対象文書ファイルを送信した被管理部門端末へ送信される。そして、被管理部門端末から、修正後の文書ファイルを送信すべき人や部門へ送信するため、社内メールサーバに送信される。同時に、管理部門が管轄する保存文書データベースにも蓄積される。
なお、修正前の文書ファイルは、本システムを採用する組織におけるポリシーによって異なる。たとえば、修正前の文書ファイルは管理部門などの所定部署において回覧用に印刷出力し、保存文書データベースには保存しないとする、としてもよい。
図2では、前述した修正候補であるか否かを判断する手順の一例を示している。
検閲対象となる文書データに対して、まず形態素解析処理を実行し、文書データを単語に分割する。
分割された単語にNGワードが含まれているか否かを判断する。含まれていない場合には、文書データにおける一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する。
NG係り受けと判断されない場合には、構文解析を行って二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当しないか否かによって修正候補と判断する。
図1において波線にて示しているが、被管理部門端末にて文書ファイルを作成する段階でNG判定用辞書記憶手段にもアクセスし、NGワード等を入力したら警告が発せられるといったシステムを構築してもよい。こうすることで、検閲対象文書においてNGワード等がなるべく使われないようにするとともに、検閲対象文書ファイルを作成する者と、管理部門の担当者との二重チェックのシステムが形成できる。
図3では、「A社が当社の特許権を侵害している。」という一文を構文解析した場合(A)と、「当社がA社の特許権を侵害している。」という一文を構文解析した場合(B)とを示している。
構文解析を実行しないと、(A),(B)のいずれもが修正候補として抽出されてしまう可能性が高い。しかし、NG係り受けにおいて「主語=当社、述語=侵害」と登録しており、構文解析を実行していれば、(A)が修正候補として抽出されず、(B)のみが修正候補として抽出される。
図4は、NG文言サーバにおけるNG判定用辞書記憶部の構造を概念的に示したブロック図である。
予め登録しておくべきNGワードなどは、NG文言入力手段によって入力され、NGワードデータベースなどにそれぞれ登録される。
一方、前記した修正入力手段にて修正した文言は、OKワードやOK文例としてOKワードデータベースなどにそれぞれ登録される。すなわち、修正作業によって、事後的に登録され、学習する。
学習したNG文言辞書データベースは、学習前よりも、本実施形態に係る文書管理装置を導入する組織における不適切な表現を含んだ文書ファイルが作成される蓋然性を低くする。
所定の分野における営業的なワード(たとえば「クレーム」)として用いられていたとしてNGワードに該当したとしても、別の部署においてはNGワードとならない場合(「クレーム」は「請求項」という意味しか持たない場合)があり、そのような場合には修正作業の効率を落とすこととなってしまうからである。
検閲対象文書ファイルにNGワードやNG文章が使用されているという解析結果を所定の端末へ出力する際、前述のOKワードデータベース、OK文例データベースを用いて、推奨文章を出力することとしてもよい。修正データ入力手段を操作する操作者が推奨文章をそのまま使ってよいと判断した場合には、その推奨文章を選択するだけで修正データの入力が完了する。 そのまま使わない場合でも、操作者にとって修正の参考となる。
なお、推奨文章の採用結果(採用した場合も不採用の場合も)についても、NG判定用辞書記憶手段にフィードバックされ、以後の精度を高めることに寄与する。
図5は、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものである。
検閲対象文書ファイルは、技術開発を担当するメンバー全員に回覧される「電子回覧板」である。閲覧した者は電子的に「閲覧済み」というデータを、この検閲対象文書ファイルに格納させる。また、回覧された内容についてコメントがあれば、コメントも記入して保存できる。
構文解析手段によって解析された後の検閲対象文書ファイルにおけるメモには、「α関連と推測」という箇所と、「製品Aの障害」という箇所が抽出され、その抽出箇所は、他の箇所と識別可能であるように出力表示(いわゆるハイライト表示)される。
図6は、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示している。
修正入力手段を操作したのは、管理部門の担当者である。その担当者は、「α関連と推測」という箇所の修正は不要であると判断し、その判断を反映させている。 また、「製品Aの障害」というフレーズを含んだ箇所は、「改良に参考となる」というように修正し、その修正内容を確定させている。
この修正によって、製品Aが特許公開番号2011−abcd号に開示されている内容と抵触していることを伺わせる記載が、社内の文書として保存されることを未然に防止したこととなる。
図7もまた、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものであり、検閲対象文書ファイルは「発明届出書」である。
構造解析手段は、「怪我をするおそれ」と「怪我のおそれ」という二カ所を抽出している。
図8もまた、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示したものである。
管理部門の担当者は、構造解析手段が抽出した部位のみならずその前の部分までを、修正前の文言を一切使わず、大幅に修正している。 このような修正をしたのは、いわゆる製造物責任法において、自社製品の危険性を認識しながら放置したと解釈されかねない記載が、社内の文書として保存されることを未然に防止するためである。
図9では、検閲対象文書ファイルがどのような理由で修正されるかを例示している。
修正前の検索対象文書ファイルの中には、以下のようなフレーズが存在していたとする。 『当社製品「A」が、例の安全基準に対してセーフであるとは思えない。』
最初の「A」は、固有名詞または登録商標に係る名称であるため、普通名称に変換している。 なお、社内文書には、こうした固有名詞や登録商標に係る名称がいろいろな部署で使われる蓋然性が高いので、予め変換テーブルをNG判定用辞書記憶部に備えることとしてもよい。
二重否定のフレーズは一般的にわかりにくく、正確な表現ではないためである。修正前における該当箇所の前後との整合性から、「安全性を確認したい」という修正を行った。
図10は、検閲対象文書ファイルが複数回の修正を経て戻される場合を概念的に示している。
被管理部門のA氏が検閲対象文書ファイルを作成したとする。なお、A氏の作成段階においても、A氏が文書ファイルを作成していた端末は、NG判定用辞書記憶部にアクセスし、NGワードやNG文例に該当する入力を指摘していたとする。
前記の検閲対象文書ファイルが管理部門へ送信され、管理部門のB氏が検閲対象文書ファイルを閲覧し、B氏ができる範囲で修正をし、判断がつかない箇所を保留して、上司であるC氏に係る端末へ、第一修正ファイルを保留箇所である旨のメモデータを付属させて送信する。
以上の手順を踏めば、管理部門においてダブルチェック、A氏の自己チェックを含めればトリプルチェックを実行できたこととなる。 B氏が管理業務に成熟していない場合には、B氏のスキルアップにも寄与する。
図11は、修正後の文書ファイルに対して、電子的なタイムスタンプを付与するシステムについて説明するための概念図である。手順をカッコ書きのローマ数字で示している。
まず、タイムスタンプを欲する文書ファイル(ここでは、修正後の文書ファイルとしているが、修正前や修正中でも、必要に応じて含めてもよい)をタイムスタンプ要求手段にかける。 NG文言サーバ内のタイムスタンプ要求手段は、その文書ファイルのハッシュ値を算出し、第三者機関に係るサーバへ、そのハッシュ値をインターネット経由で送信する。
受信した時刻認証情報は、修正後の文書ファイルに合成する。時刻認証情報が合成された文書ファイルは、保存すべきデータベースに保存する。 その文書ファイルを必要とする端末が呼び出すと、時刻認証情報が押された文書ファイルが出力される。
また、前記の例示では、第三者機関と時刻認証局とを分けて説明したが、時刻認証局が第三者機関として時刻認証情報を直接発行し、発送することとしてもよい。
図12は、既に格納された文書ファイルのデータベースや、送信を終えたメールの送信済みメールの保存データベースに対して、事後的にNGワードやNG文例に該当しないかどうかをチェックする場合を示したものである。
図2と同様、NG文言サーバに送信されてきた検閲対象文書は、構文解析手段に入力され、構文解析手段では、前記のNG文言辞書データベースのデータを用いるとともに、単語間の係り受け関係を抽出する構文分析手段などに基づいて、検閲対象文書ファイルにNGワードやNG文章が使用されているか否かを解析する。
文書ファイルが作成され、必要なチェックもなされ、格納された後に、事後的に登録されたNGワードやNG文例に該当してしまうことがある。 図12に示したように、一旦格納された文書ファイルに対しても、事後的に構文解析を実行することができるようにしてもよい。 ただし、事後的な構文解析は、修正候補の文言を含む対象文書を抽出するにとどめる。 修正入力手段によってデータを修正できるが、修正した文書ファイルは上書きをせず、別名でなければ保存できないようにしている。
図13に示す実施形態は、図1や図2と異なり、管理部門端末において検閲対象文書ファイルを修正するのではなく、文書作成者が自ら修正する実施形態を示すブロック図である。
解析結果送信手段は、被管理対象部門の端末、すなわち、検閲対象文書ファイルを作成した作成者に係る端末へ送信される。そして、出力された修正候補などを参照しながら、修正データを入力する。
修正データを入力して適正文書ファイルとなった文書ファイルは、社内の保存文書データベースへ格納するとともに、社内メールサーバなど、必要な出力に供する。
なお、ここまでの記載では、法律的な背景から、不適切な表現を効率的に発見し、未然に修正することを趣旨として説明してきた。しかし、法律の面のみならず、グローバル企業においては一つの文書ファイルを複数の言語へ翻訳する必要がある場合も多い。 その翻訳に誤りがないように、あわよくば機械翻訳で済むようにする、という目的として使用しても有益である。
本実施形態に係る文書管理装置を導入する組織、またはその組織内の更に細かな組織内においてのみ通用している略語、特殊用語、隠語などについては、前述のNG言語辞書データベースとは別に、特殊用語データベースを備えることとしてもよい。 その場合、その特殊用語データベースには、それぞれの略語、特殊用語、隠語などに対応する一般用語をそれぞれ登録しておく。
検閲対象文書において、特殊用語データベースに登録されている用語が使われている場合には、一般用語に変換する。 そして、前述の修正入力手段を操作する管理者等が表示させる出力画面においては、その用語が変換された旨を認識できるように表示する。
NG文言辞書データベースへ予め格納されるNGワードは、そのNGワード毎に危険度ランクデータを含ませることとしてもよい。 そして解析結果表示手段は、検閲対象となる文書ファイルにおいてNGワードを出力する際に、当該NGワードの危険度ランクデータに応じた識別が可能なランク表示を含ませることとしてもよい。
この場合、修正を担当する者は、その危険度ランクデータを意識しながら修正作業が行える。
検閲対象文書について分類が可能な場合には、NG文言辞書データベースにおいて格納されるNGワードやNG文言についても、対象とする検閲対象文書の種類についてのデータを予め入力しておいたり、追加で登録したりするようにする。 たとえば、検閲対象文書が発明届出書である場合に特有なNGワードやNG文言である場合には、検閲対象文書が発明届出書である場合にのみ、構文解析手段が用いるようにする。
前述してきた実施形態においては、組織における文書ファイル保存前の文書チェック補助技術として説明したが、本発明に示すアイディアのコンセプトは、契約書の作成支援システム、特許明細書の作成支援システムなどにも応用可能である。
特許明細書の作成支援システムにおけるNGワードとしては、例えば登録商標となっている自社や競合他社の製品名がある。 これらの製品名は、その製品を示す普通名称に自動変換することとしてもよい。 すなわち、NG文言辞書データベース内のOKワードを格納したデータベースに、その製品を示す普通名称を登録しておき、登録商標となっている自社や競合他社の製品名が検閲対象文書ファイルに含まれていたら、自動変換するのである。
Claims (8)
- NGワードを格納するNG判定用辞書記憶手段と、
検閲対象となる文書データを所定の端末から受信する対象文書受信手段と、
その対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、
その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、
を備え、
前記NG判定用辞書記憶手段は、格納されるNGワード毎に危険度ランクデータを含み、
前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点の危険度ランクデータによって修正候補であるか否かを判断することとした文書管理装置。 - 前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、
前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとした請求項1に記載の文書管理装置。 - 前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、
前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとした請求項1または請求項2のいずれかに記載の文書管理装置。 - 前記NG判断手段による判断結果として修正候補と判断した部位を表示させる処理結果出力手段と、
その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、を備え、
その修正入力手段には、当該修正入力手段の操作者が修正の必要の有無を判断不能な場合に保留を選択入力可能としており、
その保留を選択入力した場合におけるその保留に係る文書データを前記の操作者に係る端末以外の別端末へ送信する別端末送信手段を備え、
前記の別端末には、前記の修正入力手段と同じ修正入力手段を備えることとした請求1から請求項3のいずれかに記載の文書管理装置。 - 前記NG判断手段による判断結果として修正候補と判断した部位を表示させる処理結果出力手段と、
その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、
その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、
を備えた請求項1から請求項4のいずれかに記載の文書管理装置。 - NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、
前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとした請求項1から請求項5のいずれかに記載の文書管理装置。 - 前記NG判定用辞書記憶手段は、前記の修正入力手段による修正の結果を登録することとした請求項5または請求項6に記載の文書管理装置。
- 前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えた請求項5から請求項7のいずれかに記載の文書管理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011224716A JP5683428B2 (ja) | 2011-10-12 | 2011-10-12 | 文書管理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011224716A JP5683428B2 (ja) | 2011-10-12 | 2011-10-12 | 文書管理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013084180A JP2013084180A (ja) | 2013-05-09 |
JP5683428B2 true JP5683428B2 (ja) | 2015-03-11 |
Family
ID=48529295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011224716A Active JP5683428B2 (ja) | 2011-10-12 | 2011-10-12 | 文書管理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5683428B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6650901B2 (ja) * | 2017-03-23 | 2020-02-19 | 日本電信電話株式会社 | 発話文判定装置、方法、及びプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0883286A (ja) * | 1994-09-13 | 1996-03-26 | Canon Inc | 文書処理方法及び装置 |
JPH11195024A (ja) * | 1997-12-26 | 1999-07-21 | Just Syst Corp | 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法 |
JPH11203298A (ja) * | 1998-01-08 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 投稿文字情報事前チェック方法及び装置及び投稿文字情報事前チェックプログラムを格納した記憶媒体 |
US6336117B1 (en) * | 1999-04-30 | 2002-01-01 | International Business Machines Corporation | Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine |
JP2005135211A (ja) * | 2003-10-31 | 2005-05-26 | Hitachi Ltd | 文書管理方法および文書管理装置 |
JP2008059386A (ja) * | 2006-08-31 | 2008-03-13 | Toshiba Corp | 情報処理装置およびコンテンツ公開方法 |
JP2010044462A (ja) * | 2008-08-08 | 2010-02-25 | Twobytes Corp | コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム |
US8234259B2 (en) * | 2009-05-08 | 2012-07-31 | Raytheon Company | Method and system for adjudicating text against a defined policy |
JP5122539B2 (ja) * | 2009-09-14 | 2013-01-16 | キャンバスマップル株式会社 | ナビゲーション装置、およびナビゲーションプログラム |
JP5581743B2 (ja) * | 2010-03-08 | 2014-09-03 | アーチエス株式会社 | 文書評価付与方法、プログラム及び装置 |
-
2011
- 2011-10-12 JP JP2011224716A patent/JP5683428B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013084180A (ja) | 2013-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5735403B2 (ja) | 文書管理装置 | |
US8127365B1 (en) | Origination-based content protection for computer systems | |
US8286171B2 (en) | Methods and systems to fingerprint textual information using word runs | |
JP5111423B2 (ja) | 文書審査支援装置、文書審査支援方法およびプログラム | |
US20110099052A1 (en) | Automatic checking of expectation-fulfillment schemes | |
KR101312885B1 (ko) | 디지털 서명 정책을 위한 시스템 및 컴퓨터 판독가능 매체 | |
US11537727B2 (en) | Systems and methods for creating enhanced documents for perfect automated parsing | |
AU2021267818B2 (en) | Systems and methods for creating enhanced documents for perfect automated parsing | |
US9904497B2 (en) | Copyright infringement prevention | |
US9165065B2 (en) | Terminology management database | |
US8676791B2 (en) | Apparatus and methods for providing assistance in detecting mistranslation | |
JP2019114264A (ja) | 法律文書レビュープログラム、法律文書レビュー方法、及び法律文書レビューシステム | |
US12067372B2 (en) | Method and system for restricting transmission of sensitive information contained in a document | |
WO2014203573A1 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP5683428B2 (ja) | 文書管理装置 | |
KR101523842B1 (ko) | 번역 관리 방법 및 시스템 | |
JP7265199B2 (ja) | 支援装置、支援方法、プログラム、及び支援システム | |
WO2024177160A1 (ja) | 情報処理方法 | |
Xiao et al. | Automated extraction and validation of security policies from natural-language documents | |
JP2005222430A (ja) | セキュリティスタンダード作成方法及びセキュリティスタンダード作成システム | |
JP2015046196A (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP2010198580A (ja) | コンテンツ管理システム、コンテンツ管理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5683428 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |