JP2021114167A - Document management/viewing system and annotation text display method thereof - Google Patents
Document management/viewing system and annotation text display method thereof Download PDFInfo
- Publication number
- JP2021114167A JP2021114167A JP2020006803A JP2020006803A JP2021114167A JP 2021114167 A JP2021114167 A JP 2021114167A JP 2020006803 A JP2020006803 A JP 2020006803A JP 2020006803 A JP2020006803 A JP 2020006803A JP 2021114167 A JP2021114167 A JP 2021114167A
- Authority
- JP
- Japan
- Prior art keywords
- document
- term
- commentary
- sentence
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、文書管理・閲覧システムに関し、特に、文書管理・閲覧システムによって管理された文書に含まれる用語の理解を支援する注釈文の表示に関する。 The present invention relates to a document management / viewing system, and more particularly to the display of annotations that support the understanding of terms contained in a document managed by the document management / viewing system.
各種の文書を蓄積して管理し、利用者によって検索されまたは指定された文書を表示あるいは出力することによって提示して利用者の閲覧に供する文書管理・閲覧システムがある。利用者は、その必要とする文書を検索し、検索された文書を例えばコンピュータの表示画面上に表示する。文書管理・閲覧システムによる管理の対象となる文書として契約書や約款などがあるが、これらの文書は、契約において使用される用語や法律に詳しくないと理解することが難しい。同様に文書管理・閲覧システムによる管理の対象となる文書としてマニュアルや規定集などがあるが、これらの文書は分量が膨大であり、その記載内容をすぐに把握することが難しい。文書管理・閲覧システムで管理される文書の適切な理解のためにはその文書に含まれる用語の意味や定義などを知っている必要があるが、そのことは実際には難しく、文書の閲覧者は、詳しく内容を知りたい用語やよく分からない用語に遭遇するたびに、その用語をキーとして検索を行う必要が生じる。例えば、窓口対応業務などを文書管理・閲覧システムを用いて遂行する場合を考えると、顧客からの問い合わせに基づいて文書を検索し、検索された文書の内容を顧客に伝えるが、そのとき、その文書に含まれる用語などに疑問が生じたとき、その用語をキーとしてその文書内での検索やその用語を含む他の文書の検索を行う必要があり、再度の検索に要する時間の分だけ、業務効率が低下することになる。文書の適切な理解のためには、その文書に含まれる用語を解説する注釈文をその文書の閲覧者に対して適時に提示できることが求められる。 There is a document management / viewing system that accumulates and manages various documents, presents them by displaying or outputting documents searched or specified by the user, and makes them available for viewing by the user. The user searches for the required document and displays the searched document on, for example, a display screen of a computer. There are contracts and contracts as documents to be managed by the document management / viewing system, but it is difficult to understand these documents unless they are familiar with the terms and laws used in the contract. Similarly, there are manuals and regulation collections as documents to be managed by the document management / viewing system, but these documents are enormous in volume and it is difficult to immediately grasp the contents of the description. In order to properly understand a document managed by a document management / viewing system, it is necessary to know the meaning and definition of terms contained in the document, but that is actually difficult and the viewer of the document Whenever a term that you want to know in detail or a term that you do not understand is encountered, you need to search using that term as a key. For example, in the case of performing counter-service operations using a document management / viewing system, a document is searched based on an inquiry from the customer, and the content of the searched document is communicated to the customer. When a question arises about a term contained in a document, it is necessary to search within the document or another document containing the term using that term as a key, and only for the time required for another search. Business efficiency will decrease. For proper understanding of a document, it is required to be able to present commentary sentences explaining the terms contained in the document to the readers of the document in a timely manner.
文書に含まれる用語についての注釈文を適時にその文書の閲覧者に提示する方法として、文書自体をハイパーテキスト文書として構成し、用語ごとにその用語に対する注釈文を含むファイルをリンクとしてその文書に埋め込む方法が知られている。この方法によれば、コンピュータの表示装置においてその文書を表示しているときにマウスなどで用語をクリックすれば、例えばブラウザなどが起動してその用語に対する注釈文が表示される。また特許文献1は、文書管理・閲覧システムであって、表示されている文書中の用語がマウス操作などによって選択されたときに、その選択された用語をキーとして文書管理・閲覧システム内の他の文書の検索やインターネット上の検索を行って検索結果を表示できるシステムを開示している。 As a way to timely present commentary on a term contained in a document to the viewer of the document, the document itself is constructed as a hypertext document, and a file containing the commentary for that term is linked to the document for each term. The method of embedding is known. According to this method, if a term is clicked with a mouse or the like while the document is being displayed on a display device of a computer, for example, a browser or the like is started and an annotation sentence for the term is displayed. Further, Patent Document 1 is a document management / browsing system, and when a term in a displayed document is selected by a mouse operation or the like, the selected term is used as a key in the document management / browsing system. We disclose a system that can display search results by searching documents and searching on the Internet.
特許文献1に記載された方法は、文書中に含まれて利用者によって選択された用語をキーとして検索を行うものであるが、用語の理解に役立つ検索結果が必ず得られることを保証するものではない。一方、文書をハイパーテキスト文書とし、文書に含まれる用語に対してその用語についての注釈文のファイルに対するリンクを埋め込む場合、用語ごとの注釈文を予め作成してファイルとする必要があって注釈文の作成に労力を要する。特に、文書管理・閲覧システムに蓄積される文書の量が多い場合には、注釈文の作成に多大な作業時間がかかり、人手で実行することが非現実的となる。 The method described in Patent Document 1 performs a search using a term included in the document and selected by the user as a key, but guarantees that a search result useful for understanding the term is always obtained. is not it. On the other hand, when a document is a hypertext document and a link to a file of annotations about the terms is embedded in the terms contained in the document, it is necessary to create annotations for each term in advance and make it a file. It takes a lot of effort to create. In particular, when the amount of documents stored in the document management / viewing system is large, it takes a lot of work time to create the annotation text, which makes it unrealistic to execute it manually.
本発明の目的は、文書に含まれる用語が選択されたときにその用語に対する適切な注釈文を表示でき、かつ、注釈文の作成に要する労力を低減できる文書管理・閲覧システムとその注釈文表示方法とを提供することにある。 An object of the present invention is a document management / viewing system and an annotation text display thereof that can display an appropriate annotation text for a term when a term included in the document is selected and can reduce the labor required for creating the annotation text. To provide a method.
上記の目的を達成するために本発明の文書管理・閲覧システムは、
文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおいて、
前記文書を蓄積する第1の蓄積部と、
前記利用者に対して前記第1の蓄積部に蓄積された文書を表示する処理を実行する制御部と、
を備え、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語に対応する注釈文が前記利用者に対して表示され、
前記注釈文は人工知能によって生成されたものであることを特徴とする。
In order to achieve the above object, the document management / viewing system of the present invention
In a document management / viewing system that accumulates and manages documents and presents them to users
A first storage unit for storing the documents and
A control unit that executes a process of displaying documents stored in the first storage unit to the user, and a control unit.
With
With respect to the term selected by the user in the document displayed to the user, a commentary sentence corresponding to the term is displayed to the user.
The commentary is characterized by being generated by artificial intelligence.
上記の目的を達成するために本発明の注釈文表示方法は、
文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおける注釈文表示方法において、
文書管理・閲覧システムに蓄積された文書を利用者に対して表示するステップと、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語に対応する注釈文を前記利用者に対して表示するステップと、
を有し、
前記注釈文は人工知能によって生成されたものであることを特徴とする。
In order to achieve the above object, the annotation text display method of the present invention is:
In the annotation text display method in the document management / viewing system that accumulates and manages documents and presents them to users
The steps to display the documents stored in the document management / viewing system to the user,
For the term selected by the user in the document displayed to the user, a step of displaying an annotation sentence corresponding to the term to the user, and
Have,
The commentary is characterized by being generated by artificial intelligence.
上記のように構成された本発明においては、表示された文書において利用者が用語を選択したときに、その選択された用語に関し、人工知能によって生成された注釈文を表示する。人工知能を使用することにより、人手を介することなく文書中の用語に対する的確な注釈文を利用者に対して表示することが可能になるとともに、注釈文の作成に要する労力を低減することができる。 In the present invention configured as described above, when a user selects a term in the displayed document, an annotation sentence generated by artificial intelligence is displayed with respect to the selected term. By using artificial intelligence, it is possible to display accurate annotations to the terms in the document to the user without human intervention, and it is possible to reduce the labor required to create the annotations. ..
本発明においては、用語ごとの注釈文を事前に文書管理・閲覧システムに蓄積し、利用者が選択した用語に基づいて、事前に蓄積された注釈文の中から利用者に対して表示する注釈文を選択するようにしてもよい。事前に注釈文を文書管理・閲覧システムに蓄積しておくことにより、文書中の用語を利用者が選択したときに、即座にその用語に対する注釈文を利用者に対して表示できるようになる。 In the present invention, annotation sentences for each term are accumulated in the document management / viewing system in advance, and based on the terms selected by the user, annotations to be displayed to the user from among the annotation sentences accumulated in advance. You may choose a statement. By accumulating the annotation text in the document management / viewing system in advance, when the user selects a term in the document, the annotation text for that term can be immediately displayed to the user.
用語ごとの注釈文を事前に蓄積する場合、文書管理・閲覧システムにおいて用語ごとの注釈文を生成する処理を実行することが好ましい。文書管理・閲覧システムにおいて注釈文を生成して蓄積することにより、新たな文書を文書管理・閲覧システムに追加するときに、自動的に注釈文を生成することが可能になる。注釈文は、例えば、文書管理・閲覧システムに蓄積される文書から用語を抽出する処理と、抽出された用語に関連する関連文書を、少なくとも文書管理・閲覧システムに蓄積された文書の中から検索して取得する処理と、人工知能を使用して関連文書の要約文を生成し、注釈文として、対応する用語と関連付けて蓄積する処理と、によって生成することができる。 When accumulating the annotation sentences for each term in advance, it is preferable to execute the process of generating the annotation sentences for each term in the document management / viewing system. By generating and accumulating annotations in the document management / viewing system, it becomes possible to automatically generate annotations when a new document is added to the document management / viewing system. The commentary is, for example, a process of extracting a term from a document stored in the document management / viewing system and a search for related documents related to the extracted term from at least the documents stored in the document management / viewing system. It can be generated by the process of acquiring the document and the process of generating a summary sentence of the related document using artificial intelligence and accumulating it as an annotation sentence in association with the corresponding term.
関連文書の取得では、文書管理・閲覧システムに蓄積された文書から関連文書を取得するだけでなく、例えばインターネットなどのネットワークを介して接続した外部サーバから関連文書を検索して取得してもよい。外部サーバから関連文書を取得することにより、文書管理・閲覧システムに蓄積された文書からは適切な関連文書を取得できない場合であっても注釈文を生成することが可能になる。ただし、外部サーバから取得される関連文書には検索ノイズに相当するものが含まれる可能性も高いため、要約文の生成に際しては、文書管理・閲覧システムから取得した関連文書を優先して用いることが好ましい。また、一定数を超える関連文書が取得される場合には、関連文書ごとに用語との類似度を算出し、類似度がしきい値を超える2以上の所定数の関連文書から要約文を生成することが好ましい。類似度に基づいて関連文書を選択することにより、より適切な内容の注釈文を得ることができる。また、複数の関連文書に点在している情報を集約することにより、さらに適切な情報を含む注釈文を一挙に得ることができる。 In the acquisition of related documents, not only the related documents may be acquired from the documents stored in the document management / viewing system, but also the related documents may be searched and acquired from an external server connected via a network such as the Internet. .. By acquiring the related document from the external server, it is possible to generate an annotation even if an appropriate related document cannot be acquired from the document stored in the document management / viewing system. However, since there is a high possibility that the related documents acquired from the external server include those equivalent to search noise, the related documents acquired from the document management / viewing system should be used with priority when generating the summary sentence. Is preferable. In addition, when a certain number of related documents are acquired, the similarity with the term is calculated for each related document, and a summary sentence is generated from a predetermined number of related documents whose similarity exceeds the threshold value. It is preferable to do so. By selecting related documents based on the degree of similarity, it is possible to obtain annotations with more appropriate contents. In addition, by aggregating the information scattered in a plurality of related documents, it is possible to obtain an annotation sentence including more appropriate information at once.
本発明によれば、文書に含まれる用語が選択されたときにその用語に対する適切な注釈文を表示でき、かつ、注釈文の作成に要する労力を低減できる。 According to the present invention, when a term included in a document is selected, an appropriate commentary sentence for the term can be displayed, and the labor required for creating the commentary sentence can be reduced.
次に、本発明の実施の形態について、図面を参照して説明する。図1は、本発明の実施の一形態の文書管理・閲覧システムの構成を示すブロック図である。文書管理・閲覧システム10は、例えばサーバ用コンピュータによって構成されるものであり、事業体などにおいて発生する文書を蓄積して管理し、利用者によって検索されまたは指定された文書を表示あるいは出力することによって提示して利用者の閲覧に供する。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a document management / viewing system according to an embodiment of the present invention. The document management /
文書管理・閲覧システム10には、ローカルエリアネットワーク(LAN)や仮想プライベートネットワーク(VPN)などのネットワーク30を介して、利用者が使用する1または複数の端末50が接続する。端末50としては、グラフィカルユーザインタフェース(GUI)を備えたパーソナルコンピュータなどが使用され、文書管理・閲覧システム10によって利用者に表示される文書は、端末50の表示装置上に表示される。文書管理・閲覧システム10は、この文書管理・閲覧システム10による管理対象である文書を蓄積する第1の蓄積部11と、第1の蓄積部11に蓄積された文書に含まれる用語に対応する注釈文を蓄積する第2の蓄積部12と、注釈文を生成する注釈文生成部20と、制御部13とを備えている。第2の蓄積部12に蓄積される注釈文とは、第1の蓄積部11に蓄積された文書に含まれる各用語について、その用語を解説してその用語の理解を支援する文章のことであり、人工知能(AI)を用いて生成されたものである。第1の蓄積部11に蓄積された複数の文書に共通に含まれている用語については、第2の蓄積部12において重複して注釈文を蓄積する必要はなく、同一の用語を含む文書の数によらず、1つの注釈文を第2の蓄積部12に蓄積すればよい。第2の蓄積部12では、用語ごとの注釈文がその用語に関連付けられて蓄積されており、用語によって第2の蓄積部12を検索することによって、その用語に対応する注釈文を取得できる。
One or
制御部13は、文書管理・閲覧システム10においてネットワーク30を介して利用者の端末50とのインタフェースとなる部分であり、利用者からの要求に基づいて第1の蓄積部11内の文書を検索して検索された文書を利用者の端末50の表示画面に表示する処理を実行する。また制御部13は、利用者の端末50の画面において表示されている文書において、利用者がその文書に含まれる用語を端末50の画面上で選択した場合に、選択された用語が端末50から通知されて、通知された用語に対応する注釈文を利用者の端末50の画面に表示する処理も実行する。注釈文を端末50の画面に表示する処理は、例えば、通知された用語に基づいて制御部13が第2の蓄積部12内を検索することにより端末50に表示すべき注釈文を選択し、選択した注釈文を端末50に送出することによって行われる。制御部13のこれらの処理を実行する機能は、サーバ用コンピュータによって構成された文書管理・閲覧システム10において実行されるコンピュータプログラムによって実現することができる。
The
端末50は、その画面に文書管理・閲覧システム10から送られてきた文書や注釈文を表示するとともに、画面に表示された文書に含まれる用語が利用者によって選択されたときに、その用語を文書管理・閲覧システムに送信する機能を有する。このような端末50の機能は、一般的なブラウザソフトウェアあるいは専用のアプリケーションによって実行される。なお、文書管理・閲覧システム10のうち、制御部13の機能を端末50において実現することも可能である。
The terminal 50 displays a document or commentary sent from the document management /
次に、本実施形態における注釈文の生成について説明する。注釈文は、上述したように第1の蓄積部11に既に蓄積されている文書あるいは第1の蓄積部11に蓄積しようとしている文書に含まれる用語に関し、人工知能を用いて生成されるものである。既に第1の蓄積部11に蓄積されている文書に含まれる用語の注釈文を生成するかあるいはこれから蓄積する文書に含まれる用語の注釈文を生成するかによって注釈文生成の手順が変わることはないので、ここでは、これから蓄積する文書に含まれる用語についての注釈文を生成する場合を説明する。図2は注釈文生成部20の構成を示している。以下の説明では、第1の蓄積部11に蓄積しようとする文書を文書Aとする。文書Aに含まれる用語から注釈文を生成する処理と文書Aを第1の蓄積部11に蓄積する処理とは並行して実施することができる。
Next, the generation of the annotation text in this embodiment will be described. As described above, the commentary is generated by using artificial intelligence with respect to the terms contained in the document already stored in the
注釈文生成部20は、第1の蓄積部11に蓄積しようとする文書Aから用語を抽出する用語抽出部21と、用語抽出部21で抽出された用語に関連する関連文書を少なくとも第1の蓄積部11に蓄積された文書の中から検索して取得する関連文書取得部22と、人工知能を使用して関連文書の要約文を生成する要約文生成部23とを備えている。要約文生成部23は、生成した要約文を注釈文として、対応する用語に関連付けて第2の蓄積部12に蓄積する。ここで関連文書とは、対象となる用語についての説明や解説などを含む可能性がある文書のことである。多くの場合、関連文書は、対象となる用語そのものも含んでいる。
The commentary
次に、注釈文生成の処理について、図3を用いて説明する。まず、ステップ101において、用語抽出部21が、第1の蓄積部11に蓄積されるべき文書Aから注釈文を生成すべき用語を抽出する。文書Aが日本語文書である場合、注釈文を生成すべき用語は、固有名詞を含めて名詞であるか、名詞にいくつかの修飾語が付加された語句、いくつかの名詞を助詞で連結した語句が主であると考えられる。そこで固有名詞抽出のために、文書Aに対して例えば「Apache(登録商標) OpenNLP」のような固有名詞抽出ソフトウェアを適用し、文書Aから用語として固有名詞を抽出する。これと並行して、文書Aに対して例えばTF−IDFによるアルゴリズムなどを適用し、文書Aから重要な語句を抽出してこれも用語とする。TF−IDFは、単語の出現頻度と逆文書頻度とから単語の重要度を評価する手法である。ところで、文書から抽出すべき用語として法律の名称も挙げられるが、法律の名称には「行政手続における特定の個人を識別するための番号の利用等に関する法律」や「特定非常災害の被害者の権利利益の保全等を図るための特別措置に関する法律」など、多数の助詞などを含んでいるために通常の形態素解析によっては抽出できないものがある。そこで用語の抽出では、文書が法律名を含んでいる可能性があるときにその法律名を用語として抽出するために、コロケーション抽出による固有名詞抽出や、公開されている法令データベースによる検索を利用することも好ましい。なお、同一用語に対応する注釈文を重複して生成する必要がないので、用語抽出部21は、必要に応じて第2の蓄積部12内を検索し、既に注釈文が生成されている用語については重ねて用語を抽出しないようにすることが好ましい。
Next, the process of generating an annotation sentence will be described with reference to FIG. First, in
続いてステップ102において、関連文書取得部22は、ステップ101において抽出された用語を検索キーとして、第1の蓄積部11に蓄積されている文書の中から関連文書を検索して取得する。ステップ101において抽出された用語を含む文書が多数検索されることもあるが、その場合には、注釈文として用いられる要約文の生成に適した文書を関連文書とする。関連文書は、対象とする用語を解説するものであることが適しているから、対象とする用語に関する言及、被言及の関係を調べて関連文書を絞り込むことができる。あるいは、「FastText」ソフトウェアなどを用いて用語の分散表現を取得した上で、関連文書の候補となる文書に対してコサイン類似度などの手法を用いて用語に対するその文書の類似度を計算し、類似度に基づいて関連文書を選択してもよい。「Doc2Vec」ソフトウェアを使用し、用語に対する類似度に基づいて関連文書を選択してもよい。用語に対する類似度に基づいて関連文書を絞り込むときは、基本的には類似度が高い文書を関連文書とする。類似度に基づいて関連文書を選択することにより、より適切な内容の注釈文を得ることができる。関連文書の候補となる文書が一定数を超えて取得されるときは、類似度がしきい値を超える、2以上の所定数の文書を関連文書としてそれらの関連文書から要約文を生成することができる。この場合、複数の関連文書に点在している情報を集約することになるので、さらに適切な情報を含む注釈文を一挙に得ることができる。しきい値や所定数は、類似度の算出方法やどれだけの関連文書から要約文を生成するかに応じて予め定められる。
Subsequently, in
以上の説明では、関連文書取得部22は、第1の蓄積部11に蓄積されている文書の中から関連文書を取得しているが、関連文書の検索範囲を拡大することも可能である。図2において破線で示すように、インターネットなどの外部ネットワーク60に外部サーバ61が接続しているときに、関連文書取得部22は、外部サーバ61に格納されている文書から関連文書を取得してもよい。外部サーバ61から関連文書を取得することにより、第1の蓄積部11に蓄積された文書からは適切な関連文書を取得できない場合であっても注釈文を生成することが可能になる。
In the above description, the related
続いてステップ103において、要約文生成部23が、関連文書取得部22が取得した関連文書から人工知能を用いて要約文を生成する。要約文は、例えば「LexRank」ソフトウェアを使用して生成される。第1の蓄積部11から取得された関連文書と外部サーバ61から取得された関連文書があるときは、第1の蓄積部11から取得された関連文書を優先して要約文を生成する。これは、外部サーバ61から取得される関連文書には検索ノイズに相当するものが含まれる可能性も高く、正確性に欠けるものが存在するおそれがあるためである。そののちステップ104において、要約文生成部23は、生成した要約文を注釈文として、対応する用語に関連付けて第2の蓄積部12に蓄積する。
Subsequently, in
以上、本実施形態における注釈文の生成を説明したが、「Apache(登録商標) OpenNLP」、「FastText」、「Doc2Vec」、「LexRank」の各ソフトウェアはオープンソースソフトウェアであり、容易に実装することができる。また、TF−IDF手法を実現するソフトウェアやコサイン類似度などを算出するソフトウェアもオープンソースソフトウェアとして入手可能である。本実施形態において注釈文生成部20は、サーバ用コンピュータによって構成される文書管理・閲覧システム10上で実行されるソフトウェアによって実現することができる。
Although the generation of the annotation text in the present embodiment has been described above, the software of "Apache (registered trademark) OpenNLP", "FastText", "Doc2Vec", and "LexRank" is open source software and should be easily implemented. Can be done. In addition, software that realizes the TF-IDF method and software that calculates cosine similarity and the like are also available as open source software. In the present embodiment, the comment
次に、本実施形態での利用者の端末50における文書中の用語の選択と注釈文の表示とについて、図4を用いて説明する。文書管理・閲覧システム10の第1の蓄積部11に蓄積されている文書のいずれかが端末50の表示画面に表示されているとして、図4は、表示画面に文書に表示されている状態を示している。文書は、表示画面内の文書表示ウィンドウ70内に表示されている。文書が例えばハイパーテキスト文書、あるいは文字コードが埋め込まれているPDF(ポータブルドキュメントフォーマット)文書であるとすると、利用者は、マウスなどを使用して表示中の文書に含まれる文字列を選択することができる。表示画面がタッチパネルであれば、対象とする文字列の先頭文字に指を置いてその文字列の範囲をドラッグすることにより、その文字列を選択することができる。本実施形態では、表示画面において選択された文字列を、表示中の文書において利用者が選択した用語とする。図4では、四角で囲まれた「個人情報保護方針」の文字列71が選択された用語である。選択された文字列71については、表示色を変える、その文字列71の部分の背景色を変えるなどして強調表示されるようにすることが好ましい。ブラウザあるいはPDF文書において文字列を選択した場合には、通常、その文字列は強調表示される。さらに、表示されている文書において、選択された文字列と同じ文字列が選択された箇所以外にも存在する場合には、それらの箇所における同一文字列を強調表示するようにしてもよい。
Next, the selection of terms in the document and the display of the annotation text on the user's terminal 50 in the present embodiment will be described with reference to FIG. Assuming that any of the documents stored in the
そして利用者は、用語が選択された状態で例えばマウスの右クリックによりコンテキストメニューを呼び出し、コンテキストメニュー中の「注釈文の表示」を選択すると、選択された用語が制御部13に送信され、制御部13からその用語に対応する注釈文が端末50に送られ、端末50では、その表示画面において選択された文字列71に対応して図4に示すように吹き出し72が現れる。吹き出し72の内部には、選択された用語(ここでは「個人情報保護方針」)に対する注釈文が表示される。注釈文の表示方法としては、吹き出しによる方法のほか、ポップアップウィンドウによる方法、新規タブあるいは別ページによる方法、別コラムによる方法、新規または別ウィンドウによる方法などがある。コンテキスメニューに「注釈文の表示」を追加し、「注釈文の表示」が選択されたときに、選択された用語のデータを制御部13に送信し、制御部13から送られてきた注釈文を何らかの形態で表示させることは、専用アプリケーションによって実現できるし、一般的なブラウザを使用する場合においてもブラウザにおける設定やその端末50のオペレーティングシステム(OS)の設定によって実現することができる。
Then, when the user calls the context menu by right-clicking the mouse, for example, with the term selected and selects "display commentary" in the context menu, the selected term is transmitted to the
さらに、第1の蓄積部11に蓄積される文書において、JavaScript(登録商標)などを使用し、文書中の各用語に対しその用語に対する注釈文情報を埋め込み、文書が表示されたときに利用者が文書中の用語に対してマウスカーソルなどを重ねたときに、第2の蓄積部12に格納されている注釈文であってその注釈部情報に対応する注釈文が表示されるようにすることも可能である。この場合、第2の蓄積部12において用語ごとの注釈文を格納することで、文書のデータサイズを小さくすることができ、また、用語に対する注釈文を更新する必要が生じたときにも柔軟に対応することが可能になる。
Further, in the document stored in the
注釈文を表示させるために、第2の蓄積部12に格納されている注釈文に対するリンクを文書に埋め込むことも可能である。この場合、端末50において表示されている文書において用語を例えばマウスでクリックすることにより、その用語に対応する注釈文が端末50の表示画面に表示されることになる。この場合は、用語に対するマウスによるクリックにより用語を選択できるので、用語の選択のために用語となるべき文字列の範囲を画面において指定する必要はない。しかしながら、注釈文に対するリンクを文書に埋め込む場合には、例えば、法律名である「特定非常災害の被害者の権利利益の保全等を図るための特別措置に関する法律」の文言を含む文書が表示されているときに、利用者が欲している注釈文が「特定非常災害」自体に対するものなのか、法律である「特定非常災害の被害者の権利利益の保全等を図るための特別措置に関する法律」に対するものかを区別することが難しい、というデメリットが生じる。
In order to display the comment text, it is also possible to embed a link to the comment text stored in the
本実施形態の文書管理・閲覧システム10によれば、人工知能を用いて注釈文を生成するので、用語についての適切な注釈文を少ない労力で作成できる。特に、第1の蓄積部10への文書の蓄積と平行して注釈文の自動生成を行うことにより、作業量を最小のものとすることができる。本実施形態によれば、文書管理・閲覧システム10を用いて文書を閲覧している利用者は、文書中の用語を解説した注釈文を即座に画面に表示させることができる。したがってこの文書管理・閲覧システム10によれば、利用者による文書の的確な理解を支援することができる。例えば窓口対応業務に本実施形態の文書管理・閲覧システム10を使用する場合、文書中に含まれる用語の意味などを調べるために検索を行う時間を削減でき、顧客からの問い合わせに対して素早く対応することが可能になって、業務効率が大きく向上する。
According to the document management /
10 文書管理・閲覧システム
11 第1の蓄積部
12 第2の蓄積部
13 制御部
20 注釈文生成部
21 用語抽出部
22 関連文書取得部
23 要約文生成部
30 ネットワーク
50 端末
60 外部ネットワーク
61 外部サーバ
10 Document management /
Claims (10)
前記文書を蓄積する第1の蓄積部と、
前記利用者に対して前記第1の蓄積部に蓄積された文書を表示する処理を実行する制御部と、
を備え、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語に対応する注釈文が前記利用者に対して表示され、
前記注釈文は人工知能によって生成されたものであることを特徴とする、文書管理・蓄積システム。 In a document management / viewing system that accumulates and manages documents and presents them to users
A first storage unit for storing the documents and
A control unit that executes a process of displaying documents stored in the first storage unit to the user, and a control unit.
With
With respect to the term selected by the user in the document displayed to the user, a commentary sentence corresponding to the term is displayed to the user.
A document management / storage system characterized in that the commentary is generated by artificial intelligence.
前記制御部は、前記利用者が選択した前記用語に基づいて前記第2の蓄積部から前記注釈文を選択し、選択した注釈文を前記利用者に対して表示する処理を実行する、請求項1に記載の文書管理・蓄積システム。 It is provided with a second storage unit that stores the commentary for each term in advance.
The control unit selects the commentary text from the second storage unit based on the term selected by the user, and executes a process of displaying the selected commentary text to the user. Document management / storage system according to 1.
前記注釈文生成部は、
前記第1の蓄積部に蓄積される文書から用語を抽出する用語抽出部と、
前記用語抽出部で抽出された前記用語に関連する関連文書を少なくとも前記第1の蓄積部に蓄積された文書の中から検索して取得する関連文書取得部と、
人工知能を使用して前記関連文書の要約文を生成し、前記注釈文として、対応する用語に関連付けて前記第2の蓄積部に蓄積する要約文生成部と、
を有する、請求項2に記載の文書管理・蓄積システム。 It is provided with a commentary sentence generation unit that generates the commentary sentence for each term.
The commentary sentence generation unit
A term extraction unit that extracts terms from documents stored in the first storage unit, and a term extraction unit.
A related document acquisition unit that searches and acquires related documents related to the term extracted by the term extraction unit from at least the documents stored in the first storage unit, and a related document acquisition unit.
An artificial intelligence is used to generate a summary sentence of the related document, and as the commentary sentence, a summary sentence generation unit that is associated with the corresponding term and is stored in the second storage unit, and a summary sentence generation unit.
The document management / storage system according to claim 2.
前記要約文生成部は、前記外部サーバから取得した前記関連文書よりも前記第1の蓄積部から取得した前記関連文書を優先して前記要約文を生成する、請求項3に記載の文書管理・蓄積システム。 The related document acquisition unit searches for and acquires the related document from an external server connected via a network, and obtains the related document.
The document management according to claim 3, wherein the summary sentence generation unit generates the summary sentence by giving priority to the related document acquired from the first storage unit over the related document acquired from the external server. Storage system.
前記要約文生成部は、前記類似度がしきい値を超える複数の前記関連文書から前記要約文を生成する、請求項3に記載の文書管理・閲覧システム。 The related document acquisition unit calculates the degree of similarity between the acquired related document and the term.
The document management / viewing system according to claim 3, wherein the summary sentence generation unit generates the summary sentence from a plurality of related documents whose similarity exceeds a threshold value.
文書管理・閲覧システムに蓄積された文書を利用者に対して表示するステップと、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語に対応する注釈文を前記利用者に対して表示するステップと、
を有し、
前記注釈文は人工知能によって生成されたものであることを特徴とする、注釈文表示方法。 In the annotation text display method in the document management / viewing system that accumulates and manages documents and presents them to users
The steps to display the documents stored in the document management / viewing system to the user,
For the term selected by the user in the document displayed to the user, a step of displaying an annotation sentence corresponding to the term to the user, and
Have,
A method of displaying an annotation text, characterized in that the annotation text is generated by artificial intelligence.
前記注釈文生成ステップは、
前記文書管理・閲覧システムに蓄積される文書から用語を抽出する用語抽出ステップと、
前記用語抽出ステップで抽出された前記用語に関連する関連文書を少なくとも前記文書管理・閲覧システムに蓄積された文書の中から検索して取得する関連文書取得ステップと、
人工知能を使用して前記関連文書の要約文を生成し、前記要約文を前記注釈文として、対応する用語に関連付けて前記文書管理・閲覧システムに蓄積する要約文生成ステップと、
を有する、請求項7に記載の注釈文表示方法。 A comment statement generation step for generating the commentary sentence for each term is provided.
The comment statement generation step is
A term extraction step for extracting terms from documents stored in the document management / viewing system, and
A related document acquisition step of searching and acquiring at least related documents related to the term extracted in the term extraction step from the documents stored in the document management / viewing system, and a related document acquisition step.
A summary sentence generation step of generating a summary sentence of the related document using artificial intelligence, using the summary sentence as the commentary sentence, associating it with a corresponding term, and accumulating it in the document management / viewing system.
The commentary text display method according to claim 7.
前記要約文生成ステップにおいて、前記外部サーバから取得した前記関連文書よりも前記文書管理・閲覧システムから取得した前記関連文書を優先して前記要約文を生成する、請求項8に記載の注釈文表示方法。 In the related document acquisition step, the related document is also searched and acquired from an external server connected via the network.
The annotation text display according to claim 8, wherein in the summary text generation step, the summary text is generated by giving priority to the related document acquired from the document management / viewing system over the related document acquired from the external server. Method.
前記要約文生成ステップにおいて、前記類似度がしきい値を超える複数の前記関連文書から前記要約文を生成する、請求項8に記載の注釈文表示方法。
In the related document acquisition step, the degree of similarity between the acquired related document and the term is calculated.
The commentary text display method according to claim 8, wherein in the summary text generation step, the summary text is generated from a plurality of related documents whose similarity exceeds a threshold value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020006803A JP2021114167A (en) | 2020-01-20 | 2020-01-20 | Document management/viewing system and annotation text display method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020006803A JP2021114167A (en) | 2020-01-20 | 2020-01-20 | Document management/viewing system and annotation text display method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021114167A true JP2021114167A (en) | 2021-08-05 |
Family
ID=77077599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020006803A Pending JP2021114167A (en) | 2020-01-20 | 2020-01-20 | Document management/viewing system and annotation text display method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021114167A (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009123067A (en) * | 2007-11-16 | 2009-06-04 | Hitachi Systems & Services Ltd | Term dictionary creating method, term dictionary creating apparatus, program, and recording medium |
JP2014071541A (en) * | 2012-09-27 | 2014-04-21 | Dainippon Printing Co Ltd | Dictionary registration management device, dictionary registration method, content analysis apparatus, and program |
JP2019016181A (en) * | 2017-07-07 | 2019-01-31 | 株式会社野村総合研究所 | Text summarization system |
JP2019061594A (en) * | 2017-09-28 | 2019-04-18 | 株式会社野村総合研究所 | Conference support system and conference support program |
-
2020
- 2020-01-20 JP JP2020006803A patent/JP2021114167A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009123067A (en) * | 2007-11-16 | 2009-06-04 | Hitachi Systems & Services Ltd | Term dictionary creating method, term dictionary creating apparatus, program, and recording medium |
JP2014071541A (en) * | 2012-09-27 | 2014-04-21 | Dainippon Printing Co Ltd | Dictionary registration management device, dictionary registration method, content analysis apparatus, and program |
JP2019016181A (en) * | 2017-07-07 | 2019-01-31 | 株式会社野村総合研究所 | Text summarization system |
JP2019061594A (en) * | 2017-09-28 | 2019-04-18 | 株式会社野村総合研究所 | Conference support system and conference support program |
Non-Patent Citations (3)
Title |
---|
北川 涼太、藤田 桂英: "議論掲示板におけるスレッド構造と時系列を考慮した自動要約", 情報処理学会 研究報告 知能システム(ICS) 2015−ICS−181 [ONLINE], JPN6023027894, 15 December 2015 (2015-12-15), JP, pages 1 - 6, ISSN: 0005164569 * |
本間 康允 外2名: "利用者の状況に応じた用語解説抽出システムの提案とその実現に向けた検討", インタラクティブ情報アクセスと可視化マイニング 第6回研究会研究発表予稿集 [ONLINE], JPN6023027895, 12 March 2014 (2014-03-12), JP, pages 26 - 33, ISSN: 0005098278 * |
西川 仁: "特集 深層学習による言語生成 深層学習による自動要約", 人工知能, vol. 第34巻 第4号, JPN6023027893, 1 July 2019 (2019-07-01), JP, pages 446 - 450, ISSN: 0005098279 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11269929B2 (en) | Combining semantic relationship information with entities and non-entities for predictive analytics in a cognitive system | |
US7788251B2 (en) | System, method and computer program product for concept-based searching and analysis | |
US8849789B2 (en) | System and method for searching for documents | |
US9922383B2 (en) | Patent claims analysis system and method | |
JP2010003015A (en) | Document search system | |
US8458187B2 (en) | Methods and systems for visualizing topic location in a document redundancy graph | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
JP2012146097A (en) | Document retrieval apparatus, document retrieval method and document retrieval program | |
US10324966B2 (en) | Search by example | |
JP2020035172A (en) | Generation method, generation program, and generation device | |
JP2008269069A (en) | Information processing system and method | |
KR20230057114A (en) | Method and apparatus for deriving keywords based on technical document database | |
US20150339786A1 (en) | Forensic system, forensic method, and forensic program | |
CN111126034A (en) | Medical variable relation processing method and device, computer medium and electronic equipment | |
JP2021114167A (en) | Document management/viewing system and annotation text display method thereof | |
JP6488399B2 (en) | Information presentation system and information presentation method | |
JP2010205006A (en) | Future expression collection system, future expression collection method and future expression collection program | |
KR101078966B1 (en) | System for analyzing documents | |
JP2021114166A (en) | Document management/viewing system and annotation text generation and display method thereof | |
KR20110094562A (en) | Efficient internet search method using related keywords diagram | |
JP7366473B1 (en) | Document processing program and information processing device | |
JP2020113048A (en) | Information processing apparatus and program | |
JP2014146076A (en) | Character string extraction method, character string extraction apparatus, and character string extraction program | |
KR20110010662A (en) | System for analyzing documents | |
JP7314089B2 (en) | Search support system and search support method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220331 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220408 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230712 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231003 |