JP2021114166A - Document management/viewing system and annotation text generation and display method thereof - Google Patents

Document management/viewing system and annotation text generation and display method thereof Download PDF

Info

Publication number
JP2021114166A
JP2021114166A JP2020006802A JP2020006802A JP2021114166A JP 2021114166 A JP2021114166 A JP 2021114166A JP 2020006802 A JP2020006802 A JP 2020006802A JP 2020006802 A JP2020006802 A JP 2020006802A JP 2021114166 A JP2021114166 A JP 2021114166A
Authority
JP
Japan
Prior art keywords
document
term
user
sentence
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020006802A
Other languages
Japanese (ja)
Inventor
祐乃 福島
Yuno Fukushiima
祐乃 福島
駿介 川端
Shunsuke Kawabata
駿介 川端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Edge Inc
Original Assignee
Toppan Forms Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Forms Co Ltd filed Critical Toppan Forms Co Ltd
Priority to JP2020006802A priority Critical patent/JP2021114166A/en
Publication of JP2021114166A publication Critical patent/JP2021114166A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

To provide a document management/viewing system that can display the latest and appropriate annotation text for a term when the term included in a document is selected and that can reduce labor required for the creation and maintenance of the annotation text.SOLUTION: A document management/viewing system 10 includes: a storage unit 11 that stores a document; an annotation text generation unit 20 that generates annotation text by artificial intelligent for a term when the term is given; and a control unit 13 that performs a process of displaying the document stored in the storage unit 11 to a user, and for a term selected by the user in the document displayed to the user, performs a process of inputting the term into the annotation text generation unit 20 to cause it generate annotation text, and displaying the annotation text generated by the annotation text generation unit 20 to the user.SELECTED DRAWING: Figure 1

Description

本発明は、文書管理・閲覧システムに関し、特に、文書管理・閲覧システムによって管理された文書に含まれる用語の理解を支援する注釈文の生成と表示に関する。 The present invention relates to a document management / viewing system, and more particularly to the generation and display of annotations that support the understanding of terms contained in a document managed by the document management / viewing system.

各種の文書を蓄積して管理し、利用者によって検索されまたは指定された文書を表示あるいは出力することによって提示して利用者の閲覧に供する文書管理・閲覧システムがある。利用者は、その必要とする文書を検索し、検索された文書を例えばコンピュータの表示画面上に表示する。文書管理・閲覧システムによる管理の対象となる文書として契約書や約款などがあるが、これらの文書は、契約において使用される用語や法律に詳しくないと理解することが難しい。同様に文書管理・閲覧システムによる管理の対象となる文書としてマニュアルや規定集などがあるが、これらの文書は分量が膨大であり、その記載内容をすぐに把握することが難しい。文書管理・閲覧システムで管理される文書の適切な理解のためにはその文書に含まれる用語の意味や定義などを知っている必要があるが、そのことは実際には難しく、文書の閲覧者は、詳しく内容を知りたい用語やよく分からない用語に遭遇するたびに、その用語をキーとして検索を行う必要が生じる。例えば、窓口対応業務などを文書管理・閲覧システムを用いて遂行する場合を考えると、顧客からの問い合わせに基づいて文書を検索し、検索された文書の内容を顧客に伝えるが、そのとき、その文書に含まれる用語などに疑問が生じたとき、その用語をキーとしてその文書内での検索やその用語を含む他の文書の検索を行う必要があり、再度の検索に要する時間の分だけ、業務効率が低下することになる。文書の適切な理解のためには、その文書に含まれる用語を解説する注釈文をその文書の閲覧者に対して適時に提示できることが求められる。 There is a document management / viewing system that accumulates and manages various documents, presents them by displaying or outputting documents searched or specified by the user, and makes them available for viewing by the user. The user searches for the required document and displays the searched document on, for example, a display screen of a computer. There are contracts and contracts as documents to be managed by the document management / viewing system, but it is difficult to understand these documents unless they are familiar with the terms and laws used in the contract. Similarly, there are manuals and regulation collections as documents to be managed by the document management / viewing system, but these documents are enormous in volume and it is difficult to immediately grasp the contents of the description. In order to properly understand a document managed by a document management / viewing system, it is necessary to know the meaning and definition of terms contained in the document, but that is actually difficult and the viewer of the document Whenever a term that you want to know in detail or a term that you do not understand is encountered, you need to search using that term as a key. For example, in the case of performing counter-service operations using a document management / viewing system, a document is searched based on an inquiry from the customer, and the content of the searched document is communicated to the customer. When a question arises about a term contained in a document, it is necessary to search within the document or another document containing the term using that term as a key, and only for the time required for another search. Business efficiency will decrease. For proper understanding of a document, it is required to be able to present commentary sentences explaining the terms contained in the document to the readers of the document in a timely manner.

文書に含まれる用語についての注釈文を適時にその文書の閲覧者に提示する方法として、文書自体をハイパーテキスト文書として構成し、用語ごとにその用語に対する注釈文を含むファイルをリンクとしてその文書に埋め込む方法が知られている。この方法によれば、コンピュータの表示装置においてその文書を表示しているときにマウスなどで用語をクリックすれば、例えばブラウザなどが起動してその用語に対する注釈文が表示される。また特許文献1は、文書管理・閲覧システムであって、表示されている文書中の用語がマウス操作などによって選択されたときに、その選択された用語をキーとして文書管理・閲覧システム内の他の文書の検索やインターネット上の検索を行って検索結果を表示できるシステムを開示している。 As a way to timely present commentary on a term contained in a document to the viewer of the document, the document itself is constructed as a hypertext document, and a file containing the commentary for that term is linked to the document for each term. The method of embedding is known. According to this method, if a term is clicked with a mouse or the like while the document is being displayed on a display device of a computer, for example, a browser or the like is started and an annotation sentence for the term is displayed. Further, Patent Document 1 is a document management / browsing system, and when a term in a displayed document is selected by a mouse operation or the like, the selected term is used as a key in the document management / browsing system. We disclose a system that can display search results by searching documents and searching on the Internet.

特開2006−79366号公報Japanese Unexamined Patent Publication No. 2006-79366

特許文献1に記載された方法は、文書中に含まれて利用者によって選択された用語をキーとして検索を行うものであるが、用語の理解に役立つ検索結果が必ず得られることを保証するものではない。一方、文書をハイパーテキスト文書とし、文書に含まれる用語に対してその用語についての注釈文のファイルに対するリンクを埋め込む場合、用語ごとの注釈文を予め作成してファイルとする必要があって注釈文の作成に労力を要する。特に、文書管理・閲覧システムに蓄積される文書の量が多い場合には、注釈文の作成に多大な作業時間がかかり、人手で実行することが非現実的となる。さらに注釈文を作成しても、注釈文の作成後に例えば法改正があって法律の名称が変更されるなど、日時の経過によってその注釈文が不適切なものとなる場合があり、最新の状況に適合するように注釈文を維持し続けることにも大きなコストがかかる。 The method described in Patent Document 1 performs a search using a term included in the document and selected by the user as a key, but guarantees that a search result useful for understanding the term is always obtained. is not it. On the other hand, when a document is a hypertext document and a link to a file of annotations about the terms is embedded in the terms contained in the document, it is necessary to create annotations for each term in advance and make it a file. It takes a lot of effort to create. In particular, when the amount of documents stored in the document management / viewing system is large, it takes a lot of work time to create the annotation text, which makes it unrealistic to execute it manually. Even if a commentary is created, the commentary may become inappropriate over time, for example, the name of the law may be changed due to a revision of the law after the commentary is created. It also costs a lot to keep the annotations to fit.

本発明の目的は、文書に含まれる用語が選択されたときにその用語に対する最新かつ適切な注釈文を表示でき、かつ、注釈文の作成と維持に要する労力を低減できる文書管理・閲覧システムとその注釈文生成表示方法とを提供することにある。 An object of the present invention is a document management / viewing system capable of displaying the latest and appropriate annotation text for a term when a term contained in the document is selected, and reducing the labor required for creating and maintaining the annotation text. The purpose is to provide a method for generating and displaying the annotation text.

上記の目的を達成するために本発明の文書管理・閲覧システムは、
文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおいて、
前記文書を蓄積する蓄積部と、
用語が与えられたときに前記用語に対する注釈文を人工知能によって生成する注釈文生成部と、
前記利用者に対して前記蓄積部に蓄積された文書を表示する処理を実行するとともに、前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語を前記注釈文生成部に入力して注釈文を生成させ、前記注釈文生成部が生成した前記注釈文を前記利用者に対して表示する処理を実行する制御部と、
を有することを特徴とする。
In order to achieve the above object, the document management / viewing system of the present invention
In a document management / viewing system that accumulates and manages documents and presents them to users
The storage unit that stores the documents and
An annotation sentence generation unit that generates an annotation sentence for the term by artificial intelligence when a term is given,
A process of displaying the document stored in the storage unit is executed for the user, and the term is added to the commentary regarding the term selected by the user in the document displayed to the user. A control unit that executes a process of inputting to the generation unit to generate an annotation text and displaying the annotation text generated by the annotation text generation unit to the user.
It is characterized by having.

上記の目的を達成するために本発明の注釈文生成表示方法は、
文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおける注釈文生成表示方法において、
文書管理・閲覧システムに蓄積された文書を利用者に対して表示するステップと、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、人工知能によって当該用語に対応する注釈文を生成するステップと、
生成した前記注釈文を前記利用者に対して表示するステップと、
を有することを特徴とする。
In order to achieve the above object, the annotation sentence generation display method of the present invention is:
In the annotation sentence generation and display method in the document management / viewing system that accumulates and manages documents and presents them to users
The steps to display the documents stored in the document management / viewing system to the user,
For the term selected by the user in the document displayed to the user, a step of generating an annotation sentence corresponding to the term by artificial intelligence, and a step of generating a commentary sentence corresponding to the term.
A step of displaying the generated annotation text to the user, and
It is characterized by having.

上記のように構成された本発明においては、表示された文書において利用者が用語を選択したときに、その選択された用語に関し、人工知能を用いて注釈文を生成して表示する。人工知能を使用することにより、人手を介することなく文書中の用語に対する最新かつ的確な注釈文を利用者に対して適時に表示することが可能になるとともに、注釈文の作成と維持に要する労力を低減することができる。 In the present invention configured as described above, when a user selects a term in the displayed document, an annotation sentence is generated and displayed by using artificial intelligence with respect to the selected term. By using artificial intelligence, it is possible to display the latest and accurate annotations to the terms in the document to the user in a timely manner without human intervention, and the effort required to create and maintain the annotations. Can be reduced.

本発明において注釈文は、利用者によって選択された用語に関連する関連文書を少なくとも文書管理・閲覧システムに蓄積された文書の中から検索して取得し、人工知能を使用して関連文書の要約文を生成して注釈文とすることによって生成することができる。利用者によって選択された用語を例えば検索キーとして使用し、文書管理・閲覧システムに蓄積された文書に対して検索を行って関連文書を取得することにより、文書管理・閲覧システムに現に存在する最新版の文書である関連文書を取得してその要約文を生成できることになるので、用語に対する最新かつ適切な注釈文を生成できるようになる。 In the present invention, the commentary text searches for and obtains related documents related to the term selected by the user from at least the documents stored in the document management / viewing system, and uses artificial intelligence to summarize the related documents. It can be generated by generating a sentence and making it an annotation sentence. By using the term selected by the user as a search key, for example, by searching the documents stored in the document management / viewing system and acquiring the related documents, the latest existing in the document management / viewing system is obtained. Since the related document, which is a version of the document, can be obtained and the summary sentence can be generated, the latest and appropriate commentary sentence for the term can be generated.

関連文書の取得では、文書管理・閲覧システムに蓄積された文書から関連文書を取得するだけでなく、例えばインターネットなどのネットワークを介して接続した外部サーバから関連文書を検索して取得してもよい。外部サーバから関連文書を取得することにより、文書管理・閲覧システムに蓄積された文書からは適切な関連文書を取得できない場合であっても注釈文を生成することが可能になる。ただし、外部サーバから取得される関連文書には検索ノイズに相当するものが含まれる可能性も高いため、要約文の生成に際しては、文書管理・閲覧システムから取得した関連文書を優先して用いることが好ましい。また、一定数を超える関連文書が取得される場合には、関連文書ごとに用語との類似度を算出し、類似度がしきい値を超える2以上の所定数の関連文書から要約文を生成することが好ましい。類似度に基づいて関連文書を選択することにより、より適切な内容の注釈文を得ることができる。また、複数の関連文書に点在している情報を集約することにより、さらに適切な情報を含む注釈文を一挙に得ることができる。 In the acquisition of related documents, not only the related documents may be acquired from the documents stored in the document management / viewing system, but also the related documents may be searched and acquired from an external server connected via a network such as the Internet. .. By acquiring the related document from the external server, it is possible to generate an annotation even if an appropriate related document cannot be acquired from the document stored in the document management / viewing system. However, since there is a high possibility that the related documents acquired from the external server include those equivalent to search noise, the related documents acquired from the document management / viewing system should be used with priority when generating the summary sentence. Is preferable. In addition, when a certain number of related documents are acquired, the similarity with the term is calculated for each related document, and a summary sentence is generated from a predetermined number of related documents whose similarity exceeds the threshold value. It is preferable to do so. By selecting related documents based on the degree of similarity, it is possible to obtain annotations with more appropriate contents. In addition, by aggregating the information scattered in a plurality of related documents, it is possible to obtain an annotation sentence including more appropriate information at once.

本発明によれば、文書に含まれる用語が選択されたときにその用語に対する最新かつ適切な注釈文を表示でき、かつ、注釈文の作成と維持に要する労力を低減できる。 According to the present invention, when a term contained in a document is selected, the latest and appropriate commentary for the term can be displayed, and the labor required for creating and maintaining the commentary can be reduced.

本発明の実施の一形態の文書管理・閲覧システムの構成を示すブロック図である。It is a block diagram which shows the structure of the document management / viewing system of one Embodiment of this invention. 注釈文を生成する処理を示すフローチャートである。It is a flowchart which shows the process of generating an annotation sentence. 文書中の用語の選択と注釈文の表示とを示す図である。It is a figure which shows the selection of the term in a document, and the display of an annotation sentence.

次に、本発明の実施の形態について、図面を参照して説明する。図1は、本発明の実施の一形態の文書管理・閲覧システムの構成を示すブロック図である。文書管理・閲覧システム10は、例えばサーバ用コンピュータによって構成されるものであり、事業体などにおいて発生する文書を蓄積して管理し、利用者によって検索されまたは指定された文書を表示あるいは出力することによって提示して利用者の閲覧に供する。 Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a document management / viewing system according to an embodiment of the present invention. The document management / viewing system 10 is composed of, for example, a computer for a server, and accumulates and manages documents generated in a business entity or the like, and displays or outputs a document searched or specified by a user. Presented by the user for viewing.

文書管理・閲覧システム10には、ローカルエリアネットワーク(LAN)や仮想プライベートネットワーク(VPN)などのネットワーク30を介して、利用者が使用する1または複数の端末50が接続する。端末50としては、グラフィカルユーザインタフェース(GUI)を備えたパーソナルコンピュータなどが使用され、文書管理・閲覧システム10によって利用者に表示される文書は、端末50の表示装置上に表示される。文書管理・閲覧システム10は、この文書管理・閲覧システム10による管理対象である文書を蓄積する蓄積部11と、注釈文を生成する注釈文生成部20と、制御部13とを備えている。注釈文とは、蓄積部11に蓄積された文書に含まれる各用語について、その用語を解説してその用語の理解を支援する文章のことであり、人工知能(AI)を用いて生成されるものである。本実施形態では、後述するように、注釈文は、オンデマンドで、すなわちそれが必要になったときに生成される。 One or more terminals 50 used by the user are connected to the document management / viewing system 10 via a network 30 such as a local area network (LAN) or a virtual private network (VPN). As the terminal 50, a personal computer or the like provided with a graphical user interface (GUI) is used, and the document displayed to the user by the document management / viewing system 10 is displayed on the display device of the terminal 50. The document management / viewing system 10 includes a storage unit 11 for accumulating documents to be managed by the document management / viewing system 10, an annotation sentence generation unit 20 for generating annotation sentences, and a control unit 13. The commentary sentence is a sentence that explains each term contained in the document stored in the storage unit 11 and supports the understanding of the term, and is generated by using artificial intelligence (AI). It is a thing. In this embodiment, the commentary is generated on demand, i.e. when it is needed, as described below.

制御部13は、文書管理・閲覧システム10においてネットワーク30を介して利用者の端末50とのインタフェースとなる部分であり、利用者からの要求に基づいて蓄積部11内の文書を検索して検索された文書を利用者の端末50の表示画面に表示する処理を実行する。また制御部13は、利用者の端末50の画面において表示されている文書において、利用者がその文書に含まれる用語を端末50の画面上で選択した場合に、選択された用語が端末50から通知されて、通知された用語に基づいて注釈文生成部20に注釈文を生成させ、生成された注釈文を利用者の端末50の画面に表示する処理も実行する。制御部13のこれらの処理を実行する機能は、サーバ用コンピュータによって構成された文書管理・閲覧システム10において実行されるコンピュータプログラムによって実現することができる。 The control unit 13 is a part of the document management / viewing system 10 that serves as an interface with the user's terminal 50 via the network 30, and searches and searches for documents in the storage unit 11 based on a request from the user. The process of displaying the created document on the display screen of the user's terminal 50 is executed. Further, when the user selects a term included in the document on the screen of the terminal 50 in the document displayed on the screen of the user's terminal 50, the control unit 13 selects the term from the terminal 50. Upon being notified, the comment statement generation unit 20 is made to generate a commentary sentence based on the notified term, and a process of displaying the generated commentary sentence on the screen of the user's terminal 50 is also executed. The function of executing these processes of the control unit 13 can be realized by a computer program executed in the document management / viewing system 10 configured by the server computer.

注釈文生成部20は、端末50から通知された用語に関連する関連文書を少なくとも蓄積部11に蓄積された文書の中から検索して取得する関連文書取得部22と、人工知能を使用して関連文書の要約文を注釈文として生成する要約文生成部23とを備えている。ここで関連文書とは、対象となる用語についての説明や解説などを含む可能性がある文書のことである。多くの場合、関連文書は、対象となる用語そのものも含んでいる。 The annotation sentence generation unit 20 uses artificial intelligence and a related document acquisition unit 22 that searches and acquires at least the related documents related to the terms notified from the terminal 50 from the documents stored in the storage unit 11. It includes a summary sentence generation unit 23 that generates a summary sentence of a related document as a commentary sentence. Here, the related document is a document that may include explanations and explanations about the target term. In many cases, the relevant document also includes the term itself in question.

端末50は、その画面に文書管理・閲覧システム10から送られてきた文書や注釈文を表示するとともに、画面に表示された文書に含まれる用語が利用者によって選択されたときに、その用語を文書管理・閲覧システムに送信する機能を有する。このような端末50の機能は、一般的なブラウザソフトウェアあるいは専用のアプリケーションによって実行される。なお、文書管理・閲覧システム10のうち、制御部13の機能を端末50において実現することも可能である。 The terminal 50 displays a document or commentary sent from the document management / viewing system 10 on the screen, and when a term included in the document displayed on the screen is selected by the user, the term is displayed. It has a function to send to the document management / viewing system. The function of such a terminal 50 is executed by general browser software or a dedicated application. Of the document management / viewing system 10, the function of the control unit 13 can also be realized in the terminal 50.

次に、注釈文生成の処理について、図2を用いて説明する。まず、ステップ101において、制御部13は、端末50から、端末50において利用者に対して表示されている文書において利用者が選択した用語を受け付け、その用語を注釈文生成部20に転送する。するとステップ102において、関連文書取得部22は、転送されてきた用語を検索キーとして、蓄積部11に蓄積されている文書の中から関連文書を検索して取得する。転送されてきた用語を含む文書が多数検索されることもあるが、その場合には、注釈文として用いられる要約文の生成に適した文書を関連文書とする。関連文書は、対象とする用語を解説するものであることが適しているから、対象とする用語に関する言及、被言及の関係を調べて関連文書を絞り込むことができる。あるいは、「FastText」ソフトウェアなどを用いて用語の分散表現を取得した上で、関連文書の候補となる文書に対してコサイン類似度などの手法を用いて用語に対するその文書の類似度を計算し、類似度に基づいて関連文書を選択してもよい。「Doc2Vec」ソフトウェアを使用し、用語に対する類似度に基づいて関連文書を選択してもよい。用語に対する類似度に基づいて関連文書を絞り込むときは、基本的には類似度が高い文書を関連文書とする。類似度に基づいて関連文書を選択することにより、より適切な内容の注釈文を得ることができる。関連文書の候補となる文書が一定数を超えて取得されるときは、類似度がしきい値を超える、2以上の所定数の文書を関連文書としてそれらの関連文書から要約文を生成することができる。この場合、複数の関連文書に点在している情報を集約することになるので、さらに適切な情報を含む注釈文を一挙に得ることができる。しきい値や所定数は、類似度の算出方法やどれだけの関連文書から要約文を生成するかに応じて予め定められる。 Next, the process of generating an annotation sentence will be described with reference to FIG. First, in step 101, the control unit 13 receives a term selected by the user in the document displayed to the user on the terminal 50 from the terminal 50, and transfers the term to the annotation sentence generation unit 20. Then, in step 102, the related document acquisition unit 22 searches for and acquires the related document from the documents stored in the storage unit 11 using the transferred term as a search key. A large number of documents containing the transferred terms may be searched, and in that case, a document suitable for generating a summary sentence used as an annotation sentence is set as a related document. Since it is appropriate that the related document explains the target term, it is possible to narrow down the related document by examining the relationship between the reference and the reference to the target term. Alternatively, after obtaining a distributed representation of the term using "FastText" software or the like, the similarity of the document to the term is calculated by using a method such as cosine similarity to the document that is a candidate for the related document. Related documents may be selected based on similarity. You may use the "Doc2Vec" software to select relevant documents based on their similarity to the term. When narrowing down related documents based on the similarity to terms, basically, the documents with high similarity are regarded as related documents. By selecting related documents based on the degree of similarity, it is possible to obtain annotations with more appropriate contents. When more than a certain number of documents that are candidates for related documents are acquired, a summary sentence is generated from those related documents with a predetermined number of documents whose similarity exceeds the threshold value as related documents. Can be done. In this case, since the information scattered in a plurality of related documents is aggregated, it is possible to obtain an annotation sentence including more appropriate information at once. The threshold value and the predetermined number are predetermined according to the calculation method of the similarity and how many related documents the summary sentence is generated from.

以上の説明では、関連文書取得部22は、蓄積部11に蓄積されている文書の中から関連文書を取得しているが、関連文書の検索範囲を拡大することも可能である。図1において破線で示すように、インターネットなどの外部ネットワーク60に外部サーバ61が接続しているときに、関連文書取得部22は、外部サーバ61に格納されている文書から関連文書を取得してもよい。外部サーバ61から関連文書を取得することにより、蓄積部11に蓄積された文書からは適切な関連文書を取得できない場合であっても注釈文を生成することが可能になる。 In the above description, the related document acquisition unit 22 acquires the related document from the documents stored in the storage unit 11, but it is also possible to expand the search range of the related document. As shown by the broken line in FIG. 1, when the external server 61 is connected to the external network 60 such as the Internet, the related document acquisition unit 22 acquires the related document from the document stored in the external server 61. May be good. By acquiring the related document from the external server 61, it is possible to generate an annotation sentence even when an appropriate related document cannot be acquired from the document stored in the storage unit 11.

続いてステップ103において、要約文生成部23が、関連文書取得部22が取得した関連文書から人工知能を用いて要約文を生成する。要約文は、例えば「LexRank」ソフトウェアを使用して生成される。蓄積部11から取得された関連文書と外部サーバ61から取得された関連文書があるときは、蓄積部11から取得された関連文書を優先して要約文を生成する。これは、外部サーバ61から取得される関連文書には検索ノイズに相当するものが含まれる可能性も高く、正確性に欠けるものが存在するおそれがあるためである。そののちステップ104において、要約文生成部23は、生成した要約文を注釈文として制御部13に出力し、制御部13は、その注釈文を利用者の端末50の表示画面に表示するためにその注釈文を端末50に送信する。 Subsequently, in step 103, the summary sentence generation unit 23 generates a summary sentence from the related document acquired by the related document acquisition unit 22 using artificial intelligence. The abstract is generated using, for example, "LexRank" software. When there is a related document acquired from the storage unit 11 and a related document acquired from the external server 61, the related document acquired from the storage unit 11 is prioritized to generate a summary sentence. This is because there is a high possibility that the related documents acquired from the external server 61 include those corresponding to the search noise, and there is a possibility that some of them lack accuracy. After that, in step 104, the summary sentence generation unit 23 outputs the generated summary sentence as a commentary sentence to the control unit 13, and the control unit 13 displays the commentary sentence on the display screen of the user's terminal 50. The commentary is transmitted to the terminal 50.

以上、本実施形態における注釈文の生成を説明したが、「FastText」、「Doc2Vec」、「LexRank」の各ソフトウェアはオープンソースソフトウェアであり、容易に実装することができる。また、コサイン類似度などを算出するソフトウェアもオープンソースソフトウェアとして入手可能である。本実施形態において注釈文生成部20は、サーバ用コンピュータによって構成される文書管理・閲覧システム10上で実行されるソフトウェアによって実現することができる。 Although the generation of the annotation text in the present embodiment has been described above, the software of "FastText", "Doc2Vec", and "LexRank" is open source software and can be easily implemented. Software for calculating cosine similarity and the like is also available as open source software. In the present embodiment, the comment statement generation unit 20 can be realized by software executed on the document management / viewing system 10 configured by the server computer.

次に、本実施形態での利用者の端末50における文書中の用語の選択と注釈文の表示とについて、図3を用いて説明する。文書管理・閲覧システム10の蓄積部11に蓄積されている文書のいずれかが端末50の表示画面に表示されているとして、図3は、表示画面に文書に表示されている状態を示している。文書は、表示画面内の文書表示ウィンドウ70内に表示されている。文書が例えばハイパーテキスト文書、あるいは文字コードが埋め込まれているPDF(ポータブルドキュメントフォーマット)文書であるとすると、利用者は、マウスなどを使用して表示中の文書に含まれる文字列を選択することができる。表示画面がタッチパネルであれば、対象とする文字列の先頭文字に指を置いてその文字列の範囲をドラッグすることにより、その文字列を選択することができる。本実施形態では、表示画面において選択された文字列を、表示中の文書において利用者が選択した用語とする。図3では、四角で囲まれた「個人情報保護方針」の文字列71が選択された用語である。選択された文字列71については、表示色を変える、その文字列71の部分の背景色を変えるなどして強調表示されるようにすることが好ましい。ブラウザあるいはPDF文書において文字列を選択した場合には、通常、その文字列は強調表示される。さらに、表示されている文書において、選択された文字列と同じ文字列が選択された箇所以外にも存在する場合には、それらの箇所における同一文字列を強調表示するようにしてもよい。 Next, the selection of terms in the document and the display of the annotation text on the user's terminal 50 in the present embodiment will be described with reference to FIG. Assuming that any of the documents stored in the storage unit 11 of the document management / viewing system 10 is displayed on the display screen of the terminal 50, FIG. 3 shows a state in which the document is displayed on the display screen. .. The document is displayed in the document display window 70 in the display screen. Assuming that the document is, for example, a hypertext document or a PDF (portable document format) document in which a character code is embedded, the user can select a character string included in the displayed document by using a mouse or the like. Can be done. If the display screen is a touch panel, the character string can be selected by placing a finger on the first character of the target character string and dragging the range of the character string. In the present embodiment, the character string selected on the display screen is the term selected by the user in the displayed document. In FIG. 3, the character string 71 of the “personal information protection policy” surrounded by a square is the selected term. It is preferable that the selected character string 71 is highlighted by changing the display color or the background color of the portion of the character string 71. If you select a string in your browser or PDF document, that string is usually highlighted. Further, in the displayed document, if the same character string as the selected character string exists in a place other than the selected place, the same character string in those places may be highlighted.

そして利用者は、用語が選択された状態で例えばマウスの右クリックによりコンテキストメニューを呼び出し、コンテキストメニュー中の「注釈文の表示」を選択すると、選択された用語が制御部13に送信され、その結果、注釈文生成部20がその用語に対応する注釈文を生成し、生成された注釈文は制御部13から端末50に送られる、端末50では、その表示画面において選択された文字列71に対応して図3に示すように吹き出し72が現れる。吹き出し72の内部には、選択された用語(ここでは「個人情報保護方針」)に対して生成された注釈文が表示される。注釈文の表示方法としては、吹き出しによる方法のほか、ポップアップウィンドウによる方法、新規タブあるいは別ページによる方法、別コラムによる方法、新規または別ウィンドウによる方法などがある。コンテキスメニューに「注釈文の表示」を追加し、「注釈文の表示」が選択されたときに、選択された用語のデータを制御部13に送信し、制御部13から送られてきた注釈文を何らかの形態で表示させることは、専用アプリケーションによって実現できるし、一般的なブラウザを使用する場合においてもブラウザにおける設定やその端末50のオペレーティングシステム(OS)の設定によって実現することができる。 Then, when the user calls the context menu by right-clicking the mouse, for example, with the term selected and selects "display annotation text" in the context menu, the selected term is transmitted to the control unit 13, and the selected term is transmitted to the control unit 13. As a result, the annotation sentence generation unit 20 generates an annotation sentence corresponding to the term, and the generated annotation sentence is sent from the control unit 13 to the terminal 50. In the terminal 50, the character string 71 selected on the display screen is displayed. Correspondingly, the blowout 72 appears as shown in FIG. Inside the balloon 72, an annotation text generated for the selected term (here, "personal information protection policy") is displayed. As a method of displaying the annotation text, in addition to the method of using a balloon, the method of using a pop-up window, the method of using a new tab or another page, the method of using another column, the method of using a new or another window, and the like. "Display annotation text" is added to the context menu, and when "Display annotation text" is selected, the data of the selected term is sent to the control unit 13, and the annotation text sent from the control unit 13 is sent. Can be displayed in some form by a dedicated application, and even when a general browser is used, it can be realized by the setting in the browser and the setting of the operating system (OS) of the terminal 50.

本実施形態の文書管理・閲覧システム10によれば、端末50において表示されている文書において利用者が用語を選択したときに、人工知能によりその用語に対する注釈文が自動的に生成されて端末50の表示画面上に表示される。利用者は、文書中の用語を解説した注釈文を短時間のうちに画面に表示させることができ、この文書管理・閲覧システム10によれば、利用者による文書の理解を支援することができる。利用者の要求のあった時点で人工知能を用いて注釈文を生成しているので最新の内容で的確な注釈文を得ることができるとともに、注釈文の作成と維持に要する労力を低減できる。本実施形態によれば、例えば窓口対応業務に本実施形態の文書管理・閲覧システム10を使用する場合、文書中に含まれる用語の意味などを調べるために検索を行う時間を削減でき、顧客からの問い合あせに対して素早く対応することが可能になって、業務効率が大きく向上する。 According to the document management / viewing system 10 of the present embodiment, when a user selects a term in the document displayed on the terminal 50, an annotation sentence for the term is automatically generated by artificial intelligence and the terminal 50 is used. Is displayed on the display screen. The user can display the commentary text explaining the terms in the document on the screen in a short time, and according to this document management / viewing system 10, it is possible to support the user's understanding of the document. .. Since the annotation text is generated using artificial intelligence at the time of the user's request, it is possible to obtain an accurate annotation text with the latest contents and reduce the labor required for creating and maintaining the annotation text. According to the present embodiment, for example, when the document management / viewing system 10 of the present embodiment is used for the counter-correspondence work, it is possible to reduce the time for searching to find out the meaning of terms contained in the document, and the customer can reduce the time. It will be possible to respond quickly to inquiries, which will greatly improve work efficiency.

10 文書管理・閲覧システム
11 蓄積部
13 制御部
20 注釈文生成部
22 関連文書取得部
23 要約文生成部
30 ネットワーク
50 端末
60 外部ネットワーク
61 外部サーバ
10 Document management / viewing system 11 Storage unit 13 Control unit 20 Annotation sentence generation unit 22 Related document acquisition unit 23 Summary sentence generation unit 30 Network 50 Terminal 60 External network 61 External server

Claims (8)

文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおいて、
前記文書を蓄積する蓄積部と、
用語が与えられたときに前記用語に対する注釈文を人工知能によって生成する注釈文生成部と、
前記利用者に対して前記蓄積部に蓄積された文書を表示する処理を実行するとともに、前記利用者に対して表示された前記文書において前記利用者が選択した用語について、当該用語を前記注釈文生成部に入力して注釈文を生成させ、前記注釈文生成部が生成した前記注釈文を前記利用者に対して表示する処理を実行する制御部と、
を有することを特徴とする、文書管理・蓄積システム。
In a document management / viewing system that accumulates and manages documents and presents them to users
The storage unit that stores the documents and
An annotation sentence generation unit that generates an annotation sentence for the term by artificial intelligence when a term is given,
A process of displaying the document stored in the storage unit is executed for the user, and the term is added to the commentary regarding the term selected by the user in the document displayed to the user. A control unit that executes a process of inputting to the generation unit to generate an annotation text and displaying the annotation text generated by the annotation text generation unit to the user.
A document management / storage system characterized by having.
前記注釈文生成部は、
前記利用者が選択した前記用語に関連する関連文書を少なくとも蓄積部に蓄積された文書の中から検索して取得する関連文書取得部と、
人工知能を使用して前記関連文書の要約文を生成して前記注釈文として出力する要約文生成部と、
を有する、請求項1に記載の文書管理・蓄積システム。
The commentary sentence generation unit
A related document acquisition unit that searches and acquires at least related documents related to the term selected by the user from the documents stored in the storage unit, and a related document acquisition unit.
A summary sentence generation unit that generates a summary sentence of the related document using artificial intelligence and outputs it as the commentary sentence, and a summary sentence generation unit.
The document management / storage system according to claim 1.
前記関連文書取得部は、ネットワークを介して接続した外部サーバからも前記関連文書を検索して取得し、
前記要約文生成部は、前記外部サーバから取得した前記関連文書よりも前記蓄積部から取得した前記関連文書を優先して前記要約文を生成する、請求項2に記載の文書管理・蓄積システム。
The related document acquisition unit searches for and acquires the related document from an external server connected via a network, and obtains the related document.
The document management / storage system according to claim 2, wherein the summary sentence generation unit generates the summary sentence by giving priority to the related document acquired from the storage unit over the related document acquired from the external server.
前記関連文書取得部は、取得した前記関連文書と前記用語との類似度を算出し、
前記要約文生成部は、前記類似度がしきい値を超える複数の前記関連文書から前記要約文を生成する、請求項2に記載の文書管理・閲覧システム。
The related document acquisition unit calculates the degree of similarity between the acquired related document and the term.
The document management / viewing system according to claim 2, wherein the summary sentence generation unit generates the summary sentence from a plurality of related documents whose similarity exceeds a threshold value.
文書を蓄積して管理し利用者に提示する文書管理・閲覧システムにおける注釈文生成表示方法において、
文書管理・閲覧システムに蓄積された文書を利用者に対して表示するステップと、
前記利用者に対して表示された前記文書において前記利用者が選択した用語について、人工知能によって当該用語に対応する注釈文を生成するステップと、
生成した前記注釈文を前記利用者に対して表示するステップと、
を有することを特徴とする、注釈文生成表示方法。
In the annotation sentence generation and display method in the document management / viewing system that accumulates and manages documents and presents them to users
The steps to display the documents stored in the document management / viewing system to the user,
For the term selected by the user in the document displayed to the user, a step of generating an annotation sentence corresponding to the term by artificial intelligence, and a step of generating a commentary sentence corresponding to the term.
A step of displaying the generated annotation text to the user, and
An annotation sentence generation display method, characterized in that it has.
前記注釈文を生成するステップは、
前記利用者によって選択された前記用語に関連する関連文書を少なくとも前記文書管理・閲覧システムに蓄積された文書の中から検索して取得する関連文書取得ステップと、
人工知能を使用して前記関連文書の要約文を生成して前記注釈文とする要約文生成ステップと、
を有する、請求項5に記載の注釈文生成表示方法。
The step of generating the commentary is
A related document acquisition step of searching and acquiring a related document related to the term selected by the user from at least the documents stored in the document management / viewing system, and a related document acquisition step.
A summary sentence generation step in which artificial intelligence is used to generate a summary sentence of the related document and use it as the commentary sentence.
The commentary sentence generation display method according to claim 5, wherein the commentary text is generated and displayed.
前記関連文書取得ステップにおいて、ネットワークを介して接続した外部サーバからも前記関連文書を検索して取得し、
前記要約文生成ステップにおいて、前記外部サーバから取得した前記関連文書よりも前記文書管理・閲覧システムから取得した前記関連文書を優先して前記要約文を生成する、請求項6に記載の注釈文生成表示方法。
In the related document acquisition step, the related document is also searched and acquired from an external server connected via the network.
The commentary sentence generation according to claim 6, wherein in the abstract sentence generation step, the abstract sentence is generated by giving priority to the related document acquired from the document management / viewing system over the related document acquired from the external server. Display method.
前記関連文書取得ステップにおいて、取得した前記関連文書と前記用語との類似度を算出し、
前記要約文生成ステップにおいて、前記類似度がしきい値を超える複数の前記関連文書から前記要約文を生成する、請求項6に記載の注釈文生成表示方法。
In the related document acquisition step, the degree of similarity between the acquired related document and the term is calculated.
The commentary sentence generation display method according to claim 6, wherein in the summary sentence generation step, the summary sentence is generated from a plurality of related documents whose similarity exceeds a threshold value.
JP2020006802A 2020-01-20 2020-01-20 Document management/viewing system and annotation text generation and display method thereof Pending JP2021114166A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020006802A JP2021114166A (en) 2020-01-20 2020-01-20 Document management/viewing system and annotation text generation and display method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020006802A JP2021114166A (en) 2020-01-20 2020-01-20 Document management/viewing system and annotation text generation and display method thereof

Publications (1)

Publication Number Publication Date
JP2021114166A true JP2021114166A (en) 2021-08-05

Family

ID=77077619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020006802A Pending JP2021114166A (en) 2020-01-20 2020-01-20 Document management/viewing system and annotation text generation and display method thereof

Country Status (1)

Country Link
JP (1) JP2021114166A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019016181A (en) * 2017-07-07 2019-01-31 株式会社野村総合研究所 Text summarization system
JP2019061594A (en) * 2017-09-28 2019-04-18 株式会社野村総合研究所 Conference support system and conference support program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019016181A (en) * 2017-07-07 2019-01-31 株式会社野村総合研究所 Text summarization system
JP2019061594A (en) * 2017-09-28 2019-04-18 株式会社野村総合研究所 Conference support system and conference support program

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
北川 涼太、藤田 桂英: "議論掲示板におけるスレッド構造と時系列を考慮した自動要約", 情報処理学会 研究報告 知能システム(ICS) 2015−ICS−181 [ONLINE], JPN6023025363, 15 December 2015 (2015-12-15), JP, pages 1 - 6, ISSN: 0005086641 *
本間 康允 外2名: "利用者の状況に応じた用語解説抽出システムの提案とその実現に向けた検討", インタラクティブ情報アクセスと可視化マイニング 第6回研究会研究発表予稿集 [ONLINE], JPN6023025362, 12 March 2014 (2014-03-12), JP, pages 26 - 33, ISSN: 0005086642 *
西川 仁: "深層学習による言語生成", 人工知能, vol. 第34巻 第4号, JPN6023025361, 1 July 2019 (2019-07-01), JP, pages 446 - 450, ISSN: 0005086643 *

Similar Documents

Publication Publication Date Title
JP6185127B2 (en) Electronic document search method and electronic document search graphical display method
JP7044893B2 (en) Business analysis method
JP2018097846A (en) Api learning
US11592967B2 (en) Method for automatically indexing an electronic document
JP2012212377A (en) Information processing apparatus and information processing program
US20240176948A1 (en) Method & system for labeling and organizing data for summarizing and referencing content via a communication network
JP2012059041A (en) Document management system, retrieval designation method, and program
US9965450B2 (en) Dynamic management of site components
EP3901761A2 (en) Method, apparatus, and electronic device for processing visual data of deep model
KR101910179B1 (en) Web-based chart library system for data visualization
KR20230057114A (en) Method and apparatus for deriving keywords based on technical document database
JP2019133546A (en) Presentation device, presentation method and presentation program
KR20190033821A (en) Folder Recommending Method and Apparatus Thereof
JP2021114166A (en) Document management/viewing system and annotation text generation and display method thereof
KR101985014B1 (en) System and method for exploratory data visualization
JP2021114167A (en) Document management/viewing system and annotation text display method thereof
US20200279172A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JPWO2006064573A1 (en) WEB information providing apparatus, method thereof, and program
KR20190011186A (en) Web-based chart library system for data visualization
JP2015141540A (en) Information processor, wording association presentation system, and information processing program
JP7441576B1 (en) Information processing system, information processing method and program
JP7243362B2 (en) Information processing device, information processing system, and information processing program
JP2023104183A (en) Program and information processing method
JP2021064019A (en) Sentence creation support device, sentence creation support system and program
JP2020530639A (en) Systems and methods for providing globalization capabilities in service management application interfaces

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220331

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220408

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231212