JP2022055580A - 文書比較支援装置、文書比較支援プログラム、文書比較支援方法 - Google Patents

文書比較支援装置、文書比較支援プログラム、文書比較支援方法 Download PDF

Info

Publication number
JP2022055580A
JP2022055580A JP2020163083A JP2020163083A JP2022055580A JP 2022055580 A JP2022055580 A JP 2022055580A JP 2020163083 A JP2020163083 A JP 2020163083A JP 2020163083 A JP2020163083 A JP 2020163083A JP 2022055580 A JP2022055580 A JP 2022055580A
Authority
JP
Japan
Prior art keywords
document
displayed
page
document data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020163083A
Other languages
English (en)
Inventor
秀夫 伊東
Hideo Ito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2020163083A priority Critical patent/JP2022055580A/ja
Publication of JP2022055580A publication Critical patent/JP2022055580A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書の比較における負荷を軽減する文書比較支援プログラム、文書比較支援装置及び文書比較支援方法を提供する。【解決手段】文書比較支援プログラムは、画面71Aに、第一の文書データが表示される第一の文書表示欄72と、第二の文書データが表示される第二の文書表示欄73とを含む画面を表示させる。第一の文書データのうち、第一の文書表示欄に表示させる部分が指定されると、第二の文書データのうち、第一の文書表示欄に表示された部分と類似する部分を第二の文書表示欄に表示させる。【選択図】図8A

Description

本発明は、文書比較支援装置、文書比較支援プログラム、文書比較支援方法に関する。
従来から、複数の文書データの内容を比較するための技術が知られている。その1つとして、例えば、従来では、検索条件に基づき抽出された技術文書データのうち、選択された複数の技術文書データを比較画面に表示させる技術が知られている。
上述した従来の技術において、複数の文書データの内容を比較する場合、一方の文書データの一部である節や頁等といった部分毎に、他方の文書中から該当する箇所を検索手段により同定した後、両者の内容を比較していた。したがって、従来の技術では、文書の内容を比較する際に、比較作業に加え、検索キーの作成や入力等を行う必要があり、作業者の負荷が大きい。
開示の技術は、文書の比較における負荷を軽減することを目的とする。
開示の技術は、第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示させ、前記第一の文書データのうち、前記第一の文書表示欄に表示させる部分が指定されると、前記第二の文書データのうち、前記第一の文書表示欄に表示された部分と類似する部分を前記第二の文書表示欄に表示させる、処理をコンピュータに実行させる、文書比較支援プログラムである。
文書の比較における負荷を軽減できる。
第一の実施形態の比較支援システムのシステム構成の一例を示す図である。 第一の実施形態の文書比較支援装置のハードウェア構成の一例を示す図である。 第一の実施形態の文書比較支援装置の機能を説明する図である。 第一の実施形態の文書比較支援装置の処理を説明するフローチャートである。 第一の実施形態の表示例を示す第一の図である。 第一の実施形態の表示例を示す第二の図である。 第一の実施形態の表示例を示す第三の図である。 第一の実施形態の表示例を示す第四の図である。 第一の実施形態の表示例を示す第五の図である。 第二の実施形態の文書比較支援装置の機能を説明する図である。 第二の実施形態の文書比較支援装置の処理を説明するフローチャートである。 第二の実施形態の表示例を示す第一の図である。 第二の実施形態の表示例を示す第二の図である。 第三の実施形態の文書比較支援装置の機能を説明する図である。 第三の実施形態の文書比較支援装置の処理を説明するフローチャートである。 第三の実施形態の表示例を示す図である。
(第一の実施形態)
以下に図面を参照して、第一の実施形態について説明する。図1は、第一の実施形態の比較支援システムのシステム構成の一例を示す図である。
本実施形態の比較支援システム100は、文書比較支援装置200と、端末装置300とを含み、文書比較支援装置200と端末装置300とは、ネットワークを介して接続される。
本実施形態の文書比較支援装置200は、文書記憶部220と、比較支援処理部230とを有する。文書記憶部220は、複数の文書データが格納される。比較支援処理部230は、文書記憶部220に格納された複数の文書データの内容を比較の作業を支援する。
具体的には、文書比較支援装置200は、端末装置300において、文書記憶部220に格納された文書データの中から複数の文書データが選択されると、比較支援処理部230により、選択された複数の文書データを含む比較画面を端末装置300に表示させる。
次に、文書比較支援装置200の比較支援処理部230は、比較画面において、一方の文書データに対し、検索キーとする部分を指定する操作が行われると、指定された部分で他方の文書データを検索する。そして、文書比較支援装置200は、他方の文書データにおいて、指定された部分と内容が最も類似するページを比較画面に表示させる。
このように、本実施形態では、比較画面に表示された複数の文書データのうち、一方の文書データの一部を指定するだけで、他方の文書データにおいて、指定された部分と内容が類似する部分を、指定された部分と並べて表示させる。
したがって、本実施形態によれば、内容を比較する際に、他の文書データにおける、指定された部分と対応する箇所を特定するために、検索キーを作成して入力する、といった作業が不要となる。したがって、本実施形態によれば、複数の文書の内容を比較する際の作業の負荷を軽減することができる。
尚、図1の例では、比較支援システム100に含まれる端末装置300を1台としたが、これに限定されない。比較支援システム100には、任意の台数の端末装置300が含まれてよい。
また、図1の例では、端末装置300において、複数の文書データが選択され、比較画面が端末装置300に表示されるものとしたが、これに限定されない。複数の文書データは、文書比較支援装置200において選択されてもよいし、比較画面は、文書比較支援装置200と接続される表示装置等に表示されてもよい。
また、図1の例では、文書比較支援装置200は、文書記憶部220を有するものとしたが、これに限定されない。文書記憶部220は、全部又は一部が、文書比較支援装置200と通信が可能な外部装置に設けられいてもよい。
また、文書比較支援装置200は、複数の文書比較支援装置によって実現されてもよい。つまり、文書比較支援装置200の有する比較支援処理部230が実現する機能は、複数の文書比較支援装置によって実現されてもよい。
以下に、本実施形態の文書比較支援装置200について説明する。図2は、第一の実施形態の文書比較支援装置のハードウェア構成の一例を示す図である。
本実施形態の文書比較支援装置200は、コンピュータによって構築されており、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)508、ネットワークI/F209、データバス210、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えた情報処理装置である。
これらのうち、CPU201は、文書比較支援装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。
ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、ネットワークを利用してデータ通信をするためのインターフェースである。データバス210は、CPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
次に、図3を参照して、本実施形態の文書比較支援装置200の機能について説明する。図3は、第一の実施形態の文書比較支援装置の機能を説明する図である。
本実施形態の文書記憶部220は、複数の文書データを格納する。具体的には、文書記憶部220は、文書データをページ毎の集合として格納する。言い換えれば、文書データは、ページの列として、文書記憶部220に格納される。そして、各ページはテキスト、すなわち、文字コードの列として格納される。文書記憶部220は、例えば、HD204等により実現されてもよい。
本実施形態の比較支援処理部230は、例えば、HD204等に格納された比較支援プログラムをCPU201が読み出して実行することにより、実現される。
比較支援処理部230は、入力受付部231、文書データ格納部232、表示制御部233、ページ検索部234を有する。
入力受付部231は、文書比較支援装置200に対する各種の入力を受け付ける。具体的には、入力受付部231は、例えば、比較される複数の文書データの選択や、文書記憶部220に格納する文書データの入力等を受け付ける。また、入力受付部231は、例えば、選択された文書データにおいて、検索キーとなる部分の指定や、検索キーによる文書データの検索指示等を受け付ける。
文書データ格納部232は、入力された文書データを文書記憶部220に格納する。具体的には、文書データ格納部232は、文書データが入力されると、この文書データを、ページの列として、文書記憶部220に格納する。尚、文書データは、例えば、文書比較支援装置200の外部から入力されてもよい。
表示制御部233は、入力受付部231により、複数の文書データが選択されると、選択された文書データのそれぞれを表示される複数の文書表示欄を含む比較画面を表示させる。また、表示制御部233は、比較画面における各種の表示を制御する。
ページ検索部234は、比較画面に表示された文書データのうち、一方の文書データにおいて、検索キーとなる部分が指定され、検索処理の実行指示が入力されると、他方の文書データを検索キーで検索し、結果を出力する。つまり、ページ検索部234は、一方の文書データにおいて指定された部分と類似する部分を、他方の文書データから検索し、検索結果を表示させる検索部の一例である。
尚、指定された部分は、文書を構成する単語、熟語・文、段落、ユーザによって選択された複数の行を含む任意の領域等であってよい。また、他方の文書データから検索される検索結果は、ページである。
ここで、本実施形態のページ検索部234による検索について説明する。本実施形態では、検索キーとされる部分は、一方の文書データのページとする。また、ページ検索部234により行われる検索処理は、検索キーとされたページにより、文書データのページを検索する処理である。
尚、以下の説明では、比較される複数の文書データのうち、検索キーとなる部分(ページ)が指定される文書データを第一の文書データと呼び、検索キーにより検索される文書データを第二の文書データと呼ぶ場合がある。第二の文書データは、言い換えれば、検索キーによる検索対象となる文書データである。
本実施形態のページ検索部234は、第一の文書データにおいて、検索キーに指定されたページと、検索対象となる第二の文書データに含まれる各ページとを、ベクトルで表現する。次に、ページ検索部234は、検索キーに指定されたページのベクトルと、第二の文書データに含まれるページ毎のベクトルとのそれぞれについて、ベクトル間の類似度を算出する。
そして、ページ検索部234は、第二の文書データの各ページのうち、検索キーに指定されたページのベクトルとの類似度が最も大きいページを、検索結果として比較画面に表示させる。
また、ページ検索部234は、第二の文書データの各ページのうち、検索キーに指定されたページのベクトルとの類似度が二番目に大きいページから順に、複数のページを特定し、特定されたページ数を検索結果として保持する。
以下に、類似度の算出について説明する。本実施形態のページ検索部234は、それぞれのページにおけるテキストデータを単語に分割して索引語とし、各索引語に付加した重みを、ページ毎のベクトルの要素とする。索引語の重みは、例えば、ページにおける索引語の出現回数等に基づき求められてもよい。
そして、ページ検索部234は、検索キーに指定されたページのベクトルと、第二の文書データに含まれるページ毎のベクトルとのそれぞれについて、内積を求め、この内積を類似度とする。
尚、ページ同士の類似度の算出の方法は、上述した方法以外の方法であってもよく、上述した方法は一例である。
また、本実施形態では、文書記憶部220に文書データが格納される際に、文書データに含まれる各ページのベクトルが求められて、文書データと対応付けられた文書記憶部220に格納されてもよい。
次に、図4を参照して、本実施形態の文書比較支援装置200の処理について説明する。図4は、第一の実施形態の文書比較支援装置の処理を説明するフローチャートである。
本実施形態の文書比較支援装置200において、比較支援処理部230は、入力受付部231により、第一の文書データと第二の文書データとの入力を受け付け、文書データ格納部232により、第一の文書データと第二の文書データとを文書記憶部220に格納する(ステップS401)。
続いて、比較支援処理部230は、表示制御部233により、選択された第一の文書データと第二の文書データとを、端末装置300の比較画面に表示させる(ステップS402)。本実施形態の比較画面は、第一の文書データを表示する第一の文書表示欄と、第二の文書データを表示する第二の文書表示欄と、を含む。比較画面の詳細は後述する。
続いて、比較支援処理部230は、入力受付部231により、第一の文書データにおいて、検索キーとされる部分(ページ)を指定する操作を受け付けたか否かを判定する(ステップS403)。検索キーとされる部分を指定する操作とは、例えば、スクロール操作やページ送りの操作等により、第一の文書表示欄に表示されるページを変更する操作であってよい。
ステップS403において、該当する操作を受け付けない場合、比較支援処理部230は、後述するステップS405へ進む。
ステップS403において、該当する操作を受け付けた場合、比較支援処理部230は、表示制御部233により、指定されたページを第一の文書表示欄に表示させる(ステップS404)。
続いて、比較支援処理部230は、入力受付部231により、検索要求を受けたか否かを判定する(ステップS405)。具体的には、入力受付部231は、第一の文書表示欄に表示されたページを検索キーとして、第二の文書データを検索する検索処理の実行指示を受け付けたか否かを判定する。
ステップS405において、検索要求を受け付けない場合、比較支援処理部230は、ステップS403へ戻る。
ステップS405において、検索要求を受け付けた場合、比較支援処理部230は、ページ検索部234により、指定されたページを検索キーとして、第二の文書データの検索を行う(ステップS406)。
続いて、比較支援処理部230は、表示制御部233により、検索結果を第二の文書表示欄に表示させ(ステップS407)、処理を終了する。検索結果の表示の詳細は後述する。
尚、図4の例では、ステップS401における、第一の文書データと第二の文書データとを文書記憶部220に格納する処理と、ステップS402以降の処理と、を連続した処理としているが、これに限定されない。
第一の文書データと第二の文書データのそれぞれは、予め文書記憶部220に格納されていてもよい。
また、本実施形態において、文書データ格納部232は、文書データが文書記憶部220に格納される際に、文書データ格納部232により、文書データに含まれる各ページのベクトルを生成し、文書データと対応付けて文書記憶部220に格納してもよい。
その場合、ページ検索部234は、検索要求を受けた際に、指定されたページのベクトルと、第二の文書データと対応付けられた、第二の文書データに含まれる各ページのベクトルとの類似度を算出し、類似度に応じて検索結果を出力してもよい。
また、本実施形態では、文書記憶部220に文書データの各ページのベクトルが格納されていない場合は、ページ検索部234は、検索要求を受け付けたときに、指定されたページのベクトルと、第二の文書データに含まれる各ページのベクトルとを求めてもよい。
次に、図5乃至図7を参照して、表示例について説明する。尚、図5乃至図7に示す表示例は、端末装置300のディスプレイ等に表示される画面の例として説明するが。これに限定されない。以下に説明する表示例は、文書比較支援装置200に接続された表示装置に表示されてもよい。
図5は、第一の実施形態の表示例を示す第一の図である。図5に示す画面51は、比較支援処理部230による処理を選択するためのメニュー画面の一例である。本実施形態では、比較支援処理部230を実現するための比較支援プログラムが起動したときに、表示制御部233によって、端末装置300に表示されてもよい。
画面51は、操作部品52、53、54を有する。操作部品52は、文書記憶部220に文書データを格納するための操作部品である。本実施形態では、例えば、画面51において操作部品52が選択されると、画面51は、文書記憶部220に格納する文書データを選択するための画面に遷移してもよい。
操作部品53は、文書記憶部220に格納された文書データを削除するための操作部品である。本実施形態では、例えば、画面51において操作部品53が選択されると、画面51は、文書記憶部220から削除する文書データを選択するための画面に遷移してもよい。
操作部品54は、画面51を、比較画面に表示させる複数の文書データの選択画面に遷移させるための操作部品である。本実施形態では、画面51において、操作部品54が操作されると、画面51が後述する画面61に遷移する。
図6は、第一の実施形態の表示例を示す第二の図である。図6に示す画面61は、複数の文書データを選択するための選択画面の一例である。
画面61には、文書記憶部220に格納された文書データの一覧62が表示される。本実施形態では、一覧62において、ポインタ63によって選択された文書データを、第一の文書データと、第二の文書データとする。
具体的には、本実施形態では、ポインタ63によって、一覧62から最初に選択された文書データを、第一の文書データとし、後に選択された文書データを第二の文書データとする。
図6の例では、一覧62において、「文書A」が選択されており、続いて、ポインタ63により、「文書B」が選択されている。したがって、図6の例では、文書Aが、第一の文書データ(検索キーが指定される文書データ)となり、文書Bが、第二の文書データ(検索キーにより検索される文書データ)となる。
尚、第一の文書データと第二の文書データを決定する方法は、上述した方法に限定されない。例えば、第一の文書データと第二の文書データは、一覧62において、複数の文書データが選択された後に、比較画面において決定されてもよい。
図7は、第一の実施形態の表示例を示す第三の図である。図7に示す画面71は、画面61において選択された第一の文書データと第二の文書データとを比較するための比較画面の一例である。
本実施形態の画面71は、第一の文書データの一部が表示される文書表示欄72、第二の文書データの一部が表示される文書表示欄73を含む。また、画面71は、指定された検索キーによる検索処理の実行を指示するための操作部品74を含む。
図7の例では、文書表示欄72には、第一の文書データとして選択された「文書A」のうち、文書表示欄72と対応する領域の文書データが表示される。言い換えれば、文書表示欄72には、文書Aの一部が表示される。
また、文書表示欄73には、第二の文書データとして選択された「文書B」のうち、文書表示欄73と対応する領域の文書データが表示される。言い換えれば、文書表示欄73には、文書Bの一部が表示される。
また、文書表示欄72の近傍には、文書表示欄72に表示させる第一の文書データのページを指定するための操作部品72-1が表示される。本実施形態では、操作部品72-1に対する操作に応じて、文書表示欄72に表示させる文書Aのページを変更する。
文書表示欄73の近傍には、文書表示欄73に表示させる第二の文書データのページを指定するための操作部品73-1が表示される。本実施形態では、操作部品73-1に対する操作に応じて、文書表示欄73に表示させる文書Bのページを変更する。
本実施形態では、操作部品72-1の操作により、文書Aのうち、文書表示欄72に表示させるページが指定され、操作部品74が操作されると、文書表示欄72に表示されている文書Aのページが、検索キーに指定されて、文書Bのページ検索が行われる。尚、ページ検索とは、複数ページを含む文書データを、検索キーとなるページで検索し、検索キーとなるページと内容が類似しているページを特定することを示す。
具体的には、例えば、ページ検索部234は、操作部品74が操作されると、文書表示欄72に表示されている文書Aのベクトルを求め、文書Bの各ページとの類似度を算出してもよい。また、このとき文書Bは、第二の文書データとして選択された際に、文書Bに含まれる各ページのベクトルを予め求めておいてもよいし、操作部品74が操作されてから、各ページのベクトルを求めてもよい。
また、本実施形態では、第一の文書データとして選択された文書Aについては、検索キーが指定されて検索指示が行われた際に、検索キーとされたページのベクトルを求めればよい。したがって、本実施形態では、文書Aの各ページのテキストデータのみを取得し、各ページのベクトルは取得しなくてもよい。
このように、本実施形態では、第一の文書データに選択された文書データについては、文書記憶部220から各ページのテキストデータを取得する。また、本実施形態では、第二の文書データに選択された文書データについては、文書記憶部220から、各ページのテキストデータと、各ページのベクトルとを取得してもよい。
画面71において、操作部品74が操作され、文書Bに対する検索処理が行われると、表示制御部233は、検索結果を文書表示欄73に表示させる。
図8Aは、第一の実施形態の表示例を示す第四の図である。図8に示す画面71Aは、検索結果が表示された比較画面の一例を示す。
画面71Aの文書表示欄73には、文書Bのうち、文書表示欄72に表示された文書Aのページとの類似度が最も大きいページが表示される。つまり、文書表示欄73には、文書Bにおいて、文書表示欄72に表示された文書Aのページと、内容が最も類似しているページが表示される。
図8Aの例では、文書表示欄73には、文書表示欄72に表示された文書Aのページに含まれる「○○」、「××」、「××××」等の単語を含む文書Bのページが表示される。尚、本実施形態では、例えば、文書表示欄73において、文書表示欄72に表示されたページに含まれる単語と一致する単語に、マーカ等を付して表示させてもよい。
図8Aの例では、文書表示欄72に表示されたページに含まれる「○○」、「××」、「××××」が、文書表示欄73に表示されたページに存在している。したがって、本実施形態では、文書表示欄73において、「○○」、「××」、「××××」という単語に、マーカ等を付してもよい。
言い換えれば、本実施形態では、検索対象の文書データにおいて、検索キーに指定されたページに含まれる単語と一致する単語の表示態様を、検索キーに指定されたページに含まれる単語と一致しない単語の表示態様と異ならせてもよい。
尚、図7に示す画面71では、検索処理は行われていないため、文書表示欄73に表示されている文書Bのページは、文書表示欄72に表示されている文書Aのページとの類似度とは無関係に表示されている。
また、本実施形態では、文書表示欄73の上に配置された表示欄75において、検索キーに指定されたページとの類似度が、所定の閾値以上となった文書Bのページを特定するページ数(ページ番号)を、類似度が大きい順に表示させる。
図8Aの例では、2番目に類似度が大きいページを示すページ数を、表示欄75の左端に表示し、類似度が大きいページを示すページ数から順に、ページ数を並べて表示している。また、図8Aの例では、表示欄75には、5つのページ数が表示されているが、表示欄75に表示させるページ数の数は任意の数であってよい。
具体的には、図8Aの例では、文書Bのうち、文書表示欄73に表示されているページの次に、検索キーに指定されたページとの類似度が大きいページは、90ページであり、その次に類似度が大きいページが105ページである。したがって、表示欄75では、左端に90、その隣に105が表示されている。
このように、本実施形態では、検索キーとされたページとの類似度が所定の閾値以上であるページを特定する情報を、検索結果として表示する。言い換えれば、本実施形態では、検索キーとの類似度が所定の閾値以上のページ数を一覧で表示させる。
このため、本実施形態によれば、比較画面を閲覧して比較作業を行う作業者に対し、検索キーとされたページと類似する内容が、検索対象となる文書のどの辺りに記載されているかを、大まかに把握させることができる。
例えば、ページ数の一覧の中に、他のページ数とは大きく異なる箇所を示すページ数が含まれる場合には、該当するページ数の誤記の可能性等を提示する情報となる。
また、本実施形態では、例えば、表示欄75に表示されたページ数を選択する操作を受け付けると、文書表示欄73に、文書Bにおける、選択されたページ数が示すページを表示させてもよい。具体的には、本実施形態では、例えば、表示欄75において、ページ数「105」が選択された場合には、文書表示欄73に文書Bの105ページを表示させてもよい。
このように、本実施形態では、第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とが隣同士に配置された比較画面を表示させる。また、本実施形態では、比較画面において、第一の文書表示欄に表示された部分(ページ)を検索キーとした検索要求を受け付けると、検索結果として、第二の文書表示欄に、検索キーと最も内容が類似するページを表示させる。
したがって、本実施形態では、第二の文書データにおいて、第一の文書データと比較すべき箇所を特定するために、検索キーの組み合わせ等を作成したり、検索キーを入力したりする必要がなく、文書同士の比較作業の負荷を軽減することができる。
尚、図8Aの例では、検索キーが指定される第一の文書データを比較画面の左側に配置された文書表示欄72に表示し、検索対象となる第二の文書データを比較画面の右側に配置された文書表示欄73としたが、文書表示欄の配置は、これに限定されない。
文書表示欄72と文書表示欄73の配置は、左右が逆であってもよい。また、第一の文書データが表示される文書表示欄72と、第二の文書データが表示される文書表示欄73とは、比較画面において、入れ替えや切り替えが可能であってもよい。
例えば、画面71Aにおいて、ドラッグアンドドロップ操作等により、文書表示欄72と文書表示欄73の位置を入れ替えることで、第二の文書データが、検索キーが指定される文書データとされ、第一の文書データが検索対象の文書データとされてもよい。
例えば、画面71Aにおいて、検索キーとなるページが表示されている文書表示欄と対応付けて、検索キーであることを示すアイコン画像等を表示させてもよい。そして、このアイコン画像を選択することで、検索キーが指定される文書データを、第一の文書データから第二の文書データへ切り替えられてもよい。
また、画面71及び画面71Aでは、文書表示欄72と文書表示欄73とが、左右に並べて配置されるレイアウトとしたが、レイアウトはこれに限定されない。例えば、文書表示欄72と文書表示欄73とは、上下に並べて配置されてもよい。
また、図8Aに表示された検索結果は、文書比較支援装置200によって保持されてもよい。具体的には、文書比較支援装置200は、第一の文書データを特定する情報と、検索キーとされたページを特定するページ数と、第二の文書データを特定する情報と、検索結果として特定されたページ数とを対応付けて保持してもよい。
図8Bは、第一の実施形態の表示例を示す第五の図である。図8Bに示す画面71Bでは、第二の文書データ(検索対象となる文書データ)が複数選択された場合の比較画面の一例を示している。
画面71Bは、文書表示欄73a、73bを有する。文書表示欄73aと、文書表示欄73bのそれぞれには、第二の文書データとして選択された複数の文書データのそれぞれが表示される。
また、文書表示欄73aと文書表示欄73bのそれぞれには、表示欄75aと表示欄75bとが対応付けられて表示されている。
このように、画面71Bでは、複数の検索対象の文書データに対し、それぞれの検索結果を一度に表示させることができる。言い換えれば、画面71Bでは、検索キーとなるページに対して、複数の文書データのそれぞれについて、最も類似度が大きいページを一覧で表示させることができる。したがって、1つの文書データに対して、比較対象となる文書データが複数存在する場合に、複数の文書データにおける比較箇所を一度に特定でき、比較作業の負荷を軽減することができる。
(第二の実施形態)
以下に、図面を参照して、第二の実施形態について説明する。第二の実施形態は、ページによる検索を行った後に、さらに行による検索を行う昨日を有する点が、第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号を付与し、その説明を省略する。
図9は、第二の実施形態の文書比較支援装置の機能を説明する図である。本実施形態の文書比較支援装置200Aは、文書記憶部220、比較支援処理部230Aを有する。
比較支援処理部230Aは、入力受付部231、文書データ格納部232、表示制御部233、ページ検索部234、行検索部235を有する。
行検索部235は、検索キーに指定されたページにおいて、行の指定を受け付けて、検索処理の実行指示を受け付けると、検索キーによる検索結果として特定された第二の文書データのページ内を、指定れた行で検索する。
つまり、行検索部235は、検索キーとされたページ内の行の指定を受け付けると、指定された行を検索キーとして、ページ検索部234により特定された第二の文書データのページ内を検索する。
図10は、第二の実施形態の文書比較支援装置の処理を説明するフローチャートである。図10のステップS1001からステップS1007までの処理は、図4のステップS401からステップS407までの処理と同様であるから、説明を省略する。
ステップS1007に続いて、比較支援処理部230Aは、入力受付部231により、検索キーに指定されたページにおいて、行の指定を受け付けたか否かを判定する(ステップS1008)。ステップS1008において、行の選択を受け付けていない場合、比較支援処理部230Aは、処理を終了する。
ステップS1008において、行の選択を受け付けた場合、比較支援処理部230Aは、行検索部235により、選択された行を検索キーとして、ページ検索部234による検索で特定された、第二の文書データのページを検索する(ステップS1009)。
続いて、比較支援処理部230Aは、表示制御部233により、行検索部235による検索結果を比較画面に表示させ(ステップS1010)、処理を終了する。
次に、図11を参照して、本実施形態の表示例について説明する。図11は、第二の実施形態の表示例を示す第一の図である。図11に示す画面111は、比較画面において、検索キーとされる行が選択さけた場合の一例を示す。
画面111は、文書表示欄72、文書表示欄73、操作部品74、操作部品76を有する。操作部品76は、行検索部235による行検索の実行を指示するための操作部品である。
画面111において、文書表示欄72には、検索キーに指定された文書Aのページが表示されており、文書表示欄73には、文書Bにおいて、検索キーと最も類似度が大きいページが表示されている。
また、画面111では、文書表示欄72において、「また、○○は、××××を含む。」という行が選択されている。
この状態で、操作部品76が操作されると、行検索部235は、選択された行を検索キーとして、文書表示欄73に表示されたページ内を検索する。
以下に、行検索部235による検索について説明する。本実施形態の行検索部235は、行が検索キーに指定されると、指定された行について、ベクトルを求める。行のベクトルの求め方は、ページのベクトルの求め方と同様である。
次に、行検索部235は、文書表示欄73に表示されているページに含まれる各行について、ベクトルを求める。
次に、行検索部235は、検索キーに指定された行のベクトルと、文書表示欄73に表示されたページに含まれる各行のベクトルのそれぞれとの内積を求める。そして、行検索部235は、各行のうち、ベクトルの内積が最も大きくなる行を、検索キーと最も類似する行に特定し、検索結果とする。
つまり、行検索部235では、ページ検索部234がページを単位として行っていた検索処理と同様の処理を、行を単位として行う。
本実施形態では、行検索部235による検索結果として、指定された行と内容が類似する行が特定されると、文書表示欄73にその結果を表示させる。
図12は、第二の実施形態の表示例を示す第二の図である。図12に示す画面111Aは、行検索による結果が文書表示欄73に表示された場合を示している。
画面111Aでは、文書表示欄73において、検索キーとされた行と最も類似する行として、「××××は、○○に含まれる。」が特定され、マーカが付されている。
尚、行検索部235による検索においても、類似度が所定の閾値以上となる行に対して、マーカを付してもよい。また、類似度の大きさに応じて、マーカの色等を異ならせてもよい。
言い換えれば、本実施形態では、ページ検索部234において特定された第二の文書データのページにおいて、検索キーとなる行との類似度が所定の閾値以上となる行の表示態様を、類似度が所定の閾値未満である行の表示態様と異ならせてもよい。
本実施形態では、このように、比較すべき2つの文書(文書Aと文書B)において、互いの内容が類似するページが特定された後に、さらに、各ページ内で、内容が類似する行を特定することができる。
尚、本実施形態では、文書表示欄72において行を選択して操作部品76を操作すると、行検索が行われるものとしたが、行検索を行うための操作方法は、これに限定されない。
例えば、文書表示欄72において、行を選択する操作を受け付けたときに、この操作を、選択された行による行検索の実行指示として、受け付けてもよい。この場合には、行を選択するだけで、文書表示欄73に選択された行と類似する行にマーカが付されることになり、操作部品76の表示は不要となる。
また、本実施形態では、ページ内の行を検索キーとするものとたが、ページ内を検索する際の検索キーは、行に限定されない。ページ内を検索する際の検索キーは、例えば、段落や節等であってもよい。
尚、本実施形態では、ページ検索部234によるページ検索が行われた後に、行検索が行われるものとしたが、ページ検索を行う前に行検索が行われてもよい。
(第三の実施形態)
以下に図面を参照して、第三の実施形態について説明する。第三の実施形態では、検索キーとなるページ内の単語に重み付けをする機能を有する点が、第一の実施形態と相違する。よって、第三の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
図13は、第三の実施形態の文書比較支援装置の機能を説明する図である。本実施形態の文書比較支援装置200Bは、文書記憶部220、比較支援処理部230Bを有する。
比較支援処理部230Bは、入力受付部231、文書データ格納部232、表示制御部233、ページ検索部234A、キーワード有無判定部236を有する。
キーワード有無判定部236は、比較画面に、重み付けの対象となるキーワードが入力されているか否かを判定する。
ページ検索部234Aは、キーワード有無判定部236により、重み付けの対象となるキーワードが入力されていると判定された場合に、検索キーに指定されたページのテキストデータと、入力されているキーワードとに基づき、ページのベクトルを求め、ページ検索を行う。
図14は、第三の実施形態の文書比較支援装置の処理を説明するフローチャートである。図14のステップS1401からステップS1405までの処理は、図4のステップS401からステップS405までの処理と同様であるから、説明を省略する。
ステップS1405において、検索要求を受け付けた場合、比較支援処理部230Bは、キーワード有無判定部236により、比較画面のキーワード入力欄にキーワードが入力されているか否かを判定する(ステップS1406)。キーワード入力欄の詳細は後述する。
ステップS1406において、キーワードが入力されていない場合、比較支援処理部230Bは、ステップS1407へ進む。
図4のステップS1407とステップS1408の処理は、図4のステップS406とステップS407の処理と同様であるから、説明を省略する。
ステップS1406において、キーワードが入力されていた場合、ページ検索部234Aは、検索キーに指定されたページのテキストデータと、入力されたキーワードとから、ページのベクトルを求め、第二の文書データを検索し(ステップS1409)、ステップS108へ進む。
図15は、第三の実施形態の表示例を示す図である。図15に示す画面151は、キーワード入力欄を有する比較画面の一例である。
画面151は、文書表示欄72、文書表示欄73、操作部品74、キーワード入力欄76を有する。
キーワード入力欄76は、検索キーに指定されたページに含まれる単語において、重みをつける単語を入力するための入力欄である。尚、キーワード入力欄76に入力される単語は、検索キーに指定されたページに含まれる単語である。
本実施形態では、キーワード入力欄76に対して、直接単語が入力されてもよいし、文書表示欄72に表示されたページにおいて、選択された単語が自動的にキーワード入力欄76に入力されるようにしてもよい。
本実施形態のページ検索部234Aは、キーワード入力欄76に単語が入力されている場合、文書表示欄72に表示されたページのテキストデータに、キーワード入力欄76に入力された単語のテキストデータを追加する。そして、ページ検索部234Aは、単語が追加されたテキストデータのベクトルを求める。
本実施形態では、検索キーに指定されたページに、キーワード入力欄76に入力された単語のテキストデータを追加することで、ページのベクトルを求める際に、キーワード入力欄76に入力された単語の出現回数が多くなる。そのため、検索キーとなるページのベクトルは、キーワード入力欄76に入力された単語に重みが付加されたベクトルとなる。
このように、本実施形態では、検索キーとなるページに含まれる単語に重みを付けて、第二の文書データのページ検索を行うことができるため、比較作業を行う作業者が所望する検知結果を得ることができる。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
また、実施形態に記載された装置は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施してもよい。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
100 比較処理支援システム
200、200A、200B 文書比較支援装置
220 文書記憶部
230、230A、230B 比較支援処理部
231 入力受付部
232 文書データ格納部
233 表示制御部
234 ページ検索部
235 行検索部
236 キーワード有無判定部
300 端末装置
特許第6248625号公報

Claims (10)

  1. 第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示させ、
    前記第一の文書データのうち、前記第一の文書表示欄に表示させる部分が指定されると、前記第二の文書データのうち、前記第一の文書表示欄に表示された部分と類似する部分を前記第二の文書表示欄に表示させる、処理をコンピュータに実行させる、文書比較支援プログラム。
  2. 前記第一の文書表示欄に表示させる部分は、前記第一の文書データに含まれるページであり、
    前記第二の文書データに含まれるページのうち、指定された前記ページとの類似度が最も大きいページを、前記第二の文書表示欄に表示させる、処理を前記コンピュータに実行させる、請求項1記載の文書比較支援プログラム。
  3. 前記第二の文書表示欄と対応する位置に、前記第二の文書データに含まれるページのうち、前記類似度が所定の閾値以上となるページを特定する情報の一覧を表示させる、処理を前記コンピュータに実行させる、請求項2記載の文書比較支援プログラム。
  4. 前記ページを特定する情報は、ページ数であり、
    前記一覧において、前記類似度が大きいページから順に、前記ページ数が表示される、請求項3記載の文書比較支援プログラム。
  5. 前記第一の文書表示欄において、指定された前記ページに含まれる行の指定を受け付け、
    前記第二の文書表示欄に表示されたページのうち、指定された前記行と類似する行の表示態様を、他の行の表示態様と異ならせる、処理を前記コンピュータに実行させる、請求項2乃至4の何れか一項に記載の文書比較支援プログラム。
  6. 前記画面は、単語が入力される入力欄を含み、前記入力欄に、指定された前記ページに含まれる単語が入力されていた場合に、
    指定された前記ページにおける前記単語に重み付けを行い、
    前記第二の文書データにおいて、前記重み付けがされた前記ページと類似するページを特定する、処理を前記コンピュータに実行させる、請求項2乃至5の何れか一項に記載の文書比較支援プログラム。
  7. 第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示させる表示制御部と、
    前記第一の文書データのうち、前記第一の文書表示欄に表示させる部分が指定されると、前記第二の文書データのうち、前記第一の文書表示欄に表示された部分と類似する部分を前記第二の文書表示欄に表示させる検索部と、を有する文書比較支援装置。
  8. コンピュータによる文書比較支援方法であって、前記コンピュータが、
    第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示し、
    前記第一の文書データのうち、前記第一の文書表示欄に表示させる部分が指定されると、前記第二の文書データのうち、前記第一の文書表示欄に表示された部分と類似する部分を前記第二の文書表示欄に表示する、文書比較支援方法。
  9. 第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示させ、
    表示されている第一の文書データのうち、任意の部分が指定されると、表示されている第二の文書データのうち、前記指定された部分と類似する部分を前記第二の文書表示欄に表示させる、処理をコンピュータに実行させる、文書比較支援プログラム。
  10. 第一の文書データが表示される第一の文書表示欄と、第二の文書データが表示される第二の文書表示欄とを含む画面を表示させる表示制御部と、
    表示されている第一の文書データのうち、任意の部分が指定されると、表示されている第二の文書データのうち、前記指定された部分と類似する部分を前記第二の文書表示欄に表示させる検索部と、を有する文書比較支援装置。
JP2020163083A 2020-09-29 2020-09-29 文書比較支援装置、文書比較支援プログラム、文書比較支援方法 Pending JP2022055580A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020163083A JP2022055580A (ja) 2020-09-29 2020-09-29 文書比較支援装置、文書比較支援プログラム、文書比較支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020163083A JP2022055580A (ja) 2020-09-29 2020-09-29 文書比較支援装置、文書比較支援プログラム、文書比較支援方法

Publications (1)

Publication Number Publication Date
JP2022055580A true JP2022055580A (ja) 2022-04-08

Family

ID=80998569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020163083A Pending JP2022055580A (ja) 2020-09-29 2020-09-29 文書比較支援装置、文書比較支援プログラム、文書比較支援方法

Country Status (1)

Country Link
JP (1) JP2022055580A (ja)

Similar Documents

Publication Publication Date Title
US8838453B2 (en) Interactive input method
EP2546766B1 (en) Dynamic search box for web browser
US9342567B2 (en) Control for persistent search results and iterative searching
US8375356B2 (en) Tabular completion lists
JP2022003539A (ja) テキスト誤り訂正方法、装置、電子機器及び記憶媒体
JP4935869B2 (ja) 電子機器及びプログラム
US9218066B2 (en) Method for character correction
CN101960483A (zh) 来自应用程序页的服务预览和访问
US8458187B2 (en) Methods and systems for visualizing topic location in a document redundancy graph
CN104750378A (zh) 输入法的输入模式自动切换方法及装置
JP2012212377A (ja) 情報処理装置及び情報処理プログラム
JP2015076064A (ja) 情報処理装置、情報処理方法、プログラムならびに記憶媒体
JP2010257392A (ja) 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
JP2014115894A (ja) 表示装置
GB2365150A (en) Automatic completion of data in a data entry field using prepended text
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
JP2022055580A (ja) 文書比較支援装置、文書比較支援プログラム、文書比較支援方法
WO2016086736A1 (zh) 基于输入法的网站信息提供方法和装置
CN112783410B (zh) 信息处理方法、介质、装置和计算设备
JP2016071506A (ja) 入力文字列に関連付けられた変換候補を表示する方法、その電子装置及びサーバ・コンピュータ、並びに電子装置用プログラム及びサーバ・コンピュータ用プログラム
JP4607671B2 (ja) 翻訳支援プログラム、方法及び装置
WO2016107611A1 (zh) 一种用于移动终端的文本查找方法和装置
JP2939841B2 (ja) データベース検索装置
JP4713098B2 (ja) 選択項目表示装置、選択項目表示方法、および選択項目表示プログラム
JP2010211530A (ja) 情報検索端末装置、情報検索システム、情報検索方法、および情報検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230714