JP2021064048A - 情報処理システム - Google Patents

情報処理システム Download PDF

Info

Publication number
JP2021064048A
JP2021064048A JP2019186971A JP2019186971A JP2021064048A JP 2021064048 A JP2021064048 A JP 2021064048A JP 2019186971 A JP2019186971 A JP 2019186971A JP 2019186971 A JP2019186971 A JP 2019186971A JP 2021064048 A JP2021064048 A JP 2021064048A
Authority
JP
Japan
Prior art keywords
information
document
paragraph
similarity
work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019186971A
Other languages
English (en)
Other versions
JP7354750B2 (ja
Inventor
惇 安藤
Andojun
惇 安藤
慎也 中村
Shinya Nakamura
慎也 中村
道村 唯夫
Tadao Michimura
唯夫 道村
紀夫 山本
Norio Yamamoto
紀夫 山本
尚之 榎本
Naoyuki Enomoto
尚之 榎本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019186971A priority Critical patent/JP7354750B2/ja
Priority to US16/878,688 priority patent/US11244155B2/en
Publication of JP2021064048A publication Critical patent/JP2021064048A/ja
Application granted granted Critical
Publication of JP7354750B2 publication Critical patent/JP7354750B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】グループワークにおいて参加者が個別に事前学習した内容を共有する作業を効率よく進行させる情報処理システムを提供する。【解決手段】共有情報管理サーバ100と進行制御サーバ200とがネットワークを介して接続された情報処理システムにおいて、共有情報管理サーバ100は、画像受信部110と、画像処理部120と、文書ベクトル解析部130と、類似度解析部140と、解析結果提示画面生成部150と、解析結果表示制御部160とを備える。進行制御サーバ200は、情報共有時間設定部210と、ファシリテーション決定部220と、ファシリテーション情報提示画面生成部230と、ファシリテーション情報表示制御部240とを備える。画像受信部110は、共有する情報が記載された記載用紙の画像データを受信することで、共有する情報が記録された複数の文書を取得する。【選択図】図3

Description

本発明は、情報処理システムに関する。
グループワークにおける議論を解析してワークの参加者に情報を提供し、ワークの進行を支援することが行われている。
特許文献1には、グループごとに情報を共有する複数のグループのうち、第1のグループで共有された情報と、第2のグループで共有された情報との類似度を算出し、算出した類似度が所定の基準を満たす場合に、第1または第2のグループの少なくともいずれかのグループに対して、そのグループで共有された情報に基づいて、議論が促進する情報を提供することが開示されている。議論が促進する情報として、グループで共有された情報を特徴付ける代表単語の対義語を含むことが例示されている。
国際公開第2017/141338号公報
グループワークでは、各参加者がワークに関連する情報を共有することが求められる。しかし、ワークに関連して各参加者が有する情報が様々である場合、決められた時間内で効率よく情報を共有することは容易ではない。
本発明は、グループワークにおいて参加者が個別に事前学習した内容を共有する作業を効率よく進行させる情報処理システムを提供することを目的とする。
請求項1に係る本発明は、
取得した文書を解析するプロセッサを備え、
前記プロセッサは、
複数の参加者間で共有しようとする情報が記録された複数の文書を取得し、
前記文書に含まれる文のブロックを単位として、相異なる文書間の当該ブロックごとの内容の類似度を算出し、
前記類似度に基づき、前記ブロックの内容の共有作業の実行順を決定し、
前記ブロックの文字数に基づき、当該ブロックの内容の共有作業を行うための作業時間を割り当てることを特徴とする、情報処理システムである。
請求項2に係る本発明は、
前記プロセッサは、前記ブロックに含まれる文をベクトル表現した文書ベクトルの類似度を算出して当該ブロックの記載内容の類似度とすることを特徴とする、請求項1に記載の情報処理システムである。
請求項3に係る本発明は、
前記プロセッサは、相異なる文書間で最も類似度の高いブロックどうしを関連ブロックとし、当該関連ブロックから一つのブロックを前記共有作業の対象とすることを特徴とする、請求項2に記載の情報処理システムである。
請求項4に係る本発明は、
前記プロセッサは、前記関連ブロックのうちで最も類似度の低いブロックを前記共有作業の対象とすることを特徴とする、請求項3に記載の情報処理システムである。
請求項5に係る本発明は、
前記プロセッサは、前記関連ブロックのうち、類似度が予め定められた閾値よりも低いブロックを前記共有作業の対象から除外することを特徴とする、請求項4に記載の情報処理システムである。
請求項6に係る本発明は、
前記プロセッサは、
相異なる文書間で最も類似度の高いブロックどうしを関連付け、
前記ブロックどうしの関連性を示す情報を前記参加者に提示し、
前記参加者による指示を受け付けて、前記ブロックどうしの関連性を示す情報を更新することを特徴とする、請求項1に記載の情報処理システムである。
請求項7に係る本発明は、
前記プロセッサは、
前記ブロックを頂点とし、関連付けられた当該ブロックを表す当該頂点間に辺を張ったグラフを表示装置に表示させ、
前記参加者による前記辺を張り替える操作を受け付け、張り替えられた当該辺にしたがって、前記ブロックどうしの関連性を示す情報を更新することを特徴とする、請求項6に記載の情報処理システムである。
請求項8に係る本発明は、
前記プロセッサは、前記ブロックの前記共有作業の実行順および作業時間と、当該共有作業を当該実行順で実行した場合における作業時間の累積値とを前記参加者に提示することを特徴とする、請求項1に記載の情報処理システムである。
請求項9に係る本発明は、
前記プロセッサは、前記作業時間の累積値が予め定められた上限値以下の範囲に含まれる前記ブロックの情報を識別可能に提示することを特徴とする、請求項8に記載の情報処理システムである。
請求項10に係る本発明は、
前記プロセッサは、前記共有作業が完了した前記ブロックの情報を識別可能に提示することを特徴とする、請求項9に記載の情報処理システムである。
請求項1の発明によれば、グループワークにおいて参加者が個別に事前学習した内容を全て共有する構成と比較して、情報を共有する作業を効率よく進行させることができる。
請求項2の発明によれば、キーワードの有無を用いた類似度の判断等と比較して、文書ベクトルに基づく精度の高い類似判断を行うことができる。
請求項3の発明によれば、類似度の高い関連ブロックを全て共有作業の対象とする構成と比較して、内容の近い複数の関連ブロックに関して共有作業を行うことを避け、作業効率を向上させることができる。
請求項4の発明によれば、関連ブロックを全て共有作業の対象とする構成と比較して、重複した内容の少ない関連ブロックを対象とすることにより共有作業の効率を向上させることができる。
請求項5の発明によれば、単に類似度の低い関連ブロックを共有作業の対象とする構成と比較して、内容が大きく異なる可能性の高い関連ブロックを共有作業の対象から排除することにより共有作業の効率を向上させることができる。
請求項6の発明によれば、単に類似度に基づいて共有作業の対象を決定する場合と比較して、グループワークの参加者自身の認識に基づいて共有作業の対象を修正することができる。
請求項7の発明によれば、単に類似度に基づいて共有作業の対象を決定する場合と比較して、視覚的にブロック間の関連性を確認しながら共有作業の対象を修正することができる。
請求項8の発明によれば、単に共有作業の対象を提示する場合と比較して、作業に費やす時間を効率よく割り当てることができる。
請求項9の発明によれば、単に共有作業の対象を提示する場合と比較して、決められた時間内で作業可能な対象を明確にすることができる。
請求項10の発明によれば、単に共有作業の対象を提示する場合と比較して、作業の進行を明確にすることができる。
本実施形態が適用される情報処理システムの全体構成を示す図である。 共有情報管理サーバおよび進行制御サーバのハードウェア構成例を示す図である。 共有情報管理サーバおよび進行制御サーバの機能構成を示す図である。 共有情報管理サーバの類似度解析部により算出された段落ごとの類似度の例を示す図である。 共有情報管理サーバの解析結果提示画面生成部により生成された解析結果提示画面の例を示す図である。 進行制御サーバのファシリテーション決定部による共有作業の対象の決定例を示す図である。 共有作業の対象の関連段落に対する決定情報の例を示す図である。 ファシリテーション情報提示画面生成部により生成されたファシリテーション情報提示画面の例を示す図である。 関連段落表示画面の例を示す図である。 共有する情報が記載される記載用紙の構成例を示す図である。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<システム構成>
図1は、本実施形態が適用される情報処理システムの全体構成を示す図である。本実施形態の情報処理システムは、共有情報管理サーバ100と、進行制御サーバ200と、入力装置300と、出力装置400とを備える。
共有情報管理サーバ100は、グループワークに参加する複数の参加者間で共有する情報を管理するサーバである。管理対象である共有する情報の例としては、グループワークに関して各参加者が事前学習した内容がある。各参加者の事前学習の内容を他の参加者が共有することで、各参加者が共通の認識を持ってグループワークを実施し得る。
進行制御サーバ200は、共有情報管理サーバ100の管理対象である共有する情報の参加者による共有作業(情報を共有するために実施する作業)の進行を制御し支援するサーバである。共有作業としては、グループ内での発表、資料の配布、グループの各参加者の端末への資料の配信、グループの各参加者が見ることのできる表示装置への資料の表示等、様々な作業が考えられる。本実施形態では、共有作業として、各参加者が事前学習した内容を発表する例について説明する。
入力装置300は、グループワークの参加者がグループで共有する情報を入力する装置である。共有する情報が特定の記載用紙に記載されている場合、入力装置300として画像処理装置を用いても良い。画像処理装置は、いわゆるスキャナ装置により構成され、セットされた原稿上の画像を光学的に読み取り、読み取り画像(画像データ)を生成する。画像の読み取り方式としては、例えば、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED(Light Emitting Diode)光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式が用いられる。画像処理装置は、ネットワークを介して共有情報管理サーバ100に接続し、読み取った記載用紙の画像データを送信する通信機能を備える。また、共有する情報が電子データ化された文書(電子文書)に記載されている場合、この電子文書を共有情報管理サーバ100に送信する情報処理装置を入力装置300として用いても良い。以下では、入力装置300として画像処理装置を用いる場合について説明する。したがって、共有する情報は、入力装置300による画像の読み取りにより得られた画像データとして、共有情報管理サーバ100へ送られる。
出力装置400は、共有情報管理サーバ100および進行制御サーバ200により、情報の共有を支援するために提示される提示情報を出力する装置である。出力装置400としては、例えば、パーソナルコンピュータやスマートフォン等、各種の画面を表示する表示手段とユーザの操作を受け付ける入力デバイスとを備えた情報処理装置が用いられる。提示情報の出力は、例えば、提示情報を含む画面を出力装置400の表示手段に表示させることにより行われる。
<共有情報管理サーバ100および進行制御サーバ200のハードウェア構成>
図2は、共有情報管理サーバ100および進行制御サーバ200のハードウェア構成例を示す図である。共有情報管理サーバ100および進行制御サーバ200は、コンピュータにより実現され、演算手段であるCPU(Central Processing Unit)101と、記憶手段であるRAM(Random Access Memory)102、ROM(Read Only Memory)103、記憶装置104とを備える。RAM102は、主記憶装置(メイン・メモリ)であり、CPU101が演算処理を行う際の作業用メモリとして用いられる。ROM103にはプログラムや予め用意された設定値等のデータが保持されており、CPU101はROM103から直接プログラムやデータを読み込んで処理を実行することができる。記憶装置104は、プログラムやデータの保存手段である。記憶装置104にはプログラムが記憶されており、CPU101は記憶装置104に格納されたプログラムを主記憶装置に読み込んで実行する。また、記憶装置104には、CPU101による処理の結果が格納され、保存される。記憶装置104としては、例えば磁気ディスク装置やSSD(Solid State Drive)等が用いられる。
共有情報管理サーバ100および進行制御サーバ200が上記のコンピュータにより構成される場合、例えば、CPU101がプログラムを実行することにより、以下に説明するこれらのサーバの各機能が実現される。共有情報管理サーバ100および進行制御サーバ200は、例えば、ネットワーク上に構築されたサーバとして実現される。なお、これらのサーバは、単一のハードウェア(サーバマシン等)による構成に限定されず、複数のハードウェアや仮想マシンに分散して構成しても良い。また、共有情報管理サーバ100の機能と進行制御サーバ200の機能とを、一のサーバにより実現しても良い。
<共有情報管理サーバ100および進行制御サーバ200の機能構成>
図3は、共有情報管理サーバ100および進行制御サーバ200の機能構成を示す図である。共有情報管理サーバ100は、画像受信部110と、画像処理部120と、文書ベクトル解析部130と、類似度解析部140と、解析結果提示画面生成部150と、解析結果表示制御部160とを備える。進行制御サーバ200は、情報共有時間設定部210と、ファシリテーション決定部220と、ファシリテーション情報提示画面生成部230と、ファシリテーション情報表示制御部240とを備える。
<共有情報管理サーバ100の機能>
画像受信部110は、入力装置300から、共有する情報が記載された記載用紙の画像データ(以下、文書画像と呼ぶ)を受信する。共有する情報は、グループワークの各参加者から提出される。したがって、画像受信部110により、共有する情報が記録された複数の文書が取得される。
図10は、共有する情報が記載される記載用紙の構成例を示す図である。記載用紙500の構成をある程度特定することにより、画像受信部110により取得された記載用紙500の画像データに対する処理の負荷が軽減される。図10に示す例では、記載用紙500は、文書欄510と、情報コード520とを備える。
文書欄510は、記載用紙500の紙面の特定された領域に設けられる。文書欄510には、共有する情報を示す文書が記載される。文書欄510の様式や書式を特定する必要はないが、段落等のブロックに明示的に分けて文書を記載しても良い。以下では、文書欄510の文書は、明示的に段落を分けて記載されているものとして説明する。
情報コード520は、文書に関する情報や文書の筆者に関する情報を記録するコードである。文書に関する情報としては、文書の識別情報(文書ID)、文書の作成日時や提出日時、文書の内容が共有する情報として使用されるグループワークの識別情報等が挙げられる。筆者に関する情報としては、文書の筆者でありグループワークの参加者であるユーザの識別情報(ユーザID)、ユーザが属するグループの識別情報(グループID)等が挙げられる。グループワークが学校の授業等で行われる場合、ユーザである学生の学籍番号等を含んでも良い。情報コード520自体に、これらの情報を記録しても良いし、これらの情報が管理されているサーバへのリンク情報を情報コード520として記録しても良い。情報コード520としては、例えば、二次元コード等が用いられる。
図3に戻り、画像処理部120は、画像受信部110により取得された文書画像を処理する。具体的には、画像処理部120は、文書画像に記録された情報コード520を読み取る。情報コード520から読み取られた情報に基づき、例えば、文書画像が、文書の内容が共有する情報として使用されるグループワークを実施するグループごとに振り分けられる。また、画像処理部120は、文書画像に対して文字認識処理(OCR)を行い、文書画像に記載された文書を電子データ化する。これ以降の処理は、文書を振り分けたグループごとに行われる。
文書ベクトル解析部130は、画像処理部120により電子データ化された文書(電子文書)に対して文書ベクトル解析を行う。具体的には、文書ベクトル解析部130は、電子文書の段落ごとに切り分け、各段落の記載について文書ベクトルを算出する。
類似度解析部140は、文書ベクトル解析部130により算出された電子文書の段落ごとの文書ベクトルに基づき、段落ごとの記載内容の類似度を計算する。具体的には、類似度解析部140は、一の文書の各段落について、他の全ての文書の全ての段落との間の類似度を計算する。これを全ての文書について行う。同じ文書中の段落間の類似度は計算しない。言い換えれば、類似度解析部140は、文書に含まれる文のブロックの一例である段落を単位として、相異なる文書間の段落ごとの内容の類似度を算出する。
また、類似度解析部140は、算出した各文書の段落間の類似度に基づき、文書間で最も類似度の高い段落の組み合わせを特定する。具体的には、まず一の文書の一の段落に着目し、着目した段落と他の文書の段落のうちで最も類似度の高い段落を文書ごとに特定する。これを着目した一の文書の各段落について行い、さらに各文書について行う。これにより、各文書の段落ごとに、その段落が含まれる文書とは異なる各文書における最も類似度の高い段落が特定される。共有情報管理サーバ100および進行制御サーバ200は、この文書間で最も類似度の高い段落の組を、同じテーマに関して記載されている段落とみなし、関連段落として扱う。一の文書の一の段落には、その段落が含まれる文書とは異なる文書ごとに関連段落が存在する。
解析結果提示画面生成部150は、文書の解析結果を提示する解析結果提示画面を生成する。解析結果提示画面生成部150は、解析結果提示画面として、上記のようにして得られた文書間における最も類似度の高い段落どうしの関係に基づき、各文書の各段落における関連段落を示すグラフを生成する。具体的には、解析結果提示画面生成部150は、各文書の各段落を頂点(ノード)とし、段落間の類似度に基づく関連性に基づいて頂点間に辺(エッジ)を張ったグラフを生成する。グラフの各辺には、対応する段落間の類似度に応じた重みを付加しても良い。各辺に付加された重みは、例えば、辺の太さや長さで表現しても良い。また、各辺に類似度の値を表示しても良い。また、グラフの頂点は、対応する段落に関して文書ベクトル解析部130の解析で算出された文書ベクトルの大きさに応じたサイズで描画しても良い。
解析結果表示制御部160は、解析結果提示画面生成部150により生成された解析結果提示画面を出力装置400に送信し、表示させる。出力装置400に表示された解析結果提示画面は、グループワークの参加者であるユーザによる操作を受け付けるUI(User Interface)画面としても用いられる。ユーザは、マウスやタッチパネル等の入力デバイスを操作して出力装置400に表示された解析結果提示画面のグラフを更新しても良い。例えば、グラフの頂点間に張られた辺を張り替えても良いし、頂点を移動しても良い。グラフの辺が張り替えられると、解析結果表示制御部160は、操作内容を類似度解析部140に通知する。そして、類似度解析部140は、受け付けた操作内容に応じて段落間の関連性の情報を更新する。
<進行制御サーバ200の機能>
進行制御サーバ200の情報共有時間設定部210は、グループワークの参加者間で情報の共有作業を行うための作業時間を設定する。この設定は、例えば、グループワークの主催者によって行われる。グループワークが学校の授業等で行われる場合、教員が事前に設定しておいても良い。また、作業時間の設定は、後述するファシリテーション決定部220による動作が開始されるまでに行われれば良い。
ファシリテーション決定部220は、共有情報管理サーバ100で特定された関連段落の組のうち、共有作業の対象を決定し、共有作業の対象として決定した各関連段落の組に対して共有作業を行う時間および順番を設定する。まず、ファシリテーション決定部220は、共有作業の対象となる関連段落を決定する。具体的には、まず一の文書の一の段落に着目し、着目した段落に対する関連段落のうちで類似度の最も小さい関連段落を、着目した段落に関する共有作業の対象に決定する。これを着目した一の文書の各段落について行い、さらに各文書について行う。これにより、各文書の段落ごとに、共有作業の対象となる関連段落が一つ決定される。ここで、類似度の最も小さい関連段落を共有作業の対象とするのは、一の段落に対して類似度の低い関連段落の方が、その一の段落に記載されていない内容を多く含んでいる可能性が高く、共有作業を行う価値が高いためである。ただし、極端に類似度が小さい場合、関連段落が共通のテーマについて記載されていない可能性が高くなる。そこで、閾値を設け、類似度が閾値よりも大きい関連段落のうちで、最も類似度の小さいものを共有作業の対象とするようにしても良い。さらに、ある段落に対する全ての関連段落の類似度が非常に高く、記載内容がほぼ同一であるような場合、各関連段落間で独自の情報はほとんど無く、共有作業を行う価値が低いと考えられる。そこで、先の閾値とは別の閾値を設け、全ての関連段落の類似度が閾値よりも大きい場合は共有作業の対象から外すようにしても良い。なお、具体的な共有作業の方法は、特に限定されない。主として、関連段落の記載内容の発表が挙げられるが、文書の配布、各参加者の端末への配信、各参加者が同時に見ることができる表示装置への表示など、グループワークの内容やグループの属性等に応じて個別に選択して実施し得る。
また、ファシリテーション決定部220は、共有作業の対象である関連段落に対し、その関連段落の文字数に対応して決定される作業時間を割り当てる。具体的には、例えば、共有作業として発表を行う場合、200文字あたり1分の発表時間を割り当てても良い。割り当てられた作業時間は、上限値としても良い。すなわち、割り当てられた時間よりも短い時間で作業を完了しても良く、その場合は、次の関連段落の共有作業を前倒しで行っても良い。
また、ファシリテーション決定部220は、共有作業の対象に決定した関連段落に関して、共有作業の作業順を決定する。この順は、類似度の低い順とする。そして、ファシリテーション決定部220は、この作業順、かつ、各関連段落に対して割り当てた作業時間で共有作業を行った場合の累積時間と、情報共有時間設定部210で設定された共有作業全体の作業時間とを比較し、累積時間が全体の作業時間内に収まるように、実際に共有作業を行う関連段落を決定する。
ファシリテーション情報提示画面生成部230は、ファシリテーション決定部220による決定結果である上記のファシリテーション情報を提示するファシリテーション情報提示画面を生成する。ファシリテーション情報には、作業対象の段落の識別情報、作業順、段落ごとの作業時間が含まれる。ファシリテーション情報提示画面生成部230は、例えば、段落の識別情報と作業時間とを、作業順に並べた一覧表としてファシリテーション情報提示画面を生成する。
ファシリテーション情報表示制御部240は、ファシリテーション情報提示画面生成部230により生成されたファシリテーション情報提示画面を出力装置400に送信し、表示させる。ファシリテーション情報提示画面が上述した一覧表として生成される場合、ファシリテーション情報表示制御部240は、累積時間が全体の作業時間内に収まる範囲の関連段落の項目を、他の関連段落の項目に対して識別可能に表示しても良い。また、ファシリテーション情報表示制御部240は、共有作業が完了した関連段落の項目を、他の関連段落の項目に対して識別可能に表示しても良い。
<類似度解析の例>
図4は、共有情報管理サーバ100の類似度解析部140により算出された段落ごとの類似度の例を示す図である。図4に示す例では、文書A〜文書Eの5つの文書を対象として、各文書の段落の類似度を算出している。各文書A〜Eは、それぞれ3段落で構成されている。図4において、文書Aの各段落1〜3に着目する。段落1と文書Bの各段落との類似度を見ると、文書Bの段落3の類似度が0.98で最も大きい。また、段落1と文書Cの各段落との類似度を見ると、文書Cの段落2の類似度が0.99で最も大きい。また、段落1と文書Dの各段落との類似度を見ると、文書Dの段落2の類似度が0.88で最も大きい。また、段落1と文書Eの各段落との類似度を見ると、文書Eの段落1の類似度が0.63で最も大きい。したがって、文書Aの段落1の関連段落は、文書Bの段落3、文書Cの段落2、文書Dの段落2、文書Eの段落1となる。同様に、文書Aの段落2の関連段落は、文書Bの段落2、文書Cの段落1、文書Dの段落2、文書Eの段落2である。また、文書Aの段落3の関連段落は、文書Bの段落3、文書Cの段落3、文書Dの段落3、文書Eの段落2である。
さらに、文書Bの各落1〜3に着目すると、文書Bの段落1の関連段落は、文書Aの段落1、文書Cの段落2、文書Dの段落1、文書Eの段落3である。また、文書Bの段落2の関連段落は、文書Aの段落1、文書Cの段落1、文書Dの段落3、文書Eの段落1である。また、文書Bの段落3の関連段落は、文書Aの段落3、文書Cの段落3、文書Dの段落1、文書Eの段落1である。このようにして、文書C〜文書Eの段落1〜段落3の各々に関して関連段落が得られる。
ここで、段落間の関連性は、必ずしも対称ではない。すなわち、一方の文書の一の段落から見て他方の文書の最も類似する段落と、かかる他方の文書の段落から見て一方の文書の最も類似する段落とが一致するとは限らない。例えば、文書Aから文書Bを見ると、文書Aの段落1に最も類似する文書Bの段落は段落3である。しかし、文書Bの段落3に最も類似する文書Aの段落は段落3であり、段落1ではない。また、文書Aの段落2に最も類似する文書Bの段落は段落2である。しかし、文書Bの段落2に最も類似する文書Aの段落は段落1であり、段落2ではない。反対に、文書Bから文書Aを見ると、文書Bの段落1に最も類似する文書Aの段落は段落1である。また、文書Bの段落2に最も類似する文書Aの段落も段落1である。しかし、文書Aの段落1に最も類似する文書Bの段落は、上述したように段落3であり、段落1および段落2ではない。
<解析結果提示画面の例>
図5は、共有情報管理サーバ100の解析結果提示画面生成部150により生成された解析結果提示画面の例を示す図である。解析結果提示画面410は、出力装置400に表示される。図5に示す解析結果提示画面410のグラフの頂点は、図4に示した文書および段落に対応している。例えば頂点「DA1」の「DA」は文書Aを示し、「1」は段落1を示す。また、図5に示す例では、各頂点が、文書ごとにまとめて配置されている。ただし、図5に示す例において、頂点間に張られた辺は、単なる例示であり、図4に示した段落間の類似関係を反映していない。例えば、頂点「DA1」は、頂点「DB3」、頂点「DC3」、頂点「DD2」、頂点「DE3」と接続されており、図4を参照して示した文書Aの段落1の関連段落(文書Bの段落3、文書Cの段落2、文書Dの段落2、文書Eの段落1)と異なっている。
また、図5は、解析結果提示画面410の表示の例を示すに過ぎないので、簡単のため、各辺が方向を有しない無向グラフとなっている。しかし、実際には上述したように、段落間の関連性は対称ではない。そのため、解析結果提示画面410のグラフは、例えば有向グラフとして作成される。この場合、各辺は、段落間の関連性に応じて、一の頂点から他の一の頂点へ向かう矢印で記載される。また、図5に示す例において、ユーザが出力装置400に表示された解析結果提示画面の頂点をマウスクリック等の操作で選択すると、出力装置400の表示画面が切り替わり、選択された頂点に対応する段落が表示される。
<共有作業の対象の決定例>
図6は、進行制御サーバ200のファシリテーション決定部220による共有作業の対象の決定例を示す図である。図6には、各文書A〜Eの各段落1〜3に対する各関連段落の類似度が示されている。一の段落に対する関連段落は、各文書に一つだけなので、図6では、比較対象である関連段落が含まれる文書については段落を省略している。図6に示す各文書A〜Eの各段落1〜3と各関連段落との類似度は、図4に示した例に基づいている。
上述したように、ファシリテーション決定部220は、関連段落のうちで類似度の最も小さい関連段落を共有作業の対象として決定する。図6において、例えば文書Aの段落1に着目すると、文書B(の段落3)との類似度が0.99、文書C(の段落2)との類似度が0.99、文書D(の段落2)との類似度が0.88、文書E(の段落1)との類似度が0.63である。したがって、0.63が類似度最小値であるので、文書Eの段落1を、共有作業の対象とする。同様にして、文書Aの段落2、段落3、文書Bの段落1〜段落3、文書Cの段落1〜段落3、文書Dの段落1〜段落3、文書Eの段落1〜段落3の各々について、共有作業の対象となる関連段落が決定される。
<共有作業の対象の関連段落に対する決定情報>
図7は、共有作業の対象の関連段落に対する決定情報の例を示す図である。図7に示す例では、各関連段落について、「文書」および「段落」の識別情報、「類似度」、段落の「文字数」、「割り当て時間」、「作業時間」、「累積時間」の各情報が記録されている。「文書」は関連段落が含まれる文書の識別情報、「段落」は関連段落の識別情報である。ここでは、ファシリテーション決定部220が識別するための情報が記録される。「類似度」は、関連段落の類似度である。「文字数」は、関連段落に記載された文字数である。「割り当て時間」は、ファシリテーション決定部220により関連段落に対して共有作業のために割り当てられた時間である。この「割り当て時間」は、関連段落の文字数に基づいて計算された値である。ここでは、200文字あたり60秒として計算している。「作業時間」は、予め設定された共有作業全体の作業時間内で実際に共有作業を実施するために、関連段落に対して割り当てられた時間である。全体の作業時間が分単位等で設定される場合が多いため、ここでは、「割り当て時間」で示された時間の端数を切り上げて10の倍数の時間としている。「累積時間」は、「作業時間」を最上位の関連段落から順に累積した時間である。また、各関連段落は、類似度の低いものから順に上から並べられている。共有作業全体の作業時間が15分に設定された場合、図7の「累積時間」参照すると、10番目の関連段落(文書E、段落1)に対する共有作業を行うと、設定時間の900秒(15分)を超えてしまう。そのため、9番目の関連段落(文書A、段落1)までを作業対象とする。
<ファシリテーション情報提示画面の例>
図8は、ファシリテーション情報提示画面生成部230により生成されたファシリテーション情報提示画面の例を示す図である。ファシリテーション情報提示画面420は、出力装置400に表示される。図8に示すファシリテーション情報提示画面420には、図7に示した決定情報の9番目の関連段落までが、図8における関連段落の並び順(作業順)にしたがって、共有作業の対象として示されている。図8に示すファシリテーション情報提示画面420には、共有作業の対象である関連段落に関して、「優先順位」、「文書」の識別情報、「段落」の識別情報、「作業時間」の各情報が表示されている。「優先順位」は、ファシリテーション決定部220により関連段落の類似度に基づいて定められた共有作業の実施順である。「文書」の識別情報は、関連段落が含まれる文書の識別情報である。図7に示した識別情報と異なり、ファシリテーション情報提示画面420を見たユーザが文書を識別するための情報である。例えば、文書ファイル名や、文書の作成者であるユーザの識別情報等を用い得る。「段落」の識別情報も「文書」の識別情報と同様に、ファシリテーション情報提示画面420を見たユーザが文書中の段落を識別するための情報である。「作業時間」には、図7に示した作業時間が記録される。図8に示すファシリテーション情報提示画面において、ユーザが作業対象の関連段落の行を選択すると、出力装置400の表示が切り替わり、選択された関連段落が表示される。
<関連段落表示画面の例>
図9は、関連段落表示画面の例を示す図である。出力装置400に表示された関連段落表示画面430は、対象情報欄431と、関連段落表示領域432と、ボタンオブジェクト433、434とを備える。対象情報欄431は、表示されている関連段落を特定する情報を示す。図9に示す例では、図8のファシリテーション情報提示画面における項目「文書」および項目「段落」に記載された情報を表示して文書および段落を特定している。すなわち、図9の関連段落表示画面430には、文書FX28816の段落1が表示されていることが示されている。関連段落表示領域432は、関連段落に記載された文を表示する。
「完了」と記されたボタンオブジェクト433は、関連段落表示画面430に表示された関連段落の共有作業が完了したことを確定するためのオブジェクトである。ボタンオブジェクト433が操作(マウスクリック等)されると、共有作業が完了したことを通知するコマンドが進行制御サーバ200へ出力される。進行制御サーバ200は、コマンドを受信すると、関連段落表示画面430に表示されている関連段落のステータスを共有作業が完了したことを示す内容に更新し、出力装置400の表示をファシリテーション情報提示画面420に戻す。このとき、ファシリテーション情報提示画面420において、共有作業が完了した関連段落の行を、表示色を変える等の手段により、他の関連段落の行とは識別可能に表示する。
「戻る」と記されたボタンオブジェクト434は、関連段落表示画面430に表示された関連段落の共有作業を完了せずにファシリテーション情報提示画面へ戻るためのオブジェクトである。ボタンオブジェクト434が操作(マウスクリック等)されると、共有作業が完了せずに表示の終了を指示するコマンドが進行制御サーバ200へ出力される。進行制御サーバ200は、コマンドを受信すると、関連段落表示画面430に表示されている関連段落のステータスを更新せずに、出力装置400の表示をファシリテーション情報提示画面420に戻す。このとき、関連段落表示画面430に表示されていた関連段落の共有作業は完了していないので、ファシリテーション情報提示画面420における該当する関連段落の行の表示態様は変更しない。
図5に示した解析結果提示画面410の構成、図8に示したファシリテーション情報提示画面420の構成、図9に示した関連段落表示画面430の構成は、何れも例示であり、各段階で必要な情報や機能を含む画面であれば、図示の構成には限定されない。例えば、図8に示すファシリテーション情報提示画面420では、各関連段落の作業時間を提示したが、これに替えて、または加えて、図7に示した累積時間を提示しても良い。また、上記の例では、ファシリテーション情報提示画面420において、共有作業が完了した関連段落の行を識別可能に表示することとした。この他、関連段落ごとに、割り当てられた時間を経過した場合に、ファシリテーション情報提示画面420における該当する行を識別可能に表示するようにしても良い。また、ファシリテーション情報提示画面420において、関連段落表示画面430を表示するために選択可能な行は、「優先順位」に示す順番に限定しても良いし、「優先順位」の順番に関わらずに選択可能としても良い。さらに、共有作業が完了した関連段落の行は選択を制限するようにしても良い。
以上、本発明の実施形態について説明したが、本発明の技術的範囲は上記実施形態には限定されない。例えば、上記の実施形態では、共有する情報を記載用紙500(図10参照)に記載し、入力装置300で読み取ることとしたが、パーソナルコンピュータやその他の情報処理装置を用いて電子文書として共有する情報を記載した文書を作成し、直接、共有情報管理サーバ100に入力するようにしても良い。その他、本発明の技術思想の範囲から逸脱しない様々な変更や構成の代替は、本発明に含まれる。
100…共有情報管理サーバ、110…画像受信部、120…画像処理部、130…文書ベクトル解析部、140…類似度解析部、150…解析結果提示画面生成部、160…解析結果表示制御部、200…進行制御サーバ、210…情報共有時間設定部、220…ファシリテーション決定部、230…ファシリテーション情報提示画面生成部、240…ファシリテーション情報表示制御部、300…入力装置、400…出力装置

Claims (10)

  1. 取得した文書を解析するプロセッサを備え、
    前記プロセッサは、
    複数の参加者間で共有しようとする情報が記録された複数の文書を取得し、
    前記文書に含まれる文のブロックを単位として、相異なる文書間の当該ブロックごとの内容の類似度を算出し、
    前記類似度に基づき、前記ブロックの内容の共有作業の実行順を決定し、
    前記ブロックの文字数に基づき、当該ブロックの内容の共有作業を行うための作業時間を割り当てることを特徴とする、情報処理システム。
  2. 前記プロセッサは、前記ブロックに含まれる文をベクトル表現した文書ベクトルの類似度を算出して当該ブロックの記載内容の類似度とすることを特徴とする、請求項1に記載の情報処理システム。
  3. 前記プロセッサは、相異なる文書間で最も類似度の高いブロックどうしを関連ブロックとし、当該関連ブロックから一つのブロックを前記共有作業の対象とすることを特徴とする、請求項2に記載の情報処理システム。
  4. 前記プロセッサは、前記関連ブロックのうちで最も類似度の低いブロックを前記共有作業の対象とすることを特徴とする、請求項3に記載の情報処理システム。
  5. 前記プロセッサは、前記関連ブロックのうち、類似度が予め定められた閾値よりも低いブロックを前記共有作業の対象から除外することを特徴とする、請求項4に記載の情報処理システム。
  6. 前記プロセッサは、
    相異なる文書間で最も類似度の高いブロックどうしを関連付け、
    前記ブロックどうしの関連性を示す情報を前記参加者に提示し、
    前記参加者による指示を受け付けて、前記ブロックどうしの関連性を示す情報を更新することを特徴とする、請求項1に記載の情報処理システム。
  7. 前記プロセッサは、
    前記ブロックを頂点とし、関連付けられた当該ブロックを表す当該頂点間に辺を張ったグラフを表示装置に表示させ、
    前記参加者による前記辺を張り替える操作を受け付け、張り替えられた当該辺にしたがって、前記ブロックどうしの関連性を示す情報を更新することを特徴とする、請求項6に記載の情報処理システム。
  8. 前記プロセッサは、前記ブロックの前記共有作業の実行順および作業時間と、当該共有作業を当該実行順で実行した場合における作業時間の累積値とを前記参加者に提示することを特徴とする、請求項1に記載の情報処理システム。
  9. 前記プロセッサは、前記作業時間の累積値が予め定められた上限値以下の範囲に含まれる前記ブロックの情報を識別可能に提示することを特徴とする、請求項8に記載の情報処理システム。
  10. 前記プロセッサは、前記共有作業が完了した前記ブロックの情報を識別可能に提示することを特徴とする、請求項9に記載の情報処理システム。
JP2019186971A 2019-10-10 2019-10-10 情報処理システム Active JP7354750B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019186971A JP7354750B2 (ja) 2019-10-10 2019-10-10 情報処理システム
US16/878,688 US11244155B2 (en) 2019-10-10 2020-05-20 Information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019186971A JP7354750B2 (ja) 2019-10-10 2019-10-10 情報処理システム

Publications (2)

Publication Number Publication Date
JP2021064048A true JP2021064048A (ja) 2021-04-22
JP7354750B2 JP7354750B2 (ja) 2023-10-03

Family

ID=75383137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019186971A Active JP7354750B2 (ja) 2019-10-10 2019-10-10 情報処理システム

Country Status (2)

Country Link
US (1) US11244155B2 (ja)
JP (1) JP7354750B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7354750B2 (ja) * 2019-10-10 2023-10-03 富士フイルムビジネスイノベーション株式会社 情報処理システム
CN116934068A (zh) * 2023-09-19 2023-10-24 江铃汽车股份有限公司 一种办公流程节点管理方法及系统

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8370746B2 (en) * 1992-12-14 2013-02-05 Monkeymedia, Inc. Video player with seamless contraction
US20030079184A1 (en) * 2000-05-05 2003-04-24 International Business Machines Corporation Dynamic image storage using domain-specific compression
JP3943824B2 (ja) * 2000-10-31 2007-07-11 株式会社東芝 情報管理方法および情報管理装置
WO2003067497A1 (en) * 2002-02-04 2003-08-14 Cataphora, Inc A method and apparatus to visually present discussions for data mining purposes
US7519589B2 (en) * 2003-02-04 2009-04-14 Cataphora, Inc. Method and apparatus for sociological data analysis
CA2504984A1 (en) * 2002-11-07 2004-05-21 Invoke Solutions, Inc. Survey system
US7996462B2 (en) * 2004-07-30 2011-08-09 Sap Ag Collaborative agent for a work environment
US8136034B2 (en) * 2007-12-18 2012-03-13 Aaron Stanton System and method for analyzing and categorizing text
GB2458388A (en) * 2008-03-21 2009-09-23 Dressbot Inc A collaborative online shopping environment, virtual mall, store, etc. in which payments may be shared, products recommended and users modelled.
US9262390B2 (en) * 2010-09-02 2016-02-16 Lexis Nexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
WO2012092556A2 (en) * 2010-12-30 2012-07-05 Kleinbart Kyle System and method for online communications management
US10387836B2 (en) * 2015-11-24 2019-08-20 David Howard Sitrick Systems and methods providing collaborating among a plurality of users
US9058331B2 (en) * 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US10109278B2 (en) * 2012-08-02 2018-10-23 Audible, Inc. Aligning body matter across content formats
US9542669B1 (en) * 2013-03-14 2017-01-10 Blab, Inc. Encoding and using information about distributed group discussions
JP6142616B2 (ja) * 2013-03-27 2017-06-07 富士通株式会社 ディスカッション支援プログラム、ディスカッション支援方法、及び情報処理装置
US11886796B2 (en) * 2013-07-03 2024-01-30 Ofer Bleiweiss Collaborative matter management and analysis
US9507758B2 (en) * 2013-07-03 2016-11-29 Icebox Inc. Collaborative matter management and analysis
US9450771B2 (en) * 2013-11-20 2016-09-20 Blab, Inc. Determining information inter-relationships from distributed group discussions
US10922719B1 (en) * 2013-12-09 2021-02-16 Groupon, Inc. Systems and methods for providing group promotions
US10078533B2 (en) * 2014-03-14 2018-09-18 Amazon Technologies, Inc. Coordinated admission control for network-accessible block storage
US9984310B2 (en) * 2015-01-23 2018-05-29 Highspot, Inc. Systems and methods for identifying semantically and visually related content
KR101734728B1 (ko) * 2015-12-17 2017-05-11 고려대학교 산학협력단 소셜 네트워크 서비스를 이용하여 온라인 협동 학습을 제공하는 방법 및 서버
JP6607263B2 (ja) 2016-02-15 2019-11-20 富士通株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US20180032608A1 (en) * 2016-07-27 2018-02-01 Linkedin Corporation Flexible summarization of textual content
US10706278B2 (en) * 2017-07-14 2020-07-07 Adobe Inc. Syncing digital and physical documents
CN108156070B (zh) * 2018-01-09 2020-07-17 论客科技(广州)有限公司 基于邮件系统的即时通讯方法、装置及系统
JP6488417B1 (ja) 2018-03-27 2019-03-20 株式会社日立製作所 ワークショップ支援システムおよびワークショップ支援方法
US20210026897A1 (en) * 2019-07-23 2021-01-28 Microsoft Technology Licensing, Llc Topical clustering and notifications for driving resource collaboration
JP7354750B2 (ja) * 2019-10-10 2023-10-03 富士フイルムビジネスイノベーション株式会社 情報処理システム
US11829723B2 (en) * 2019-10-17 2023-11-28 Microsoft Technology Licensing, Llc System for predicting document reuse

Also Published As

Publication number Publication date
JP7354750B2 (ja) 2023-10-03
US11244155B2 (en) 2022-02-08
US20210110155A1 (en) 2021-04-15

Similar Documents

Publication Publication Date Title
Cheong et al. ClicO FS: an interactive web-based service of Circos
EP3506124A1 (en) Method for processing fusion data and information recommendation system
US20170061341A1 (en) Workflow management for crowd worker tasks with fixed throughput and budgets
RU2012141567A (ru) Система и способ обработки мультимедийных коммуникационных информационных продуктов
CN1896996A (zh) 用于显示图标的装置和方法
JP2018026119A (ja) 分類システム、分類システムの制御方法、およびプログラム
JP7354750B2 (ja) 情報処理システム
US20120237918A1 (en) Information display apparatus and question inputting apparatus, and display system
CN112650430A (zh) 任务处理方法和装置及电子设备
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
Yu et al. A dataset of human decision-making in teamwork management
CN1815474A (zh) 将原始数据从一个数据结构转移到另一结构的机制
JP2016085534A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
US20190266220A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2019134399A (ja) 情報処理システム、電子黒板装置及びプログラム
JP2009086952A (ja) 情報処理システム及び情報処理プログラム
US11423230B2 (en) Process extraction apparatus and non-transitory computer readable medium
CN112182343A (zh) 一种在线学习交互方法、装置、设备和存储介质
JP2015069483A (ja) 電子チラシ推薦システム、電子チラシ推薦サーバ、電子チラシ推薦方法及びプログラム
JP2020178301A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
KR101755343B1 (ko) 할일 관리 방법, 이를 수행하는 메시지 서버 및 이를 저장하는 기록매체
CN113260970B (zh) 图片识别的用户界面系统、电子设备及交互方法
US11074392B2 (en) Information processing apparatus and non-transitory computer readable medium for switching between an attribute information mode and an image information mode
CN107438818A (zh) 处理经受应用程序监控和干预的数字墨水输入
Ellis et al. Prototyping as a process for improved user experience with library and archives websites

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220922

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230815

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R150 Certificate of patent or registration of utility model

Ref document number: 7354750

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150