JP2023087805A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2023087805A
JP2023087805A JP2021202283A JP2021202283A JP2023087805A JP 2023087805 A JP2023087805 A JP 2023087805A JP 2021202283 A JP2021202283 A JP 2021202283A JP 2021202283 A JP2021202283 A JP 2021202283A JP 2023087805 A JP2023087805 A JP 2023087805A
Authority
JP
Japan
Prior art keywords
information
image data
elements
terminal device
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021202283A
Other languages
English (en)
Inventor
義久 石原
Yoshihisa Ishihara
聡 田端
Satoshi Tabata
荘介 下山
Sosuke Shimoyama
隆寛 田中
Takahiro Tanaka
悠一 伊藤
Yuichi Ito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2021202283A priority Critical patent/JP2023087805A/ja
Publication of JP2023087805A publication Critical patent/JP2023087805A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像データを解析し、端末装置を使用したテストのレイアウトを容易に生成する情報処理装置及びプログラムを提供する。【解決手段】情報処理装置であるサーバ10は、画像データ取得部31と、要素抽出部32と、属性認識部33と、関連認識部34と、構造情報生成部35と、構造情報出力部36と、編集情報取得部37と、ディスプレイ情報取得部38と、レイアウト生成部39と、表示データ出力部40と、を備える。要素抽出部32は、画像データに含まれるコンテンツの要素を抽出する。構造情報生成部35は、画像データに含まれる要素の構造に関する構造情報を生成する。構造情報出力部36は、画像データに含まれる要素の構造情報を端末装置へ送信する。ディスプレイ情報取得部38は、端末装置から、ディスプレイ情報を取得する。レイアウト生成部39は、画像データと、構造情報とに基づいて、ディスプレイに応じたレイアウトを生成する。【選択図】図3

Description

本発明は、学習支援者の業務を軽減する技術に関する。
従来から生徒に対し、紙ではなく端末装置を使用してテストを実施するシステムが知られている。特許文献1には、タブレット端末装置を使用して英語のテストを実施する教育支援システムが開示されている。
特開2016-65987号公報
端末装置を使用してテストを実施する場合、今まで使用していた紙媒体のテストをそのまま使用することは困難である。また、パーソナルコンピュータや汎用のタブレットPC(パソコン)といった、生徒が使用する端末装置の種類に応じたテストのレイアウトを生成する必要がある。そのため、学習支援者の負担増加という問題が生じている。
本発明は、例えば、上記のような課題を解決するためになされたものであり、画像データを解析し、端末装置を使用したテストのレイアウトを容易に生成する情報処理装置を提供することにある。
本発明の1つの観点では、情報処理装置は、画像データを取得する画像データ取得部と、前記画像データを解析し、当該画像データに含まれるコンテンツを構成する要素を抽出する抽出部と、前記要素の属性を認識する属性認識部と、前記コンテンツを構成する要素間の関連を認識する関連認識部と、前記画像データに含まれる要素の領域、前記要素の属性及び前記要素間の関連に関する情報を含む構造情報を生成する構造情報生成部と、を備える。この態様によれば、情報処理装置は、画像データを解析することで、要素の領域と、要素の属性と、要素間の関連とを認識し、要素の構造情報を生成することができる。
上記の情報処理装置の一態様では、前記画像データ取得部は、ユーザが使用する端末装置から前記画像データを取得し、前記構造情報を前記端末装置へ送信する構造情報出力部を備える。この態様によれば、情報処理装置は、端末装置からユーザが指定する任意の画像データを取得し、当該画像データに含まれる要素の構造情報を当該ユーザに提供することができる。
上記の情報処理装置の一態様では、前記構造情報は、前記端末装置が表示する画像データ上に、前記要素の領域と、前記要素の属性と、前記要素間の関連とを表示させる情報である。この態様によれば、要素の領域と、要素の属性と、要素間の関連とを画像データ上で可視化することができる。
上記の情報処理装置の一態様では、前記関連認識部は、要素間の関連を表す要素IDを各要素に割り振り、前記構造情報は、前記端末装置が表示する画像データ上に、前記要素IDに基づいて前記要素間を結んだリンクを表示させる情報である。この態様によれば、リンクにより画像データ上で要素間の関連を可視化することができる。
上記の情報処理装置の一態様では、前記構造情報出力部は、前記要素間を結んだリンク上に、前記要素IDを示す数字を表示させる。この態様によれば、要素IDを示す数字により画像データ上で要素間の関連を可視化することができる。
上記の情報処理装置の一態様では、前記端末装置から、前記ユーザにより前記要素の領域、前記要素の属性及び前記要素間の関連のいずれか1つ以上が編集された構造情報を取得する編集情報取得部を備え、前記構造情報生成部は、前記構造情報を編集された構造情報に置き換える。この態様によれば、ユーザは、要素の領域、要素の属性、要素間の関連を自由に編集することができ、編集後、情報処理装置は、編集された構造情報に基づいて所定の処理を行う。
上記の情報処理装置の一態様では、前記画像データと、前記構造情報とに基づいて、前記要素を組み合わせたコンテンツのレイアウトを生成するレイアウト生成部と、前記レイアウトを表示する表示データを前記端末装置へ送信する表示データ出力部と、を備える。この態様によれば、情報処理装置は、要素を組み合わせたコンテンツのレイアウトを自由に生成することができる。
上記の情報処理装置の一態様では、前記端末装置から、前記表示データを出力する出力先端末装置が有するディスプレイに関するディスプレイ情報を取得するディスプレイ情報取得部を備え、前記レイアウト生成部は、前記ディスプレイ情報に基づいて、前記出力先端末装置が有するディスプレイに応じたレイアウトを生成する。この態様によれば、情報処理装置は、ディスプレイ情報に基づいて、PCやスマートフォンといった端末装置それぞれが有するディスプレイの機能や大きさに応じて適切なレイアウトを生成することができる。
上記の情報処理装置の一態様では、前記画像データは、問題と、前記問題の解答欄とを含み、前記要素は、前記問題及び前記解答欄のいずれかである。この態様によれば、情報処理装置は、テスト問題用紙等の画像データに含まれる問題や解答欄の構造を認識することができる。
上記の情報処理装置の一態様では、前記問題は、階層構造の複数の問題から構成される。この態様によれば、情報処理装置は、問題が大問と小問等から構成される階層構造であったとしても、画像データに含まれる問題や解答欄の構造を認識することができる。
本発明の別の観点では、コンピュータを備える情報処理装置により実行されるプログラムは、画像データを取得する画像データ取得部、前記画像データを解析し、当該画像データに含まれるコンテンツを構成する要素を抽出する抽出部、前記要素の属性を認識する属性認識部、前記コンテンツを構成する要素間の関連を認識する関連認識部、前記画像データに含まれる要素の領域、前記要素の属性及び前記要素間の関連に関する情報を含む構造情報を生成する構造情報生成部、として前記コンピュータを機能させる。このプログラムをコンピュータにインストールして実行させることで、本発明に係る情報処理装置を構成させることができる。
本発明に係る情報処理装置によれば、画像データを解析し、端末装置を使用したテストのレイアウトを容易に生成することができる。
本発明のサーバを適用した学習支援システムの構成を示す。 サーバのハードウェア構成を示すブロック図である。 サーバの機能構成を示すブロック図である。 画像データの一例である。 画像データ上に表示される矩形領域の一例である。 端末装置のハードウェア構成を示すブロック図である。 編集画面の一例である。 編集機能を説明する図である。 レイアウト画面の一例である。 レイアウト生成処理のフローチャートである。 画像データ上に表示されるリンクの一例である。
以下、図面を参照しながら、本発明の実施の形態について説明する。
<実施形態>
[全体構成]
図1は、本発明のサーバを適用した学習支援システムの構成を示す。学習支援システム100は、画像データを解析し、当該画像データに含まれるコンテンツを構成する要素の構造を認識するシステムである。また、学習支援システム100は、出力先の端末装置(以下、「出力先端末装置」ともいう。)が有するディスプレイに応じて、要素を組み合わせたコンテンツによるレイアウトを生成するシステムである。学習支援システム100は、サーバ10と、端末装置20とがインターネット等のネットワーク5を介して通信可能に構成されている。
サーバ10は、種々の情報に対する処理、記憶及び送受信を行う情報処理装置であって、例えばサーバ装置、パーソナルコンピュータまたは汎用のタブレットPC等である。
端末装置20は、教師やテストの作成者といったユーザが使用するものであって、例えば、パーソナルコンピュータやタブレットPC等の情報処理機器である。具体的に、端末装置20は、画像データや編集情報の送信、構造情報や表示データの受信、編集画面やレイアウト画面の表示等を行う。
[サーバの構成]
図2は、サーバ10のハードウェア構成を示すブロック図である。サーバ10は、通信部11と、制御部12と、記憶部13と、記録媒体14と、表示部15と、入力部16とを備える。なお、これらの構成要素は、バス19を介して相互に接続されている。
なお、サーバ10はコンピュータ単体で実行しても良いし、複数のコンピュータで分散して実行しても良いし、仮想マシンで分散して実行しても良い。
通信部11は、ネットワーク5を通じて端末装置20と通信を行うための通信ユニットである。具体的に、通信部11は、端末装置20から画像データや編集情報を受信したり、構造情報や表示データを端末装置20へ送信したりする。
制御部12は、CPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を含み、記憶部13に記憶されたプログラムを読み出して実行することにより、サーバ10に係る種々の情報処理、制御処理等を行う。なお、プログラムは、単一のコンピュータ上で、または1つのサイトにおいて配置されるか、もしくは複数のサイトにわたって分散され、通信ネットワークによって相互接続された複数のコンピュータ上で実行されるように展開することができる。なお、図2では制御部12を単一のプロセッサであるものとして説明するが、マルチプロセッサであっても良い。
記憶部13はRAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ素子を含み、制御部12が処理を実行するために必要なプログラム又はデータ等を記憶している。また、記憶部13は、制御部12が演算処理を実行するために必要なデータ等を一時的に記憶する。
記録媒体14は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、サーバ10に対して着脱可能に構成される。記録媒体14は、制御部12が実行する各種プログラムを記録している。サーバ10が後述のレイアウト生成処理を実行する際には、記録媒体14に記録されているプログラムが記憶部13にロードされ、制御部12により実行される。
表示部15は、液晶ディスプレイ又は有機EL(electroluminescence)ディスプレイ等であり、制御部12の指示に従い各種情報を表示する。入力部16は、マウス、キーボード、タッチパネル、ボタン等の入力デバイスであり、受け付けた操作情報を制御部12へ出力する。
図3は、サーバの機能構成を示すブロック図である。サーバ10は、機能的には、画像データ取得部31と、要素抽出部32と、属性認識部33と、関連認識部34と、構造情報生成部35と、構造情報出力部36と、編集情報取得部37と、ディスプレイ情報取得部38と、レイアウト生成部39と、表示データ出力部40とを備える。
なお、画像データ取得部31、要素抽出部32、属性認識部33、関連認識部34、構造情報生成部35、構造情報出力部36、編集情報取得部37、ディスプレイ情報取得部38、レイアウト生成部39及び表示データ出力部40は、制御部12がプログラムを実行することにより実現される。
また、サーバ10は、ドキュメント構造認識AI(Artificial Intelligence)及び新レイアウト生成AIの2つのAIモジュールで構成されている。
ドキュメント構造認識AIは、機械学習やルールベースロジックで実装される。機械学習の手法は、例えば、CNN(Convolutional Neural Network)等のディープラーニングが挙げられる。ルールベースロジックのルールは、例えば、要素情報に基づいて、「画像データ上で近い要素を1つのコンテンツとする」、「左上に位置する要素ほど当該要素を含むコンテンツの並び順が早く、右下に位置する要素ほど当該要素を含むコンテンツの並び順が遅い」等が挙げられ、予め任意に設定されている。ドキュメント構造認識AIは、画像データを解析することで、当該画像データから要素を抽出し、画像データに含まれる要素の領域、要素の属性及び要素間の関連を認識する。後述する要素抽出部32、属性認識部33、関連認識部34及び構造情報生成部35は、ドキュメント構造認識AIにより実現される。
新レイアウト生成AIは、レイアウトを表示する出力先端末装置が有するディスプレイの性能や大きさに応じて、要素を組み合わせたコンテンツのレイアウトを生成する。新レイアウト生成AIは、ルールベースロジックで実装される。後述するレイアウト生成部39は、新レイアウト生成AIにより実現される。
画像データ取得部31は、教材の画像データを取得する。教材は、例えば、問題及び当該問題の解答欄を含むテスト問題用紙等である。具体的に、ユーザは、スキャナーを用いて紙媒体のテスト問題用紙を読み込むことで画像データを取得し、端末装置20を使用して当該画像データをサーバ10へ送信する。画像データ取得部31は、端末装置20からテスト問題用紙の画像データを受信する。なお、画像データは、紙媒体の教材をスキャナーで読み込んだものに限らず、もともと電子データで作成されたものであってもよい。
図4は、画像データの一例である。ユーザは、端末装置20を使用して所定の操作により、図4に示すような、テスト問題用紙の画像データ60を取得して表示する。そして、端末装置20は、画像データ60と、要素生成リクエストとをサーバ10へ送信する。
なお、本実施形態において、端末装置20は、画像データを取得すると、当該画像データ及び要素生成リクエストをサーバ10へ送信しているが、本発明はこれに限定されるものではなく、予め画像データのみを送信しておき、要素生成リクエストは別のタイミングで送信してもよい。
また、本実施形態において、コンテンツとは、1つの事柄に焦点をあて、これ以上分割できない最小限の単位にまで分割したものである。例えば、テスト問題用紙のコンテンツは、1つの問題と、当該問題の解答欄で構成される。ここで、1つの問題とは、1つの大問と、当該大問に属する1つの小問のセットである。要素とは、コンテンツを構成する部品であって、例えば、テスト問題用紙の大問、小問、解答欄は、それぞれ1つの要素となる。つまり、本実施形態のテスト問題用紙では、大問、小問及び解答欄の3つの要素を組み合わせることで1つのコンテンツを構成している。なお、テスト問題用紙は、教科によって構成が異なり、大問がないものや小問と解答欄が一緒になっているもの等、種々の構成が考えられるため、コンテンツを構成する要素はこれに限定されるものではなく、任意に設定することができる。
要素抽出部32は、画像データを解析し、当該画像データに含まれるコンテンツの要素を抽出する。本実施形態において、コンテンツの要素は、大問、小問、解答欄であるため、要素抽出部32は、画像データを解析し、矩形で各要素の領域を定める。図5は、画像データ60に含まれる各要素の領域を定める矩形領域を示す一例である。図5に示すように、画像データ60は、矩形領域61~72を有する。
属性認識部33は、要素抽出部32により抽出された要素の属性を認識する。本実施形態において、属性は、大問、小問及び解答欄のいずれかである。図5に示すように、矩形領域は、属性に応じた線で囲まれており、具体的に、属性が「大問」であれば太めの実線、属性が「小問」であれば細目の実線、属性が「解答欄」であれば点線で囲まれている。
例えば、矩形領域61は、属性認識部33により属性が「大問」と認識されているため、太めの実線で囲まれている。矩形領域62は、属性認識部33により属性が「小問」と認識されているため、細めの実線で囲まれている。矩形領域63は、属性認識部33により属性が「解答欄」と認識されているため、点線で囲まれている。矩形領域64~72も同様に、各要素の領域が、属性認識部33により認識された属性に応じた線で囲まれている。
関連認識部34は、要素抽出部32により抽出された要素間の関連を認識する。具体的に、関連認識部34は、各要素に、認識した要素間の関連を表す要素IDを割り振る。要素IDは、後述するリンクを表示するために必要な情報であって、大問、小問、解答欄の各要素に振られている。要素である大問、小問及び解答欄は、階層構造となっており、大問が上位階層の要素、小問が中位階層の要素、解答欄が下位階層の要素である。そのため、例えば、画像データ60に含まれる大問1に要素ID「1」が振られている場合、大問1の小問1には要素ID「1‐1」、小問1の解答欄には要素ID「1-1-1」が振られている。また、大問1の小問2には要素ID「1‐2」、小問2の解答欄には要素ID「1-2-1」が振られている。このとき、大問の要素は、子となる小問の要素IDが何か、当該小問の子となる解答欄の要素IDが何かという情報を含んでいる。また、小問の要素は、親となる大問の要素IDが何か、子となる解答欄の要素IDは何かという情報を含んでいる。また、解答欄の要素は、親となる小問の要素IDは何か、当該小問の親となる大問の要素IDは何かという情報を含んでいる。このように、要素IDは、大問1と、大問1の小問1と、小問1の解答欄とを組み合わせて1つのコンテンツが構成されるという要素間の関連を表している。
また、具体的に、関連認識部34は、画像データ上の矩形領域の座標値に基づいて、矩形領域の位置関係から問題の並び順を表す順番を割り当てる。つまり、関連認識部34は、問題を構成する各要素に、当該問題の並び順を表す順番を割り当てる。なお、関連認識部34は、矩形領域の位置関係から各要素に順番を割り当てているが、本発明はこれに限定されるものではなく、例えば、OCR(Optical Character Recognition)を用いて大問、小問及び解答欄の矩形領域に記載された問題番号を認識し、位置関係及び問題番号に基づいて各要素に順番を割り当ててもよい。このように、各要素に順番を割り当てるルールは、任意に設定することができる。
構造情報生成部35は、画像データに含まれる要素の構造に関する構造情報を生成する。構造情報は、画像データ上の要素の矩形領域を示す座標値、要素の属性及び要素間の関連に関する情報を含む。具体的に、要素間の関連に関する情報は、要素間の関連を表す要素ID及び問題の並び順を表す順番に関する情報を含む。また、構造情報生成部35は、後述する編集情報取得部37が編集情報を取得した場合、画像データ60に含まれる要素の構造情報を、ユーザによる編集後の構造情報に置き換える。
構造情報出力部36は、画像データに含まれる要素の構造情報を端末装置20へ送信する。端末装置20は、サーバ10から受信した構造情報に基づいて、後述する編集画面を表示する。ユーザは、端末装置20を使用して、編集画面から要素の編集を行う。端末装置20は、ユーザにより編集された要素の矩形領域の座標値、要素の属性及び要素間の関連に基づいて、編集後の構造情報を生成し、編集情報としてサーバ10へ送信する。
編集情報取得部37は、端末装置20から編集情報として、編集後の構造情報を取得する。ディスプレイ情報取得部38は、端末装置20から、後述する出力先端末装置が有するディスプレイに関するディスプレイ情報を取得する。出力先端末装置が有するディスプレイとは、情報処理機器の出力装置の1つであって、画面に像を映し出す表示装置である。ディスプレイ情報は、ディスプレイの性能や大きさに関する情報であって、具体的に、タブレットPCやスマートフォンといった出力先端末装置の端末種類や、出力先端末装置が有するディスプレイの解像度に関する情報を含む。なお、編集情報とディスプレイ情報は別々のタイミングで取得してもよいし、ディスプレイ情報を取得するタイミングで編集情報を取得してもよい。
レイアウト生成部39は、まず、ディスプレイ情報に基づいて、出力先端末装置が有するディスプレイの性能や大きさを特定する。そして、レイアウト生成部39は、画像データと、構造情報とに基づいて、出力先端末装置が有するディスプレイに応じたレイアウトを生成する。例えば、レイアウト生成部39は、図4に示すような画像データ60と、構造情報とに基づいて、出力先端末装置が有するディスプレイに応じたテストのレイアウトを生成する。
表示データ出力部40は、生成したレイアウトを表示する表示データを端末装置20へ送信する。端末装置20は、表示データを受信し、後述するレイアウト画面を表示する。
上記の構成において、サーバ10の画像データ取得部31、要素抽出部32、属性認識部33、関連認識部34、構造情報生成部35、構造情報出力部36、編集情報取得部37、ディスプレイ情報取得部38、レイアウト生成部39及び表示データ出力部40は、それぞれ本発明の画像データ取得部、抽出部、属性認識部、関連認識部、構造情報生成部、構造情報出力部、編集情報取得部、ディスプレイ情報取得部、レイアウト生成部及び表示データ出力部の一例である。
[端末装置の構成]
図6は、端末装置20のハードウェア構成を示すブロック図である。端末装置20は、通信部21と、制御部22と、記憶部23と、表示部25と、入力部26とを備える。なお、これらの構成要素は、バス29を介して相互に接続されている。
通信部21は、ネットワーク5を通じてサーバ10と通信を行うための通信ユニットである。具体的に、通信部21は、サーバ10へ画像データや編集情報を送信したり、サーバ10から構造情報や表示データを受信したりする。
制御部22は、CPU、MPU、GPU等の演算処理装置を含み、記憶部23に記憶されたプログラムを読み出して実行することにより、端末装置20に係る種々の情報処理、制御処理等を行う。なお、図6では制御部22を単一のプロセッサであるものとして説明するが、マルチプロセッサであっても良い。
記憶部23はRAM、ROM等のメモリ素子を含み、制御部22が処理を実行するために必要なプログラム又はデータ等を記憶している。また、記憶部23は、制御部22が演算処理を実行するために必要なデータ等を一時的に記憶する。
表示部25は、液晶ディスプレイ又は有機ELディスプレイ等であり、制御部22の指示に従い各種情報を表示する。入力部26は、マウス、キーボード、タッチパネル、ボタン等の入力デバイスであり、受け付けた操作情報を制御部22へ出力する。
[編集画面]
図7は、編集画面の一例である。編集画面は、端末装置20が、サーバ10から受信した構造情報と、画像データとに基づいて表示する画面である。ユーザは、編集画面により要素の領域、要素の属性及び要素間の関連を編集することができる。図7に示すように、編集画面は、要素の構造を可視化した画像表示エリア56がUI(User Interface)左側に、各要素に関する情報を可視化した要素表示エリア58がUI右側に配置されている。
編集画面の左側は、画像読み込みボタン51と、要素生成ボタン52と、タブレットビュー取得ボタン53と、スマートフォンビュー取得ボタン54と、PCビュー取得ボタン55と、画像表示エリア56とが配置されている。
画像読み込みボタン51は、ユーザが所定の画像データを読み込む際に押下される。画像読み込みボタン51の押下により、端末装置20は、画像データを読み込み、サーバ10へ送信する。
要素生成ボタン52は、ユーザが要素生成リクエストを要求する際に押下される。要素生成ボタン52の押下により、端末装置20は、要素生成リクエストをサーバ10へ送信する。そして、端末装置20は、サーバ10から構造情報を受信する。
タブレットビュー取得ボタン53は、ユーザがタブレットPCに表示するテストのレイアウトをシミュレーションする際に押下される。タブレットビュー取得ボタン53の押下により、端末装置20は、出力先端末装置の端末種類がタブレットPCであることを示すディスプレイ情報をサーバ10へ送信する。そして、端末装置20は、タブレットPCが有するディスプレイに応じたレイアウトを表示する表示データをサーバ10から受信する。
スマートフォンビュー取得ボタン54は、ユーザがスマートフォンに表示するレイアウトをシミュレーションする際に押下される。スマートフォンビュー取得ボタン54の押下により、端末装置20は、出力先端末装置の端末種類がスマートフォンであることを示すディスプレイ情報をサーバ10へ送信する。そして、端末装置20は、スマートフォンが有するディスプレイに応じたレイアウトを表示する表示データをサーバ10から受信する。
PCビュー取得ボタン55は、ユーザがPCに表示するレイアウトをシミュレーションする際に押下される。PCビュー取得ボタン55の押下により、端末装置20は、出力先端末装置の端末種類がPCであることを示すディスプレイ情報をサーバ10へ送信する。そして、端末装置20は、PCが有するディスプレイに応じたレイアウトを表示する表示データをサーバ10から受信する。
具体的に、画像データは、図4に示すテスト問題用紙の画像データ60であるとする。端末装置20は、画像読み込みボタン51が押下されると、読み込んだ画像データ60を画像表示エリア56に表示する。さらに要素生成ボタン52が押下されると、端末装置20は、図7に示すように、サーバ10から受信した構造情報に基づいて、画像データ60上に、要素の領域を属性に応じた線で囲んだ矩形領域61~72を表示する。
各矩形領域61~72はそれぞれノードを有しており、端末装置20は、要素IDに基づいて構造上関連する要素間にノード同士を線で結んだリンクを表示する。例えば、図7に示すように、端末装置20は、大問1の矩形領域61のノード73と、大問1が有する小問1の矩形領域62のノード74とを結んだリンクを表示する。さらに、端末装置20は、小問1の矩形領域62のノード74と、小問1の解答欄の矩形領域63のノード75と結んだリンクを表示する。
このとき、端末装置20は、リンクに対応付けて、構造情報に含まれる要素IDを表示してもよい。例えば、図7に示すように、端末装置20は、大問1の要素IDが「1」であることから、矩形領域61のノード73上に「1」を表示する。そして、端末装置20は、小問1の要素IDが「1-1」であることから、ノード73とノード74を結ぶリンク上に「1」を表示する。さらに、端末装置20は、解答欄の要素IDが「1-1-1」であることから、ノード74とノード75を結ぶリンク上に「1」を表示する。
このように、要素は、大問から小問、小問から解答欄へと枝分かれしてリンクが結ばれる。画像表示エリア56にリンクや要素IDを示す数字を表示することで、大問、小問及び解答欄が階層構造であり、3つの要素で1つのコンテンツを構成していることを可視化することができる。
編集画面の右側は、リンク追加ボタン41と、リンク削除ボタン42と、矩形のサイズと位置ボタン43と、矩形追加ボタン44と、矩形削除ボタン45と、矩形属性変更ボタン46と、要素表示エリア58とが配置されている。
要素表示エリア58は、画像表示エリア56に表示された画像データに含まれる各要素に関する情報をそれぞれ表示する複数の要素項目を有する。例えば、図7に示すように、端末装置20は、要素項目81に、矩形領域61により定められた要素の画像データと、当該要素に振られた要素ID85とを表示する。また、要素項目82に、矩形領域62により定められた要素の画像データと、当該要素に振られた要素ID86とを表示する。また、要素項目83に、矩形領域63により定められた要素の画像データと、当該要素に振られた要素ID87とを表示する。
また、要素表示エリア58は、要素間の関連を可視化するように要素項目を配置してもよい。例えば、図7に示すように、要素表示エリア58は、要素IDに基づいて、上位階層である大問1の要素項目81を色付きで上部に表示し、中位階層である小問1の要素の要素項目82及び下位階層である解答欄の要素項目83を要素項目81の下部に表示する。要素項目をこのように配置することで、ユーザは、大問1より下の階層に小問1及び小問1の解答欄、小問2及び小問2の解答欄、小問3及び小問3の解答欄が存在することを視覚的に確認しやすい。また、要素表示エリア58は、順番に基づいて、問題の並び順が早い問題を構成する小問と解答欄を上部に表示し、問題の並び順が遅い問題を構成する小問と解答欄を下部に表示する。要素項目をこのように配置することで、ユーザは画像データにおける問題の並び順を確認しやすい。このような要素項目の配置は、任意に設定することができる。
リンク追加ボタン41は、ユーザが画像表示エリア56において要素間のリンクを追加したい場合に押下される。リンク追加ボタン41の押下により、端末装置20は、リンク追加機能を実行する。図8は、編集画面における要素の編集機能を説明する図である。リンク追加機能は、図8(A)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、要素間の関連を示すリンクを追加する機能である。
リンク削除ボタン42は、ユーザが画像表示エリア56において要素間のリンクを削除したい場合に押下される。リンク削除ボタン42の押下により、端末装置20は、リンク削除機能を実行する。リンク削除機能は、図8(B)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、要素間の関連を示すリンクを削除する機能である。
矩形のサイズと位置ボタン43は、ユーザが画像表示エリア56において矩形領域のサイズや位置を修正したい場合に押下される。矩形のサイズと位置ボタン43の押下により、端末装置20は、矩形のサイズと位置編集機能を実行する。矩形のサイズと位置編集機能は、図8(C)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、画像データ上の矩形領域のサイズや位置を修正する機能である。
矩形追加ボタン44は、ユーザが画像表示エリア56において矩形領域を追加したい場合に押下される。矩形追加ボタン44の押下により、端末装置20は、矩形追加機能を実行する。矩形追加機能は、図8(D)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、画像データ上で新たな矩形領域を追加し、新たな要素の領域を定める機能である。
矩形削除ボタン45は、ユーザが画像表示エリア56において矩形領域を削除したい場合に押下される。矩形削除ボタン45の押下により、端末装置20は、矩形削除機能を実行する。矩形削除機能は、図8(E)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、画像データ上に表示された矩形領域を削除し、当該矩形領域が定める要素を削除する機能である。
矩形属性変更ボタン46は、ユーザが画像表示エリア56において要素の属性を変更したい場合に押下される。矩形属性変更ボタン46の押下により、端末装置20は、矩形属性変更機能を実行する。矩形属性変更機能は、図8(F)に示すように、画像表示エリア56においてユーザが所定の操作をすることにより、要素の属性を変更する機能である。
編集機能によって編集された要素の矩形領域の座標値、要素の属性、要素間の関連は、全て要素表示エリア58に反映される。つまり、端末装置20は、ユーザによる編集に基づいて構造情報を編集し、編集後の構造情報に基づいて要素表示エリア58を含む編集画面を表示する。
このような編集機能により、ユーザは、各種AIが推測した要素の領域、要素の属性及び要素間の関連が間違っている場合に適切な修正を行うことができる。なお、編集機能はこれに限定されるものではなく、例えば、各要素に割り当てられた問題の並び順を表す順番を変更する順番変更機能等、任意に設定することができる。
[レイアウト画面]
図9は、レイアウト画面の一例である。レイアウト画面は、端末装置20が、サーバ10から受信した表示データに基づいて表示する画面である。ユーザは、レイアウト画面により、出力先端末装置が有するディスプレイに応じた所定のレイアウトを確認することができる。
具体的に、ユーザは、端末装置20を使用して、タブレットビュー取得ボタン53、スマートフォンビュー取得ボタン54又はPCビュー取得ボタン55を押下することで、ディスプレイ情報をサーバ10に送信する。すると、端末装置20は、サーバ10から、出力先端末装置が有するディスプレイに応じた所定のレイアウトを表示する表示データを受信することができる。
図9に示すように、レイアウト画面は、画面イメージ91と、ページ項目94と、戻るボタン95と、次ボタン96とを有する。
画面イメージ91は、出力先端末装置の画面のイメージを表示する。例えば、ユーザがタブレットビュー取得ボタン53の押下によりディスプレイ情報をサーバ10に送信すると、図9に示すように、画面イメージ91はタブレットPCの画面のイメージを表示する。画面イメージ91は、問題が表示される問題イメージ92と、解答欄が表示される解答欄イメージ93とを有する。出力先端末装置の端末種類がタブレットPCやスマートフォンの場合、1ページの画面に1つの問題を表示することが適切であるため、図9に示すように、問題イメージ92は大問1と大問1の小問2を組み合わせた1つの問題を表示し、解答欄イメージ93は大問1の小問2の解答欄を表示する。つまり、画面イメージ91は、1ページに、1つのコンテンツを構成する大問、小問及び解答欄を任意の配置で表示する。
ページ項目94は、ページ数に関する情報を表示する。ページ項目94は、全ページ数を示す全ページ数94aと、画面イメージ91に現在表示されているページのページ数を示す現ページ数94bを有する。
例えば、図7に示す編集画面の画像データ60は、「大問1の小問1」、「大問1の小問2」、「大問1の小問3」、「大問2の小問1」及び「大問1の小問2」という5つの問題を有する。1ページの画面に1つの問題を表示するレイアウトとすると、サーバ10のレイアウト生成部39は、画像データ60に基づくテストのレイアウトとして全5ページを生成する。端末装置20は、サーバ10から当該レイアウトを表示する表示データを受信し、レイアウト画面を表示する。この場合、図9に示すように、全ページ数94aは全5ページを示す「5」、現ページ数94bは2問目のページ数を示す「2」を表示する。
戻るボタン95は、画面イメージ91に表示しているページの1つ前のページに画面を遷移するボタンである。また、次ボタン96は、画面イメージ91に表示しているページの次のページに画面を遷移するボタンである。これにより、ユーザは、全てのページを確認することができる。
なお、出力先端末装置の端末種類がPCの場合、タブレットPCやスマートフォンと比べて有するディスプレイが大きいため、1ページの画面に複数の問題を表示することとしてもよい。このように、1ページに表示する問題数は、予め出力先端末装置が有するディスプレイの性能や大きさに応じて任意に設定されており、サーバ10のレイアウト生成部39は、設定に基づいて適切なレイアウトを生成する。
[レイアウト生成処理]
次に、画像データを解析することで要素の構造を認識し、出力先端末装置が有するディスプレイに応じた所定のレイアウトを生成するレイアウト生成処理について説明する。図10は、レイアウト生成処理のフローチャートである。この処理は、サーバ10が予め用意されたプログラムを実行することにより実現される。
ユーザは、端末装置20を使用して、スキャナーを用いて読み込んだ画像データと、要素生成リクエストとをサーバ10へ送信する(ステップS101)。サーバ10は、端末装置20から受信した画像データを解析し、画像データに含まれる要素を抽出する(ステップS102)。そして、サーバ10は、抽出した要素の属性を認識する(ステップS103)。さらに、サーバ10は、抽出した要素間の関連を認識する(ステップS104)。具体的に、サーバ10は、認識した要素間の関連に基づいて、各要素に要素IDや順番を割り当てる。サーバ10は、抽出した要素の領域、要素の属性及び要素間の関連に基づいて、画像データに含まれる要素の構造に関する構造情報を生成し、端末装置20へ送信する(ステップS105)。
端末装置20は、サーバ10から受信した構造情報に基づいて編集画面を表示する(ステップS106)。そして、端末装置20は、ユーザによる要素の編集が行われたか否かを判定する(ステップS107)。具体的に、端末装置20は、編集機能に対応する各種ボタンがユーザにより押下されたか否かを判定する。編集が行われていないと判定した場合(ステップS107;No)、端末装置20は、ステップS109の処理に進む。一方、編集が行われたと判定した場合(ステップS107;Yes)、端末装置20は、ユーザにより編集された要素の領域、要素の属性及び要素間の関連に基づいて、編集後の構造情報を生成する(ステップS108)。
端末装置20は、所定の出力先端末装置に表示した場合の所定のレイアウトを確認するため、ディスプレイ情報をサーバ10へ送信する(ステップS109)。このとき、編集後の構造情報を生成していれば、端末装置20は、ディスプレイ情報と共に編集情報をサーバ10へ送信する。サーバ10は、端末装置20からディスプレイ情報を受信する(ステップS110)。このとき、ディスプレイ情報と共に編集情報を受信していれば、サーバ10は、画像データに含まれる要素の構造情報を編集後の構造情報に置き換える。サーバ10は、ディスプレイ情報に基づいて出力先端末装置が有するディスプレイの性能や大きさを特定し、画像データ及び構造情報に基づいて、出力先端末装置が有するディスプレイに応じた所定レイアウトを生成する。そして、サーバ10は、生成したレイアウトを表示する表示データを端末装置20へ送信する(ステップS111)。
端末装置20は、受信した表示データに基づいて、出力先端末装置が有するディスプレイに応じた所定のレイアウトをレイアウト画面に表示する(ステップS112)。これにより、レイアウト生成処理は終了する。
本実施形態の学習支援システム100は、画像データを解析して構造情報を生成することで、当該画像データに含まれる要素の領域、要素の属性、要素間の関連を可視化することができる。これにより、ユーザは、容易に要素の構造を確認し、編集することができる。また、学習支援システム100は、画像データを要素単位に分割して加工することができるため、出力先端末装置が有するディスプレイに応じた所定のレイアウトを容易に生成することができる。例えば、学習支援システム100は、紙媒体のテスト問題用紙から容易に、出力先端末装置が有するディスプレイに応じたテストのレイアウトを生成し、ユーザへ提供することができる。このように、学習支援システム100は、要素の構造を可視化するUIや容易にレイアウトを確認できるUIをユーザに提供することができる。
<変形例>
次に、変形例について説明する。以下の変形例は、適宜組み合わせて実施形態に適用することができる。
(第1変形例)
上記の実施形態では、リンクを単なる実線で表しているが、本発明はこれに限定されるものではなく、要素間の関連に応じてリンクを変化させてもよい。図11は、要素間の関連に応じてリンクを変化させた一例である。図11に示すように、上位階層の要素と中位階層の要素を結ぶリンクを太めの実線、中位階層の要素と下位階層の要素を結ぶリンクを細めの実線とすることで、リンクの太さにより要素の階層構造を可視化することができる。なお、単なる線の代わりに、リンクを矢印にすることで要素の階層構造を可視化することとしてもよい。
(第2変形例)
上記の実施形態では、ユーザは端末装置20を使用することとしているが、本発明はこれに限定されるものではなく、ユーザはサーバ10の機能を有する端末装置20xを使用することとしてもよい。端末装置20xは、サーバ10と同様に、例えば、パーソナルコンピュータまたは汎用のタブレットPC(パソコン)等である。
この場合、端末装置20xは、サーバ10が行っていたレイアウト生成処理(ステップS102~105、ステップS110及びステップS111)も実行し、画像データを解析して構造情報やレイアウトを生成することができる。端末装置20xは、本発明の情報処理装置の一例である。
5 ネットワーク
10 サーバ
20、20x 端末装置
31 画像データ取得部
32 要素抽出部
33 属性認識部
34 関連認識部
35 構造情報生成部
36 構造情報出力部
37 編集情報取得部
38 ディスプレイ情報取得部
39 レイアウト生成部
40 表示データ出力部
100 学習支援システム

Claims (11)

  1. 画像データを取得する画像データ取得部と、
    前記画像データを解析し、当該画像データに含まれるコンテンツを構成する要素を抽出する抽出部と、
    前記要素の属性を認識する属性認識部と、
    前記コンテンツを構成する要素間の関連を認識する関連認識部と、
    前記画像データに含まれる要素の領域、前記要素の属性及び前記要素間の関連に関する情報を含む構造情報を生成する構造情報生成部と、
    を備える情報処理装置。
  2. 前記画像データ取得部は、ユーザが使用する端末装置から前記画像データを取得し、
    前記構造情報を前記端末装置へ送信する構造情報出力部を備える請求項1に記載の情報処理装置。
  3. 前記構造情報は、前記端末装置が表示する画像データ上に、前記要素の領域と、前記要素の属性と、前記要素間の関連とを表示させる情報である請求項2に記載の情報処理装置。
  4. 前記関連認識部は、要素間の関連を表す要素IDを各要素に割り振り、
    前記構造情報は、前記端末装置が表示する画像データ上に、前記要素IDに基づいて前記要素間を結んだリンクを表示させる情報である請求項3に記載の情報処理装置。
  5. 前記構造情報出力部は、前記要素間を結んだリンク上に、前記要素IDを示す数字を表示させる請求項4に記載の情報処理装置。
  6. 前記端末装置から、前記ユーザにより前記要素の領域、前記要素の属性及び前記要素間の関連のいずれか1つ以上が編集された構造情報を取得する編集情報取得部を備え、
    前記構造情報生成部は、前記構造情報を編集された構造情報に置き換える請求項2乃至5のいずれか一項に記載の情報処理装置。
  7. 前記画像データと、前記構造情報とに基づいて、前記要素を組み合わせたコンテンツのレイアウトを生成するレイアウト生成部と、
    前記レイアウトを表示する表示データを前記端末装置へ送信する表示データ出力部と、
    を備える請求項2乃至6のいずれか一項に記載の情報処理装置。
  8. 前記端末装置から、前記表示データを出力する出力先端末装置が有するディスプレイに関するディスプレイ情報を取得するディスプレイ情報取得部を備え、
    前記レイアウト生成部は、前記ディスプレイ情報に基づいて、前記出力先端末装置が有するディスプレイに応じたレイアウトを生成する請求項7に記載の情報処理装置。
  9. 前記画像データは、問題と、前記問題の解答欄とを含み、
    前記要素は、前記問題及び前記解答欄のいずれかである請求項1乃至8のいずれか一項に記載の情報処理装置。
  10. 前記問題は、階層構造の複数の問題から構成される請求項9に記載の情報処理装置。
  11. コンピュータを備える情報処理装置により実行されるプログラムであって、
    画像データを取得する画像データ取得部、
    前記画像データを解析し、当該画像データに含まれるコンテンツを構成する要素を抽出する抽出部、
    前記要素の属性を認識する属性認識部、
    前記コンテンツを構成する要素間の関連を認識する関連認識部、
    前記画像データに含まれる要素の領域、前記要素の属性及び前記要素間の関連に関する情報を含む構造情報を生成する構造情報生成部、
    として前記コンピュータを機能させるプログラム。
JP2021202283A 2021-12-14 2021-12-14 情報処理装置及びプログラム Pending JP2023087805A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021202283A JP2023087805A (ja) 2021-12-14 2021-12-14 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021202283A JP2023087805A (ja) 2021-12-14 2021-12-14 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2023087805A true JP2023087805A (ja) 2023-06-26

Family

ID=86899698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021202283A Pending JP2023087805A (ja) 2021-12-14 2021-12-14 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2023087805A (ja)

Similar Documents

Publication Publication Date Title
CN111475163B (zh) 视图模板的代码文件生成方法、装置、设备及存储介质
CN103814371B (zh) Web浏览器中的Web应用和辅助设备的模拟、Web应用开发工具以及使用它们的方法
US20030193521A1 (en) Rapid GUI refacing of a legacy application
CN107239318A (zh) 应用转换方法、装置及设备
Ziegler et al. Direct manipulation
CN110263281B (zh) 一种数据可视化开发中页面分辨率自适应的装置及方法
WO2001075568A1 (en) Method for gesture based modeling
CN107111497A (zh) 开发支持系统
US10019424B2 (en) System and method that internally converts PowerPoint non-editable and motionless presentation mode slides into editable and mobile presentation mode slides (iSlides)
US20240004923A1 (en) Multi-user searching of sources of digital assets and curation of search results in a collaboration session
Yudhanto et al. Design and development of ui/ux on company profile web with design thinking method
CN113326044A (zh) 一种基于控件库的开发方法、系统及存储介质
Manca et al. Customizable dynamic user interface distribution
Drucker Knowledge design: A conceptual and curricular challenge
Vásquez‐Ramírez et al. Athena: a hybrid management system for multi‐device educational content
De Lima et al. Using awareness information to enhance online discussion forums: a systematic mapping study
Toomey Jupyter Cookbook: Over 75 recipes to perform interactive computing across Python, R, Scala, Spark, JavaScript, and more
JP2023087805A (ja) 情報処理装置及びプログラム
Jin Teaching Responsive Web Design to Novice Learners
CN110275996B (zh) 数据可视化开发为内容开发提供页面框架的装置及方法
JP2008059135A (ja) ソフトウェア自動生成装置、ソフトウェア自動生成方法、およびプログラム
CN112001157A (zh) 一种网页数据表格在线设计方法及装置
Avazpour et al. Generating reusable visual notations using model transformation
CN115630622B (zh) 一种基于矢量图元的画法实现方法及装置
da Silva et al. InkBlog: a pen-based blog tool for e-Learning environments