JP2009129040A - 情報認識システム - Google Patents
情報認識システム Download PDFInfo
- Publication number
- JP2009129040A JP2009129040A JP2007301167A JP2007301167A JP2009129040A JP 2009129040 A JP2009129040 A JP 2009129040A JP 2007301167 A JP2007301167 A JP 2007301167A JP 2007301167 A JP2007301167 A JP 2007301167A JP 2009129040 A JP2009129040 A JP 2009129040A
- Authority
- JP
- Japan
- Prior art keywords
- input
- data
- information
- content
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 19
- 238000007405 data analysis Methods 0.000 description 18
- 238000013523 data management Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 12
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/171—Editing, e.g. inserting or deleting by use of digital ink
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】コンテンツに入力される情報から利用コンテンツのフォーマットを推定し、コンテンツ利用状態を把握する情報認識システムを提供する。
【解決手段】電子コンテンツ利用筐体を基本とし、同筐体への入力行動を抽出し、同行動データ間の類似値・差分値や行動データと模範データとの類似値・差分値を計算することによってコンテンツ中のデータ入力位置を推定し、推定された入力位置からユーザの入力状況を推定し、同推定値をコンテンツ利用状況として呈示する。
【選択図】図1
【解決手段】電子コンテンツ利用筐体を基本とし、同筐体への入力行動を抽出し、同行動データ間の類似値・差分値や行動データと模範データとの類似値・差分値を計算することによってコンテンツ中のデータ入力位置を推定し、推定された入力位置からユーザの入力状況を推定し、同推定値をコンテンツ利用状況として呈示する。
【選択図】図1
Description
本発明は、コンテンツを利用している時間帯においてコンテンツに入力される情報から利用コンテンツのフォーマットを推定し、コンテンツ利用状態を把握する情報認識システムに関する。
昨今のブロードバンドネットワークの普及に伴い、webコンテンツ等大容量のメディア・コンテンツが普及しつつある。例えば、webでのアンケートは、多くのポータルサービスにおいて行われており、個人ユーザの情報を収集する機能として重要であり、インターネットを利用できるユーザにアンケートを依頼できれば、グローバルに情報収集することができる。
一方、紙を利用したアンケートは従来からある方法であり、回収に時間が掛かったりする難点はあるが、現在も多く利用されている方法である。
しかしながら、Webを利用したネット上のコンテンツを利用したアンケートであっても紙を用いて行なわれたアンケートであっても、全体の傾向を把握するためには、入力された、或いは書き込まれたデータを集計・分析する必要がある。
この場合、現状は、まずwebコンテンツの場合は、アンケートの回答情報を入力する各テキストボックスに回答番号タグを付与しておき、同タグ番号に基づいて、同じタグ番号のテキストボックスに入力されたデータを同一の質問に対する回答とみなして集計・分析を行なっている。
しかしながら、Webを利用したネット上のコンテンツを利用したアンケートであっても紙を用いて行なわれたアンケートであっても、全体の傾向を把握するためには、入力された、或いは書き込まれたデータを集計・分析する必要がある。
この場合、現状は、まずwebコンテンツの場合は、アンケートの回答情報を入力する各テキストボックスに回答番号タグを付与しておき、同タグ番号に基づいて、同じタグ番号のテキストボックスに入力されたデータを同一の質問に対する回答とみなして集計・分析を行なっている。
一方、紙に書き込むアンケートの場合は、紙に書かれた回答を集計する担当者が回答内容を読み取り、集計・分析を行なう。後者については近年、デジタルペンという紙に書いた位置データが取得できる機能を持つペンシステムにより、紙上での筆記位置・時刻データが読み取れ、電子的に情報を格納できるようになってきており、この場合においては、紙上に回答記入領域を設定し、同領域内に記入されたデータを回答データとみなして集計・分析する。
また、従来の分析手法としては、webコンテンツの場合、同コンテンツ内に設定されている回答入力用テキストボックスに対して入力が行なわれた時刻を用いて、アンケートの各質問に対しての回答順序を抽出したり、入力された内容を用いて、内容の正誤を判断したりする機能がある(特許文献1、特許文献2、特許文献3)。またデジタルペンを利用して入力を行なうコンテンツの場合、上記に記載したような回答記入領域に対する入力時刻によって回答順序を抽出したり、入力された内容については文字認識技術を用いるなどすることによって、内容の正誤を判断したりする機能がある(特許文献4、特許文献5)。
特許文献1、特許文献2、特許文献3は、例えば、教育用のPC用webコンテンツ或いは評価対象となるインタフェースに対して学習中に記録した学習者のPC操作ログと正解操作データとを比較・分析することで、操作型学習の評価を行なう。
しかしながら、対象となるコンテンツやインタフェースの各入力箇所には、入力されるデータを取得する機能が組み込まれており、この機能が組み込まれることで入力内容や時刻を取得することが可能になる。したがって、入力内容を取得するには、各入力箇所にこの機能を組み込んでおく必要があるが、必要となるコンテンツ全てに本機能を組み込むのは困難である。
しかしながら、対象となるコンテンツやインタフェースの各入力箇所には、入力されるデータを取得する機能が組み込まれており、この機能が組み込まれることで入力内容や時刻を取得することが可能になる。したがって、入力内容を取得するには、各入力箇所にこの機能を組み込んでおく必要があるが、必要となるコンテンツ全てに本機能を組み込むのは困難である。
また、特許文献4、特許文献5の装置は、デジタルペンを用いて筆記情報を取得し、筆記領域内に記載された筆記情報から筆記内容の正誤を判断している。しかし、この場合も筆記すべき領域を予め登録しておく必要があり、その登録に時間がかかるのが通常である。そのため、大量のコンテンツに関して短時間にユーザの入力過程を抽出したり視覚化したりすることが出来ず、十分な機能を果たすことはできない。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、下記のとおりである。パソコン、携帯電話といった電子コンテンツ利用筐体を基本とし、同筐体への入力行動(データ入出力(入出力データ(入力テキスト、表示内容))を抽出し、同行動データ間の類似値・差分値や行動データと模範データとの類似値・差分値を計算することによってコンテンツ中のデータ入力位置を推定し、推定された入力位置からユーザの入力状況を推定し、同推定値をコンテンツ利用状況として呈示する。
本発明により、ユーザやコンテンツフォーマットを意識することなくユーザがコンテンツ利用をしている中で入出力する情報からユーザのコンテンツ利用状態を推定し、開発されたコンテンツの評価を行なうことができる。また大量のコンテンツに対する評価を簡便かつ迅速に行なうことができるため、利用された結果をそのまま反映させてwebコンテンツやその他コンテンツの開発指針を迅速に立てることが可能になる。また、ユーザ自身のコンテンツ嗜好や利用傾向を把握することができるため、ユーザに必要な情報を適切に提供することができるようになる。
本発明を実施するための一形態であるコンテンツフリーフォーマット認識装置を図1に示す。
まず、システム構成の例と機能の例について述べる。本システムは、図1に示すように、サーバ・クライアント型で構成され、サーバ環境のユニットとしては、コンテンツ管理やデータ解析を行なうデータ管理・解析用サーバ101と紙コンテンツを使う場合に利用するデジタルペンサーバ102がある。
一方、クライアント環境のユニットとしては、コンテンツを利用するユーザの端末として、ユーザ用端末PC103、コンテンツ評価者用端末PC104、デジタルペン105、及びデジタルペン用紙106がある。データ管理・解析用サーバ101では、コンテンツデータベースの管理、ユーザ登録・管理、クライアントソフトとの通信処理、イベントの解析処理を行なう。
デジタルペンサーバ102は、図3に示すように、CPU1021、プログラム格納メモリ1022がある。本メモリには、システムプログラム102201、データ送受信プログラム102202、ユーザイベントデータ解析プログラム102203、文字認識プログラム102204、デジタルペン用フォーマット推定プログラム102205、イベント領域移動過程認識プログラム102206が搭載されている。さらに、ハードディスク1023には、単語辞書102301と認識結果データ102302が格納される。
本サーバは、クライアント環境に設定されているデジタルペン105及びデジタルペン用紙106を利用した結果として得られるデジタルペン情報を格納・解析する機能を持ち、解析結果をデータ管理・解析用サーバ101に送信する。
データ管理・解析用サーバ101には、図2に示すように、CPU10101、プログラム格納メモリ10102、ハードディスク10103が搭載されている。プログラム格納メモリに搭載されているプログラムは、システムプログラム1010201、データ蓄積プログラム1010202、コンテンツ管理プログラム1010203、ユーザイベント情報解析プログラム1010204、解析結果表示用プログラム1010205である。また、ハードディスク10103に格納されているデータは、ユーザイベントデータ1010301、標準入力データ1010302、フォーマット推定結果データ1010303、コンテンツデータ1010304である。
本発明でのデータ管理・解析用サーバの役割は、主として、ユーザイベント情報解析プログラム1010204を用いることによって、クライアントPCから送信された、コンテンツ毎の複数名の解答結果であるイベント情報を、イベントログの種類、イベント発生位置、イベント発生時刻を軸として解析し、イベント発生が重複している領域をユーザの入力領域として指定された領域であると仮定して、ユーザイベント発生領域を抽出する。さらに、ユーザイベント発生領域において入力された内容の比較を行なって、同一情報のことを目的として、発生領域にて発生したテキスト入力情報であるユーザイベントデータ1010301とクライアント側で基準データとして入力される標準解答データ1010303とのマッチングを行ない、以下の解答内容・プロセスを抽出する。
ユーザ個人単位での解答内容・プロセスとしては、 (a)解答の正誤、(b)解答所要時間、(c)解答順序、(d)解答回数を算出し、集団としては、(a)解答正誤比率、(b)各設問における解答所要時間分布、(c)解答順序傾向(パタン分類)、(d)解答回数分布 を算出する。
キーボード・マウスデバイスによる入力については、解答の正誤、解答正誤比率、はユーザイベント解析プログラムのサブプログラムであるテキスト解析プログラムによって、個々のユーザがユーザイベント発生領域と推定された位置に入力した情報のテキスト解析を行ない、同一の単語やセンテンスが存在しているかどうかをマッチングする。
一方、デジタルペンで入力を行なった場合は、文字認識機能を搭載することによって、ユーザイベント発生領域に発生したデジタルペン入力情報であるユーザイベントデータ1010301を認識し、テキスト情報に変換するという手段を用いる。
クライアント側について、コンテンツを利用するユーザが利用する機器としては、ユーザ用端末103、コンテンツ評価者用端末104及びデジタルペン105、デジタルペン用紙106が設定されている。
ユーザ用端末であるPCとデジタルペン、コンテンツ評価者用端末であるPCとデジタルペンは、例えば、USBで接続され、デジタルペンで記入されたデータは、各PCを介してデジタルペンサーバに送信される。
各PCで発生したデジタルペンのユーザイベントデータ以外のデータは、各PCからデータ管理・解析用サーバ101に送信される。ここで、テスト等、正しい解答が必要な場合やアンケートで標準解答との差分を抽出したい場合には、例えば、コンテンツ評価者が、各ユーザイベント発生領域に、別途正解や標準解答を登録し、実解答との差分を抽出することができる。コンテンツの選択、各コンテンツの標準解答入力の実行、実行時のイベント記録、各コンテンツへの解説入力を行なうと、その結果をサーバに送信する。標準解答として、複数パタンの標準解答を入力することが可能である。
対象コンテンツは、例えば、web形式コンテンツとデジタルペン対応紙ベースコンテンツ、の2種類のコンテンツとする。ユーザが選択したコンテンツがweb形式コンテンツであった場合、ユーザはまず、コンテンツ利用プログラムを起動し、図6(a)に示すようなページをユーザ端末画面601に表示する。ここで、コンテンツに対して回答を行なう場合には、図13に示すように「アンケート回答ページへ」を選択すると、アンケート回答ページへと遷移する。「回答結果閲覧ページ」ボタン選択した場合は、閲覧ページへ遷移する。遷移したページに、例えば、コンテンツの選択メニューが表示され、ユーザが所望のコンテンツを選択すると、ユーザ用端末が、例えば、自動的にデータ管理・解析用サーバのハードディスクに格納されているページをコンテンツ利用プログラムによって、同サーバのコンテンツ管理プログラムを介して同サーバのハードディスクに格納されているコンテンツデータから選択されているコンテンツを呼び出し、ユーザ用端末上に表示する。
ユーザが「アンケート回答ページへ」を選択した場合は、図7に示すように、ユーザはweb上で回答を行なってコンテンツのウィンドウを閉じる事で、回答状態が終了し、イベント収集も終了する。ユーザがマウス、キーボードを介して入力したイベントの記録はユーザ用端末の解析用情報入力プログラムによって行なう。回答が終了し、webコンテンツを終了すると、データ送受信制御プログラムによって入力したユーザイベントデータが、データ管理・解析用サーバに自動送信される。ユーザイベントデータは、ハードディスクにもサーバ送信と共に蓄積しておくこともできる。
一方、デジタルペンを利用した紙ベースコンテンツを対象とした場合も最初のステップは、図13と同様であるが、コンテンツを選択した後は、図8のフローに示すように、PC上のPDFファイルをダウンロードして印刷を行ない、デジタルペンを用いて解答し、解答を終了する。
ユーザがデジタルペンを介して入力したイベントの記録はデジタルペン及びデジタルペンサーバが行なう。記入時に利用したデジタルペンをユーザ用端末に接続されているデジタルペンボックスに格納すると、デジタルペンに格納されているイベント情報が、ユーザ用端末を介して、デジタルペンサーバへ記録される。その後、管理者がデジタルペンサーバからユーザ入力イベントデータを取り出し、データ管理・解析用サーバへ登録する。ユーザを識別するペンIDは、予めデータ管理・解析用サーバに登録し、ログインでのユーザ識別と同様のデータとして取り扱う。
ユーザがデジタルペンを介して入力したイベントの記録はデジタルペン及びデジタルペンサーバが行なう。記入時に利用したデジタルペンをユーザ用端末に接続されているデジタルペンボックスに格納すると、デジタルペンに格納されているイベント情報が、ユーザ用端末を介して、デジタルペンサーバへ記録される。その後、管理者がデジタルペンサーバからユーザ入力イベントデータを取り出し、データ管理・解析用サーバへ登録する。ユーザを識別するペンIDは、予めデータ管理・解析用サーバに登録し、ログインでのユーザ識別と同様のデータとして取り扱う。
また、コンテンツ評価者は、コンテンツ評価者用端末から標準入力データを入力することができる。これは先に示したように、テストのような正誤情報が必要な場合や、アンケートにおいて標準回答との分散を観察したい場合に行なう。
入力方法は、ユーザ用端末への入力と同様であり、コンテンツ評価者がコンテンツ利用プログラムを起動し、図6(b)や図14に示すように「標準回答入力ページへ」を選択すると、コンテンツ選択メニューが表示され、ユーザが標準入力を行なうコンテンツを選択すると、データ管理・解析用サーバのコンテンツ管理プログラムを介して該当するコンテンツが選択され、コンテンツ評価者用端末にコンテンツが表示される。またデジタルペン入力の場合もユーザ用端末への入力と同様のフローである。
利用者がコンテンツに回答するユーザであるのかコンテンツ評価者であるのかは、例えば、ログインのIDで識別する。また、入力された標準回答は、別ファイルとして複数登録しておくことも可能である。
以下、ユーザによる情報入力位置であるユーザ入力イベント発生領域の推定方法について説明する。サーバでは、ユーザイベントデータ解析プログラムが起動されている。ユーザイベントデータ解析プログラムは、データ蓄積プログラムによって蓄積されたユーザ入力イベントデータを用いて解析を行なう。
図15に示すように、まず、データ管理・解析用サーバが、ユーザ用端末103から解析対象を指定するデータを受信し、複数のユーザ端末から送信されたイベントデータをコンテンツ単位に分類する。ここでは、ユーザIDとコンテンツに付与されているコンテンツIDによって分類を行なう。次に、標準回答の有無を判断する。
標準回答が無い場合には、複数ユーザのイベントデータのイベント入力位置情報から情報入力位置を推定する。例えば、以下の順序にしたがって実施する。
イベント入力時刻nと入力時刻n+1間に、例えば、複数ユーザイベントデータを平均して2s以上の差分があり、かつ複数ユーザのデータをページ領域に重畳した場合に、イベント入力時刻nに入力されたイベント位置p(x,y)の前後距離(p[ i ] - p[ i-1 ])が ページ領域を最大として、例えば、平均して横2cmあるいは縦3cm以上であった場合には、nとn+1間に問題間の間隙があるとして、間隙数m+1(0-j)を問題数と推定する。さらに、推定された各問題に対する解答入力初端の座標値及びnに代表される各問題に対する解答終端の座標値を問題[i=0-m]に対応付けて格納しておく。または、マウスクリック位置とキーボード入力初端座標位置が同一の場合に、当該位置にイベント発生領域があると推定する。さらに、イベント発生領域間の移動過程をイベント発生時刻とイベント発生領域から抽出し、当該入力データと移動過程をメモリに格納する。次に、格納された複数ユーザの移動過程データから回答パタン毎の頻度を抽出し、同一イベント発生領域内において記載或いは選択されたテキストデータを比較し、頻度を付与した回答パタンと共に同比較データをメモリに格納する。
次に、標準パタンが有る場合の情報入力位置の推定方法について説明する。入力されている標準パタンと複数のユーザ入力イベントデータを用いてイベント発生領域の推定を行なう。まず、ユーザ入力イベントデータの入力イベント座標値と標準パタンの各問題における入力イベント座標値とを照合し、ユーザの各解答位置を推定する。照合した結果、標準パタンの解答初端座標値及び終端座標値と適合した座標値を、各問題に対する解答初端及び終端と推定する。次に、複数ユーザ間の回答内容の分散や回答の正誤を判断するために、推定されたイベント発生領域における入力データ(テキスト情報)を領域毎に抽出する。さらに、イベント発生領域間の移動過程をイベント発生時刻とイベント発生領域から抽出し、当該入力データと移動過程をメモリに格納する。次に、格納された複数ユーザの移動過程データから回答パタン毎の頻度を抽出し、同一イベント発生領域内において記載或いは選択されたテキストデータと標準入力において同領域に記載されたデータを比較し、頻度を付与した回答パタンと共に同比較データをメモリに格納する。
また、デジタルペンを利用した場合は、図16のフローに示すように、各ユーザ用端末からデータ管理・解析用サーバがデジタルペンのユーザイベントデータを受信する。この時点で、デジタルペン用フォーマット推定プログラムを起動し、入力されたデジタルペンのユーザ入力イベントデータを解析し、フォーマット推定を行なう。
はじめに、デジタルペンのイベント入力共通領域を複数ユーザの入力イベントデータを重畳することによって抽出する。共通領域の連続性からイベント発生領域を推定する。
具体的には、例えば、紙領域を1cmメッシュ領域で切り分け、重畳したイベントデータが入っているメッシュが隣接している領域を抽出することによって、イベント発生領域を推定する。ここで推定されたイベント発生領域を座標値でメモリに格納しておく。
次に、イベント発生領域移動過程認識プログラムの起動し、ユーザイベントデータのイベント発生時刻とイベント発生領域から移動過程を抽出する。
次に、各ユーザの移動過程を集計し、移動パタン(回答順序パタン)を抽出し、回答順序パタンの頻度を算出し、メモリに格納しておく。次に、文字認識プログラムを起動し、同プログラムによって、イベント発生領域において発生したイベント情報からテキストを抽出する。
ここで、文字認識プログラムでテキストを抽出した際、認識結果が線状・形状であった場合(直線、波線、円状)には、直線・波線の直上に記載されているテキスト、円内にコンテンツの内容として記載されているテキストを抽出する。最後に、イベント発生領域内テキストの比較、直線上・波線上・円内のテキスト情報のユーザデータ間比較を行ない、比較結果をメモリに格納する。
具体的には、例えば、紙領域を1cmメッシュ領域で切り分け、重畳したイベントデータが入っているメッシュが隣接している領域を抽出することによって、イベント発生領域を推定する。ここで推定されたイベント発生領域を座標値でメモリに格納しておく。
次に、イベント発生領域移動過程認識プログラムの起動し、ユーザイベントデータのイベント発生時刻とイベント発生領域から移動過程を抽出する。
次に、各ユーザの移動過程を集計し、移動パタン(回答順序パタン)を抽出し、回答順序パタンの頻度を算出し、メモリに格納しておく。次に、文字認識プログラムを起動し、同プログラムによって、イベント発生領域において発生したイベント情報からテキストを抽出する。
ここで、文字認識プログラムでテキストを抽出した際、認識結果が線状・形状であった場合(直線、波線、円状)には、直線・波線の直上に記載されているテキスト、円内にコンテンツの内容として記載されているテキストを抽出する。最後に、イベント発生領域内テキストの比較、直線上・波線上・円内のテキスト情報のユーザデータ間比較を行ない、比較結果をメモリに格納する。
次に、格納したイベント発生領域(問題数、回答位置)、イベント発生領域内テキスト情報、イベント発生位置に隣接したテキスト情報を用いて、ユーザ状態を判断する。ここでは各判断基準の例を示す。
(無記入の判断)
イベント領域i(問題i)の解答初端及び終端に適合する入力イベント座標値が無い場合には、無記入であると判断する。
(正解・不正解・正解への近さの判断)
各問題に対して入力された標準パタンとユーザイベントを照合する。はじめに標準パタンと同一のイベント或いはテキスト情報を検索する。ユーザイベントと標準パタンのイベント或いはテキスト情報が同一であった場合には「正解」と判断し、判断値k[i]において k[i]=0を返し、情報管理・制御サーバに送信する。ユーザイベント中に標準パタンのイベントが含まれていて、かつ同イベントがユーザイベントの終端に存在した場合には「正解」と判断し、判断値 k[i]=1を返し、情報管理・制御サーバに送信する。
(無記入の判断)
イベント領域i(問題i)の解答初端及び終端に適合する入力イベント座標値が無い場合には、無記入であると判断する。
(正解・不正解・正解への近さの判断)
各問題に対して入力された標準パタンとユーザイベントを照合する。はじめに標準パタンと同一のイベント或いはテキスト情報を検索する。ユーザイベントと標準パタンのイベント或いはテキスト情報が同一であった場合には「正解」と判断し、判断値k[i]において k[i]=0を返し、情報管理・制御サーバに送信する。ユーザイベント中に標準パタンのイベントが含まれていて、かつ同イベントがユーザイベントの終端に存在した場合には「正解」と判断し、判断値 k[i]=1を返し、情報管理・制御サーバに送信する。
一方、ユーザイベント中に標準パタンのイベントが含まれているが、終端に存在しない場合には、「迷って不正解」と判断し、判断値 k[i] =2を返し、情報管理・制御サーバに送信する。ユーザイベントに標準パタンイベントが含まれていない場合には、「不正解」と判断し、判断値 k[i]=3を返し、情報管理・制御サーバに送信する。以上の値、及び各問題における標準パタンイベントとユーザ入力イベントとの照合数/ユーザ入力イベント数の値h[i]を正解への近さの値として登録する。またデジタルペンデータの場合、認識結果が線状・形状であった場合(直線、波線、円状)には、直線・波線の直上に記載されているテキスト、円内にコンテンツの内容として記載されているテキスト間の比較を行ない、正解・不正解を上記と同様な形で判断する。
(解答時間の判断)
各問題に対する標準パタンの回答初端時刻と終端時刻の差分と、各問題に対するユーザの回答初端及び終端時刻の差分との差分値d[i]を、標準入力時間を基準値とした解答変動時間と推定する。
(解答時間の判断)
各問題に対する標準パタンの回答初端時刻と終端時刻の差分と、各問題に対するユーザの回答初端及び終端時刻の差分との差分値d[i]を、標準入力時間を基準値とした解答変動時間と推定する。
上記の方法で入力領域の推定及び解答内容・プロセスの抽出を行なう。さらに複数名のコンテンツユーザから得た解答データからユーザ集団の傾向及びパタン分類を行なうことによって各コンテンツに対する評価傾向を抽出する。
次に、解析結果を表示する。上記のように解析された結果は、はじめに、図17に示すように、データ管理・解析用サーバ上の解析結果表示用プログラムにより、解析結果表示用データに変換される。まず、解析結果表示用プログラムを起動され、抽出された解析結果から、イベント発生領域毎の回答結果の分散・頻度を集計する。また、回答パタン(問題A→問題B・・・、問題B→問題A・・・)毎の頻度を集計し、グラフ化データとして整理する。最終的に、ユーザ用端末、コンテンツ評価者用端末から配信トリガが掛かった時に上記データを配信する。
図9は、ユーザ用端末において、図6(a)における「回答結果閲覧ページへ」を選び、遷移したページに表示されたコンテンツ選択メニューから所望のコンテンツを選択した時に表示される画面である。「回答順序パタン」と「回答結果」が表示される。複数の「回答順序パタン」は、例えば頻度順に並べられる。また、ユーザの回答順序は、例えば、パタンに付与されている番号が囲まれる形で明示される。回答結果は、各問題・アンケートに対して回答の種類が、例えば頻度順に並べられる。正解・或いは標準回答には、回答の下に「正解」あるいは「標準回答」という記載がある。
ユーザ自身の回答は、例えば、同一の回答表示領域に色づけされている。さらに、個々の問題・アンケートの回答過程(即正解、迷って正解、即誤り、迷って誤り)が画像パタン(斜線、スクエア・・・)によって表示される。図10に示すように、コンテンツ評価者用端末においても同様の表示が行なわれる。また、コンテンツと解析結果を併記する場合、図11に示すように、画面上に、上記に示したような「回答順序パタン」と「回答結果」と共に、ユーザイベント発生領域として推定された位置に各問題を示すシンボル(ここでは、A、B・・)が表示される。また、図12中の「B」に示すように、デジタルペンを利用して線状、波線状、円状のデータについては、該データのテキスト下にイベントデータの座標値を元に筆記データを表示する。
1:ネットワーク、101:データ管理・解析用サーバ、102:デジタルペンサーバ、
103:ユーザ用端末 、104:コンテンツ評価者用端末、105:デジタルペン、106:デジタルペン用紙。
103:ユーザ用端末 、104:コンテンツ評価者用端末、105:デジタルペン、106:デジタルペン用紙。
Claims (9)
- 入力対象であるコンテンツフォーマットを表示する第一の端末において複数のデータを入力する第一入力手段と、
入力された前記複数のデータを記憶する記憶手段と、
入力された前記複数のデータ間の類似値或いは差分値を算出し、第二の端末の第二入力手段によって標準入力或いは模範入力として入力されたデータと前記複数のデータとの類似値、差分値を算出する手段と、
該算出結果から、前記コンテンツフォーマットにおける前記複数のデータの情報入力位置を推定する手段を有することを特徴とする情報認識システム。 - 請求項1に記載の情報認識システムにおいて、算出された前記複数のデータの情報入力位置の情報と、入力された前記複数のデータの入力位置情報との類似値、差分値から、正解入力位置と不正解入力位置を推定する手段を有することを特徴とする情報認識システム。
- 請求項1に記載の情報認識システムにおいて、算出された前記複数のデータの情報入力位置の情報と、入力された前記複数のデータの入力位置情報との類似値、差分値から、正解値と不正解値を推定する手段を有することを特徴とする情報認識システム。
- 請求項1に記載の情報認識システムにおいて、前記標準入力或いは模範入力として入力されたデータの入力内容情報と、入力された前記複数のデータの入力内容情報との類似値、差分値から、不正解値の種類を推定する手段を有することを特徴とする情報認識システム。
- 請求項1または2に記載の情報認識システムにおいて、前記第一入力手段により入力されるデータの座標位置データ及び入力時刻を記憶する手段と、
前記第二入力手段により標準入力或いは模範入力として入力されたデータの入力位置の入力時刻情報と、前記第一入力手段により入力された複数の入力データの入力位置の入力時刻情報との差分値から、フォーマットの各入力位置へのアクセス回数を算出することを特徴とする情報認識システム。 - 請求項1または2に記載の情報認識システムにおいて、前記第一入力手段により入力される座標位置データ及び入力時刻を記憶する手段と、前記第二入力手段により標準入力或いは模範入力として入力されたデータの入力位置の入力時刻情報と、前記第一入力手段により入力された複数の入力データの入力位置の入力時刻情報との差分値から、フォーマットの各入力位置へのアクセス順序傾向を抽出する手段を有することを特徴とする情報認識システム。
- 請求項1または2に記載の情報認識システムにおいて、推定された前記コンテンツフォーマット中の情報入力位置と前記第一入力手段により入力される座標位置データ及び入力時刻を記憶する手段により得られた入力位置の入力時刻情報から、各入力位置へのアクセス時間を算出する手段を有することを特徴とする情報認識システム。
- 請求項1または2に記載の情報認識システムにおいて、推定された前記コンテンツフォーマット中の情報入力位置と前記第一入力手段により入力される座標位置データと、入力時刻を記憶する手段により得られた入力されたデータの入力位置の連続性と、前記コンテンツフォーマットに記載されているテキストの表示位置から、連続性のある入力位置データ群が示すテキスト内容を推定する手段を有することを特徴とする情報認識システム。
- 請求項1または2に記載の情報認識システムにおいて、前記第一端末により入力された前記複数のデータを解析した結果を同一単語頻度順、入力プロセスのパタン順に表示する手段を有することを特徴とする情報認識システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007301167A JP2009129040A (ja) | 2007-11-21 | 2007-11-21 | 情報認識システム |
CN2008101709787A CN101441617B (zh) | 2007-11-21 | 2008-10-21 | 信息识别系统 |
US12/275,559 US20090132637A1 (en) | 2007-11-21 | 2008-11-21 | Information recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007301167A JP2009129040A (ja) | 2007-11-21 | 2007-11-21 | 情報認識システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009129040A true JP2009129040A (ja) | 2009-06-11 |
Family
ID=40643117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007301167A Pending JP2009129040A (ja) | 2007-11-21 | 2007-11-21 | 情報認識システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20090132637A1 (ja) |
JP (1) | JP2009129040A (ja) |
CN (1) | CN101441617B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101018840B1 (ko) * | 2008-11-27 | 2011-03-04 | 세메스 주식회사 | 유저 인터페이스를 이용하여 반도체 제조 설비를 제어하는 시스템 및 그 방법 |
JP5972707B2 (ja) * | 2012-08-09 | 2016-08-17 | 株式会社日立製作所 | 学習コンテンツの構造化装置及びそれを用いた学習コンテンツ選択支援システム並びに支援方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4285012B2 (ja) * | 2003-01-31 | 2009-06-24 | 株式会社日立製作所 | 学習状況判断プログラム及びユーザ状況判断システム |
SE0401687D0 (sv) * | 2004-06-30 | 2004-06-30 | Anoto Ab | Information management |
US20080227075A1 (en) * | 2007-03-15 | 2008-09-18 | Ctb/Mcgraw-Hill, Llc | Method and system for redundant data capture from scanned documents |
-
2007
- 2007-11-21 JP JP2007301167A patent/JP2009129040A/ja active Pending
-
2008
- 2008-10-21 CN CN2008101709787A patent/CN101441617B/zh not_active Expired - Fee Related
- 2008-11-21 US US12/275,559 patent/US20090132637A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20090132637A1 (en) | 2009-05-21 |
CN101441617B (zh) | 2010-10-13 |
CN101441617A (zh) | 2009-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8191004B2 (en) | User feedback correlated to specific user interface or application features | |
Ivory et al. | The state of the art in automating usability evaluation of user interfaces | |
Callegaro | Paradata in web surveys | |
JP5255773B2 (ja) | 教育支援システム、情報処理装置、およびプログラム | |
CN104391786B (zh) | 网页自动化测试系统及其方法 | |
CN108292231A (zh) | 从数据生成应用 | |
Flood et al. | Evaluating mobile applications: A spreadsheet case study | |
Garcia-Lopez et al. | Validation of navigation guidelines for improving usability in the mobile web | |
US20220020040A1 (en) | Systems and methods for detecting and analyzing response bias | |
KR20220105888A (ko) | 사용자의 행동 데이터 또는 입력 데이터를 이용하여 사용자의 심리 상태를 판별하는 방법 및 컴퓨터 프로그램 | |
JP4353729B2 (ja) | 情報処理装置、プログラムおよび媒体 | |
KR101838162B1 (ko) | 고객 가치 중심의 브랜드 아이덴티티를 적용한 빅데이터 기반의 브랜드 통합관리방법 및 이를 수행하는 통합관리서버 | |
CN113761514A (zh) | 一种云桌面多因子安全认证方法及系统 | |
Zimmeck et al. | Usability and enforceability of global privacy control | |
Thomas | Using interaction data to explain difficulty navigating online | |
CN109299592A (zh) | 人机行为特征边界构建方法、系统、服务器及存储介质 | |
CN109995751A (zh) | 上网设备标记方法、装置及存储介质、计算机设备 | |
JP2009129040A (ja) | 情報認識システム | |
JPWO2019244849A1 (ja) | 投稿情報抽出制御装置、投稿情報抽出制御プログラム | |
Ge et al. | Leveraging android automated testing to assist crowdsourced testing | |
CN109753284B (zh) | 界面创建方法、装置及存储介质 | |
Walshe et al. | A longitudinal study of hacker behaviour | |
CN109815658A (zh) | 一种验证方法和装置、计算机设备以及计算机存储介质 | |
CN110737693A (zh) | 数据挖掘处理方法、装置、设备及计算机可读存储介质 | |
JP2011154443A (ja) | 情報処理システム及びプログラム |