以下、図面を参照しながら、本発明の一実施形態に係るデータ処理装置について説明する。図1は、本実施形態のデータ処理装置1が適用されたデータ処理システム5を示しており、このデータ処理システム5には、複数のデータ処理装置1(2つのみ図示)及びメインサーバ2が設けられている。
メインサーバ2は、ストレージ、プロセッサ、メモリ(RAM、E2PROM、ROMなど)及びI/Oインターフェースなどを備えている。このメインサーバ2には、ネットワーク3(例えばインターネット)を介して、多数の外部サーバ4が接続されている(3つのみ図示)。
この場合、各種のSNSサーバ、所定メディア(例えば、新聞社)のサーバ及び検索サイトのサーバなどが外部サーバ4に相当する。データ処理装置1は、後述するように、メインサーバ2を介して、これらの外部サーバ4からテキストデータ(テキスト情報)を取得する。
また、データ処理装置1は、パソコンタイプのものであり、ディスプレイ1a、装置本体1b及び入力インターフェース1cなどを備えている。装置本体1bは、HDDなどのストレージ、プロセッサ及びメモリ(RAM、E2PROM、ROMなど)などを備えており(いずれも図示せず)、この装置本体1bのストレージには、データ取得用のアプリケーションソフト(以下「データ取得ソフト」という)がインストールされている。
また、入力インターフェース1cは、データ処理装置1を操作するためのキーボード及びマウスなどで構成されている。なお、本実施形態では、ディスプレイ1aが出力インターフェースに相当し、装置本体1bが、テキスト情報取得部、テキスト情報表示部、ノイズ除去済み情報作成部、データベース作成部、ノイズ記憶部、ノイズ表示部、ノイズ除去済み情報表示部、タグ情報記憶部及び感性情報表示部に相当する。
このデータ処理装置1では、以下に述べるように、データベース作成処理が実行される。具体的には、ユーザによる入力インターフェース1cの操作により、データ取得ソフトを起動されると、後述する図8などに示すような画面がGUI(グラフィカル・ユーザ・インターフェース)としてディスプレイ1aに表示される。
このGUIの場合、データ取得ボタン10、データクレンジングボタン20、感性修正ボタン30、タグ付けボタン40及び可視化ボタン50が、ディスプレイ1aの左側の位置に縦一列に表示される。そして、ユーザが入力インターフェース1cを介して、これらのボタンの押下操作などを実行することにより、以下に述べるように、データベース作成処理が実行される。なお、以下の説明では、ユーザにより入力インターフェース1cが操作されることを「ユーザ操作」という。
次に、図2を参照しながら、上述したデータベース作成処理について説明する。このデータベース作成処理は、以下に述べるように、データ取得ソフトの起動中、外部サーバ4からテキスト情報を取得してデータベースを作成するとともに、その作成結果を表示するものであり、データ処理装置1において、所定の制御周期で実行される。
なお、このデータベース作成処理の実行中に取得又は作成されたデータはいずれも、データ処理装置1の装置本体1bのストレージに記憶されるものとする。また、これらのデータを、装置本体1bのメモリ、装置本体1bに外付けしたストレージ、又はメインサーバ2に記憶するように構成してもよい。
図2に示すように、このデータベース作成処理では、まず、データ取得処理が実行される(図2/STEP1)。この処理は、外部サーバ4からテキストデータを取得するものであり、その詳細については後述する。
次いで、データクレンジング処理が実行される(図2/STEP2)。この処理は、装置本体1bのストレージ内のテキストデータを読出し、読み出したテキストデータに含まれる不要なデータを取り除くことで、テキストデータを整理するためのものであり、その詳細については後述する。
次に、感性情報修正処理が実行される(図2/STEP3)。この処理は、装置本体1bのストレージ内のテキストデータを読出し、読み出したテキストデータにおける感性情報を修正するためのものであり、その詳細については後述する。
この感性情報修正処理に続けて、ユーザ定義タグ付け処理が実行される(図2/STEP4)。この処理は、装置本体1bのストレージ内のテキストデータを読出し、読み出したテキストデータにユーザ定義のタグを付加するためのものであり、その詳細については後述する。
次いで、データ可視化処理が実行される(図2/STEP5)。この処理は、以上の各処理を実行して作成されたデータベースを可視化して表示するものであり、その詳細については後述する。以上のように、データ可視化処理を実行した後、本処理を終了する。
次に、図3を参照しながら、前述したデータ取得処理の内容について説明する。この処理では、同図に示すように、まず、前述したデータ取得ボタン10がユーザ操作によって押下されたか否かを判定する(図3/STEP10)。この判定が否定(図3/STEP10…NO)のときには、そのまま本処理を終了する。
一方、この判定が肯定(図3/STEP10…YES)で、データ取得ボタン10が押下されたときには、メディア選択処理が実行される(図3/STEP11)。 このメディア選択処理では、図8に示すようなメディア選択画面がディスプレイ1aに表示される。
このメディア選択画面では、上記のようにデータ取得ボタン10が押下された場合、それを表すために、データ取得ボタン10は、外枠が太線で表示されるとともに、その内部が網掛け状態で表示される。
このメディア選択画面の上側には、左から右に向かって順に、メディア選択アイコン11、期間入力アイコン12、言語選択アイコン13、キーワード入力アイコン14、付加情報選択アイコン15及び最終確認アイコン16が表示される。また、メディア選択画面の右下側には、Nextボタン17が表示される。
メディア選択処理の実行中は、それを表すために、メディア選択アイコン11が反転表示されるとともに、その下側に「Select Media」の文字が表示される。図8では、メディア選択アイコン11が反転表示された状態は、黒塗りではなく、ハッチングで表示されており、この点は、後述する図9〜13における各種のアイコン12〜16においても同様である。
さらに、メディア選択処理の実行中、メディア選択画面の中央部には、メディアを選択するための複数のチェックボックスが表示される。図8に示す例では、複数のチェックボックスとして、6つのチェックボックス11a〜11fが表示されている。
この場合、チェックボックス11a〜11cは、メデイアとして、「TWITTER(登録商標)」、「FACEBOOK(登録商標)」及び「YOUTUBE(登録商標)」をそれぞれ選択するためのものであり、チェックボックス11d〜11fは、その他の3つのメディアをそれぞれ選択するためのものである。
このようにチェックボックス11a〜11fが表示されている状態で、ユーザ操作によっていずれかのメディアが選択されると、それを表すために、選択されたメディアに対応するチェックボックス内にチェックが表示されると同時に、チェックボックスが反転表示される。図8に示す例では、メディアとして、TWITTER(登録商標)が選択された状態が表示されている。以上のように、メディア選択処理は実行される。
次に、メディア選択処理が終了したか否かを判定する(図3/STEP12)。この場合、チェックボックス11a〜11fのうちの少なくとも1つが選択された状態で、Nextボタン17がユーザ操作によって押下されたときには、メディア選択処理が終了したと判定され、それ以外のときには、メディア選択処理が終了していないと判定される。
この判定が否定(図3/STEP12…NO)のときには、上述したメディア選択処理に戻る。一方、この判定が肯定(図3/STEP12…YES)で、メディア選択処理が終了したときには、期間入力処理が実行される(図3/STEP13)。
この期間入力処理は、上記のように選択したメディアからテキストデータを取得する期間を入力するためのものであり、期間入力処理の実行中、図9に示すような期間入力画面がディスプレイ1aに表示される。
この期間入力画面では、期間入力処理の実行中、それを表すために、期間入力アイコン12が反転表示される。また、期間入力画面の中央部には、データ取得期間の始点である検索開始日を入力するための入力欄12aと、データ取得期間の終点である検索終了日を入力するための入力欄12bとが表示される。
さらに、期間入力画面の左下側には、Backボタン18が表示される。このBackボタン18は、期間入力処理の前の処理(すなわちメディア選択処理)の画面に戻るためのものであり、この点は、後述する各種処理の画面においても同様である。この期間入力処理では、検索開始日及び検索終了日がユーザ操作によって入力欄12a,12bに入力される。以上のように、期間入力処理は実行される。
次いで、期間入力処理が終了したか否かを判定する(図3/STEP14)。この場合、検索開始日及び検索終了日が入力欄12a,12bに入力されている状態で、Nextボタン17がユーザ操作によって押下されたときには、期間入力処理が終了したと判定され、それ以外のときには、期間入力処理が終了していないと判定される。
この判定が否定(図3/STEP14…NO)のときには、上述した期間入力処理に戻る。一方、この判定が肯定(図3/STEP14…YES)で、期間入力処理が終了したときには、言語選択処理が実行される(図3/STEP15)。
この言語選択処理は、上記のように選択したメディアからテキストデータを取得する際の言語を選択するためのものであり、言語選択処理の実行中、図10に示すような言語選択画面がディスプレイ1aに表示される。この言語選択画面では、言語選択処理の実行中、それを表すために、言語選択アイコン13が反転表示されるとともに、その下側に「Select Language」の文字が表示される。
また、言語選択画面の左寄りの部分には、3つのチェックボックス13a〜13cが上下に並んで表示される。チェックボックス13aは、テキストデータを取得する際の言語として、日本語と英語の双方を選択するためのものであり、それを表すために、チェックボックス13aの右側には、「日・英」の文字が表示される。
また、チェックボックス13bは、テキストデータを取得する際の言語として、日本語を選択するためのものであり、それを表すために、チェックボックス13bの右側には、「日本語」の文字が表示される。さらに、チェックボックス13cは、テキストデータを取得する際の言語として、英語を選択するためのものであり、それを表すために、チェックボックス13cの右側には、「英語」の文字が表示される。
このようにチェックボックス13a〜13cが表示されている状態で、いずれかの言語がユーザ操作によって選択されると、それを表すために、選択されたメディアに対応するチェックボックス内にチェックが表示されると同時に、チェックボックスが反転表示される。図10に示す例では、テキストデータを取得する際の言語として、日本語が選択された状態が表示されている。以上のように、言語選択処理は実行される。
次いで、言語選択処理が終了したか否かを判定する(図3/STEP16)。この場合、チェックボックス13a〜13cのいずれかにチェックが表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、言語選択処理が終了したと判定され、それ以外のときには、言語選択処理が終了していないと判定される。
この判定が否定(図3/STEP16…NO)のときには、上述した言語選択処理に戻る。一方、この判定が肯定(図3/STEP16…YES)で、言語選択処理が終了したときには、キーワード入力処理が実行される(図3/STEP17)。
このキーワード入力処理は、外部サーバ4からテキストデータを取得する際に、検索したいキーワードと、排除したいキーワードとを入力するためのものであり、キーワード入力処理の実行中、図11に示すようなキーワード入力画面がディスプレイ1aに表示される。
このキーワード入力画面では、キーワード入力処理の実行中、それを表すために、キーワード入力アイコン14が反転表示されるとともに、このキーワード入力アイコン14の下側に、「Keyword Definition」の文字が表示される。
また、キーワード入力画面の中央部には、2つの入力欄11a,11b及び追加ボタン14cが表示される。この入力欄11aは、検索キーワードを入力するためのものであり、それを表すために、入力欄11aの上側には、「検索キーワード」の文字が表示される。さらに、追加ボタン14cは、入力欄11aを追加するためのものである。
また、入力欄11bは、排除キーワードを入力するためのものであり、それを表すために、入力欄11bの上側には、「排除キーワード」の文字が表示される。この排除キーワードを用いるのは以下の理由による。
すなわち、外部サーバ4からテキストデータを取得する際、検索キーワードと無関係であるにもかかわらず、検索キーワードと同一又は類似しているキーワードが外部サーバ4内のテキストデータに含まれている場合、そのようなテキストデータが、本来のテキストデータと混同されて取得される可能性が高くなる。したがって、そのような不要なテキストデータの取得を回避するために、排除キーワードが用いられる。
このキーワード入力処理では、キーワード入力画面が表示されている状態で、検索キーワード及び排除キーワードがユーザ操作によって入力される。図11は、検索キーワードとしてホンダ及びHonda(登録商標)が、排除キーワードとしてケイスケ及びKeisukeがそれぞれ入力された例を示している。この例の場合、ホンダ及びHondaの少なくとも一方を含むテキストデータが取得(検索)され、ケイスケ及びKeisukeの一方を含むテキストデータの取得が中止される。以上のように、キーワード入力処理は実行される。
次いで、キーワード入力処理が終了したか否かを判定する(図3/STEP18)。この場合、キーワードが2つの入力欄11a,11bに入力されている状態で、Nextボタン17がユーザ操作によって押下されたときには、キーワード入力処理が終了したと判定され、それ以外のときには、キーワード入力処理が終了していないと判定される。
この判定が否定(図3/STEP18…NO)のときには、上述したキーワード入力処理に戻る。一方、この判定が肯定(図3/STEP18…YES)で、キーワード入力処理が終了したときには、付加情報選択処理が実行される(図3/STEP19)。
この付加情報選択処理は、上記のように選択したメディアからテキストデータを取得する際に、テキストデータに付加する情報を選択するためのものであり、付加情報選択処理の実行中、図12に示すような付加情報選択画面がディスプレイ1aに表示される。
この付加情報選択画面では、付加情報選択処理の実行中、それを表すために、付加情報選択アイコン15が反転表示されるとともに、その下側に、「Additional Info」の文字が表示される。また、付加情報選択画面の左寄りの部分には、3つのチェックボックス15a〜15cが表示される。チェックボックス15aは、取得したデータに後述する感性情報を付加するためのものであり、それを表すために、チェックボックス15aの右側には、「感性情報」の文字が表示される。
また、チェックボックス15bは、取得したデータにキーワードに関連する情報を付加するためのものであり、それを表すために、チェックボックス15bの右側には、「キーワード情報」の文字が表示される。さらに、チェックボックス15cは、長文に対する感性情報の精度を向上させるためのものであり、それを表すために、チェックボックス15cの右側には、「長文に対する感性情報の精度向上」の文字が表示される。
このようにチェックボックス15a〜15cが表示されている状態で、チェックボックス15a〜15cのいずれかがユーザ操作によって選択されると、それを表すために、選択されたチェックボックス内にチェックが表示されると同時に、チェックボックスが反転表示される。図12に示す例では、3つのチェックボックス15a〜15cがすべて選択された状態を示している。以上のように、付加情報選択処理は実行される。
次いで、付加情報選択処理が終了したか否かを判定する(図3/STEP20)。この場合、チェックボックス15a〜15cのいずれかにチェックが表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、付加情報選択処理が終了したと判定され、それ以外のときには、付加情報選択処理が終了していないと判定される。
この判定が否定(図3/STEP20…NO)のときには、上述した付加情報選択処理に戻る。一方、この判定が肯定(図3/STEP20…YES)で、付加情報選択処理が終了したときには、最終確認処理が実行される(図3/STEP21)。
この最終確認処理は、ユーザが以上のように自身で選択及び入力した結果を最終的に確認するためのものであり、最終確認処理の実行中、図13に示すような最終確認画面がディスプレイ1aに表示される。
この最終確認画面では、最終確認処理の実行中、それを表すために、最終確認アイコン16が反転表示されるとともに、その下側に「Confirmation」の文字が表示される。また、最終確認画面の中央部には、以上のように設定された各種の項目と、それらの設定値がそれぞれ表示されるとともに、その右下側には、Finishボタン19が表示される。以上のように、最終確認処理は実行される。
次いで、最終確認処理が終了したか否かを判定する(図3/STEP22)。この場合、最終確認画面が表示されている状態で、Finishボタン19がユーザ操作によって押下されたときには、最終確認処理が終了したと判定され、それ以外のときには、最終確認処理が終了していないと判定される。
この判定が否定(図3/STEP22…NO)のときには、上述した最終確認処理に戻る。一方、この判定が肯定(図3/STEP22…YES)で、最終確認処理が終了したときには、データ取得処理が実行される(図3/STEP23)。
具体的には、メインサーバ2を介して、前述したように選択されたメディアの外部サーバ4から、以上のようにユーザによって設定された各種の条件で、テキストデータが取得される。この場合、テキストデータを取得する際の言語として、日本語と英語の双方が選択された場合には、テキストデータとして、英語を機械翻訳したテキストデータと日本語のテキストデータを混合したデータが取得される。また、この場合、テキストデータが、メインサーバ2を介さずに、データ処理装置1によって外部サーバ4から取得されるように構成してもよい。
次いで、感性情報の抽出処理が実行される(図3/STEP24)。この処理では、文章の構成や単語の連接関係を理解/判断する言語理解アルゴリズムを用い、上記のデータ取得処理で取得したテキストデータの感性情報が分類して抽出される。具体的には、データの感性情報は、3つの大分類「Positive」、「Neutral」、「Negative」と、各大分類の下位の多数の小分類(後述する図27参照)との2段階に分類して抽出される。
次いで、保存データが作成される(図3/STEP25)。具体的には、前述したデータ取得処理で取得したテキストデータに、上述した抽出処理で抽出された感性情報を紐付けることにより、保存データが作成される。
次に、以上のように作成した保存データが、データベースの一部として、装置本体1bのストレージに記憶される(図3/STEP26)。その後、本処理を終了する。
次に、図4を参照しながら、前述したデータクレンジング処理(図2/STEP2)の内容について説明する。この処理では、同図に示すように、まず、前述したデータクレンジングボタン20がユーザ操作によって押下されたか否かを判定する(図4/STEP40)。この判定が否定(図4/STEP40…NO)のときには、そのまま本処理を終了する。
一方、この判定が肯定(図4/STEP40…YES)で、データクレンジングボタン20が押下されたときには、データ選択処理が実行される(図4/STEP41)。このようにデータクレンジングボタン20が押下された場合、それを表すために、データクレンジングボタン20は、外枠が太線で表示されるとともに、その内部が網掛け状態で表示される(図14参照)。
このデータ選択処理では、図14に示すようなデータ選択画面がディスプレイ1aに表示される。このデータ選択画面の上側には、左から右に向かって順に、データファイル選択アイコン21、クレンジングキーワードアイコン22及び最終確認アイコン23が表示される。
このデータ選択処理の実行中は、それを表すために、データファイル選択アイコン21が反転表示されるとともに、その下側に「Select Data File」の文字が表示される。これと同時に、データ選択画面の中央部には、表示窓24及び選択ボタン25が表示される。
この選択ボタン25がユーザ操作によって押下されると、図示しないメニュー画面が表示され、装置本体1bのストレージ内のフォルダ及びデータが表示される(いずれも図示せず)。その状態で、ユーザ操作によってデータクレンジング処理を実施するデータファイルが選択されると、そのデータファイルが記憶されているフォルダのパス名とデータファイル名が表示窓24に表示される。なお、図14に示す例では、フォルダのパス名及びデータファイル名が「xxxxx……」で表示されている。この点は、後述する図19などにおいても同様である。
この場合、装置本体1bのストレージ内には、図2に示すSTEP1〜4の各処理が実行されると、前述した保存データに限らず、以下に述べるように、クレンジング済みデータ、感性修正済みデータ及びタグ付け済みデータを含むデータファイルが、データベースとして記憶される状態となる。その場合には、このデータ選択処理において、ユーザは、これらの4種類のデータファイルのいずれかを任意に選択することが可能となる。以上のように、データ選択処理は実行される。
次に、データ選択処理が終了したか否かを判定する(図4/STEP42)。この場合、上記のように、フォルダのパス名とデータファイル名が表示窓24に表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、データ選択処理が終了したと判定され、それ以外のときには、データ選択処理が終了していないと判定される。
この判定が否定(図4/STEP42…NO)のときには、上述したデータ選択処理に戻る。一方、この判定が肯定(図4/STEP42…YES)で、データ選択処理が終了したときには、クレンジングキーワード処理が実行される(図4/STEP43)。
このクレンジングキーワード処理は、上記のように選択したデータファイルから不要なデータを排除するためのものであり、クレンジングキーワード処理の実行中、図15に示すようなクレンジングキーワード画面がディスプレイ1aに表示される。この図15に示すクレンジング画面は、上述したデータ選択処理において前述した保存データを選択した場合の例である。
このクレンジングキーワード画面では、クレンジングキーワード処理の実行中、それを表すために、クレンジングキーワードアイコン22が反転表示されるとともに、その下側に「Cleansingkeyword」の文字が表示される。
さらに、クレンジングキーワード画面の中央部には、データファイルにおけるテキストデータが、その重複数の多いものから順に上から下に向かって表示される。すなわち、完全一致のテキストデータの集合がデータファイル内に存在する場合において、集合の大きいものから順に表示される。さらに、各データでは、左から右に向かって、その重複数の順位(No.)、テキストデータ(TEXT)及び重複数(COUNT)が表示される。
また、テキストデータの左側には、上から下に向かって順に、操作ボタン24、クレンジングボタン25、キーワード保存ボタン26及びキーワード読出ボタン27が表示される。さらに、テキストデータの右下側には、テキストデータのページ数を表す多数のボタン28aと、テキストデータのページをめくるためのボタン28b,28bが表示される。
ユーザは、クレンジングキーワード画面に表示されているテキストデータを視認し、不要なテキストデータが見つかった場合、操作ボタン24を入力インターフェース1cを介して押下した後、不要なテキストデータに含まれる排除キーワード(ノイズ)をポインタによって選択する。そして、そのように排除キーワードが選択された場合、図16に示すように、選択された排除キーワード(同図では「キニ速」)が反転表示される。
また、クレンジングキーワード画面におけるクレンジングボタン25がユーザ操作によって押下されると、図17に示すように、絞込キーワードを入力するための入力窓29aと、選択した排除キーワードを表示する表示窓29bが表示される。さらに、キーワード保存ボタン26がユーザ操作によって押下されると、排除キーワードが装置本体1bのストレージに記憶され、キーワード読出ボタン27がユーザ操作によって押下されると、装置本体1bのストレージに記憶された排除キーワードが表示窓29bに表示される。
これに加えて、図17に示す画面表示状態において、クレンジングボタン25がユーザ操作によって押下されると、排除キーワードを含む全てのテキストデータが削除された状態で表示される(図示せず)。以上のように、クレンジングキーワード処理は実行される。
次いで、クレンジングキーワード処理が終了したか否かを判定する(図4/STEP44)。この場合、クレンジングキーワード画面が表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、クレンジングキーワード処理が終了したと判定され、それ以外のときには、クレンジングキーワード処理が終了していないと判定される。
この判定が否定(図4/STEP44…NO)のときには、上述したクレンジングキーワード処理に戻る。一方、この判定が肯定(図4/STEP44…YES)で、クレンジングキーワード処理が終了したときには、最終確認処理が実行される(図4/STEP45)。
この最終確認処理は、ユーザが以上のように自身で選択した排除キーワードなどを最終的に確認するためのものであり、最終確認処理の実行中、図18に示すような最終確認画面がディスプレイ1aに表示される。
この最終確認画面では、最終確認処理の実行中、それを表すために、最終確認アイコン23が反転表示されるとともに、その下側に「Confirmation」の文字が表示される。また、最終確認画面の中央部には、クレンジングキーワード処理で入力された検索キーワード及び排除キーワードが表示される。図18に示す例では、検索キーワードが入力されていないことで、検索キーワードとして「0」が表示されているとともに、排除キーワードとして「キニ速」が表示されている。以上のように、最終確認処理は実行される。
次いで、最終確認処理が終了したか否かを判定する(図4/STEP46)。この場合、最終確認画面が表示されている状態で、Finishボタン19がユーザ操作によって押下されたときには、最終確認処理が終了したと判定され、それ以外のときには、最終確認処理が終了していないと判定される。
この判定が否定(図4/STEP46…NO)のときには、上述した最終確認処理に戻る。一方、この判定が肯定(図4/STEP46…YES)で、最終確認処理が終了したときには、クレンジング済みデータが、データベースの一部として、装置本体1bのストレージに記憶される(図4/STEP47)。このクレンジング済みデータは、以上のようにデータクレンジングを施したテキストデータである。その後、本処理を終了する。
次に、図5を参照しながら、前述した感性情報修正処理(図2/STEP3)の内容について説明する。この処理では、同図に示すように、まず、前述した感性修正ボタン30がユーザ操作によって押下されたか否かを判定する(図5/STEP50)。この判定が否定(図5/STEP50…NO)のときには、そのまま本処理を終了する。
一方、この判定が肯定(図5/STEP50…YES)で、感性修正ボタン30が押下されたときには、データ選択処理が実行される(図5/STEP51)。このように感性修正ボタン30が押下された場合、それを表すために、感性修正ボタン30は、外枠が太線で表示されるとともに、その内部が網掛け状態で表示される(図19参照)。
このデータ選択処理では、図19に示すようなデータ選択画面がディスプレイ1aに表示される。このデータ選択画面の上側には、左から右に向かって順に、データファイル選択アイコン31、感性修正アイコン32及び最終確認アイコン33が表示される。
データ選択処理の実行中は、それを表すために、データファイル選択アイコン31が反転表示されるとともに、その下側に「Select Data File」の文字が表示される。これと同時に、データ選択画面の中央部には、表示窓34及び選択ボタン35が表示される。
この選択ボタン35がユーザ操作によって押下されると、図示しないメニュー画面が表示され、装置本体1bのストレージ内のフォルダ及びデータが表示される(いずれも図示せず)。その状態で、ユーザ操作によって感性修正を実施するデータファイルが選択されると、そのデータファイルが記憶されているフォルダのパス名とデータファイル名が表示窓34に表示される。
このデータ選択処理においても、保存データ、クレンジング済みデータ、感性修正済みデータ及びデータベースが装置本体1bのストレージ内に記憶されている場合には、ユーザは、これらの4種類のデータファイルのいずれかを任意に選択することが可能となる。以上のように、データ選択処理は実行される。
次に、データ選択処理が終了したか否かを判定する(図5/STEP52)。この場合、上記のように、フォルダのパス名とデータファイル名が表示窓34に表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、データ選択処理が終了したと判定され、それ以外のときには、データ選択処理が終了していないと判定される。
この判定が否定(図5/STEP52…NO)のときには、上述したデータ選択処理に戻る。一方、この判定が肯定(図5/STEP52…YES)で、データ選択処理が終了したときには、感性修正処理が実行される(図5/STEP53)。
この感性修正処理は、上記のように選択したデータファイルに紐付けされている感性情報が間違っている場合、それを修正するためのものであり、感性修正処理の実行中、図20に示すような感性修正画面がディスプレイ1aに表示される。
この感性修正画面では、感性修正処理の実行中、それを表すために、感性修正アイコン32が反転表示されるとともに、その下側に「SenseCheck」の文字が表示される。
さらに、感性修正画面には、左から右に向かって、3つの大分類「Positive」、「Neutral」、「Negative」のタブ36a〜36cが表示される。そして、これらのタブ36a〜36cのいずれかがユーザ操作によって選択されると、感性情報及びテキスト情報などが表示される。
例えば、図20に示すように、「Positive」のタブ36aが選択された場合には、それを表すために、「Positive」のタブ36aが反転表示される。これと同時に、データファイルにおけるテキストデータが、その重複数の多いものから順に上から下に向かって表示される。さらに、各データでは、左から右に向かって、その重複数の順位(No.)、感性情報(SENSE)、感性表現(EXPRESSION)、テキストデータ(TEXT)及び重複数(COUNT)が表示される。
このように各データが表示されている場合、ユーザは、表示された感性情報、感性表現及びテキストデータの内容を参照することにより、感性情報が正しいかどうかを判定することができる。例えば、図20に示す例では、No.1のデータにおいて、その感性情報が「褒め 賞賛」であるにもかかわらず、テキストデータが「エンジンがかからない」という内容であることから、ユーザは、この感性情報が誤っており、修正すべきであると判定することができる。
そして、そのように感性情報を修正する場合、ユーザは、入力インターフェース1cの操作により、No.1のデータの感性情報の表示窓の右側のプルダウンメニューボタン37を押下する。それに伴い、図21に示すように、プルダウンメニュー38が表示されるので、ユーザは、このプルダウンメニュー38内の各種の感性情報から適切なものを、入力インターフェース1cの操作によって選択する。例えば、図21に示す例では、「悪い」という感性情報が選択されており、それを表すために、「悪い」という感性情報が点描で表示されている。以上のように、感性修正処理は実行される。
次いで、感性修正処理が終了したか否かを判定する(図5/STEP54)。この場合、感性修正画面が表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、感性修正処理が終了したと判定され、それ以外のときには、感性修正処理が終了していないと判定される。
この判定が否定(図5/STEP54…NO)のときには、上述した感性修正処理に戻る。一方、この判定が肯定(図5/STEP54…YES)で、感性修正処理が終了したときには、最終確認処理が実行される(図5/STEP55)。
この最終確認処理は、ユーザが以上のように自身で修正した感性情報などを最終的に確認するためのものであり、最終確認処理の実行中、図22に示すような最終確認画面がディスプレイ1aに表示される。
この最終確認画面では、最終確認処理の実行中、それを表すために、最終確認アイコン33が反転表示されるとともに、その下側に「Confirmation」の文字が表示される。また、最終確認画面の中央部には、左から右に向かって、テキストデータ(TEXT)、表現(EXPRESSION)、修正前の感性情報(BEFORE)及び修正後の感性情報(AFTER)が表示される。図22に示す例では、修正前の感性情報として「褒め・賞賛」が、修正後の感性情報として「悪い」がそれぞれ表示されている。以上のように、最終確認処理は実行される。
次いで、最終確認処理が終了したか否かを判定する(図5/STEP56)。この場合、最終確認画面が表示されている状態で、Finishボタン19がユーザ操作によって押下されたときには、最終確認処理が終了したと判定され、それ以外のときには、最終確認処理が終了していないと判定される。
この判定が否定(図5/STEP56…NO)のときには、上述した最終確認処理に戻る。一方、この判定が肯定(図5/STEP56…YES)で、最終確認処理が終了したときには、感性修正済みデータが、データベースの一部として、装置本体1bのストレージに記憶される(図5/STEP57)。この感性修正済みデータは、以上のようにテキストデータに紐付けされている感性情報を修正したテキストデータである。その後、本処理を終了する。
次に、図6を参照しながら、前述したユーザ定義タグ付け処理(図2/STEP4)の内容について説明する。この処理では、同図に示すように、まず、前述したタグ付けボタン40がユーザ操作によって押下されたか否かを判定する(図6/STEP60)。この判定が否定(図6/STEP60…NO)のときには、そのまま本処理を終了する。
一方、この判定が肯定(図6/STEP60…YES)で、タグ付けボタン40が押下されたときには、データ選択処理が実行される(図6/STEP61)。このようにタグ付けボタン40が押下された場合、それを表すために、タグ付けボタン40は、外枠が太線で表示されるとともに、その内部が網掛け状態で表示される(図23参照)。
このデータ選択処理は、後述するユーザ定義タグを付加する対象のデータファイルを選択するためのものであり、データ選択処理の実行中、図23に示すようなデータ選択画面がディスプレイ1aに表示される。このデータ選択画面の上側には、左から右に向かって順に、データファイル選択アイコン41及び最終確認アイコン42が表示される。
データ選択処理の実行中は、それを表すために、データファイル選択アイコン41が反転表示されるとともに、その下側に「Select Data File」の文字が表示される。これと同時に、データ選択画面の中央部には、表示窓43及び選択ボタン44が表示される。
この選択ボタン44がユーザ操作によって押下されると、図示しないメニュー画面が表示され、装置本体1bのストレージ内のフォルダ及びデータが表示される(いずれも図示せず)。その状態で、データファイルがユーザ操作によって選択されると、そのデータファイルが記憶されているフォルダのパス名とデータファイル名が表示窓43に表示される。
このデータ選択処理においても、保存データ、クレンジング済みデータ、感性修正済みデータ及びデータベースが装置本体1bのストレージ内に記憶されている場合には、ユーザは、これらの4種類のデータファイルのいずれかを任意に選択することが可能となる。以上のように、データ選択処理は実行される。
次に、データ選択処理が終了したか否かを判定する(図6/STEP62)。この場合、上記のように、フォルダのパス名とデータファイル名が表示窓43に表示されている状態で、Nextボタン17がユーザ操作によって押下されたときには、データ選択処理が終了したと判定され、それ以外のときには、データ選択が終了していないと判定される。
この判定が否定(図6/STEP62…NO)のときには、上述したデータ選択処理に戻る。一方、この判定が肯定(図6/STEP62…YES)で、データ選択処理が終了したときには、ユーザ定義タグ選択処理が実行される(図6/STEP63)。
このユーザ定義タグ選択処理は、上記のように選択したデータファイルに対して紐付けるユーザ定義タグを選択するためのものであり、ユーザ定義タグ選択処理の実行中、図24に示すようなユーザ定義タグ選択画面がディスプレイ1aに表示される。
このユーザ定義タグ選択画面では、ユーザ定義タグ選択処理の実行中、それを表すために、ユーザ定義タグ選択アイコン42が反転表示されるとともに、その下側に「Tag Definition」の文字が表示される。これと同時に、ユーザ定義タグ選択画面の中央部には、表示窓45及び選択ボタン46が表示されるとともに、選択ボタン46の下側には、プレビューボタン47が表示される。
この選択ボタン46がユーザ操作によって押下されると、図示しないメニュー画面が表示され、装置本体1bのストレージ内のフォルダ及びデータが表示される(いずれも図示せず)。その状態で、テキストデータにタグ付けするユーザ定義タグファイルがユーザ操作によって選択されると、そのユーザ定義タグファイルが記憶されているフォルダのパス名とユーザ定義タグファイル名が表示窓45に表示される。
このように、ユーザ定義タグファイル名が表示窓45に表示されている状態で、プレビューボタン47がユーザ操作によって押下されると、図25に示すようなユーザ定義タグ画面がディスプレイ1aに表示される。このユーザ定義タグ画面には、タグ一覧表48及びOKボタン49が表示される。このタグ一覧表48では、左から右に向かって、大分類のカテゴリ(level1)、小分類のカテゴリ(level2)及び文字列(word)が表示される。これらのカテゴリ及び文字列は、ユーザによって予め定義されたものである。
図25に示す例では、大分類のカテゴリとして「4輪」及び「2輪」が定義されており、小分類のカテゴリとしては、車名である「ACCORD(登録商標)」、「ACTY(登録商標)」及び「Africa Twin」と、ブランド名である「ACURA(登録商標)」などが定義されている。さらに、文字列としては、上記のローマ字表記の車名及びブランド名に加えて、カタカナ表記の車名「アコード(登録商標)」及び「アクティ(登録商標)」と、カタカナ表記のブランド名「アキュラ(登録商標)」とが定義されている。
ユーザは、このタグ一覧表48を参照することにより、自身が選択したユーザ定義タグファイルの内容を確認することができる。さらに、ユーザは、入力インターフェース1cを操作してOKボタン49を押下することにより、図24に示す画面表示に戻ることができる。以上のように、ユーザ定義タグ選択処理は実行される。
次に、ユーザ定義タグ選択処理が終了したか否かを判定する(図6/STEP64)。この場合、ユーザ定義タグファイルのフォルダのパス名とユーザ定義タグファイル名が表示窓45に表示されている状態で、Finishボタン19がユーザ操作によって押下されたときには、ユーザ定義タグ選択処理が終了したと判定され、それ以外のときには、ユーザ定義タグ選択処理が終了していないと判定される。
この判定が否定(図6/STEP64…NO)のときには、上述したユーザ定義タグ選択処理に戻る。一方、この判定が肯定(図6/STEP64…YES)で、ユーザ定義タグ選択処理が終了したときには、上述したように選択されたユーザ定義タグファイルをテキストデータにタグ付けすることにより、タグ付け済みデータを作成する(図6/STEP65)。
次いで、タグ付け済みデータが、データベースの一部として、装置本体1bのストレージに記憶される(図6/STEP66)。その後、本処理を終了する。
次に、図7を参照しながら、前述したデータ可視化処理(図2/STEP5)の内容について説明する。この処理では、同図に示すように、まず、前述した可視化ボタン50がユーザ操作によって押下されたか否かを判定する(図7/STEP70)。この判定が否定(図7/STEP70…NO)のときには、そのまま本処理を終了する。
一方、この判定が肯定(図7/STEP70…YES)で、可視化ボタン50が押下されたときには、データ選択処理が実行される(図7/STEP71)。このように可視化ボタン50が押下された場合、それを表すために、可視化ボタン50は、外枠が太線で表示されるとともに、その内部が網掛け状態で表示される(図26参照)。
このデータ選択処理は、グラフ表示するデータベースのデータファイルを選択するためのものであり、データ選択処理の実行中、図26に示すようなデータ選択画面がディスプレイ1aに表示される。
このデータ選択画面の上側には、データファイル選択アイコン51が表示される。データ選択処理の実行中、それを表すために、データファイル選択アイコン51が反転表示されるとともに、その下側に「Select Data File」の文字が表示される。これと同時に、データ選択画面の中央部には、表示窓52及び選択ボタン53が表示される。
この選択ボタン53がユーザ操作によって押下されると、図示しないメニュー画面が表示され、装置本体1bのストレージ内のフォルダ及びデータが表示される(いずれも図示せず)。その状態で、ユーザ操作によってデータベースのデータファイルが選択されると、そのデータファイルが記憶されているフォルダのパス名とデータファイル名が表示窓52に表示される。
このデータ選択処理においても、保存データ、クレンジング済みデータ、感性修正済みデータ及びデータベースが装置本体1bのストレージ内に記憶されている場合には、ユーザは、これらの4種類のデータファイルのいずれかを任意に選択することが可能となる。以上のように、データ選択処理は実行される。以上のように、データ選択処理は実行される。
次に、データ選択処理が終了したか否かを判定する(図7/STEP72)。この場合、上記のように、フォルダのパス名とデータファイル名が表示窓52に表示されている状態で、Finishボタン19がユーザ操作によって押下されたときには、データ選択処理が終了したと判定され、それ以外のときには、データ選択が終了していないと判定される。
この判定が否定(図7/STEP72…NO)のときには、上述したデータ選択処理に戻る。一方、この判定が肯定(図7/STEP72…YES)で、データ選択処理が終了したときには、データ表示処理が実行される(図7/STEP73)。
このデータ表示処理は、上記のように選択したデータファイル内の各種データを、ユーザが視認できるようにグラフ化して表示するものである。なお、以下の説明では、前述したデータ取得処理で取得したテキストデータファイルに対して、データクレンジング処理、感性情報修正処理及びユーザ定義タグ付け処理を全て実施したデータファイルを表示する場合の例について説明する。
このデータ表示処理の実行中、図27に示すような初期表示画面がディスプレイ1aに表示される。同図に示すように、この初期表示画面の場合、最上位の左側には、感性情報の3つの大分類「Positive」、「Neutral」、「Negative」が円環状のグラフ(ドーナツグラフ)形式で表示される。このグラフでは、3つの大分類の領域の面積が、そのヒット数の割合(%)に応じて設定されるとともに、互いに異なる色に色分けして表示される。これに加えて、各大分類の名称及びヒット数の割合がグラフに近接した位置に表示される。それにより、ユーザは、検索結果における感性情報の3つの大分類の割合を一瞥して判断することができる。
また、円環状のグラフの右側には、感性情報「Neutral」の下位の小分類(例えば、「質問」、「問い合わせ」及び「要望」など)が棒グラフ形式で多数、表示される。この棒グラフの場合、横軸はヒット数を示しており、この点は、以下の棒グラフにおいても同様である。
さらに、3つの大分類の割合を示す円環状のグラフの下側には、感性情報「Positive」の下位の小分類(例えば、「良い」、「買いたい」及び「感謝」など)が棒グラフ形式で多数、表示される。また、感性情報「Neutral」の棒グラフの下側には、感性情報「Negative」の下位の小分類(例えば、「悪い」、「不満」及び「困っている」など)が棒グラフ形式で多数、表示される。
これに加えて、感性情報「Positive」の棒グラフの下側には、ユーザ定義タグの大分類のカテゴリ「4輪」の下位の小分類(例えば、「N BOX(登録商標)、FIT(登録商標)及びFREED(登録商標)など)が棒グラフ形式で多数、表示される。さらに、感性情報「Negative」の棒グラフの下側には、ユーザ定義タグの大分類のカテゴリ「2輪」の下位の小分類(例えば、「CUB」、「BIO」及び「GOLD WING(登録商標)」など)が棒グラフ形式で多数、表示される。
また、図27に示す初期表示画面の感性情報「Neutral」の棒グラフにおいて、例えば、小分類「問い合わせ」の棒グラフ60がユーザ操作によってクリックされた場合、図28に示すような小分類「問い合わせ」の関連画面(以下「問い合わせ関連画面」という)が表示される。同図に示すように、この問い合わせ関連画面では、感性情報「問い合わせ」の関連語がキーワード「購入」を中心として、これに関連しかつヒット数の多い言葉がワードクラウド形式で表示される。さらに、その右側には、感性情報の有無の割合が棒グラフ形式で表示される。
一方、問い合わせ関連画面の中央の上側には、復帰ボタン62が表示されており、この復帰ボタン62がユーザ操作によって押下された場合、ディスプレイ1aに表示される画面が、問い合わせ関連画面から初期表示画面に復帰する。なお、図27に示す初期表示画面の感性情報「Neutral」の棒グラフにおいて、小分類「問い合わせ」以外の小分類(例えば「質問」)の棒グラフがクリックされた場合にも、図28と同様の画面が表示される。
さらに、図27に示す初期表示画面のユーザ定義の大分類「2輪」の棒グラフにおいて、例えば、小分類「CUB」の棒グラフ61がユーザ操作によってクリックされた場合、図29に示すような小分類「CUB」の関連画面(以下「CUB関連画面」という)が表示される。同図に示すように、このCUB関連画面では、ユーザ定義タグの小分類のカテゴリ「CUB」の関連語がキーワード「スーパーカブ(登録商標)」を中心として、これに関連しかつヒット数の多い言葉がワードクラウド形式で表示される。さらに、その右側には、感性情報の有無の割合が棒グラフ形式で表示される。
この図29に示すCUB関連画面の中央の上側にも、復帰ボタン62が表示されており、この復帰ボタン62がユーザ操作によって押下された場合、ディスプレイ1aに表示される画面が、CUB関連画面から初期表示画面に復帰する。なお、図27に示す初期表示画面の大分類「2輪」の棒グラフにおいて、小分類「CUB」以外の小分類(例えば「BIO」)の棒グラフがクリックされた場合にも、図29と同様の画面が表示される。以上のように、データ表示処理は実行される。
次に、データ表示処理が終了したか否かを判定する(図7/STEP74)。この場合、図27〜29のいずれかの画面がディスプレイ1aに表示されている状態で、画面の右上の終了ボタン63がユーザ操作によって押下されたときには、データ表示処理が終了したと判定され、それ以外のときには、データ表示処理が終了していないと判定される。
この判定が否定(図7/STEP74…NO)のときには、上述したデータ表示処理に戻る。一方、この判定が肯定(図7/STEP74…YES)で、データ表示処理が終了したときには、そのままデータ可視化処理を終了する。
以上のように、本実施形態のデータ処理装置1によれば、データ取得処理において、ユーザ操作により、所定の取得条件として、メディア、検索期間、言語及び検索キーワード&排除キーワードなどの条件が決定された後、外部サーバ4からテキストデータが取得される。そして、取得されたテキストデータが保存データとして、装置本体1bのストレージ内に記憶される。
この場合、排除キーワードとしては、検索キーワードと無関係であるにもかかわらず、検索キーワードと同一又は類似しているキーワードを含むテキストデータが外部サーバ4内に存在したとしても、そのようなテキストデータの取得を回避できるようなキーワードがユーザ操作によって入力されるので、検索キーワードに関連するテキストデータを精度よく取得することができる。
また、データクレンジング処理では、ユーザは、クレンジングキーワード画面において、不要なテキストデータが見つかった場合、不要なテキストデータに含まれる排除キーワードを選択し、クレンジングボタン25を押下することによって、排除キーワードを含む全てのテキストデータを削除して、クレンジング済みデータを作成することができる。
その際、クレンジングキーワード画面では、データファイルにおけるテキストデータが、その重複数の多いものから順に上から下に向かって表示されるので、ユーザは、テキスト情報の重複数の多いものから順に排除キーワードを選択することが可能となる。それにより、ノイズとしての排除キーワードを含むテキスト情報を、複数のテキスト情報から効率よく除去することができる。
また、クレンジングキーワード画面では、ユーザが入力した排除キーワードが表示されるので、ユーザはユーザ自身が現在までに選択した排除キーワードを視認することができる。それにより、利便性を向上させることができる。
さらに、感性情報修正処理では、感性情報とテキストデータが感性修正画面上に表示されるので、ユーザは、その表示内容を視認しながら、感性情報を容易に修正することができる。
これに加えて、ユーザ定義タグ付け処理では、テキストデータに対してユーザ定義タグを紐付けすることにより、データベースが作成されるので、ユーザ定義タグの情報に基づいて、データベースの検索などを実行することができ、データベースの有用性をさらに向上させることができる。
また、データ可視化処理では、データベースに含まれる3つの大分類の感性情報が互いに異なる色彩でかつその割合が判るように、ディスプレイ1aに表示されるので、ユーザは、3つの大分類の感性情報の割合を容易に視認することができる。
なお、実施形態は、データ処理装置として、パソコンタイプのデータ処理装置1を用いた例であるが、本発明のデータ処理装置は、これに限らず、出力インターフェース、入力インターフェース、テキスト情報取得部、ノイズ除去済み情報作成部及びデータベース作成部を備えるものであればよい。例えば、パソコンタイプのデータ処理装置1とメインサーバ2を組み合わせた構成をデータ処理装置として用いてもよい。また、タブレット端末をデータ処理装置として用いてもよく、タブレット端末とメインサーバ2を組み合わせた構成をデータ処理装置として用いてもよい。
また、実施形態は、出力インターフェースとして、ディスプレイ1aを用いた例であるが、本発明の出力インターフェースは、これに限らず、複数のテキスト情報などを表示可能なものであればよい。例えば、出力インターフェースとして、1つのモニタや、1つのタッチパネル式のモニタを用いてもよい。また、出力インターフェースとして、3Dホログラム装置や、ヘッドマウント式のVR装置を用いてもよい。
さらに、実施形態は、入力インターフェースとして、キーボード及びマウスなどで構成された入力インターフェース1cを用いた例であるが、本発明の入力インターフェースはこれに限らず、ユーザによって各種操作が実行されるものであればよい。例えば、入力インターフェースとして、レーザポインタなどの光学式ポインティングデバイスを用いてもよく、タッチパネル及びタッチペンなどの接触式のデバイスを用いてもよい。さらに、入力インターフェースとして、音声を各種操作に変換できる非接触式のデバイスを用いてもよい。
一方、実施形態は、所定の取得条件として、検索期間、検索言語、検索キーワード、排除キーワード及び付加情報などを組み合わせた条件を用いた例であるが、本発明の所定の取得条件は、これらに限らず、他の条件を用いてもよい。例えば、所定の取得条件として、上記の取得条件に、検索キーワード及び排除キーワードをさらに追加した条件を用いてもよい。
また、実施形態は、図15に示すようなクレンジングキーワード画面においてテキストデータを表示する際、完全一致のテキストデータの集合において重複数が多いものから順に表示した例であるが、完全一致のテキストデータと、1文字又は2文字違いのテキストデータ(近似の情報)とを集めたテキストデータの集合を作成し、その集合が大きいものから順に表示するように構成してもよい。
さらに、実施形態は、ノイズとして、排除キーワード(キニ速)を用いた例であるが、本発明のノイズは、これに限らず、複数のテキスト情報のそれぞれのうちの少なくとも一部であればよい。例えば、複数の単語を組み合わせたものをノイズとして用いてもよい。
一方、実施形態は、外部サーバ4によって構成されるSNSメディアなどを所定メディアとした例であるが、本発明の所定メディアはこれらに限らず、TV及びラジオなどのハードウェア、又は、新聞などの紙上で情報が公開されるマスメディアを所定メディアとしてもよい。この場合、TV、ラジオ及び新聞などのマスメディアを所定メディアとしたときには、TV、ラジオ及び新聞上に公開された情報(動画情報、音声情報及び文字情報)を、パソコンなどの入力インターフェースを介して、テキストデータとして入力すればよい。
また、実施形態は、感性情報を大分類と小分類との2段階に分別した例であるが、本発明の感性情報はこれに限らず、最上位から最下位までの複数段階の分類に分別したものであればよい。例えば、感性情報を3段階以上の分類に分別してもよい。