JP5895756B2 - 情報分類プログラム及び情報処理装置 - Google Patents

情報分類プログラム及び情報処理装置 Download PDF

Info

Publication number
JP5895756B2
JP5895756B2 JP2012158601A JP2012158601A JP5895756B2 JP 5895756 B2 JP5895756 B2 JP 5895756B2 JP 2012158601 A JP2012158601 A JP 2012158601A JP 2012158601 A JP2012158601 A JP 2012158601A JP 5895756 B2 JP5895756 B2 JP 5895756B2
Authority
JP
Japan
Prior art keywords
information
microblog
category
image
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012158601A
Other languages
English (en)
Other versions
JP2014021645A (ja
Inventor
大熊 智子
智子 大熊
加藤 典司
典司 加藤
康秀 三浦
康秀 三浦
圭悟 服部
圭悟 服部
福井 基文
基文 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012158601A priority Critical patent/JP5895756B2/ja
Priority to US13/750,538 priority patent/US8930367B2/en
Priority to AU2013201018A priority patent/AU2013201018B2/en
Publication of JP2014021645A publication Critical patent/JP2014021645A/ja
Application granted granted Critical
Publication of JP5895756B2 publication Critical patent/JP5895756B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報分類プログラム及び情報処理装置に関する。
従来の技術として、文章を入力した利用者に対して入力した文章に含まれる用語に対応した広告等を表示する情報処理装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報処理装置は、Twitter(登録商標)等のように投稿された複数の文字情報と画像情報とが混在して時系列表示されるマイクロブログにおいて、ある利用者によって入力された文章を取得し、取得した文章から自然言語処理によって用語を抽出し、抽出された用語によって利用者を分類して、当該用語に対応した広告等を利用者に対して提示する。
特開2009−193133号公報
本発明の目的は、文字情報と画像情報が任意の割合で含まれる投稿された情報を分類する情報分類プログラム及び情報処理装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の情報分類プログラム及び情報処理装置を提供する。
[1]コンピュータを、
文字情報及び/又は画像情報からなる複数の投稿された情報を取得する取得手段と、
前記複数の投稿された情報から画像情報を除いて複数の文章を含む文字情報を生成し、当該文字情報の各文章を第1のカテゴリに分類する分類手段と、
前記複数の投稿された情報から文字情報を除いた投稿された情報として画像情報を生成し、当該画像情報の各画像を第2のカテゴリに分類する分類手段と、
前記分類された文章及び前記分類された画像を、前記第1のカテゴリ及び前記第2のカテゴリに基づいて対応付ける対応付手段と、
前記対応付手段によって対応付けられた文章及び画像を分類毎に出力する出力手段として機能させるための情報分類プログラム。
[2]前記出力手段は、前記文章と前記画像をそれぞれ独立して分類毎に出力する前記[1]に記載の情報分類プログラム。
[3]前記対応付手段は、前記第1のカテゴリと前記第2のカテゴリとを総合カテゴリによって対応づける対応情報を有し、前記分類された文章及び前記分類された画像を、前記第1のカテゴリ、前記第2のカテゴリ及び前記対応情報の前記総合カテゴリに基づいて対応付ける前記[1]又は[2]に記載の情報分類プログラム。
[4] 文字情報及び/又は画像情報からなる複数の投稿された情報を取得する取得手段と、
前記複数の投稿された情報から画像情報を除いて複数の文章を含む文字情報を生成し、当該文字情報の各文章を第1のカテゴリに分類する分類手段と、
前記複数の投稿された情報から文字情報を除いた投稿された情報として画像情報を生成し、当該画像情報の各画像を第2のカテゴリに分類する分類手段と、
前記分類された文章及び前記分類された画像を、前記第1のカテゴリ及び前記第2のカテゴリに基づいて対応付ける対応付手段と、
前記対応付手段によって対応付けられた文章及び画像を分類毎に出力する出力手段とを有する情報処理装置。
請求項1又は4に係る発明によれば、文字情報と画像情報が任意の割合で含まれる投稿された情報を分類することができる。
請求項2に係る発明によれば、文章と画像をそれぞれ独立して分類毎に出力することができる。
請求項3に係る発明によれば、総合カテゴリに対応付けられた第1のカテゴリに属する文章と、第2のカテゴリに属する画像を対応付けることができる。
図1は、本発明の第1の実施の形態に係るマイクロブログ分類システムの構成の一例を示すブロック図である。 図2は、マイクロブログ分類サーバの構成の一例を示すブロック図である。 図3は、マイクロブログ情報の構成の一例を示す概略図である。 図4は、マイクロブログ文字情報の構成の一例を示す概略図である。 図5は、マイクロブログ画像情報の構成の一例を示す概略図である。 図6は、マイクロブログ文字情報分類結果の構成の一例を示す概略図である。 図7は、マイクロブログ画像情報分類結果の構成の一例を示す概略図である。 図8は、マイクロブログ情報分類結果の構成の一例を示す概略図である。 図9は、マイクロブログ分類システムの動作の一例を示すフローチャートである。 図10は、マイクロブログ情報分類結果に基づいて作成されたウェブページ情報が表示処理された表示画面の一例を示す概略図である。 図11は、第2の実施の形態に係るマイクロブログ分類サーバの構成の一例を示すブロック図である。 図12は、カテゴリ対応情報の構成の一例を示す概略図である。
[第1の実施の形態]
(マイクロブログ分類システムの構成)
図1は、本発明の第1の実施の形態に係るマイクロブログ分類システムの構成の一例を示す概略図である。
このマイクロブログ分類システム6は、マイクロブログ分類サーバ1、マイクロブログサーバ2、ウェブサーバ3、端末4を有し、ネットワーク5で各装置を互いに通信可能に接続する。ここで、マイクロブログ(Microblog)とは、投稿(送信)された複数の文字情報と画像情報とが混在して時系列表示されるものであり、具体的には、マイクロブログサーバ2に記憶されるマイクロブログ情報を端末4等の情報処理装置で表示処理することで表示されるものである。以下において、マイクロブログに投稿された情報の単位を簡単のため「投稿情報」と呼び、投稿情報には文字情報及び画像情報、文字情報のみ、画像情報のみが含まれる場合があるものとする。つまり、マイクロブログ情報は複数の投稿情報を有する。
マイクロブログ分類サーバ1は、情報を処理するための機能を備えたCPU(Central Processing Unit)や記憶部等の電子部品を備える情報処理装置であり、マイクロブログサーバ2からマイクロブログ情報を取得して、投稿情報中に含まれる複数の文字情報と画像情報をカテゴリ毎に分類する。
マイクロブログサーバ2は、情報を処理するための機能を備えたCPUや記憶部等の電子部品を備える情報処理装置であり、端末4等から送信された文章等の文字情報及び/又は写真等の静止画や動画に関する画像情報(投稿情報)を受け付けて、これらの投稿情報を時系列表示するためのマイクロブログ情報を生成する。また、マイクロブログサーバ2は、端末4からマイクロブログ情報の閲覧要求を受け付けると、マイクロブログ情報を端末4へ送信する。なお、投稿情報中の画像情報には、静止画や動画に関する情報を直接含むものの他、静止画や動画に関する情報が格納されているリンク先情報を含むものとする。また、投稿情報中の文字情報は、文章に関する情報を直接含むものの他、テキストファイルやHTMLファイル等の情報が格納されているリンク先情報を含むものであってもよい。
ウェブサーバ3は、情報を処理するための機能を備えたCPUや記憶部等の電子部品を備える情報処理装置であり、記憶部にHTMLファイル等のウェブページを表示するためのウェブページ情報を記憶して、端末4からウェブページの閲覧要求を受け付けると、ウェブページ情報を端末4へ送信する。なお、ウェブページ情報は、後述するようにマイクロブログ分類サーバ1が生成する分類結果情報に基づいて生成されるものである。
端末4は、操作入力用のタッチパネル等の操作部と、タッチパネル下に設けられた液晶ディスプレイ等の表示部と、CPUや記憶部等の電子部品を有する制御部とを備える。端末4は、利用者の操作に応じてマイクロブログサーバ2に対して文章や画像等の投稿情報を送信することでマイクロブログに投稿する。また、端末4は、利用者の操作に応じてマイクロブログサーバ2にマイクロブログの閲覧要求を送信し、当該閲覧要求の結果、マイクロブログサーバ2からマイクロブログ情報を受信するとマイクロブログの投稿情報に含まれる文章や画像(静止画又は動画)を表示部に表示する。
また、端末4は、利用者の操作に応じてウェブサーバ3にウェブページの閲覧要求を送信し、当該閲覧要求の結果、ウェブサーバ3からウェブページに対応したウェブページ情報を受信すると、当該情報を表示処理してウェブページを表示部に表示する。
なお、端末4は、例えば、携帯電話機であり、その他にPDA(Personal Digital Assistant)、パーソナルコンピュータ等を用いることもできる。また、端末4は、同図では1台を図示するが、複数台でもよい。
ネットワーク5は、インターネット、LAN(Local Area Network)等の通信網であり、有線、無線は問わない。
(マイクロブログ分類サーバの構成)
図2は、マイクロブログ分類サーバ1の構成の一例を示すブロック図である。
このマイクロブログ分類サーバ1は、CPU等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記録媒体から構成され情報を記憶する記憶装置の一例としての記憶部11と、ネットワーク5を介して外部と通信する通信部12とを備える。
制御部10は、後述するマイクロブログ分類プログラム110を実行することで、マイクロブログ情報取得手段100、文字情報分類手段101、画像情報分類手段102、カテゴリ対応付手段103及び分類結果出力手段104等として機能する。
マイクロブログ情報取得手段100は、マイクロブログサーバ2からマイクロブログ情報111を取得し、記憶部11に記憶する。なお、マイクロブログ情報111は、マイクロブログサーバ2に蓄積されたマイクロブログ情報のすべてを取得するものであってもよいし、予め定めた期間や、予め定めたキーワード等によりフィルタリングされたものを取得するものであってもよい。マイクロブログ情報111の取得方法については後述する。
文字情報分類手段101は、マイクロブログ情報取得手段100が取得したマイクロブログ情報111の各投稿情報から画像情報を省いたもの、つまり文字情報のみをマイクロブログ文字情報112とし、さらにマイクロブログ文字情報112の各文字情報をカテゴリ毎に分類し、マイクロブログ文字情報分類結果114として記憶部11に記憶する。
なお、文字情報分類手段101は、分類方法の一例として、予め各カテゴリに属する文章について複数の単語の各々の出現有無を判定し、当該出現有無を要素とする特徴ベクトルを生成することで学習しておき、分類対象の文字情報についても同様に特徴ベクトルを生成して、学習結果の特徴ベクトルと比較することにより各カテゴリに属するか判定することで分類する。
画像情報分類手段102は、マイクロブログ情報取得手段100が取得したマイクロブログ情報111の各投稿情報から文字情報を省いたもの、つまり画像情報のみをマイクロブログ画像情報113とし、さらにマイクロブログ画像情報113の各画像をカテゴリ毎に分類し、マイクロブログ画像情報分類結果115として記憶部11に記憶する。
なお、画像情報分類手段102は、分類方法の一例として、各カテゴリに関連する画像の特徴情報を生成して予め学習しておき、分類対象の画像情報の特徴情報を生成して、学習結果の特徴情報と比較することにより各カテゴリに属するか判定することで分類する。
カテゴリ対応付手段103は、マイクロブログ文字情報分類結果114と、マイクロブログ画像情報分類結果115とを、文字情報分類手段101及び画像情報分類手段102が分類したカテゴリに基づいて対応付けてマイクロブログ情報分類結果116として記憶部11に記憶する。
分類結果出力手段104は、マイクロブログ情報分類結果116を外部の一例としてウェブサーバ3へと出力する。
記憶部11は、マイクロブログ分類プログラム110、マイクロブログ情報111、マイクロブログ文字情報112、マイクロブログ画像情報113、マイクロブログ文字情報分類結果114、マイクロブログ画像情報分類結果115及びマイクロブログ情報分類結果116等を格納する。
マイクロブログ分類プログラム110は、制御部10を上記した各手段100〜104として動作させるプログラムである。
図3は、マイクロブログ情報111の構成の一例を示す概略図である。
マイクロブログ情報111は、一例として時系列順に付与された識別子を示すマイクロブログID欄と、投稿情報として入力された文章、画像(静止画又は動画)が格納された図示しない他のサーバのURL又は文章とURLとからなる内容を示す内容欄とを有する。なお、内容欄のURLに代えて静止画や動画に関する情報を直接含むものであってもよい。
なお、各内容は本来、ユーザIDを有する利用者によって投稿されたものであり、また投稿された時刻を示す時刻情報を含むものであるが、ここではユーザID及び時刻情報を省略して表示している。
図4は、マイクロブログ文字情報112の構成の一例を示す概略図である。
マイクロブログ文字情報112は、図3に示すマイクロブログID欄と共通のマイクロブログID欄と、投稿情報として入力された文章からなる内容を示す文字内容欄とを有する。
つまり、マイクロブログ文字情報112は、マイクロブログ情報111から画像が格納されたURLのみの投稿情報を削除し、URLを含む投稿情報のURLを削除したものである。
図5は、マイクロブログ画像情報113の構成の一例を示す概略図である。
マイクロブログ画像情報113は、図3に示すマイクロブログID欄と共通のマイクロブログID欄と、投稿情報として入力されたURLに格納された実際の画像情報を示す画像内容欄とを有する。
つまり、マイクロブログ画像情報113は、マイクロブログ情報111から文章のみの投稿情報を削除し、画像が格納されたURLから画像情報を取得したものである。
図6は、マイクロブログ文字情報分類結果114の構成の一例を示す概略図である。
マイクロブログ文字情報分類結果114は、図3に示すマイクロブログID欄と共通のマイクロブログID欄と、図4に示す文字内容欄と共通の文字内容欄と、文字内容欄の文章から分類された結果としてのカテゴリ名を示すカテゴリ欄とを有する。
図7は、マイクロブログ画像情報分類結果115の構成の一例を示す概略図である。
マイクロブログ画像情報分類結果115は、図3に示すマイクロブログID欄と共通のマイクロブログID欄と、図5に示す画像内容欄と共通の画像内容欄と、画像内容欄の画像情報から分類された結果のカテゴリ名を示すカテゴリ欄とを有する。
図8は、マイクロブログ情報分類結果116の構成の一例を示す概略図である。
マイクロブログ情報分類結果は、図3に示すマイクロブログID欄と共通のマイクロブログID欄と、図5に示す画像内容欄と共通の画像内容欄と、図4に示す文字内容欄と共通の文字内容欄と、図6及び図7に示すカテゴリ欄と共通のカテゴリ欄を有する。
(マイクロブログ分類システムの動作)
次に、本実施の形態の作用を、(1)基本動作、(2)マイクロブログ情報取得動作、(3)マイクロブログ分類動作、(4)分類結果出力動作に分けて説明する。
(1)基本動作
まず、端末4の利用者は、端末4においてマイクロブログに投稿情報を送信するための操作を行う。
端末4は、利用者の操作に応じて、マイクロブログサーバ2に対して文章や画像等を含む投稿情報を送信することでマイクロブログに投稿する。
マイクロブログサーバ2は、端末4から投稿情報を受信することでマイクロブログ情報を蓄積していく。
また、端末4の利用者は、端末4においてマイクロブログの閲覧のための操作を行う。
端末4は、利用者の操作に応じて、マイクロブログサーバ2に対してマイクロブログ情報の閲覧要求を送信する。
マイクロブログサーバ2は、端末4に対してマイクロブログ情報を送信する。
端末4は、マイクロブログサーバ2からマイクロブログ情報を受信するとマイクロブログの文章や画像を表示部に表示する。
一方、ウェブサーバ3の管理者は、ウェブサーバ3に設置するウェブページを作成する材料としての情報を、マイクロブログ分類サーバ1に要求する。なお、ウェブサーバ3が定期的にマイクロブログ分類サーバ1に要求するものであってもよい。
マイクロブログ分類サーバ1は、要求に応じて以下のように動作する。
図9は、マイクロブログ分類システムの動作の一例を示すフローチャートである。
(2)マイクロブログ情報取得動作
まず、マイクロブログ情報取得手段100は、マイクロブログサーバ2から対象とするマイクロブログ情報111を取得する(S1)。
マイクロブログ情報取得手段100は、マイクロブログ情報111としてマイクロブログサーバ2のすべてのマイクロブログ情報を取得してもよいが、その一部を取得することで後述する処理の負担を軽減することができる。マイクロブログ情報の一部を取得する方法は、一例として、以下のようなものが挙げられる。
まず、マイクロブログ情報取得手段100は、ウェブサーバ3の内容に関連するキーワードを複数指定する。
次に、マイクロブログ情報取得手段100は、複数のキーワードから選択した一のキーワードを含む投稿情報を検索する。
次に、マイクロブログ情報取得手段100は、検索された当該投稿情報のユーザを特定し、特定したユーザの投稿情報のうち、予め定めた期間の投稿情報から指定された他のキーワードを含む投稿情報を検索する。次に、一のキーワードを含む投稿情報から他のキーワードを含む投稿情報までの一連の投稿情報を取得する。
上記したようにマイクロブログサーバ2のマイクロブログ情報の一部を取得することで、あるキーワードに対してあるユーザが送信した投稿情報の一連のマイクロブログ情報を取得することができる。
(3)マイクロブログ分類動作
次に、文字情報分類手段101は、図3に示すマイクロブログ情報111の投稿情報から画像情報を省いたもの、つまり文字情報のみを図4に示すマイクロブログ文字情報112とする(S2)。図3に示す例では、画像情報の格納先であるURLを削除している。
さらに文字情報分類手段101は、図4に示すマイクロブログ文字情報112の各文字情報をカテゴリ毎に分類し、図6に示すようにマイクロブログ文字情報分類結果114として記憶部11に記憶する(S3)。
一方、画像情報分類手段102は、図3に示すマイクロブログ情報取得手段100が取得したマイクロブログ情報111から文字情報を省いたもの、つまり画像情報のみを図5に示すマイクロブログ画像情報113とする(S4)。図4に示す例では、文字情報を削除し、格納先であるURLから画像情報を取得している。
さらに画像情報分類手段102は、図4に示すマイクロブログ画像情報113の各画像をカテゴリ毎に分類し、図7に示すようにマイクロブログ画像情報分類結果115として記憶部11に記憶する。
次に、カテゴリ対応付手段103は、図6に示すマイクロブログ文字情報分類結果114と、図7に示すマイクロブログ画像情報分類結果115とを、カテゴリ欄に示されたカテゴリに基づいて対応付け、図8に示すマイクロブログ情報分類結果116として記憶部11に記憶する。
(4)分類結果出力動作
次に、分類結果出力手段104は、マイクロブログ情報分類結果116をウェブサーバ3へと出力する(S7)。
ウェブサーバ3は、マイクロブログ情報分類結果116に基づいてウェブページを作成する。
なお、上記した「(2)マイクロブログ情報取得動作」、「(3)マイクロブログ分類動作」は予め定められた時間間隔で、又はマイクロブログサーバ2のマイクロブログ情報が更新される度に実行してもよく、その場合にはマイクロブログ分類サーバ1からマイクロブログ情報分類結果116が逐次ウェブサーバ3に送信される。また、ウェブサーバ3は、マイクロブログ情報分類結果116を受信する度にウェブページの内容を更新するものとする。
一方、端末4は、ウェブサーバ3にウェブページの閲覧要求を送信する。ウェブサーバ3は、閲覧要求に応じて端末4にウェブページに対応するウェブページ情報を送信する。
端末4は、ウェブサーバ3からウェブページ情報を受信すると、当該ウェブページ情報を表示処理してウェブページを表示部に表示する。
図10は、マイクロブログ情報分類結果116に基づいて作成されたウェブページ情報が表示処理された表示画面の一例を示す概略図である。
ウェブページ表示画面40は、一例として過去の花火大会の様子を伝えるものであり、タイトル400と、文字情報分類手段101及び画像情報分類手段102が分類したカテゴリ毎に、画像情報が表示される画像表示領域401a、402a…と、文字情報が表示される文字表示領域401b、402b…とを有する。
なお、ウェブサーバ3は、マイクロブログ情報分類結果116を受信する度にウェブページ情報の内容を更新するが、画像表示領域401a、402a…と、文字表示領域401b、402b…とは、それぞれ独立して更新されるものであってもよい。これは、一般的に現在運用されているマイクロブログにおいては、文字情報の数に対する画像情報の数が少ない場合が多いためである。つまり、分類したカテゴリ毎の、画像情報の数(例えば、静止画の数)と文字情報の数(文章として入力された投稿情報の数)とは異なり、同時に更新すると文字情報の表示に要する文字表示領域401b、402b…が画像情報の表示に要する画像表示領域401a、402a…に比べて大きいものとなり、バランスを欠くためである。
従って、画像情報と文字情報とで表示の更新タイミングを異なるものにしてもよい。この場合、画像情報の表示更新タイミングを文字情報の表示更新タイミングに比べて遅く設定することで上記問題に対応することができる。また、この逆に設定してもよい。
これは、例えば、カテゴリ「花火」の画像情報として100の画像が分類されて、カテゴリ「花火」の文書情報として、1000の文字情報が分類された場合に、画像情報の表示更新タイミングを文書情報の表示更新タイミングよりも遅くする(例えば、10倍の時間かけて更新する)ことで、文字表示領域401b、402b…と画像表示領域401a、402a…の表示のバランスを維持することができる。
また、ウェブサーバ3のウェブページの種類は特に限定されるものではなく、図10に示したような過去イベントのレポートの他、一例として、イベントの実行委員が閲覧する苦情レポート、何らかのキーワードに関するまとめサイト等が挙げられる。
(実施の形態の効果)
上記した第1の実施の形態によると、マイクロブログ情報111をマイクロブログ文字情報112とマイクロブログ画像情報113とに分けて、マイクロブログ文字情報112とマイクロブログ画像情報113とについてそれぞれカテゴリに分類し、カテゴリ毎にマイクロブログ文字情報112とマイクロブログ画像情報113とを対応づけしたため、投稿情報中に複数の文字情報と画像情報とが混在して時系列表示される情報を分類することができる。
また、文章と画像URLが一つの投稿情報に含まれている場合等に、文章と画像URLとを含む投稿情報を分類結果として表示すると、文章のカテゴリと画像のカテゴリが必ずしも一致しないが、この場合に比べて、文字情報と画像情報との内容的な一致の精度を向上することができる。
[第2の実施の形態]
図11は、第2の実施の形態に係るマイクロブログ分類サーバの構成の一例を示すブロック図である。第1の実施の形態と同一の構成については、同一の符号を付している。
第2の実施の形態に係るマイクロブログ分類サーバ1Aは、第1の実施の形態のマイクロブログ分類サーバ1の構成にカテゴリ対応情報117を追加したものである。また、カテゴリ対応付手段103の動作が異なるものである。
図12は、カテゴリ対応情報117の構成の一例を示す概略図である。
カテゴリ対応情報117は、文字情報のカテゴリと画像情報のカテゴリを対応付けるカテゴリを示す総合カテゴリ欄と、マイクロブログ文字情報112が分類されるカテゴリを示す文字情報カテゴリ欄と、マイクロブログ画像情報113が分類されるカテゴリを示す画像情報カテゴリ欄とを有する。
(第2の実施の形態の動作)
第2の実施の形態の動作は、以下に示す動作以外については第1の実施の形態の動作と同様であるため、説明を省略する。
カテゴリ対応付手段103は、図6に示すマイクロブログ文字情報分類結果114と、図7に示すマイクロブログ画像情報分類結果115とを、カテゴリ欄に示されたカテゴリ及びカテゴリ対応情報117に基づいて対応付け、マイクロブログ情報分類結果116として記憶部11に記憶する。
例えば、画像情報は画像解析によって分類されるものであるため、「邪魔」や「残念」という主観的なカテゴリには分類されず「行列」のような客観的なカテゴリに分類され、第1の実施の形態では「邪魔」や「残念」等のカテゴリに分類された文字情報とは直接的には対応付けられることはないが、第2の実施の形態においては、「行列」のカテゴリに分類された画像情報と、「邪魔」や「残念」等のカテゴリに分類された文字情報とは、総合カテゴリが「ネガティブ」と設定されている場合には、同一のカテゴリとして対応づけられる。
(第2の実施の形態の効果)
上記した第2の実施の形態によると、カテゴリ対応付手段103が文字情報と画像情報とを対応付ける際に、カテゴリの完全一致に代えてカテゴリ対応情報117に基づいて対応付ける構成としたため、第1の実施の形態に比べて上位概念化したカテゴリによりマイクロブログを分類することができる。
なお、カテゴリ対応付手段103は、カテゴリ以外のパラメータにより画像情報と文字情報とを対応付けるものであってもよい。例えば、画像情報と文字情報とが時間情報を有する場合、当該時間情報が互いに一定時間内のものを対応付けの条件に用いても良い。また、画像情報と文字情報とがユーザ情報を有する場合、当該ユーザ情報が一致するものを対応付けの条件に用いても良い。また、画像情報と文字情報とがGPS情報等の場所情報を有する場合、当該場所情報が一致するものを対応付けの条件に用いても良い。
また、文字情報分類手段101及び画像情報分類手段102は、カテゴリとの関連性をスコアによって数値化してもよく、カテゴリ対応付手段103は、スコアに基づいて文字情報分類手段101及び画像分類手段102を対応付してもよい。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。例えば、マイクロブログとしてはTwitterに限らず、Facebook(登録商標)等のように比較的短い文章が投稿されるものであって、文字情報と画像情報(静止画、動画やこれらの情報のリンク先情報も含む)が混在し、それらが時系列で大量に表示されるようなものであれば種類を問わない。また、投稿情報としてメールのメッセージ等を対象としてもよい。
上記実施の形態では制御部10内の各手段100−104の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1、1A マイクロブログ分類サーバ
2 マイクロブログサーバ
3 ウェブサーバ
4 端末
5 ネットワーク
6 マイクロブログ分類システム
10 制御部
11 記憶部
12 通信部
40 ウェブページ表示画面
100 マイクロブログ情報取得手段
101 文字情報分類手段
102 画像情報分類手段
103 カテゴリ対応付手段
104 分類結果出力手段
110 マイクロブログ分類プログラム
111 マイクロブログ情報
112 マイクロブログ文字情報
113 マイクロブログ画像情報
114 マイクロブログ文字情報分類結果
115 マイクロブログ画像情報分類結果
116 マイクロブログ情報分類結果
117 カテゴリ対応情報
400 タイトル
401a 画像表示領域
401b 文字表示領域

Claims (4)

  1. コンピュータを、
    文字情報及び/又は画像情報からなる複数の投稿された情報を取得する取得手段と、
    前記複数の投稿された情報から画像情報を除いて複数の文章を含む文字情報を生成し、当該文字情報の各文章を第1のカテゴリに分類する分類手段と、
    前記複数の投稿された情報から文字情報を除いた投稿された情報として画像情報を生成し、当該画像情報の各画像を第2のカテゴリに分類する分類手段と、
    前記分類された文章及び前記分類された画像を、前記第1のカテゴリ及び前記第2のカテゴリに基づいて対応付ける対応付手段と、
    前記対応付手段によって対応付けられた文章及び画像を分類毎に出力する出力手段として機能させるための情報分類プログラム。
  2. 前記出力手段は、前記文章と前記画像をそれぞれ独立して分類毎に出力する請求項1に記載の情報分類プログラム。
  3. 前記対応付手段は、前記第1のカテゴリと前記第2のカテゴリとを総合カテゴリによって対応づける対応情報を有し、前記分類された文章及び前記分類された画像を、前記第1のカテゴリ、前記第2のカテゴリ及び前記対応情報の前記総合カテゴリに基づいて対応付ける請求項1又は2に記載の情報分類プログラム。
  4. 文字情報及び/又は画像情報からなる複数の投稿された情報を取得する取得手段と、
    前記複数の投稿された情報から画像情報を除いて複数の文章を含む文字情報を生成し、当該文字情報の各文章を第1のカテゴリに分類する分類手段と、
    前記複数の投稿された情報から文字情報を除いた投稿された情報として画像情報を生成し、当該画像情報の各画像を第2のカテゴリに分類する分類手段と、
    前記分類された文章及び前記分類された画像を、前記第1のカテゴリ及び前記第2のカテゴリに基づいて対応付ける対応付手段と、
    前記対応付手段によって対応付けられた文章及び画像を分類毎に出力する出力手段とを有する情報処理装置。
JP2012158601A 2012-07-17 2012-07-17 情報分類プログラム及び情報処理装置 Expired - Fee Related JP5895756B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012158601A JP5895756B2 (ja) 2012-07-17 2012-07-17 情報分類プログラム及び情報処理装置
US13/750,538 US8930367B2 (en) 2012-07-17 2013-01-25 Non-transitory computer-readable medium, information classification method, and information processing apparatus
AU2013201018A AU2013201018B2 (en) 2012-07-17 2013-02-22 Information classification program, information classification method, and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012158601A JP5895756B2 (ja) 2012-07-17 2012-07-17 情報分類プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2014021645A JP2014021645A (ja) 2014-02-03
JP5895756B2 true JP5895756B2 (ja) 2016-03-30

Family

ID=49947440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012158601A Expired - Fee Related JP5895756B2 (ja) 2012-07-17 2012-07-17 情報分類プログラム及び情報処理装置

Country Status (3)

Country Link
US (1) US8930367B2 (ja)
JP (1) JP5895756B2 (ja)
AU (1) AU2013201018B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311568B1 (en) * 2014-05-21 2016-04-12 Yummly, Inc. Recipe text and image extraction
US9984100B2 (en) * 2015-09-29 2018-05-29 International Business Machines Corporation Modification of images and associated text
US10409814B2 (en) * 2017-01-26 2019-09-10 International Business Machines Corporation Network common data form data management
US10817515B2 (en) * 2017-07-26 2020-10-27 International Business Machines Corporation Cognitive data filtering for storage environments

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3067966B2 (ja) 1993-12-06 2000-07-24 松下電器産業株式会社 画像部品を検索する装置及びその方法
US20010012062A1 (en) * 1998-07-23 2001-08-09 Eric C. Anderson System and method for automatic analysis and categorization of images in an electronic imaging device
US20060136467A1 (en) * 2004-12-17 2006-06-22 General Electric Company Domain-specific data entity mapping method and system
US7640218B2 (en) * 2005-01-18 2009-12-29 Fuji Xerox Co., Ltd. Efficient methods for temporal event clustering of digital photographs
US20090276500A1 (en) * 2005-09-21 2009-11-05 Amit Vishram Karmarkar Microblog search engine system and method
US7930647B2 (en) * 2005-12-11 2011-04-19 Topix Llc System and method for selecting pictures for presentation with text content
US7751592B1 (en) 2006-01-13 2010-07-06 Google Inc. Scoring items
JP5182854B2 (ja) * 2007-09-07 2013-04-17 富岳通運株式会社 イベント管理システム
JP2009193133A (ja) 2008-02-12 2009-08-27 C2Cube Inc 情報処理装置、情報処理方法、およびプログラム
US8724007B2 (en) * 2008-08-29 2014-05-13 Adobe Systems Incorporated Metadata-driven method and apparatus for multi-image processing
US8542950B2 (en) * 2009-06-02 2013-09-24 Yahoo! Inc. Finding iconic images
US8478052B1 (en) * 2009-07-17 2013-07-02 Google Inc. Image classification
JP2011129009A (ja) 2009-12-21 2011-06-30 Cybird Co Ltd 短文コミュニケーション方法
US20120084323A1 (en) * 2010-10-02 2012-04-05 Microsoft Corporation Geographic text search using image-mined data
JP2012079166A (ja) 2010-10-04 2012-04-19 Fujifilm Imagetec Co Ltd 情報表示システム
US20120109754A1 (en) * 2010-11-03 2012-05-03 Microsoft Corporation Sponsored multi-media blogging
US8732584B2 (en) * 2010-11-09 2014-05-20 Palo Alto Research Center Incorporated System and method for generating an information stream summary using a display metric
EP2664998B1 (en) * 2011-01-11 2022-03-09 Tencent Technology (Shenzhen) Company Limited Microblog message processing method and device thereof
US20130159277A1 (en) * 2011-12-14 2013-06-20 Microsoft Corporation Target based indexing of micro-blog content
US9645724B2 (en) * 2012-02-01 2017-05-09 Facebook, Inc. Timeline based content organization
US9098532B2 (en) * 2012-11-29 2015-08-04 International Business Machines Corporation Generating alternative descriptions for images
US20140164371A1 (en) * 2012-12-10 2014-06-12 Rawllin International Inc. Extraction of media portions in association with correlated input

Also Published As

Publication number Publication date
US20140025682A1 (en) 2014-01-23
AU2013201018B2 (en) 2014-08-28
AU2013201018A1 (en) 2014-02-06
JP2014021645A (ja) 2014-02-03
US8930367B2 (en) 2015-01-06

Similar Documents

Publication Publication Date Title
US9390144B2 (en) Objective and subjective ranking of comments
JP6388988B2 (ja) オンライン・ソーシャル・ネットワークにおける検索クエリのための静的ランク付け
US10621274B2 (en) Dynamic arrangement of content presented while a client device is in a locked state
JP2017182828A (ja) オンライン・ソーシャル・ネットワークにおける検索クエリの書き換え
JP6184840B2 (ja) 情報処理装置及び表示優先度決定方法
US20140136517A1 (en) Apparatus And Methods for Providing Search Results
JP2017076162A (ja) 情報処理装置、情報処理方法及びプログラム
JP5895756B2 (ja) 情報分類プログラム及び情報処理装置
JP5895777B2 (ja) 情報分類プログラム及び情報処理装置
JP5880350B2 (ja) 情報検索プログラム及び情報検索装置
JP5416253B2 (ja) 関連コンテンツ検索装置及び関連コンテンツ検索方法
US20230300091A1 (en) Machine learning based supervised user experience for an application monitored by multiple secondary applications
JP5407336B2 (ja) 情報処理装置
KR20150045236A (ko) 스크랩 정보 관리 방법 및 장치
JP5415499B2 (ja) 情報表示装置、方法及びプログラム
JP5014386B2 (ja) コンテンツ検索装置
JP2013238939A (ja) 推奨検索語提示システム
JP2013073474A (ja) 情報処理装置及び情報処理方法
JP5955610B2 (ja) ウェブページ提供装置
KR20200125407A (ko) 언어 단위를 이용한 여행지 추천 항목 관리 방법 및 장치
JP2012103750A (ja) 文字変換装置、文字変換システム、文字変換方法及びプログラム
JP2020080078A (ja) コンテンツ表示端末、コンテンツ管理サーバ、コンテンツ表示プログラム、コンテンツ管理プログラム
JP2011242892A (ja) 情報投稿閲覧システム、キーワード管理装置、情報投稿閲覧方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5895756

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees