JP2008102790A - 検索システム - Google Patents

検索システム Download PDF

Info

Publication number
JP2008102790A
JP2008102790A JP2006285485A JP2006285485A JP2008102790A JP 2008102790 A JP2008102790 A JP 2008102790A JP 2006285485 A JP2006285485 A JP 2006285485A JP 2006285485 A JP2006285485 A JP 2006285485A JP 2008102790 A JP2008102790 A JP 2008102790A
Authority
JP
Japan
Prior art keywords
document
vector
feature vector
search
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006285485A
Other languages
English (en)
Other versions
JP4853915B2 (ja
Inventor
Tadashi Yanagihara
正 柳原
Hajime Hattori
元 服部
Fumiaki Sugaya
史昭 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2006285485A priority Critical patent/JP4853915B2/ja
Publication of JP2008102790A publication Critical patent/JP2008102790A/ja
Application granted granted Critical
Publication of JP4853915B2 publication Critical patent/JP4853915B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のドキュメントを統合したドキュメント集合を検索キーとして、このドキュメント集合に関連したドキュメントやドキュメント制作者を検索できる検索システムを提供する。
【解決手段】ブログやホームページ等のドキュメントを解析して、その特徴ベクトルを生成するドキュメント解析部4と、検索対象の各ドキュメントの特徴ベクトルを管理するドキュメント管理部2と、ドキュメント集合を構成する複数のドキュメントの特徴ベクトルに基づいてドキュメント集合の特徴ベクトルを生成するドキュメント集合ベクトル生成部6と、ドキュメント集合の特徴ベクトルを検索キーとしてドキュメント管理部2を検索し、ドキュメント集合に関連したドキュメントを抽出する検索部7と、検索結果を出力する検索結果出力部8とを含む。
【選択図】図1

Description

本発明は検索システムに係り、特に、複数のドキュメントを統合したドキュメント集合を検索キーとして、このドキュメント集合に関連したドキュメント制作者や、この制作者により制作されたドキュメントを検索する検索システムに関する。
近年、ホームページなどのウェブドキュメントが急速に増加している。大量のウェブドキュメントの中から所望のウェブドキュメントを探す場合、ユーザは、興味と関連したキーワードを検索エンジンに入力することでウェブを検索していた。
また、近年においてブログなどに代表される、個人に関する出来事を記したウェブドキュメントが急増している。これはブログ制作者(ブロガー)の身の回りの出来事や意見などを日記風にまとめ、高頻度で更新するという特徴を持つ。上述の検索エンジンを用いて興味があるキーワードなどを検索することで、同じ嗜好や興味対象を持ったブロガーのウェブドキュメントを発見することが可能となり、結果として同じ興味を持ったユーザを発見することが可能となる。
既存のキーワードベースの検索エンジンでは、キーワードを入力すると、このキーワードを含むドキュメントを検索結果として返す方式を採用しているため、文書を検索キーとして他の文書を発見する検索には有効ではない。例えば、お気に入りのブログなど、特定の文章を検索対象として検索エンジンに入力した場合、現在の検索エンジンでは、全く同じ文章を含んだドキュメントは発見できるが、関連しているドキュメントを発見することができない。
このような技術課題に対して、特許文献1には、複数の参照文書からなる参照文書集合を構成する文書の特徴を要素とするベクトルデータを生成し、また、複数の検索対象文書からなる検索対象文書集合を構成する文書の特徴を要素とするベクトルデータを生成し、参照文書集合のベクトルデータと検索対象文書集合のベクトルデータとの類似度に基づいて、参照文書集合に類似する文書集合を検索する技術が開示されている。
特開2001−249951号公報
上記した特許文献1によれば、検索ユーザが自身で制作したウェブサイトやブログの集合を参照文書集合とすることで、検索ユーザが興味を示している分野の文書集合を検索できるかもしれない。しかしながら、そのような文書量は膨大になるために所望する文書を見つけ出すことは難しい。
一方、検索ユーザが自身で制作したウェブサイトやブログの集合を参照文書集合として、これに関連するウェブサイトやブログの制作者を検索できれば、所望の文書を正確かつ簡単に見つけ出すことができる。しかしながら、上記した従来の検索方法では、参照文書集合に関連した検索対象文書集合は検索できるものの、その制作者や執筆者を検索することができなかった。
本発明の目的は、上記した従来技術の課題を解決し、複数のドキュメントを統合したドキュメント集合を検索キーとして、このドキュメント集合に関連したドキュメントの制作者や管理者を簡単に検索できる検索システムを提供することにある。
上記した目的を達成するために、本発明は、ドキュメントの集合を検索キーとして、このドキュメント集合に関連した情報を検索する検索システムにおいて、以下のような構成を備えた点に特徴がある。
(1)ドキュメントを解析して、その特徴ベクトルを生成するドキュメント解析手段と、検索対象の各ドキュメントの特徴ベクトルを管理するドキュメント管理手段と、制作者および/または管理者が同一のドキュメントの特徴ベクトルに基づいて制作者の特徴ベクトルを生成する手段と、前記制作者の特徴ベクトルを管理する制作者管理手段と、ドキュメント集合を構成する複数のドキュメントの特徴ベクトルに基づいてドキュメント集合の特徴ベクトルを生成する手段と、ドキュメント集合の特徴ベクトルを検索キーとして前記制作者管理手段を検索し、前記ドキュメント集合に関連した制作者のドキュメントを抽出する検索手段と、検索結果を出力する検索結果出力手段とを含むことを特徴とする。
(2)検索対象の各ドキュメントが更新されたか否かを監視するドキュメント監視手段をさらに含み、ドキュメント解析手段は、更新されたドキュメントを解析し、その解析結果に基づいて、前記ドキュメント管理手段に既登録の特徴ベクトルを更新することを特徴とする。
(3)制作者の特徴ベクトルを生成する手段は、制作者および/または管理者が同一の複数のドキュメントを前記ドキュメント解析手段で解析して生成された複数の特徴ベクトルを統合して制作者の特徴ベクトルを生成し、検索対象の各ドキュメントが最後に更新されてからの経過期間に基づいて、経過時間が長くなるほど減少する減衰係数α(0≦α≦1)を算出し、制作者が同一である各ドキュメントの特徴ベクトルの重みに前記減衰係数αを乗じることを特徴とする。
(4)ドキュメント解析手段は、各ドキュメントから顔文字を抽出する顔文字抽出手段と、感情別に多数の顔文字の感情割合が登録された複数の顔文字辞書と、抽出された顔文字が各顔文字辞書に既登録であるか否かに基づいて、ドキュメントの感情ベクトルを生成する手段とを含み、感情ベクトルをドキュメントの特徴ベクトルとすることを特徴とする。
本発明によれば、以下のような効果が達成される。
(1)検索対象のドキュメントを、その制作者や管理者で予めグループ化しておき、検索キーとしてのドキュメント集合と各グループのドキュメント集合との類似度に基づいて、ドキュメント集合に関連したグループを検索できるので、検索キーとしてのドキュメント集合と関連する人物を簡単に検索できるようになる。したがって、検索ユーザが自信の複数のブログを検索キーとして用いれば、自身と嗜好や興味が近いブロガーやホームページを簡単に検索できるようになる。
(2)検索対象のドキュメントが更新されたか否かを監視し、更新を契機として特徴ベクトルを更新するようにしたので、ドキュメントの特徴ベクトルを常に最新の状態に保つことができる。
(3)制作者や管理者が同一の複数のドキュメントを統合して制作者ベクトルを生成する際に、更新日の新しいドキュメントの内容が古いドキュメントの内容よりも優先されるようにしたので、制作者や管理者の現在の嗜好や興味を制作者ベクトルに正確に反映させることができるようになる。
(4)ドキュメントの特徴ベクトルを、そのドキュメントに含まれる顔文字に基づいて生成するようにしたので、顔文字を多く含むドキュメント間の検索を正確に行えるようになる。
以下、図面を参照して本発明の最良の実施の形態について詳細に説明する。図1は、本発明に係るドキュメント検索システムの主要部の構成を示したブロック図であり、検索ユーザは、自身で制作したドキュメント集合を検索キーとして、これに類似したドキュメントやその制作者を検索できるようにしている。
ドキュメント群1は、例えば通信事業者により管理されるイントラサーバやネットワークに接続されたサーバであり、検索対象となる多数のホームページやブログなどのウェブドキュメント(以下、ドキュメントと総称する)が、例えばURLをアドレス情報として多数管理されている。ドキュメント群1に登録されている全てのドキュメントのURLはドキュメント管理部2で管理されている。
ドキュメント監視部3は、ドキュメント管理部2からURLを取得してドキュメント群1に定期的にアクセスすることで各ドキュメントを監視し、その内容が更新されていると、更新された最新のドキュメントをドキュメント解析部4へ渡す。なお、検索対象のドキュメントが、そのサマリー(要旨)情報を「RSS(RDF Site Summary)」で提供していれば、ドキュメント監視部3は、このRSSを参照することで更新の有無や内容を簡単に認識できる。
ドキュメント解析部4は、後に詳述するように、ドキュメント監視部3から渡されたドキュメントを解析して解析結果を更新部5へ渡す。更新部5は、ドキュメント管理部2で管理されている各ドキュメントの情報を、前記解析結果に基づいて最新の状態に更新する。
ドキュメント管理部2には、検索対象となる多数のドキュメントのそれぞれを一意に識別するための属性情報として、図2に一例を示したように、その制作者や管理者を識別するユーザID、アドレス情報(URL)、ドキュメントの内容を示すURLデータ、ドキュメントの更新日時、およびドキュメントの内容をベクトルで表現する特徴ベクトル(以下、ドキュメントベクトルと表現する場合もある)が登録されており、更新されたドキュメントのURLデータ、更新日時およびドキュメントベクトル(W1,W2…)が前記更新部5により更新される。なお、図2ではドキュメントベクトルが一段しか示されていないが、多段であっても良い。
図3は、ドキュメントのアドレス情報に基づいてユーザIDおよびURLデータを識別する方法の一例を示した図であり、アドレスが「http://www.dion.ne.jp/kdditaro/index.rdf」というようにURLで表現されていれば、サーバ名「www.dion.ne.jp」に続く「kdditaro」がユーザIDと認識され、「index.rdf」がURLデータ(ドキュメント)と認識される。
図1へ戻り、ドキュメント集合設定部9からは、検索キーとなるドキュメント集合を構成する複数のドキュメントがユーザにより入力される。このドキュメントは前記ドキュメント解析部4で同様に解析され、各ドキュメントベクトルがドキュメント集合ベクトル生成部6に渡される。ドキュメント集合ベクトル生成部6は、後に詳述するように、ドキュメント集合を構成する各ドキュメントの特徴ベクトル(ドキュメントベクトル)に基づいて、ドキュメント集合の内容をベクトルで表現する特徴ベクトル(以下、ドキュメント集合ベクトルと表現する)を生成する。
図4は、前記ドキュメント解析部4の構成を模式的に表現したブロック図であり、キーワード抽出部41、特徴ベクトル生成部42および複数のキーワード辞書43を主要な構成としている。
キーワード抽出部41は、解析対象のドキュメントを構文解析し、名詞など文書を代表的に表す単語をドキュメントごとにキーワードとして抽出する。例えば、ドキュメントが「サッカーワールドカップがベルリンで開催」であれば、キーワードとして「サッカー」、「ワールドカップ」、「ベルリン」、「開催」が抽出される。キーワード辞書43では、「経済」、「社会」、「国際」、「スポーツ」等のカテゴリを上位概念として、これに関連する多数のキーワードが下位概念として登録されており、各キーワードには、その上位概念との関連性を表した重み値が登録されている。この重みの計算方法として、たとえば、ディレクトリ型のウェブページに登録されている主要ウェブコンテンツから文書を抽出し、tf・idfなどの手法で重みを決定する手法を適用できる。ベクトル生成部42は、カテゴリ別の複数のキーワード辞書43を用いて、各ドキュメントのカテゴリベクトルを生成する。
図4に示した例では、キーワード「ワールドカップ」は2つの辞書(国際およびスポーツ)に登録されており、各辞書での重み値は、それぞれ「0.4」および「0.8」である。同様にして、他のキーワードについてもカテゴリ別に重み値が求められ、各キーワードの重み値をカテゴリ別に加算することで、当該ドキュメントのカテゴリベクトルが生成される。本実施形態では、このカテゴリベクトルがドキュメントベクトルとして利用される。
図5は、前記ドキュメント集合ベクトル生成部6の動作を示したブロック図であり、前記ドキュメント集合設定部9から入力された複数のドキュメントD1,D2,…Dnに関して、前記ドキュメント解析部4でドキュメントベクトルD1D2,…Dnが生成されると、これらを統合してドキュメント集合ベクトルを生成する。本実施形態では、各ドキュメントベクトルD1D2,…Dnの重み値をカテゴリ別に加算することで各ドキュメントベクトルが統合され、ドキュメント集合ベクトルが生成される。本実施形態では、このカテゴリ集合ベクトルが検索キーとして利用される。
図1へ戻り、制作者ベクトル生成部10は、ドキュメント管理部2に登録されているドキュメントを、そのユーザIDに基づいて制作者ごとにグループ化し、グループごとに各ドキュメントの特徴ベクトル(ドキュメントベクトル)を前記と同様に統合して、制作者の特徴をベクトルで表す特徴ベクトル(以下、制作者ベクトルと表現する)を生成する。前記制作者ベクトルは制作者管理部11で管理される。図6は、制作者管理部11の一例を示した図であり、制作者(ユーザID)ごとに、各カテゴリに重み値が設定された制作者ベクトルが登録されている。
なお、制作者ベクトルを生成する際に、更新日の新しいドキュメントと更新日の古いドキュメントとを同等に扱うと制作者の現在の特徴が制作者ベクトルに反映されにくくなる。したがって、更新日の新しいドキュメント特徴が古いドキュメントの特徴よりも優先されるように、例えば各ドキュメントが最後に更新されてからの経過期間Δkに基づいて、経過時間が長くなるほど減少する減衰係数α(=1/Δk)を算出し、各ドキュメントの特徴ベクトルの重みに前記減衰係数αを乗じるようにしても良い。
検索部7は、前記統合検索キー(ドキュメント集合ベクトル)を利用して制作者管理部11を検索し、統合検索キーとの類似度が高い制作者ベクトルのグループに属する
ドキュメントを検索結果出力部8へ渡す。このとき、ベクトル間の相関を求めるための手法として、例えばピアソン相関係数やコサイン類似度を用いることができる。検索結果出力部8は、検索結果を視覚的に認識しやすい表現に加工してユーザに提示する。
次いで、本実施形態の動作を、図7のフローチャートに沿って説明する。なお、ここでは検索対象となる全てのドキュメントに関して既に解析が完了しており、その最新のドキュメントベクトルがドキュメント管理部2に既登録であり、制作者管理部11でも、この最新のドキュメントベクトルに基づいて制作者ベクトルが生成されているものとして説明する。
ステップS1では、ドキュメント集合を構成する複数のドキュメントがドキュメント集合設定部9から検索ユーザにより入力される。本実施形態では、3つのドキュメントD1,D2,D3が入力されたものとして説明する。ステップS2では、3つのドキュメントD1,D2,D3がドキュメント解析部4で解析され、その特徴ベクトル(ドキュメントベクトル)D1D2D3が生成される。
ステップS3では、前記ドキュメント集合ベクトル生成部6において各ドキュメントベクトルD1D2D3が統合されてドキュメント集合ベクトルΣDが生成される。ステップS4では、このドキュメント集合ベクトルΣDを検索キーとして、前記検索部7により制作者管理部11が検索され、制作者ベクトルが検索キー(ドキュメント集合ベクトル)と類似したグループが検索される。ステップS5では、前記グループに属するドキュメントおよびその制作者が前記検索結果出力部8で加工されて検索ユーザに提示される。
図8は、検索結果の表示例を示した図であり、本実施形態では、検索キーとなるドキュメント集合71を中心とした同心円が表示され、このドキュメント集合71と各検索結果72,73,74とが線分で結ばれ、両者の類似度が線分の長さで表現されている。このとき、類似度を定量的に示す数値を線分に併記するようにしても良い。また、ドキュメントに、その内容を代表するタブ情報(いわゆる「メタデータ」)が付与されている場合には、図8に示したように、各検索結果72,73,74にタグ情報(「ミュンヘン」、「ベルリン」、「ワールドカップ」等)を併記するようにしても良い。
なお、上記した実施形態では、ドキュメントの特徴ベクトルをキーワードに基づいて生成するものとして説明したが、ブログ等では、文字だけでは伝えきれない微妙なニュアンスや感情を表現するマークとして顔文字が普及しているので、ドキュメントの特徴ベクトルを顔文字に基づいて生成するようにしても良い。
図9は、前記ドキュメント解析部4において、ドキュメントを顔文字に基づいて解析する場合の構成を模式的に表現したブロック図であり、顔文字抽出部44、ベクトル(感情ベクトル)生成部45および複数の顔文字辞書46を主要な構成とし、ドキュメントに含まれる顔文字に基づいて各ドキュメントの特徴ベクトルを生成するようにした点に特徴がある。本実施形態では、顔文字が「楽しみ」、「悲しみ」、「驚き」、「嫌悪」、「怒り」、「恐れ」、「無表情」の7つのカテゴリに分類される。
顔文字抽出部44は、解析対象のドキュメントを構文解析して顔文字を抽出する。特徴ベクトル生成部45は、感情別に多数の顔文字の感情割合が登録された複数の顔文字辞書46を用いて、各ドキュメントの感情ベクトルを生成する。各顔文字辞書46では、各顔文字がその重み値と共に登録されており、同一の顔文字が複数の顔文字辞書に重複登録を許可されている。そして、各顔文字の重み値を感情別に加算することで、当該ドキュメントの感情ベクトルが生成される。本実施形態では、この感情ベクトルがドキュメント特徴ベクトルとして利用される。
なお、前記ドキュメント解析部4において、ドキュメントをキーワードおよび顔文字に基づいて解析するのであれば、各ドキュメントをキーワードに基づく特徴ベクトル(カテゴリベクトル)および顔文字に基づく特徴ベクトル(感情ベクトル)の2つの特徴量で表し、この2つの特徴ベクトルと検索対象の各2つのベクトルとの類似度に基づいて検索を行うようにすれば良い。
本発明に係る検索システムのブロック図である。 ドキュメント管理部で管理される各ドキュメントの属性情報を示した図である。 ドキュメントのアドレス情報に基づいてユーザIDおよびURLデータを識別する方法の一例を示した図である。 ドキュメント解析部の構成を模式的に表現したブロック図である。 ドキュメント集合ベクトル生成部の動作を示したブロック図である。 制作者管理部で管理される制作者ベクトルの一例を示した図である。 本発明の動作を示したフローチャートである。 検索結果の表示例を示した図である。 ドキュメントを顔文字に基づいて解析する構成のブロック図である。
符号の説明
1…ドキュメント群,2…ドキュメント管理部,3…ドキュメント監視部,4…ドキュメント解析部,5…更新部,6…ドキュメント集合ベクトル生成部,7…検索部,8…検索結果出力部,9…ドキュメント集合設定部,10…制作者ベクトル生成部,11…制作者管理部

Claims (9)

  1. ドキュメントの集合を検索キーとして、このドキュメント集合に関連した情報を検索する検索システムにおいて、
    ドキュメントを解析して、その特徴ベクトルを生成するドキュメント解析手段と、
    検索対象の各ドキュメントの特徴ベクトルを管理するドキュメント管理手段と、
    制作者および/または管理者が同一のドキュメントの特徴ベクトルに基づいて制作者の特徴ベクトルを生成する手段と、
    前記制作者の特徴ベクトルを管理する制作者管理手段と、
    前記ドキュメント集合を構成する複数のドキュメントの特徴ベクトルに基づいてドキュメント集合の特徴ベクトルを生成する手段と、
    前記ドキュメント集合の特徴ベクトルを検索キーとして前記制作者管理手段を検索し、前記ドキュメント集合に関連した制作者のドキュメントを抽出する検索手段と、
    前記検索結果を出力する検索結果出力手段とを含むことを特徴とする検索システム。
  2. 検索対象の各ドキュメントが更新されたか否かを監視するドキュメント監視手段をさらに含み、
    前記ドキュメント解析手段は、更新されたドキュメントを解析し、その解析結果に基づいて、前記ドキュメント管理手段に既登録の特徴ベクトルを更新することを特徴とする請求項1に記載の検索システム。
  3. 前記制作者の特徴ベクトルを生成する手段は、
    制作者および/または管理者が同一の複数のドキュメントを前記ドキュメント解析手段で解析して生成された複数の特徴ベクトルを統合して制作者の特徴ベクトルを生成することを特徴とする請求項1または2に記載の検索システム。
  4. 検索対象の各ドキュメントが最後に更新されてからの経過期間に基づいて、経過時間が長くなるほど減少する減衰係数αを算出する手段を含み、
    前記制作者の特徴ベクトルを生成手段は、制作者が同一である各ドキュメントの特徴ベクトルの重みに前記減衰係数αを乗じることを特徴とする請求項3に記載の検索システム。
  5. 前記ドキュメント集合の特徴ベクトルを生成する手段は、
    ドキュメント集合の各ドキュメントを前記ドキュメント解析手段で解析して生成された各特徴ベクトルを統合してドキュメント集合の特徴ベクトルを生成することを特徴とする請求項1ないし4のいずれかに記載の検索システム。
  6. 前記ドキュメント解析手段は、
    各ドキュメントからキーワードを抽出するキーワード抽出手段と、
    カテゴリ別に多数のキーワードが登録された複数のキーワード辞書と、
    前記抽出されたキーワードが各キーワード辞書に既登録であるか否かに基づいて、前記ドキュメントのカテゴリベクトルを生成する手段とを含み、
    前記カテゴリベクトルをドキュメントの特徴ベクトルとすることを特徴とする請求項1ないし5のいずれかに記載の検索システム。
  7. 前記各キーワード辞書では、登録されているキーワードごとに重み値が割り当てられ、かつ同一のキーワードが複数のキーワード辞書に重複登録を許可されており、
    前記カテゴリベクトルを生成する手段は、各キーワードについてカテゴリごとに重み値を求め、各キーワードの各重み値をカテゴリごとに加算してカテゴリベクトルを生成することを特徴とする請求項6に記載の検索システム。
  8. 前記ドキュメント解析手段は、
    各ドキュメントから顔文字を抽出する顔文字抽出手段と、
    感情別に多数の顔文字の感情割合が登録された複数の顔文字辞書と、
    前記抽出された顔文字が各顔文字辞書に既登録であるか否かに基づいて、前記ドキュメントの感情ベクトルを生成する手段とを含み、
    前記感情ベクトルをドキュメントの特徴ベクトルとすることを特徴とする請求項1ないし7のいずれかに記載の検索システム。
  9. 前記各顔文字辞書では、登録されている顔文字ごとに重み値が割り当てられ、かつ同一の顔文字が複数の顔文字辞書に重複登録を許可されており、
    前記感情ベクトルを生成する手段は、各顔文字について感情ごとに重み値を求め、各顔文字の各重み値を感情ごとに加算して感情ベクトルを生成することを特徴とする請求項8に記載の検索システム。
JP2006285485A 2006-10-19 2006-10-19 検索システム Expired - Fee Related JP4853915B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006285485A JP4853915B2 (ja) 2006-10-19 2006-10-19 検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006285485A JP4853915B2 (ja) 2006-10-19 2006-10-19 検索システム

Publications (2)

Publication Number Publication Date
JP2008102790A true JP2008102790A (ja) 2008-05-01
JP4853915B2 JP4853915B2 (ja) 2012-01-11

Family

ID=39437068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006285485A Expired - Fee Related JP4853915B2 (ja) 2006-10-19 2006-10-19 検索システム

Country Status (1)

Country Link
JP (1) JP4853915B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126042A1 (ja) * 2009-04-27 2010-11-04 シャープ株式会社 コンテンツ出力システム
JP2015184749A (ja) * 2014-03-20 2015-10-22 株式会社東芝 情報処理装置、情報処理方法およびプログラム
JP2016173742A (ja) * 2015-03-17 2016-09-29 株式会社Jsol 顔文字感情情報抽出システム、方法及びプログラム
JP2019096346A (ja) * 2013-03-29 2019-06-20 キヤノン株式会社 会議支援システム、会議支援方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202283A (ja) * 1999-11-09 2001-07-27 Fujitsu Ltd コンテンツ更新状況監視システム
JP2001249951A (ja) * 2000-03-06 2001-09-14 Kddi Corp 文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置
JP2003271620A (ja) * 2002-03-19 2003-09-26 Fuji Xerox Co Ltd 文書分類装置及び文書分類方法、文書分類プログラム
JP2004362419A (ja) * 2003-06-06 2004-12-24 Matsushita Electric Ind Co Ltd 情報処理装置および方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202283A (ja) * 1999-11-09 2001-07-27 Fujitsu Ltd コンテンツ更新状況監視システム
JP2001249951A (ja) * 2000-03-06 2001-09-14 Kddi Corp 文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置
JP2003271620A (ja) * 2002-03-19 2003-09-26 Fuji Xerox Co Ltd 文書分類装置及び文書分類方法、文書分類プログラム
JP2004362419A (ja) * 2003-06-06 2004-12-24 Matsushita Electric Ind Co Ltd 情報処理装置および方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126042A1 (ja) * 2009-04-27 2010-11-04 シャープ株式会社 コンテンツ出力システム
JP2019096346A (ja) * 2013-03-29 2019-06-20 キヤノン株式会社 会議支援システム、会議支援方法及びプログラム
JP2015184749A (ja) * 2014-03-20 2015-10-22 株式会社東芝 情報処理装置、情報処理方法およびプログラム
JP2016173742A (ja) * 2015-03-17 2016-09-29 株式会社Jsol 顔文字感情情報抽出システム、方法及びプログラム

Also Published As

Publication number Publication date
JP4853915B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
US10235681B2 (en) Text extraction module for contextual analysis engine
US9990422B2 (en) Contextual analysis engine
US7660783B2 (en) System and method of ad-hoc analysis of data
US10430806B2 (en) Input/output interface for contextual analysis engine
US9990368B2 (en) System and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information
US8099406B2 (en) Method for human editing of information in search results
US8352455B2 (en) Processing a content item with regard to an event and a location
US8001135B2 (en) Search support apparatus, computer program product, and search support system
US20070250501A1 (en) Search result delivery engine
JP2009508267A (ja) ブログ文書のランク付け
JP2011134334A (ja) ショートテキスト通信のトピックを識別するためのシステムおよび方法
US9858332B1 (en) Extracting and leveraging knowledge from unstructured data
Magnani et al. Conversation retrieval for microblogging sites
KR101073358B1 (ko) 태그 기반 정보 검색 장치, 방법 및 태그 관리 방법
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
JP2010044462A (ja) コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム
JP4820147B2 (ja) 属性評価プログラム、属性評価システムおよび属性評価方法
JP5194731B2 (ja) 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
JP4853915B2 (ja) 検索システム
JP2010026773A (ja) 地理的特徴情報抽出方法およびシステム
US20240020476A1 (en) Determining linked spam content
Hu et al. Personalized searching for web service using user interests
JP2009265908A (ja) 個人プロファイル抽出方法、人物検索方法及び装置
JP2006236254A (ja) コミュニティ依存型情報検索システム及び方法
Mohajer The Extraction of Social Networks from Web Using Search Engines

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111019

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111019

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4853915

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees