JP5439100B2 - 文書解析システム - Google Patents

文書解析システム Download PDF

Info

Publication number
JP5439100B2
JP5439100B2 JP2009218496A JP2009218496A JP5439100B2 JP 5439100 B2 JP5439100 B2 JP 5439100B2 JP 2009218496 A JP2009218496 A JP 2009218496A JP 2009218496 A JP2009218496 A JP 2009218496A JP 5439100 B2 JP5439100 B2 JP 5439100B2
Authority
JP
Japan
Prior art keywords
evaluation
document
keyword
data
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009218496A
Other languages
English (en)
Other versions
JP2011070252A (ja
Inventor
仙 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2009218496A priority Critical patent/JP5439100B2/ja
Publication of JP2011070252A publication Critical patent/JP2011070252A/ja
Application granted granted Critical
Publication of JP5439100B2 publication Critical patent/JP5439100B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書データを解析する文書解析システムに関する。
近年、インターネットの普及に伴ってユーザが利用可能な情報が爆発的に増加している。特に、CGM(Comsumer Generated Media)と呼ばれるユーザ自身がコンテンツを作成、追加していくメディアが活用されるようになってからは、情報の増加速度は一層大きくなっている。
CGMとして代表的なものにはブログやSNS(Social Networking Service)があり、どちらもユーザが個人的な体験や日記を書いたり、自分が気になったニュースやサイトなどのURL(Uniform Resource Locator)を寸評付きで紹介したりして、幅広い話題を時系列で比較的頻繁に更新するのが特徴である。
CGMで扱われる情報は非常に分野の幅が広く、また書き手との知り合い関係や話題同士のつながりからさまざまなネットワークが作られることが多い。CGMには、このように雑多ながらも膨大な量の情報がゆるやかな関係でつながり、時間とともに蓄積されている。また、肥えた目を持っていたり巧い文章を書いたりするユーザには注目が集まり、そこから伝達された情報が社会に影響を与える例も増えている。
近年では、このような整頓されていない大規模な電子情報を分析することや、情報をろ過することによって有用な情報を取り出すため、情報検索技術を基礎として様々な技術が研究されている。特にデータの発信源がユーザ自身であるCGMでは、その分析によってユーザの嗜好の変化や流行を把握し、マーケティング等に利用することが期待されている。
上述の大規模情報の分析手法として広く使われているのは、キーワードマッチングによる検索結果を利用したものである。あるキーワードとの関連を文書内でマッチング検索がヒットした回数によって判断し、またマッチングした文書が多いほどそのキーワードは注目されていると判断する。分析するためのキーワードはあらかじめデータベースとして準備されているか、あるいは分析対象となる文書で繰り返し利用される語句をキーワードとして抽出して用意する。
これに加えて、近年ではベクトル演算を用いた検索技術(概念検索技術)が利用されている(例えば、特許文献1参照)。この技術では、上述の分析手法で利用するキーワードに対してそれぞれ基本となるベクトルを規定しておく。このベクトルはそのキーワードが利用される分野や概念を示す意味情報を持つ。そして、分析対象となる文書に対して様々なキーワードでマッチング検索を行い、その結果と各キーワードの持つベクトルを元に対象文書全体がもつ文書ベクトルを決定する。
この技術により、単語単位ではなく文書単位で概念を比較することができるようになった。検索を実行する際にも単語ではなく文章を入力として、その文章から得られたベクトルと各文書ベクトルを比較し、その概念が近い文書を得ることが出来る。また、ベクトルで表される概念の関連性を示すことで、キーワードマッチングの回数よりも文書間の関係を詳細に分析することが出来る。
特開2002−15001号公報
しかし、概念検索は、検索対象の文書の数が多かったり、一文書辺りの単語数が多かったりする場合は、検索対象の文書ベクトルの生成に時間を要する。
また、論旨の一貫した学術論文等の文書については正確な文書ベクトルが得られやすいが、話題が移り変わることが多い日記などの文書においては、正確な文書ベクトルが得られにくい。
この発明の目的は、大量の文書が常に増加していくという特徴や、話題が多様で体験談や感想が書かれていることが多いという特徴を持つ文書データの集合において、より正確に話題の内容や筆者の意図を分析することができる文書解析システムを提供することである。
好ましくは、本発明に係る文書解析システムは、
分析対象である複数の文書データと、キーワードと関連分野とを含む複数のキーワードデータ、および評価語句と関連分野と当該評価語句に対する肯定的評価または否定的評価の段階を客観的に示す評価値とを含む複数の評価語句データを記憶する記憶手段と、
前記記憶手段に記憶されている前記各文書データに含まれる各単語に対して、前記記憶手段に記憶されている前記キーワードデータに含まれる各キーワードマッチング検索を行い、前記文書データごとに当該各文書データに含まれるキーワードと当該各キーワードが出現する出現回数とを求めるマッチング検索手段と、
前記各文書データから前記マッチング検索手段によって求められた各キーワードが現れる位置それぞれに対して前後の位置に含まれる評価語句を抽出し、当該各キーワードと当該抽出された各評価語句の関連分野が一致している場合に、前記評価語句データに含まれる評価値を取得し、当該取得した各評価値を、前記抽出された各評価語句と前記マッチング検索手段によって求められた各キーワードとの位置関係および前記抽出された各評価語句の文書内の位置に基づいて補正し、当該補正された各評価値に基づいて当該各キーワードに対する評価が数値化された文書内における当該各キーワードの評価値を求める文書内分析手段と、
前記文書内分析手段によって求められた文書内における各キーワード評価に基づいて、2以上の文書データについて当該各キーワードを評価するための評価値を求める文書間分析手段と、
を備えることを特徴とする。
本発明によれば、大量の文書が常に増加していくという特徴や、話題が多様で体験談や感想が書かれていることが多いという特徴を持つ文書データの集合において、より正確に話題の内容や筆者の意図を分析することができる。
本発明の実施形態に係る文書解析システムの構成の一例を示す図である。 文書解析システムの運用に関わるユーザや管理者の関係を示すブロック図である。 文書解析システムが実行する分析プログラムにおいて、各処理が入出力に利用するデータと処理の流れとを示した図である。 本発明の実施形態で作成されるデータのうち、文書群データの構成の一例を表す図である。 本発明の実施形態で作成されるデータのうち、検索データ(キーワードデータと評価語句データ)と市場分析データの構成の一例を表す図である。 文書内分析処理部で実行する文書内分析処理のフローチャートを示す図である。 文書間分析処理部で実行する文書間分析処理の概要を示す図である。
以下、本発明の実施形態について図面を参照しながら説明する。
CGMにおける流行の伝達の様子を分析した所、複数のユーザが作るネットワーク内で類似した話題の日記や体験談が書かれ、各々のユーザがその話題について評価しながら話題が伝播することが分かった。表現の方法はユーザによって様々であるが、評価に利用される語句は、肯定的評価であるか否定的評価であるかを軸に、客観的な評価に数値化することができる。
本実施形態では、体験談や日記に多く見られる感想や評価を表す語句に注目し、そこから周囲のキーワードに対する書き手の感想を分析する手法を導入する。
この手法では、感想や評価を表す語句を、その語句の利用される分野や、その語句が示す肯定的評価と否定的評価の段階を客観的に表した数値と共にデータベースに事前に登録する。そして、分析対象の文書にその語句が含まれている場合に、その語句から付近のキーワードを評価することができると判断する。また、感想や評価を表す語句の文章中の位置も考慮して文章全体を分析する。たとえば、タイトルに含まれている語句や、文章の締めで使われている語句は強調していると判断して文章全体を分析する。
この分析を蓄積された文書それぞれに対して行って各キーワードに対する文書ごとの評価を得る。そして、複数の文書について各キーワードに対する評価を様々な面から集計することによって、ユーザ全体の流行やその変化を捉る。
本実施形態に係る文書解析システムによれば、例えば、分野を特定せず広くユーザを集めているSNSを対象とし、ユーザの嗜好や流行を分析してその情報をユーザやSNSの管理者、文書解析システムの運営者に還元することができる。
図1は、本発明の実施形態に係る文書解析システム100の構成の一例を示す。
文書解析システム100は、処理装置110と、記憶装置120と、入力装置130と、出力装置140とを備える。
処理装置110は、CPU(Central Processing Unit)111とメモリ112とを有している。
メモリ112は、RAM(Random Access Memory)やROM(Read Only Memory)等を含む。メモリ112には、分析プログラムが記憶装置120等から読み込まれる。この分析プログラムはマッチング検索処理部113と文書内分析処理部114と文書間分析処理部115とで構成される
CPU111は、メモリ112に読み込まれた分析プログラムを実行する。
記憶装置120には、分析対象となる文書群に関するデータ121と検索用データ122と文書間分析結果データ123とが格納される。
文書群に関するデータ121は、分析する文書それぞれに対し、文書データ124とマッチング検索結果データ125と文書内分析結果データ126とを含む。ここで、文書データ124はユーザの日記の内容などの分析対象の文書そのものである。また、マッチング検索結果データ125は、マッチング検索処理部113が文書データに含まれるキーワードを検索した結果のデータである。文書内分析結果データ126は、文書内分析処理部114が評価語句により分析した結果のデータである。文書データ124とマッチング検索結果データ125と文書内分析結果データ126の詳細については後述する。
検索用データ122は、キーワードデータ127と評価語句データ128とを含む。キーワードデータ127は検索に利用する単語(キーワード)とその単語が関連する関連分野の情報等を含む。評価語句データ128はユーザが感想や評価に利用する単語(評価語句)と、その単語が関連する関連分野と、その単語の評価を客観的に示す評価値等を含む。キーワードデータ127と評価語句データ128の詳細については後述する。
文書間分析結果データ123は、文書間分析処理部115が2以上の文書データ124について分析した結果のデータである。文書間分析処理部115の詳細については後述する。
図2は、文書解析システム100の運用に関わるブロック図である。
文書解析システム100の運用には、SNSに参加するユーザが使用するユーザ端末201とSNSシステム202が関わる。
SNSに参加するユーザは、ユーザ端末201を用いて日記や体験を記した文書データを作成する。ユーザ端末201は、ユーザが作成した文書データをSNSシステム202に送信する。ユーザ端末201は文書解析システム100が関わっていない場合と同様であり、ユーザは文書解析システム100を意識することはない。
SNSシステム202の管理者は、通常のSNSシステム202の管理業務に加え、文書解析システム100に対して検索対象となるユーザが作成した文書を提供する。SNSシステム202は、ユーザが作成した文書データを蓄積し、分析対象である文書データを文書解析システム100に送信する。また、SNSシステム202は、SNSの閲覧情報やコミュニティに関わる情報などSNSの管理統計情報の一部を文書解析システム100に送信する。これらの情報を用いることにより、文書解析システム100はより詳細な分析結果を出力することができる。
文書解析システム100は、SNSシステム202から送信された文書データに対して分析プログラムを適用して分析し、分析した結果を出力する。分析の結果は、ユーザ端末201を使用するユーザやSNSシステム202の管理者、または文書解析システム100の運営者に対して開示される。分析の結果は、流行の把握や更なる話題の提供、関連ビジネスに利用される。
図3は、文書解析システム100が実行する分析プログラムにおいて、各処理が入出力に利用するデータと処理の流れとを示す。
まず、マッチング検索処理部113が、文書データ124とキーワードデータ127を入力としたマッチング検索処理を行い、マッチング検索結果データ125を作成する。マッチング検索は、文書データ124に含まれる各単語に対してキーワードデータ127に含まれる各キーワードのマッチング検索を行い、マッチング結果を得る。キーワードマッチングは通常の検索処理であり、説明は省略する。
次に、文書内分析処理部114が、文書データ124とマッチング検索結果データ125とキーワードデータ127と評価語句データ128を入力とした文書内分析処理(詳細については後述する。)によって文書内分析結果データ126を作成する。
次に文書間分析処理部115が、文書内分析結果データ126とキーワードデータ127、さらに得られた場合にはSNSの閲覧データ301等を入力として、文書間分析処理(詳細については後述する。)によって文書間分析結果データ123を作成し、出力する。
図4は、分析を行う際に入力または作成され、記憶装置120に格納される対象文書群データ121についてその内容の一例を示す。
文書データ124は、図1中の文書データ124の一例である。SNSに記録されるユーザの書き込みデータから分析に必要な部分がコピーされたものであり、文書ID(Identifier)・タイトル・内容・ユーザ名・作成時間などの属性を持つ。
マッチング検索結果データ125は、図1中のマッチング検索結果データ125の一例である。マッチング検索処理部113によって作成され、ある文書に対して特定のキーワードがどれだけ出現しているかを通常のマッチング検索で調査した結果を示す属性を持つ。
文書内分析結果データ126は、図1中の文書内分析結果データ126の一例である。文書内分析処理部114によって作成され、マッチング結果検索データ125に加えて、そのキーワードに対して得られた評価を集計した結果の属性を持つ。例では、肯定的な評価が得られた数と、否定的な評価が得られた数、さらに全ての評価を集計した合計評価値を格納している。
図5は、分析を行う際に入力または作成され、記憶装置120に格納される検索用データ122(キーワードデータ127と評価語句データ128)と文書間分析結果データ123についてその内容の一例を示す。
キーワードデータ127は、図1中のキーワードデータ127の一例である。検索や分析に利用するキーワードをリストにしたものである。キーワードデータ127は、キーワードの内容と、評価語句データとの関連を示す関連分野などの属性を持つ。例では、関連分野を単語で示しているが、分野間の関連をさらに詳細に分析する場合には、関連分野をベクトルで表しても良い。
評価語句データ128は、図1中の評価語句データ128の一例である。体験談や日記で利用される、ユーザの印象を表す言葉をリストにしたものである。評価語句の内容(単語)と、キーワードとの関連を示すための関連分野、さらにその言葉が示す印象を数値化した評価値を属性に持つ。例では、評価値は一次元の数値とし、0以上のものは肯定的な評価を、0以下のものは否定的な評価を表している。評価値の絶対値が大きい程印象が強く、肯定的または否定的な方向に評価が強い事を示す。
また、同じ評価語句であっても、利用される関連分野によって印象の違いがあるため、評価語句の関連分野毎に評価値が設定されている場合もある。たとえば、「まずい」という評価は多くの場合に否定評価とされるが、特に食事・グルメの評価に使われる場合は強い否定評価と取る事ができる。通信関係における「重い」などの表現も同様と考えられる。
文書間分析結果データ123は、図1中の文書間分析結果データ123の一例である。文書間分析処理部115によって作成され、多数の文書内分析結果データの統計を元にユーザ全体の傾向を示す。文書間分析結果データデータ123は、分析したい事柄によって大きく内容が変化する事もある。例では、キーワードの登場文書数、肯定的な評価が得られた数の合計と否定的な評価が得られた数の合計、評価の平均値やそこから分析した分析結果等の属性を持っている。
図6は、文書内分析処理部114で実行する文書内分析処理のフローチャートである。
文書内分析処理は、文書データ124、マッチング検索結果データ125、キーワードデータ127、評価語句データ128を分析して文書内分析結果データ126を作成する。
CPU111は、まず、記憶装置120から分析対象の文書データ124、キーワードデータ127、マッチング検索結果データ125、評価語句データ128を読みこむ(S101)。CPU111は、キーワードデータ127とマッチング検索結果データ125から文書データ124に含まれるキーワードが分かるので、そのうち1つを選び、そのキーワードが文書に現れる位置を確認する。CPU111は、キーワードが現れる位置それぞれに対して、文書の前後の位置に含まれる評価語句を検索し、抜き出す(S103)。
通常は複数の評価語句が得られる。CPU111は、そのうち1つの評価語句に対して評価語句とキーワードの関連分野が一致しているか否かを判別する(S105)。CPU111は、一致していた場合(S105:Yes)、評価語句データから評価語句とキーワードの一致した関連分野における評価値を取得する(S106)。
CPU111は、取得した評価値を、評価語句とキーワードとの位置関係、評価語句の文書内の位置により補正する。(S107)。評価語句とキーワードとの位置関係による補正は、評価語句とキーワードが文の構成から見て関係が大きいかどうかを示すものである。CPU111は、評価語句データ128から取得された評価値を、例えば、評価語句とキーワードの間の単語数が少ない(評価語句とキーワードの距離が近い)ほど大きく、読点などが間に入ると小さく補正する。文書内の位置による補正とは、段落や節の中における文の位置が影響する印象の強さを示すものである。CPU111は、段落や節の先頭または末尾にある評価語句を、他のものより大きく補正する。
CPU111は、文書内分析結果データ126に各キーワードの評価結果を記録する(S108)。文書内分析結果データ126に何を記録するかは、分析の目的と文書内分析結果データの構成によって変化する。図4に示した文書内分析結果データ126の例では、CPU111は、肯定評価の数と否定評価の数をカウントし、さらに補正された各評価値の合計を記録する。
ステップS105において関連分野で一致するものが無い場合(S105:No)、CPU111は何もせず、次の評価語句を選ぶ。CPU111は、ステップS104からステップS109までの処理を抜き出した全ての評価語句に対して繰り返す(S104)。
さらに、CPU111は、ステップS102からステップS110までの処理を、文書データに含まれる全てのキーワードに対して繰り返す(S102)。
ここで、文章を分析する一例を示す。「○○マーケットに行ってきました。会場が広くて歩き疲れるほど。途中で△△ワインという地元産の有名銘柄を発見。試飲もできるところがすばらしい。しかし、目当ての銘菓□□は売り切れでした、残念。」という内容の日記文書があり、この文に対するマッチング検索結果としてキーワードの「○○マーケット」「△△ワイン」「銘菓□□」が抽出されているとする。
文書内分析処理では、評価語句として「広い」「疲れる」「有名」「すばらしい」「残念」が抽出される。キーワード「○○マーケット」の関連分野は「ショッピング」で、この文で得られた評価語句の関連分野は全てショッピングを含み、「有名」「すばらしい」は強い肯定評価、「広い」は弱い肯定評価、「疲れる」「残念」は否定評価である。それぞれの評価値をキーワードとの距離等の重みを考慮して加算し、この文の「○○マーケット」に対する合計評価として記録する。これを「△△ワイン」「銘菓□□」にたいして同様に繰り返す。
図7は、文書間分析処理部115で実行する文書間分析処理の概要を示す。
文書間分析処理部115では、文書内分析結果データ126をキーワードごとや期間ごと等に集計したものを元に市場で流行しているキーワードやその変化を分析する。市場の分析は目的によって様々な手段があるため、ここでは代表的な3つの手段のみを挙げる。
図4の例に挙げた文書内分析結果データ126を集計することで、これまで蓄積された文書で話題となったキーワードと、そのキーワードが登場する文書数、さらに評価が肯定的なものと否定的なものの回数、全ての文書での評価の平均値等を得ることができる(301)。
ここでキーワードの登場文書数とその推移に注目することで、市場における話題性の分析ができる(302)。登場文書数が多いもの、特に所定の時間内に登場文書数が増加しているキーワードは、旬の話題であることを示しており、逆に所定の時間内に登場文書数が低下しているキーワードは市場の関心が低く推移していることを示す。
また、キーワードの平均評価値やその分布、推移に注目することで、市場における評価度の分析ができる(303)。平均評価値が高いものは市場で肯定的な評価を得られていることを示す。そして、さらに平均評価値の分布を調査することでキーワードに対する市場の受け入れられ方を分析することができる。例えば、平均評価値が肯定的(すなわち、+)で、各文書データの評価が同じ程度に分布が固まっている場合はそのキーワードが市場全体に広く評価され、受け入れられていることを示す。評価値の合計が肯定的で、各文書データの評価は肯定的なものから否定的なものまで広く分布している場合、一部のコアなファンがいる分野であることを推測できる。後者の場合は、さらに肯定的な評価がどのようなユーザに集まっているかを調べることで、さらなる市場ニーズの分析につながる。但しこの場合は、SNSシステムの管理者から各文書データの書き手であるユーザデータを得る必要がある。
さらに、SNSシステムの管理者の協力がある場合、各文書データの閲覧数やその推移に注目することで、市場の注目度の分析が出来る(304)。閲覧数の高いものは市場の注目度が高いといえる。なお、話題性と注目度の違いは市場ニーズの潜在性である。CGMに参加するユーザは積極的に情報を発信するため直接的、活動的なユーザと判断することができ、それらのユーザの嗜好を話題性から図ることができる。一方、注目度からやや消極的なユーザや、間接的なユーザの関心の度合いを測ることが出来る。
ここに挙げた分析や、さらに他の観点からの分析を組み合わせ、市場で関心を集めているキーワードや、ニーズがありビジネスにつながりそうなキーワードを抽出することが出来る。
以上説明したように、本発明によれば、次のような効果を得ることができる。
(1)体験談や日記の多い文章に対して、その文章と特定キーワードの関連性と、キーワードに関する書き手の肯定的評価と否定的評価を分析する事が出来る。
(2)多数のユーザによる上記の評価を集計・分析することによって、ユーザの嗜好性や流行の変化、ユーザの注目するキーワードを把握し、ユーザに対して話題を還元したり、ビジネスに利用したりする事が出来る。
以上、本発明の実施形態について説明したが、設計上の都合やその他の要因によって必要となる様々な修正や組み合わせは、請求項に記載されている発明や発明の実施形態に記載されている具体例に対応する発明の範囲に含まれると理解されるべきである。
100…文書解析システム、110…処理装置、111…CPU、112…メモリ、113…マッチング検索処理部、114…文書内分析処理部、115…文書間分析処理部、120…記憶装置、121…文書群に関するデータ、122…検索用データ、123…文書間分析結果データ、124…文書データ、125…マッチング検索結果データ、126…文書内結果データ、127…キーワードデータ、128…評価語句データ、130…入力装置、140…出力装置、201…ユーザ端末、202…SNSシステム、301…SNSの閲覧データ

Claims (1)

  1. 分析対象である複数の文書データと、キーワードと関連分野とを含む複数のキーワードデータ、および評価語句と関連分野と当該評価語句に対する肯定的評価または否定的評価の段階を客観的に示す評価値とを含む複数の評価語句データを記憶する記憶手段と、
    前記記憶手段に記憶されている前記各文書データに含まれる各単語に対して、前記記憶手段に記憶されている前記キーワードデータに含まれる各キーワードマッチング検索を行い、前記文書データごとに当該各文書データに含まれるキーワードと当該各キーワードが出現する出現回数とを求めるマッチング検索手段と、
    前記各文書データから前記マッチング検索手段によって求められた各キーワードが現れる位置それぞれに対して前後の位置に含まれる評価語句を抽出し、当該各キーワードと当該抽出された各評価語句の関連分野が一致している場合に、前記評価語句データに含まれる評価値を取得し、当該取得した各評価値を、前記抽出された各評価語句と前記マッチング検索手段によって求められた各キーワードとの位置関係および前記抽出された各評価語句の文書内の位置に基づいて補正し、当該補正された各評価値に基づいて当該各キーワードに対する評価が数値化された文書内における当該各キーワードの評価値を求める文書内分析手段と、
    前記文書内分析手段によって求められた文書内における各キーワード評価に基づいて、2以上の文書データについて当該各キーワードを評価するための評価値を求める文書間分析手段と、
    を備えることを特徴とする文書解析システム。
JP2009218496A 2009-09-24 2009-09-24 文書解析システム Expired - Fee Related JP5439100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009218496A JP5439100B2 (ja) 2009-09-24 2009-09-24 文書解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009218496A JP5439100B2 (ja) 2009-09-24 2009-09-24 文書解析システム

Publications (2)

Publication Number Publication Date
JP2011070252A JP2011070252A (ja) 2011-04-07
JP5439100B2 true JP5439100B2 (ja) 2014-03-12

Family

ID=44015507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009218496A Expired - Fee Related JP5439100B2 (ja) 2009-09-24 2009-09-24 文書解析システム

Country Status (1)

Country Link
JP (1) JP5439100B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013003663A (ja) * 2011-06-13 2013-01-07 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN103186555B (zh) * 2011-12-28 2016-05-11 腾讯科技(深圳)有限公司 评价信息生成方法及系统
JP6529133B2 (ja) * 2016-01-29 2019-06-12 Kddi株式会社 複数地域でのトピックの評価を分析する装置、プログラム及び方法
CN116957633B (zh) * 2023-09-19 2023-12-01 武汉创知致合科技有限公司 一种基于智能家居场景的产品设计用户体验评价方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5151991B2 (ja) * 2006-12-18 2013-02-27 日本電気株式会社 極性推定システム、情報配信システム、極性推定方法及び、極性推定用プログラム、及び評価極性推定用プログラム
JP5178233B2 (ja) * 2008-02-21 2013-04-10 株式会社東芝 表示データ生成装置及び方法

Also Published As

Publication number Publication date
JP2011070252A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
Bouadjenek et al. Social networks and information retrieval, how are they converging? A survey, a taxonomy and an analysis of social information retrieval approaches and platforms
Li et al. Deriving market intelligence from microblogs
US10430806B2 (en) Input/output interface for contextual analysis engine
US9990422B2 (en) Contextual analysis engine
US10235681B2 (en) Text extraction module for contextual analysis engine
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及系统
CN109815386B (zh) 一种基于用户画像的构建方法、装置及存储介质
CN100444591C (zh) 获取网页关键字的方法及其应用系统
Shahid et al. Insights into relevant knowledge extraction techniques: a comprehensive review
JPWO2009096523A1 (ja) 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
US9262510B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
Lipczak et al. The impact of resource title on tags in collaborative tagging systems
US20150120708A1 (en) Information aggregation, classification and display method and system
Bhardwaj et al. Web scraping using summarization and named entity recognition (ner)
JP5439100B2 (ja) 文書解析システム
Navarro Bullock et al. Accessing information with tags: search and ranking
Najadat et al. Detecting Arabic spam reviews in social networks based on classification algorithms
Jiang et al. Beyond click graph: Topic modeling for search engine query log analysis
US20110252313A1 (en) Document information selection method and computer program product
Bouadjenek et al. Personalized social query expansion using social annotations
Cortez et al. A flexible approach for extracting metadata from bibliographic citations
JP4853915B2 (ja) 検索システム
Hurtado Martín et al. An exploratory study on content-based filtering of call for papers
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
US20220138407A1 (en) Document Writing Assistant with Contextual Search Using Knowledge Graphs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131216

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees