JP5427119B2 - 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体 - Google Patents

類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体 Download PDF

Info

Publication number
JP5427119B2
JP5427119B2 JP2010135349A JP2010135349A JP5427119B2 JP 5427119 B2 JP5427119 B2 JP 5427119B2 JP 2010135349 A JP2010135349 A JP 2010135349A JP 2010135349 A JP2010135349 A JP 2010135349A JP 5427119 B2 JP5427119 B2 JP 5427119B2
Authority
JP
Japan
Prior art keywords
topic
category
vector
importance
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010135349A
Other languages
English (en)
Other versions
JP2012003333A (ja
Inventor
真詞 田本
理 吉岡
敏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010135349A priority Critical patent/JP5427119B2/ja
Publication of JP2012003333A publication Critical patent/JP2012003333A/ja
Application granted granted Critical
Publication of JP5427119B2 publication Critical patent/JP5427119B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、或る文書に類似した文書を複数の文書から検索する装置等に関し、特に、文書に含まれる話題の重要度に基づき類似性を判定する類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体に関する。
従来の類似文書検索手法(例えば、特許文献1)においては、検索したい内容の文書(標本文書)と検索対象である1以上の文書(参照文書)のそれぞれについて特徴量を求め、これら特徴量間の距離を算出して、その距離が小さい文書を類似文書として抽出する。特徴量は、例えば文書に含まれる各単語をそれぞれ単語概念ベクトルに変換し、それら全ての単語概念ベクトルの重心として得られるベクトル(文書ベクトル)として定義される。この文書ベクトルを計算する際には、類似文書の検索精度を高めるために、単語に対してTF−IDFなどの単語の出現頻度をもとに決定した重みを付すという方法をとるのが一般的である。
特開2009−277099号公報 特開2009−211277号公報
文書間の類似性を人間が判定する場合には、主に文書に含まれる重要な話題の共通性に着目して判定するのが一般的である。これに対し、従来の類似文書検索手法においては、文書に含まれる単語の出現頻度に重み付けをしており、つまり、大きな重みが付された単語に着目して類似性が判定されている。しかし、文書の類似性を判定する上で重要となる話題の中心をなす単語は、必ずしも出現頻度が高いとは限らず、出現の頻度が高いからといって話題の中心をなす単語であるとは限らない。従って、従来の類似文書検索手法においては、文書の類似性を判定する上で必ずしも重要でない単語にも大きな重みが与えられてしまう場合があり、その場合、重要な話題の共通性を類似度に反映できないため、人間による類似性の判定精度と差が生じるという問題がある。また、このような問題を回避するために、単語の重み付けのみを人為的に行うという方法も考えられるが、効率面やコスト面などの新たな問題が生じる。
本発明の目的は、文書間の類似性を文書に含まれる話題の重要度を加味して判定することより、従来より判定精度に優れた類似文書検索を可能とする類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体を提供することにある。
本発明の類似文書検索装置は、単語概念ベースと話題分類部と話題ベクトル計算部と話題カテゴリ分類部と重要度計算部と類似度計算部とを備える。
単語概念ベースは、単語とその特徴量である単語概念ベクトルの対の集合が格納されるデータベースである。
話題分類部は、文書を構成する各単語について、単語概念ベースから得られた各単語の単語概念ベクトルに基づき複数の話題に分類する。
話題ベクトル計算部は、話題の特徴量である話題ベクトルを、話題に分類された各単語の単語概念ベクトルの重心として求める。
話題カテゴリ分類部は、複数の話題について、話題ベクトルに基づき複数の話題カテゴリに分類する。
重要度計算部は、或る話題カテゴリpに属する話題を含む文書の集合Pにおける、各話題カテゴリi(iは話題カテゴリ分類部で分類されたpを含む各話題カテゴリの識別子)に属する話題を含む文書の出現頻度分布P(i)と、全文書の集合Qにおける、各話題カテゴリiに属する話題を含む文書の出現頻度分布Q(i)との分布の差を、或る話題カテゴリpの重要度として、全ての話題カテゴリについて重要度を求める。
類似度計算部は、2つの文書について、話題カテゴリごとに、当該話題カテゴリに属する話題の話題ベクトルの類似度を求め、これを当該話題カテゴリの重要度で正規化する計算を、全ての話題カテゴリについて実行し、その総和を当該2つの文書の類似度として求める。
以上の構成の下で、標本文書と各参照文書との類似度を以下のように求める。
予め複数の参照文書について、話題の分類、当該各話題の話題ベクトルの計算、当該各話題の話題カテゴリへの分類、及び各話題カテゴリの重要度の計算を、話題分類部、話題ベクトル計算部、話題カテゴリ分類部、及び重要度計算部においてそれぞれ実行しておく。
そして、標本文書について、話題の分類、当該各話題の話題ベクトルの計算、及び当該各話題の前記各話題カテゴリへの分類を、話題分類部、話題ベクトル計算部、及び話題カテゴリ分類部においてそれぞれ実行し、類似度計算部において、参照文書ごとに標本文書との類似度を求める。
本発明の類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体によれば、文書間の類似性を文書に含まれる話題の重要度を加味して判定を行うため、従来より判定精度に優れた類似文書検索が可能となる。
類似文書検索装置100の構成例を示すブロック図。 類似文書検索装置100の処理フロー例を示す図。 文書と話題と話題カテゴリとの関係を示す図。 或る話題カテゴリに属する話題を含む文書の集合Pと全文書の集合Qとの関係を示す図。
図1は本発明の類似文書検索装置100の構成例を示すブロック図である。また、図2はその処理フロー例である。類似文書検索装置100は、単語概念ベース110と話題分類部120と話題ベクトル計算部130と話題カテゴリ分類部140と重要度計算部150と類似度計算部160と検索結果表示部170とを備える。以下、まず、これら各部の機能を説明した上で、この装置を用いて複数の参照文書から標本文書と類似性の高い文書を検索する方法を説明する。
単語概念ベース110は、単語とその特徴量である単語概念ベクトルとの対の集合が格納されるデータベースである。単語概念ベース110は既存のものを用いることができ、例えば国語辞典の語義文から作成される辞書概念ベースや、新聞記事等の文書を大量に集めたコーパスから作成されるコーパスから作成されるコーパス概念ベースなどが知られている。このような単語概念ベースは一般に、単語間の類似性が高いほど、概念ベクトル間の距離が近いという性質を持つ。
話題分類部120は、文書を構成する各単語について、単語概念ベースから得られた各単語の単語概念ベクトルに基づき複数の話題に分類する。図3に示す例の場合、文書D1、D2、D3に含まれる各単語(図形やアルファベットで表示)をそれぞれ2つ、3つ、3つの話題に分類している。分類は、単語概念ベクトル間の距離が近いものを任意の方法でクラスタリングすればよい。
話題ベクトル計算部130は、話題の特徴量である話題ベクトルを、話題に分類された各単語の単語概念ベクトルの重心として求める。
話題カテゴリ分類部140は、複数の話題について、話題ベクトルに基づき複数の話題カテゴリに分類する。図3に示す例では、4つの話題カテゴリp、r、s、tに分類している。分類は、話題ベクトル間の距離が近いものを任意の方法でクラスタリングすればよい。
重要度計算部150は、或る話題カテゴリpに属する話題を含む文書の集合Pにおける、各話題カテゴリi(iは話題カテゴリ分類部140で分類されたpを含む各話題カテゴリの識別子)に属する話題を含む文書の出現頻度分布P(i)と、全文書の集合Qにおける、各話題カテゴリiに属する話題を含む文書の出現頻度分布Q(i)との分布の差を、前記或る話題カテゴリの重要度として、全ての話題カテゴリについて重要度を求める。
形式的な内容や偶発的な挿入など、重要性の低い話題カテゴリは、文書の重要な話題に関わりなく文書全体に一様に出現するため、他の話題カテゴリとの共起関係において従属性が低い。ここでは、着目する或る話題カテゴリを変数とし、当該話題カテゴリに共起する話題カテゴリ分類部140で分類された各話題カテゴリの出現頻度分布を考えたときに、着目する或る話題カテゴリの出現頻度分布と全話題カテゴリの出現頻度分布との差を重要度の尺度にする。
図3に示す例の場合、例えば、着目する或る話題カテゴリが話題カテゴリpであるとき、これに属する話題を含む文書の集合Pは、文書D1とD2である。そして、文書D1とD2に含まれる話題が各話題カテゴリi(=p、r、s、t)に出現する頻度は、P(p)=2(D1の話題とD2の話題の両方)、P(r)=2、P(s)=1(D2の話題のみ)、P(t)=0(D1の話題、D2の話題ともに無し)である。一方、全文書の集合Qに含まれる話題が各話題カテゴリに出現する頻度は、Q(p)=2(D1の話題とD2の話題)、P(r)=3(D1〜D3のすべての話題)、P(s)=2(D2の話題とD3の話題)、P(t)=1(D3の話題)である。そして、このように求めたP(i)とQ(i)を用いて、例えば次式により話題カテゴリpの重要度DKL(p)を求める。
Figure 0005427119
そして、同様な手順で話題カテゴリr、s、tについても重要度を求める。
式(1)で求めた重要度は、カルバック・ライブラー情報量であり、或る話題カテゴリを含む文書集合Pにおける各話題カテゴリiの共起関係と全文書集合Qにおける各話題カテゴリiの共起関係との差が、当該或る話題カテゴリの重要度として反映される。つまり、P(i)とQ(i)との分布の差が大きい話題カテゴリほど重要度が高くなり、逆にP(i)=Q(i)の場合は重要度は0となる。図4は、式(1)で求められる話題カテゴリの共起関係の差を模式化して表したものである。図4中の3つの話題カテゴリu1、u2、u3のうち、他の話題カテゴリと共起関係にある話題カテゴリu1は、独立した話題カテゴリu2、u3と比べて重要度が低くなる。このような話題カテゴリには、形式的内容や偶発などが含まれるため、類似度算出において、これらの話題カテゴリが占める割合が相対的に低くなる。
類似度計算部160は、2つの文書について、話題カテゴリごとに、当該話題カテゴリに属する話題の話題ベクトルの類似度を求め、これを当該話題カテゴリの重要度で正規化する計算を、全ての話題カテゴリについて実行し、その総和を当該2つの文書の類似度として求める。
具体的には2つの話題ベクトル(例えばp1、p2)の類似度は、例えば次式のコサイン距離として求めることができる。
Figure 0005427119
そして、例えば図3に示すように、2つの文書D1、D2が共通して含む文書カテゴリp(重要度DKL(p))の話題(話題ベクトルp1、p2)と文書カテゴリr(重要度DKL(r))の話題(話題ベクトルr1、r2)に基づき、その類似度を2つの文書D1、D2の類似度を次式のように求める。
Figure 0005427119
そして、検索結果表示部170は各文書の類似度に基づき、検索結果を表示する。
次に、この装置を用いて複数の参照文書から標本文書と類似性の高い文書を検索する方法を図2の処理フロー例(S1〜S9)に従い説明する。
予め複数の参照文書について、話題の分類、当該各話題の話題ベクトルの計算、当該各話題の話題カテゴリへの分類、及び各話題カテゴリの重要度の計算を、話題分類部120、話題ベクトル計算部130、話題カテゴリ分類部140、及び重要度計算部150においてそれぞれ実行しておく(S1〜S4)。
続いて、標本文書(任意の文書。参照文書として用いた文書であっても構わない。)について、話題の分類、当該各話題の話題ベクトルの計算、及び当該各話題の前記各話題カテゴリへの分類を、話題分類部120、話題ベクトル計算部130、及び話題カテゴリ分類部140においてそれぞれ実行し(S5〜S7)、類似度計算部160において、参照文書ごとに標本文書との類似度を求める(S8)。そして、検索結果表示部170において、標本文書に対する各参照文書の類似度に基づき、標本文書に類似する参照文書の検索結果を表示する(S9)。表示方法は任意であり、例えば、類似度を降順に並べることで、標本文書と類似性の高い参照文書のリストを表示できる。
以上のように本発明の類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体によれば、文書間の類似性を文書に含まれる話題の重要度を加味して判定を行うため、従来の装置と比べて判定精度に優れた類似文書検索が可能となる。
上記の各処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、本発明の類似文書検索装置をコンピュータによって実現する場合、装置の各部が有す機能の処理内容はプログラムによって記述される。そのプログラムは、例えば、ハードディスク装置に格納されており、実行時には必要なプログラムやデータがRAM(Random Access Memory)に読み込まれる。その読み込まれたプログラムがCPUにより実行されることにより、コンピュータ上で各処理内容が実現される。なお、処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
上記の処理機能を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、上述した実施形態とは別の実行形態として、コンピュータが可搬型記録媒体から直接このプログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。

Claims (8)

  1. 単語とその特徴量である単語概念ベクトルの対の集合が格納された単語概念ベースと、
    文書を構成する各単語について、単語概念ベースから得られた各単語の単語概念ベクトルに基づき複数の話題に分類する話題分類部と、
    話題の特徴量である話題ベクトルを、話題に分類された各単語の単語概念ベクトルの重心として求める話題ベクトル計算部と、
    複数の話題について、話題ベクトルに基づき複数の話題カテゴリに分類する話題カテゴリ分類部と、
    或る話題カテゴリpに属する話題を含む文書の集合Pにおける、各話題カテゴリi(iは話題カテゴリ分類部で分類されたpを含む各話題カテゴリの識別子)に属する話題を含む文書の出現頻度分布P(i)と、全文書の集合Qにおける、各話題カテゴリiに属する話題を含む文書の出現頻度分布Q(i)との分布の差を、或る話題カテゴリpの重要度として、全ての話題カテゴリについて重要度を求める重要度計算部と、
    2つの文書について、話題カテゴリごとに、当該話題カテゴリに属する話題の話題ベクトルの類似度を求め、これを当該話題カテゴリの重要度で正規化する計算を、全ての話題カテゴリについて実行し、その総和を当該2つの文書の類似度として求める類似度計算部と、
    を備え、
    予め複数の参照文書について、話題の分類、当該各話題の話題ベクトルの計算、当該各話題の話題カテゴリへの分類、及び各話題カテゴリの重要度の計算を、話題分類部、話題ベクトル計算部、話題カテゴリ分類部、及び重要度計算部においてそれぞれ実行しておき、
    標本文書について、話題の分類、当該各話題の話題ベクトルの計算、及び当該各話題の前記各話題カテゴリへの分類を、話題分類部、話題ベクトル計算部、及び話題カテゴリ分類部においてそれぞれ実行し、
    類似度計算部において、参照文書ごとに標本文書との類似度を求めることにより、標本文書に類似する文書を検索する類似文書検索装置。
  2. 請求項1に記載の類似文書検索装置であって、
    前記重要度計算部は、前記或る話題カテゴリpの重要度DKL(p)を、
    Figure 0005427119

    により求めることを特徴とする類似文書検索装置。
  3. 請求項1又は2に記載の類似文書検索装置であって、
    前記類似度計算部は、各話題の話題ベクトルp1、p2の類似度をコサイン距離
    Figure 0005427119

    として求めることを特徴とする類似文書検索装置。
  4. 単語とその特徴量である単語概念ベクトルの対の集合が格納された単語概念ベースを用い、
    複数の参照文書について、
    類似文書検索装置の話題分類部が、文書を構成する各単語について、単語概念ベースから得られた各単語の単語概念ベクトルに基づき複数の話題に分類する第1話題分類ステップを実行し、
    類似文書検索装置の話題ベクトル計算部が、話題の特徴量である話題ベクトルを、話題に分類された各単語の単語概念ベクトルの重心として求める第1話題ベクトル計算ステップを実行し、
    類似文書検索装置の話題カテゴリ分類部が、複数の話題について、話題ベクトルに基づき複数の話題カテゴリに分類する第1話題カテゴリ分類ステップを実行し、
    類似文書検索装置の重要度計算部が、或る話題カテゴリpに属する話題を含む文書の集合Pにおける、各話題カテゴリi(iは話題カテゴリ分類部で分類されたpを含む各話題カテゴリの識別子)に属する話題を含む文書の出現頻度分布P(i)と、全文書の集合Qにおける、各話題カテゴリiに属する話題を含む文書の出現頻度分布Q(i)との分布の差を、或る話題カテゴリpの重要度として、全ての話題カテゴリについて重要度を求める重要度計算ステップを実行し、
    標本文書について、
    類似文書検索装置の話題分類部が、文書を構成する各単語について、単語概念ベースから得られた各単語の単語概念ベクトルに基づき複数の話題に分類する第2話題分類ステップを実行し、
    類似文書検索装置の話題ベクトル計算部が、話題の特徴量である話題ベクトルを、話題に分類された各単語の単語概念ベクトルの重心として求める第2話題ベクトル計算ステップを実行し、
    類似文書検索装置の話題カテゴリ分類部が、複数の話題について、話題ベクトルに基づき前記複数の話題カテゴリに分類する第2話題カテゴリ分類ステップを実行し、
    類似文書検索装置の類似度計算部が、標本文書と参照文書について、話題カテゴリごとに、当該話題カテゴリに属する話題の話題ベクトルの類似度を求め、これを当該話題カテゴリの重要度で正規化する計算を、全ての話題カテゴリについて実行し、その総和を標本文書と当該参照文書の類似度として、全ての参照文書について標本文書との類似度を求める類似度計算ステップ
    を実行する類似文書検索方法。
  5. 請求項4に記載の類似文書検索方法であって、
    前記重要度計算ステップは、前記或る話題カテゴリpの重要度DKL(p)を、
    Figure 0005427119

    により求めることを特徴とする類似文書検索方法。
  6. 請求項4又は5に記載の類似文書検索方法であって、
    前記類似度計算ステップは、各話題の話題ベクトルp1、p2の類似度をコサイン距離
    Figure 0005427119

    として求めることを特徴とする類似文書検索方法。
  7. 請求項1乃至3のいずれかに記載の類似文書検索装置としてコンピュータを機能させるためのプログラム。
  8. 請求項1乃至3のいずれかに記載の類似文書検索装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2010135349A 2010-06-14 2010-06-14 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体 Expired - Fee Related JP5427119B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010135349A JP5427119B2 (ja) 2010-06-14 2010-06-14 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010135349A JP5427119B2 (ja) 2010-06-14 2010-06-14 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2012003333A JP2012003333A (ja) 2012-01-05
JP5427119B2 true JP5427119B2 (ja) 2014-02-26

Family

ID=45535272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010135349A Expired - Fee Related JP5427119B2 (ja) 2010-06-14 2010-06-14 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP5427119B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5758349B2 (ja) * 2012-02-15 2015-08-05 日本電信電話株式会社 文書カテゴライズ装置とその方法とプログラム
CN105488151A (zh) * 2015-11-27 2016-04-13 小米科技有限责任公司 参考文档的推荐方法及装置
JP2019211808A (ja) * 2018-05-31 2019-12-12 日本電信電話株式会社 類似性評価装置、その方法、及びプログラム
CN117836763A (zh) * 2021-08-26 2024-04-05 株式会社半导体能源研究所 文件分类系统及文件分类方法

Also Published As

Publication number Publication date
JP2012003333A (ja) 2012-01-05

Similar Documents

Publication Publication Date Title
US11222055B2 (en) System, computer-implemented method and computer program product for information retrieval
Ma et al. Exploring performance of clustering methods on document sentiment analysis
Hilden The area under the ROC curve and its competitors
JP2007219880A (ja) 評判情報処理プログラム、方法及び装置
CN107391921B (zh) 一种科学文献中参考文献影响力评估方法
Sohn et al. Optimal training sets for bayesian prediction of MeSH® assignment
US8825641B2 (en) Measuring duplication in search results
Weisser et al. Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data
JP5427119B2 (ja) 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体
CN108334588A (zh) 一种用户标签构建方法及装置
Hajhmida et al. Predicting mobile application breakout using sentiment analysis of Facebook posts
CN108681564A (zh) 关键词和答案的确定方法、装置和计算机可读存储介质
Jiang et al. Integrating image caption information into biomedical document classification in support of biocuration
Bartol et al. Nano language and distribution of article title terms according to power laws
CN106997340B (zh) 词库的生成以及利用词库的文档分类方法及装置
JP7041299B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
Guo et al. An opinion feature extraction approach based on a multidimensional sentence analysis model
Wang et al. Improved pagerank and new indices for academic impact evaluation using AI papers as case studies
KR101347884B1 (ko) 사이트 특성 단어를 이용한 연관 사이트 제공 방법 및 시스템
Sharma et al. A trend analysis of significant topics over time in machine learning research
Lucas et al. Sentiment analysis and image classification in social networks with zero-shot deep learning: applications in tourism
Roy et al. A tag2vec approach for questions tag suggestion on community question answering sites
JP5310196B2 (ja) 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法
JP5890413B2 (ja) 多数のデータレコードをサーチする方法及びサーチエンジン
KR20090093153A (ko) 사이트 특성 단어를 이용한 연관 사이트 제공 방법 및시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5427119

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees