JP2010186421A - タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム - Google Patents

タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム Download PDF

Info

Publication number
JP2010186421A
JP2010186421A JP2009031498A JP2009031498A JP2010186421A JP 2010186421 A JP2010186421 A JP 2010186421A JP 2009031498 A JP2009031498 A JP 2009031498A JP 2009031498 A JP2009031498 A JP 2009031498A JP 2010186421 A JP2010186421 A JP 2010186421A
Authority
JP
Japan
Prior art keywords
taxonomy
class
document
positive example
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009031498A
Other languages
English (en)
Other versions
JP5382917B2 (ja
Inventor
Takahiro Madokoro
峻洋 間所
Takeshi Harada
剛 原田
Sumio Miyazaki
純生 宮崎
Kenichiro Okamoto
賢一郎 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009031498A priority Critical patent/JP5382917B2/ja
Publication of JP2010186421A publication Critical patent/JP2010186421A/ja
Application granted granted Critical
Publication of JP5382917B2 publication Critical patent/JP5382917B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができるタクソノミ検索装置を提供する。
【解決手段】タクソノミ検索装置が、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部と、入力された文書をベクトル化し、当該ベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを文書ベクトル記憶部から検索する検索部と、を有する。
【選択図】図2

Description

本発明は、タクソノミを検索するタクソノミ検索装置に関する。
従来、ナレッジをタクソノミ上に整理しておくことにより、ナレッジを共有する技術が知られている。このような従来技術として、特許文献1、特許文献2または非特許文献1が知られている。
特開2003−316765号公報 特開2008−250652号公報
間所峻洋, 中辻真, 岡本賢一郎, 宮崎純生, 原田剛, "タクソノミを活用したメールに潜むKnow-How,Know-Who可視化技術"、第19回セマンティックウェブとオントロジー研究会,2008.
しかしながら、従来技術においては、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておかないと、タクソノミ上に整理された自身が必要とするナレッジに到達することができないという問題があった。
たとえば、「この前開発が完了したお客様サービスについて、検証を実施した際に問題になった設備について、その原因と対処法をまとめたい。」という場合に、ナレッジが「タクソノミ上のどのクラスに属するのか解らない」ために、タクソノミ上に整理された自身が必要とするナレッジに到達することができないという問題があった(図11参照)。
このように、従来のタクソノミにおいては、目的とするクラスへの到達が困難であり、ナレッジを十分に活用することができないという問題があった。
本発明は、このような事情に鑑みてなされたもので、その目的は、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができるタクソノミ検索装置を提供することにある。
この発明は上述した課題を解決するためになされたもので、請求項1に記載の発明は、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部と、入力された文書をベクトル化し、当該ベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを前記文書ベクトル記憶部から検索する検索部と、を有することを特徴とするタクソノミ検索装置である。
請求項2に記載の発明は、前記タクソノミクラスとタクソノミとが予め関連付けて記憶されているタクソノミ記憶部、を有し、前記検索部が、前記検索したタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する、ことを特徴とする請求項1に記載のタクソノミ検索装置である。
請求項3に記載の発明は、前記検索部が、前記検索したタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する場合に、前記検索したタクソノミクラスと同一階層となるタクソノミクラス間の関係を示す関係図を出力するとともに、当該出力した関係図において前記検索したタクソノミクラスの位置を強調表示して出力する、ことを特徴とする請求項2に記載のタクソノミ検索装置である。
請求項4に記載の発明は、前記検索部が、前記出力した関係図に含まれているタクソノミクラスが選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する、ことを特徴とする請求項3に記載のタクソノミ検索装置である。
請求項5に記載の発明は、前記検索部が、入力された文書をベクトル化する第1の文書ベクトル生成部と、前記第1の文書ベクトル生成部がベクトル化した文書と、前記文書ベクトル記憶部から読み出した正例文書ベクトルとの類似度を算出するベクトル類似度演算部と、前記ベクトル類似度演算部が算出した類似度が最も高い正例文書ベクトルと対応付けられているタクソノミクラスを前記文書ベクトル記憶部から読み出して出力するタクソノミ表示部と、を有することを特徴とする請求項1から請求項4のいずれか1項に記載のタクソノミ検索装置である。
請求項6に記載の発明は、前記タクソノミ記憶部から読み出したタクソノミに基づいて正例文書を生成する正例文書生成部と、前記正例文書生成部が生成した正例文書をベクトル化するとともに、当該ベクトル化した正例文書を前記正例文書ベクトルとして、当該タクソノミに対応する前記タクソノミクラスと関連付けて前記文書ベクトル記憶部に記憶させる第2の文書ベクトル生成部と、を有することを特徴とする請求項2から請求項5のいずれか1項に記載のタクソノミ検索装置である。
請求項7に記載の発明は、前記正例文書生成部が、前記タクソノミ記憶部から読み出したタクソノミクラスにおいて、親クラスとなるタクソノミクラスを示す文字列と子クラスとなるタクソノミクラスを示す文字列とで重複する文字列を、前記子クラスとなるタクソノミクラスを示す文字列から削除するフィルタリング処理部と、前記フィルタリング処理部が重複を削除したタクソノミクラスを示す文字列において、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する前記正例文書として生成する正例文書化部と、を有することを特徴とする請求項6に記載のタクソノミ検索装置である。
請求項8に記載の発明は、前記正例文書化部が、前記自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する前記正例文書として生成する場合に、前記タクソノミの階層構造における前記親クラスと自タクソノミクラスとの間の階層数に基づいて、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列よりも自タクソノミクラスの文字列を組み合わせた文字列の方が前記正例文書における出現頻度が多くなるように、前記自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせて前記正例文書を生成する、ことを特徴とする請求項6に記載のタクソノミ検索装置である。
請求項9に記載の発明は、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する検索手順、を有することを特徴とするタクソノミ検索方法である。
請求項10に記載の発明は、タクソノミ検索装置としてのコンピュータに、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する検索手順、を実行させるためのタクソノミ検索プログラムである。
この発明によれば、タクソノミ検索装置が、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する。これにより、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができるという効果を奏する。
この発明の一実施形態によるタクソノミ検索装置の動作概要を示す説明図である。 この発明の一実施形態によるタクソノミ検索装置の構成を示すブロック図である。 一例としてのタクソノミ記憶部に記憶されるデータ構造を示すデータ構造図である。 一例としての文書ベクトル記憶部に記憶されるデータ構造を示すデータ構造図である。 タクソノミ検索装置のタクソノミを検索する場合の動作を示すフローチャートである。 一例としてのタクソノミ検索装置により検索されたタクソノミの結果を示す画面図である。 タクソノミ検索装置の事前処理する場合における一例としての動作を示すフローチャートである。 図7のステップS201からステップS204の具体例を示す図である。 図8の場合のタクソノミ記憶部に記憶されるタクソノミのデータを示す図である。 タクソノミ検索装置の動作概要を示す説明図である。 従来のタクソノミ検索装置の動作概要と問題とを示す説明図である。
最初に、本実施形態におけるナレッジとタクソノミとについて説明する。ナレッジとは、マニュアルやメールなどにより文書形式で記述されている知識や方法論である。例えば、ナレッジとして、技術的なナレッジ、販売・営業ナレッジ、業務遂行のための事務処理ナレッジなどがある。
タクソノミとは、たとえばドメインごとの専門家が構築する、そのドメインの情報を網羅的に分類する概念(クラス)階層として定義されるものである。ここでいうドメインとは、たとえば、上述したナレッジの分類であってもよい。タクソノミは、クラス階層のみからなるため、オントロジのように対象世界における概念空間の関係を網羅的かつ詳細に記述することはできない。しかし、構築がオントロジに比べ容易であるという利点がある。
なおタクソノミはドメインごとの専門家ではなく、テキスト分類装置により分類されてもよい。このテキスト分類装置は、コサイン類似度やユークリッド距離をベースとする分類方式、カルバック・ライブラー距離をベースとする分類方式、または、この2つの分類方式を組み合わせた方式により、マニュアルやメールなどの文書形式のナレッジをタクソノミとして分類する。
次に、図1を用いて、本発明の実施の形態によるタクソノミ検索装置1の概要について説明する。たとえば、ユーザは「この前開発が完了したお客様サービスについて、検証を実施した際に問題になった設備について、その原因と対処法をまとめたい。」という自然文を、タクソノミ検索装置1に入力する。そして、タクソノミ検索装置1は、入力された自然文に対応するタクソノミのクラスを返答する。これにより、ユーザは、タクソノミのクラスがわかる。次に、ユーザは、タクソノミ上のクラスを指定してナレッジを取得する。
このように、従来技術のようにタクソノミに直接アクセスするのではなく、本実施形態によるタクソノミ検索装置1においては、文書クラスタリング技術を用いて、入力された自然文に対してタクソノミのクラスを検索することを、フロントエンドとする。これにより、ユーザは、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができる。なお、本実施形態においては、文書クラスタリング技術を利用し、タクソノミ上の各クラス名を分類先とした文書分類を実行しておく必要がある。
以下、図面を参照して、本発明の実施の形態について説明する。図2は、この発明の一実施形態によるタクソノミ検索装置1の構成を示す概略ブロック図である。ここでは、タクソノミ検索装置1は、ユーザが用いるユーザ端末100とネットワークを介して接続されている場合について説明する。
タクソノミ検索装置1は、タクソノミ記憶部2(タクソノミDB2)と、文書ベクトル記憶部3(文書ベクトルDB3)と、文書クラスタリング部4と、正例文書生成部5と、ユーザインタフェース部6とを有している。この文書クラスタリング部4は、第1の文書ベクトル生成部411および第2の文書ベクトル生成部412を有する文書ベクトル生成部41と、ベクトル類似度演算部42とを有している。また正例文書生成部5は、フィルタリング処理部51と正例文書化部52とを有している。またユーザインタフェース部6は、クエリ受付部61とタクソノミ表示部62とを有している。
ここで本実施形態においては、文書クラスタリング部4が有する第1の文書ベクトル生成部411およびベクトル類似度演算部42と、ユーザインタフェース部6が有するタクソノミ表示部62とが、検索部7として機能する。
また本実施形態においては、正例文書生成部5が有するフィルタリング処理部51および正例文書化部52と、文書クラスタリング部4が有する第2の文書ベクトル生成部412とが、事前処理部8として機能する。
<タクソノミの検索に関係する構成:検索部7の構成>
まず、上述したタクソノミ検索装置1の構成において、タクソノミの検索に関係する構成(検索部7の構成)について説明する。文書ベクトル記憶部3には、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている。タクソノミ記憶部2には、タクソノミクラスとタクソノミとが予め関連付けて記憶されている。このタクソノミには、タクソノミとしてのナレッジの情報が含まれている。
図3と図4とを用いて、一例としてのタクソノミ記憶部2と文書ベクトル記憶部3とのデータ構造について説明する。
タクソノミ記憶部2には、クラスIDとクラス名と親クラスIDとが関連付けて、タクソノミクラス毎に記憶されている。このクラスIDは、タクソノミのクラスを一意に識別するIDであり、本実施形態におけるタクソノミクラスに相当する。またクラス名は、クラスの名称を示す文字列である。また親クラスIDは、親クラスのクラスIDである。またここでは、タクソノミ記憶部2には、クラスIDとクラス名と親クラスIDとに関連付けて当該タクソノミクラスのナレッジが、タクソノミクラス毎に記憶されているものとする。
文書ベクトル記憶部3には、クラスIDとクラスベクトルとが、各タクソノミクラス毎に関連付けて記憶されている。このクラスIDは、タクソノミのクラスを一意に識別するIDである。またクラスベクトルは、各クラスの文書ベクトルである。
図2の説明に戻り、クエリ受付部61は、ユーザ端末100からネットワークを介して文書が入力される。この文書は、たとえば「この前開発が完了したお客様サービスについて、検証を実施した際に問題になった設備について、その原因と対処法をまとめたい。」という自然文である。
検索部7は、クエリ受付部61に入力された文書をベクトル化し、当該ベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを文書ベクトル記憶部3から検索して、ネットワークを介してユーザ端末100に出力する。
すなわち、検索部7を構成する第1の文書ベクトル生成部411が、クエリ受付部61に入力された文書をベクトル化する。また検索部7を構成するベクトル類似度演算部42が、第1の文書ベクトル生成部411がベクトル化した文書と、文書ベクトル記憶部3から読み出した正例文書ベクトルとの類似度を算出する。また検索部7を構成するタクソノミ表示部62が、ベクトル類似度演算部42が算出した類似度が最も高い正例文書ベクトルと対応付けられているタクソノミクラスを文書ベクトル記憶部3から読み出して、ネットワークを介してユーザ端末100に出力する。
また、この検索部7を構成するタクソノミ表示部62は、検索したタクソノミクラスに対応するタクソノミをタクソノミ記憶部2から読み出して出力する場合に、検索したタクソノミクラスと同一階層となるタクソノミクラス間の関係を示す関係図を出力するとともに、当該出力した関係図において検索したタクソノミクラスの位置を強調表示して出力する(後述する図6参照)。
また検索部7を構成するタクソノミ表示部62は、出力した関係図に含まれているタクソノミクラスが選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミをタクソノミ記憶部2から読み出して、ネットワークを介してユーザ端末100に出力する。
次に図5を用いて、タクソノミ検索装置1のタクソノミを検索する場合の動作について説明する。まず、クエリ受付部61に、ユーザ端末100からネットワークを介して文書が入力される(ステップS101)。すなわち、ユーザインタフェース部6が、ユーザから質問文をクエリとして受け取り、検索部7(文書クラスタリング部4)に渡す。
次に、検索部7を構成する第1の文書ベクトル生成部411が、クエリ受付部61に入力された文書をベクトル化する(ステップS102)。すなわち、受け取ったクエリを文書ベクトル化する。たとえば第1の文書ベクトル生成部411は、入力された文書に対して形態素解析を実行し、入力された文書を構成する語の重みに基づいたベクトルを生成する。このような技術として、tf−idf法が知られている。
次に、検索部7を構成するベクトル類似度演算部42が、第1の文書ベクトル生成部411がベクトル化した文書と、文書ベクトル記憶部3から読み出した正例文書ベクトルとの類似度を算出する(ステップS103〜ステップS106参照)。
ここで検索部7を構成するベクトル類似度演算部42は、たとえば、次に説明するステップS103〜ステップS106により、第1の文書ベクトル生成部411がベクトル化した文書と、文書ベクトル記憶部3から読み出した正例文書ベクトルとの類似度を算出する。
まず、文書ベクトル記憶部3から各タクソノミクラスの正例文書ベクトルを順に読み込む(ステップS103)。すなわち、後述する事前処理で生成しておいた、各タクソノミクラスの正例文書ベクトルを読み込む。
次に、ベクトル化した文書(クエリの文書ベクトル)と、読み込んだタクソノミクラスの正例文書ベクトルとの類似度を算出する(ステップS104)。たとえば、ベクトル化した文書と正例文書ベクトルとが成す角度の余弦として、類似度を算出する。
次に、入力されたクエリに対する全タクソノミクラスの類似度が算出できたか否かを判定する(ステップS105)。このステップS105で、クエリに対する全タクソノミクラスの類似度が算出できていないと判定された場合には、ステップS103からの処理を繰り返す。このステップS105で、逆に、クエリに対する全タクソノミクラスの類似度が算出できたと判定された場合には、処理をステップS106に進める。これにより、全タクソノミクラスに対して類似度の計算を実行する。
上述したステップS103〜ステップS105の技術として、次の文献1および文献2による技術が知られている。
(文献1)北研二, 津田和彦, 獅々堀正幹:情報検索アルゴリズム,共立出版, pp.60-63, 2002.
(文献2)別所克人,内山俊郎,片岡良治:単語間の階層関係に基づくテキスト分類方式,信学技報, Vol.PRMU2007-15, pp.79-84, 2007.
次に、検索部7を構成するベクトル類似度演算部42が、類似度が最も高い正例文書ベクトルと対応付けられているタクソノミクラスを、検索部7を構成するタクソノミ表示部62に出力する(ステップS106)。これにより、ベクトル化したクエリに最も類似した正例文書ベクトルを持つタクソノミクラスが、同定される。
次に、検索部7を構成するタクソノミ表示部62が、ベクトル類似度演算部42から入力されたタクソノミクラス、すなわち、ベクトル類似度演算部42が算出した類似度が最も高い正例文書ベクトルと対応付けられているタクソノミクラスを、文書ベクトル記憶部3から読み出して、ネットワークを介してユーザ端末100に出力する(ステップS107)。
このステップS107において、検索部7を構成するタクソノミ表示部62は、検索したタクソノミクラスと同一階層となるタクソノミクラス間の関係を示す関係図を出力するとともに、当該出力した関係図において検索したタクソノミクラスの位置を強調表示して出力する(後述する図6参照)。
たとえば図6に示すように、「開発」というタクソノミクラスが検索され、この「開発」というタクソノミクラスと同一階層となるタクソノミクラスが表示される。また、それぞれのタクソノミクラス間の関係が、関係図の一例として、ネットワーク図により表示される。また、このネットワーク図において、検索されたタクソノミクラスである「開発」は、強調表示されている。たとえば強調表示する方法として、このタクソノミクラスのみを他のタクソノミクラスと異なる色とする方法や、このタクソノミクラスのみを点滅させる方法などがある。
このように、ユーザインタフェース部6のタクソノミ表示部62は、ベクトル類似度演算部42から結果を受け取り、タクソノミ記憶部2からタクソノミクラスの全体を取得し、タクソノミクラスの全体における検索したタクソノミクラスの位置を強調表示してユーザ端末100に表示させる。これにより、タクソノミクラスの全体において、検出されたタクソノミクラスをユーザに通知する。
なお、ここでいうタクソノミクラスの全体とは、検索したタクソノミクラスと近い関係を有するタクソノミクラスであって、検索したタクソノミクラスの位置とともに上述した関係図において表示できるタクソノミクラスであってもよい。たとえばタクソノミクラスの全体とは、上述したように、検索したタクソノミクラスと同一階層のタクソノミクラスであってもよい。またここでいう関係図とは、図6に示すように、たとえば各タクソノミの関係を示したネットワーク図であってもよい。
その後、ユーザは、関係図に表示されているタクソノミクラスの中からいずれかのタクソノミクラスを、ユーザ端末100を用いて選択する。ここでユーザは、強調表示されているタクソノミクラスを選択することも可能であるし、強調表示されていないタクソノミクラスを選択することも可能である。
たとえば、図6において、強調表示されている「開発」というタクソノミクラスを選択することも可能であるし、「研究開発」または「商用開発」というタクソノミクラスなどの図6に表示されているタクソノミクラスを選択することも可能である。これにより、ユーザは、より自身が必要とするタクソノミクラスを取得することができる。
次に、検索部7を構成するタクソノミ表示部62は、関係図に表示されているタクソノミクラスの中からいずれかのタクソノミクラスがユーザ端末100により選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミをタクソノミ記憶部2から読み出して、ネットワークを介してユーザ端末100に出力する。すなわち、検索部7を構成するタクソノミ表示部62は、選択されたタクソノミクラスと関連付けられているナレッジをタクソノミ記憶部2から読み出して、ネットワークを介してユーザ端末100に出力する。
上記に説明したように、本実施形態によるタクソノミ検索装置1の検索部7は、情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部3から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する。
これにより、ユーザ端末100のユーザは、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができるという効果を奏する。
また本実施形態によるタクソノミ検索装置1の検索部7は、図6に示すように、検索したタクソノミクラスと同一階層となるタクソノミクラス間の関係を示す関係図を出力するとともに、当該出力した関係図において検索したタクソノミクラスの位置を強調表示して出力する。これによりユーザは、検索したタクソノミクラスがタクソノミ全体のどのような位置にあるかを確認することができる。
また本実施形態によるタクソノミ検索装置1の検索部7は、出力した関係図に含まれているタクソノミクラスが選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミをタクソノミ記憶部2から読み出して、ネットワークを介してユーザ端末100に出力する。これのより、ユーザは、検索したタクソノミクラスについてのナレッジを取得することも可能であるし、当該検索したタクソノミクラスと関連するタクソノミクラスについてのナレッジを取得することも可能である。これにより、ユーザは、より自身が必要とするタクソノミクラスを取得することができる。
<事前処理>
次に、図1に示したタクソノミ検索装置1の構成において、事前処理に関係する構成(事前処理部8の構成)について説明する。まず、この事前処理について説明する。上記に説明したように本実施形態においては、タクソノミの検索をするために、文書ベクトル記憶部3にはタクソノミクラスと正例文書ベクトルとが関連付けて予め記憶されている必要がある。
更に、この文書ベクトル記憶部3に記憶されているタクソノミクラスは、タクソノミ記憶部2に記憶されているタクソノミクラスと一致している必要がある。また、文書ベクトル記憶部3に記憶されている正例文書ベクトルは、ベクトル化されたユーザからの自然言語による入力と類似していると判定された場合に、適切なタクソノミクラスが検出できる必要がある。
この文書ベクトル記憶部3にはタクソノミクラスと正例文書ベクトルとを、タクソノミ検索装置1を管理する管理者が、上記の条件を満たすようにして、予め登録しておくことも可能である。しかし、タクソノミの情報量が多くなると、その登録には時間を要し、管理者の負担が増大するという問題がある。
このように、正例文書がなければタクソノミのクラスへのユーザクエリのマッピングが行えない。しかしながら、タクソノミのクラスが多くなればなるほど、正例文書を生成するのは難しくなる。
そこで、タクソノミクラスと正例文書ベクトルとが関連付けて文書ベクトル記憶部3に、事前処理として自動登録されることが望ましい。以降、この文書ベクトル記憶部3にタクソノミクラスと正例文書ベクトルとを登録する事前処理をする場合の構成について説明する。
正例文書生成部5は、タクソノミ記憶部2から読み出したタクソノミに基づいて正例文書を生成する。第2の文書ベクトル生成部412は、正例文書生成部5が生成した正例文書をベクトル化するとともに、当該ベクトル化した正例文書を正例文書ベクトルとして、当該タクソノミに対応するタクソノミクラスと関連付けて文書ベクトル記憶部3に記憶させる。これにより、文書ベクトル記憶部3には、タクソノミクラスと正例文書ベクトルとが関連付けて登録される。この第2の文書ベクトル生成部412は、第1の文書ベクトル生成部411と同様のベクトル化する機能を有している。
次に、正例文書生成部5の構成について詳細に説明する。正例文書生成部5のフィルタリング処理部51は、タクソノミ記憶部2から読み出したタクソノミクラスにおいて、親クラスとなるタクソノミクラスを示す文字列と子クラスとなるタクソノミクラスを示す文字列とで重複する文字列を、子クラスとなるタクソノミクラスを示す文字列から削除する。なお、フィルタリング処理部51が重複する文字列を削除する場合には、処理用の一時的な領域(たとえば後述するテーブルT1)において、重複する文字列を文字列から削除する。よって、タクソノミ記憶部2に記憶されている情報が、フィルタリング処理部51により変更されることや削除されることはない。
正例文書生成部5の正例文書化部52は、フィルタリング処理部51が重複を削除したタクソノミクラスを示す文字列において、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する正例文書として生成する。
この正例文書を生成する場合に、正例文書化部52は、タクソノミの階層構造における親クラスと自タクソノミクラスとの間の階層数に基づいて、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列よりも自タクソノミクラスの文字列を組み合わせた文字列の方が正例文書における出現頻度が多くなるように、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせて正例文書を生成する。
次に図7を用いて、タクソノミ検索装置1の事前処理する場合における一例としての動作を説明する。まず、正例文書生成部5のフィルタリング処理部51が、タクソノミ記憶部2から読み出したタクソノミクラスにおいて、親クラスとなるタクソノミクラスを示す文字列と子クラスとなるタクソノミクラスを示す文字列とで重複する文字列を、子クラスとなるタクソノミクラスを示す文字列から削除する(ステップS201〜ステップS203参照)。この処理については、後に図8とともに詳述する。
次に、正例文書生成部5の正例文書化部52が、フィルタリング処理部51が重複を削除したタクソノミクラスを示す文字列において、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する正例文書として生成する(ステップS204)。
次に、第2の文書ベクトル生成部412が、正例文書生成部5が生成した正例文書をベクトル化し(ステップS205)、当該ベクトル化した正例文書を正例文書ベクトルとして、当該タクソノミに対応するタクソノミクラスと関連付けて文書ベクトル記憶部3に記憶させる(ステップS206)。これにより、文書ベクトル記憶部3には、タクソノミクラスと正例文書ベクトルとが関連付けて登録される。
次に、図8を用いて、上述した図7のステップS201〜ステップS203の処理、および、ステップS204の処理について、具体的に説明する。まずステップS201において、フィルタリング処理部51は、タクソノミ記憶部2からタクソノミクラスを読み出す。ここでは、タクソノミ記憶部2には、図9に示すようなデータが記憶されていたものとする。
次にステップS202において、フィルタリング処理部51は、タクソノミ記憶部2から読み出したタクソノミクラスを、テーブル上に展開する(図8のテーブルT1参照)。このテーブルとは、タクソノミクラスを示す文字列に対して文字列処理するために用いられる一時的な作業領域としてのテーブルである。また、ここでいうテーブル上に展開するとは、タクソノミクラスの親クラスと子クラスとに基づいて、各タクソノミクラスを示す文字列を表形式に並べることである。
このステップS202により、たとえば図8のテーブルT1に示すように、親クラスから子クラスへ、「業務、報告、経理、四半期決算」と、「業務、報告、福利厚生、カフェテリアプラン、期首」と、「業務、物品、物品管理、固定資産管理」と、「業務、物品、物品管理、利活用物品」という文字列で識別される4つのクラスが展開されたものとする。また、ここではカンマという符号により、クラスを示す文字列がそれぞれ区切られているものとして説明する。
次にステップS203において、フィルタリング処理部51が、タクソノミ記憶部2から読み出してテーブルT1に展開したタクソノミクラスにおいて、親クラスとなるタクソノミクラスを示す文字列と子クラスとなるタクソノミクラスを示す文字列とで重複する文字列を、子クラスとなるタクソノミクラスを示す文字列から削除する
たとえば、上述したテーブルT1の「業務、物品、物品管理、固定資産管理」という文字列で識別されるクラスにおいて、「物品」および「管理」という文字列が重複している。この重複する文字列が子クラスとなるタクソノミクラスを示す文字列から削除され、「業務、物品、物品管理、固定資産管理」という文字列で識別されるクラスは、「業務、物品、管理、固定資産」という文字列で識別されるクラスに更新される(テーブルT2参照)。同様に、「業務、物品、物品管理、利活用物品」は「業務、物品、管理、利活用」に更新される(テーブルT2参照)。
このように親クラスのキーワードと重複したキーワードが子クラスにある場合、正例文書に重複するキーワードが大量に出力されるため、重み付けが偏ることになる。そのため、親クラスと子クラスとのタクソノミの分析結果が明確になるように、親クラスの重複ワードは削除している。
次にステップS204において、正例文書化部52が、フィルタリング処理部51が重複を削除したタクソノミクラスを示す文字列において、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する正例文書として生成する。また、この正例文書として生成する場合に、正例文書化部52は、タクソノミの階層構造における親クラスと自タクソノミクラスとの間の階層数に基づいて、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列よりも自タクソノミクラスの文字列を組み合わせた文字列の方が正例文書における出現頻度が多くなるように、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせて正例文書を生成する。
たとえば、正例文書化部52は、対象となるクラスについて、当該クラスのルートとなるクラスの階層数を0として、ルートから対象となるクラスまで、階層が1つ増加する毎に、階層数を1だけ増加させるものとする。そして、予め定められている係数aをその階層数の値でべき乗した回数だけ、各階層のクラスを示す文字列を正例文書に順に記載する。そしてルートから対象のクラスまでの全ての文字列を、正例文書に記載する。なお、ここでいう各階層のクラスを示す文字列とは、上述したフィルタリング処理部51が重複を削除したタクソノミクラスを示す文字列のことである。
たとえば、「業務、報告、福利厚生」というクラス「福利厚生」では、ルートである「業務」の階層数が0であり、次の階層である「報告」の階層数が1であり、次の階層である「福利厚生」の階層数が2である。ここで係数a=2の場合には、「業務」を1回(=2)だけ正例文書に記載し、「報告」を2回(=2)だけ正例文書に記載し、「福利厚生」を4回(=2)だけ正例文書に記載する。よって、クラス「福利厚生」に対する正例文書は、たとえば、「業務、報告、報告、福利厚生、福利厚生、福利厚生、福利厚生」となる(図8の符合C1参照)。
同様に、「業務、物品、管理、利活用」というクラス「利活用物品」で、係数a=2の場合には、「業務、物品、物品、管理、管理、管理、管理、利活用、利活用、利活用、利活用、利活用、利活用、利活用、利活用」となる(図8の符合C2参照)。
このように、出力される正例文書は、該当のクラスのキーワードをより重くするため、子クラスのように枝葉の階層であればあるほどキーワードの出力回数が多くなる。そのためこの正例文書により、ベクトル化されたユーザからの自然言語による入力と類似していると判定された場合に、適切なタクソノミクラスが検出できるようになる。
また、上記には一例として係数a=2の場合について説明したが、可読性は求められないため、係数a=5や係数a=10としてもよい。このようにして本実施形態においては、タクソノミに基づいて、正例文書を生成することができる。
上記に説明したように、本実施形態による事前処理部8により、タクソノミクラスと正例文書ベクトルとが関連付けて文書ベクトル記憶部3に登録される。これにより、タクソノミクラスが多くなる場合においても、正例文書を容易に生成することが可能である。
次に図10を用いて、上述した本実施形態によるタクソノミ検索装置1の特徴についてまとめて説明する。ここで、本実施形態に用いる文書クラスタリング技術における文書分類とは、クラスごとに準備された正例文書から文書ベクトルを生成し、入力された文書(ユーザのクエリ)から得られた文書ベクトルと比較することで、最も近いクラスを返答する機能である。そして上述した本実施形態では、タクソノミ上のクラス(キーワード)への分類を実現するために、このような文書クラスタリング技術を用いて、各キーワードについての正例文書を自動生成できるようにしている。
また、タクソノミ検索装置1は事前処理の特徴として、次のような特徴を有している。第1の特徴として、各クラスの文書ベクトルの生成に必要な正例文書(各クラスの概念を表現した文書)を、タクソノミから自動生成できるようにしている。第2の特徴として、タクソノミの各クラスに、クラスの概念を表す文書ベクトルを持たせ、それを利用してユーザクエリを入力としたタクソノミのクラスの同定を実現している。
そしてタクソノミ検索装置1は、次のように動作する。まず事前処理の場合においては、タクソノミをもとに正例文書を自動生成し(図10中の符号1を参照)、正例文書を文書ベクトルに変換する(図10中の符号2を参照)。
そして、ユーザが利用する場合には、まず、ユーザ(利用者)が質問を入力する(図10中の符号2を参照)。次に、タクソノミ検索装置1が、質問文を文書ベクトルに変換し(図10中の符号3を参照)、質問文の文書ベクトルと最も近い文書ベクトルを計算し、そのキーワードをユーザに返答する(図10中の符号4を参照)。これにより、ユーザは、タクソノミ上の「ネットワーク」に分類されたナレッジを習得することが可能となる(図10中の符号5を参照)。
以上説明したように、本実施形態によるタクソノミ検索装置1により、ユーザは、自身が必要とするナレッジがどのクラス(キーワード)に属するかを予め把握しておく必要なしに、タクソノミ上に整理された自身が必要とするナレッジに到達することができる。
なお、上記の説明においては、タクソノミ検索装置1はユーザが用いるユーザ端末100とネットワークを介して接続されているものとして説明したがこれに限られるものではない。たとえば、タクソノミ検索装置1とユーザ端末100とは、一体として構成されていてもよい。そして、このタクソノミ検索装置1と一体として構成されたユーザ端末100には、周辺機器として入力装置、表示装置等(いずれも図示せず)が接続されていてもよい。ここで、入力装置とはキーボード、マウス等の入力デバイスのことをいう。表示装置とはCRT(Cathode Ray Tube)や液晶表示装置等のことをいう。
なお、上述した第1の文書ベクトル生成部411と第2の文書ベクトル生成部412とは、文書をベクトル化するという同様の機能を有している。そのため、第1の文書ベクトル生成部411と第2の文書ベクトル生成部412とを一体として構成してもよい。
また、上記の説明においては、タクソノミ記憶部2には、クラスIDとクラス名と親クラスIDとに関連付けて当該タクソノミクラスのナレッジが、タクソノミクラス毎に記憶されているとして説明した。しかしこれに限られるものではなく、タクソノミ記憶部2にはクラスIDとクラス名と親クラスIDとが関連付けて記憶されており、このタクソノミ記憶部2とは別に、クラスIDとナレッジとが関連付けられているナレッジ記憶部を有していてもよい。また、入力されたタクソノミクラス(クラスID)に関連付けられているナレッジを、このナレッジ記憶部から読み出して出力するナレッジ検索部を有していてもよい。
なお、このナレッジ記憶部とナレッジ検索部とを、タクソノミ検索装置1とは異なるナレッジ検索装置が有するものとしてもよい。この場合、検索部7を構成するタクソノミ表示部62は、出力した関係図に含まれているタクソノミクラスが選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミをタクソノミ記憶部2から読み出して、ナレッジ検索装置に出力する。そして、ナレッジ検索装置のナレッジ検索部が、入力されたタクソノミクラス(クラスID)に関連付けられているナレッジを、ナレッジ記憶部から読み出してユーザ端末100に出力する。このようにタクソノミ検索装置1とナレッジ検索装置とを異なる装置とするのは、たとえばナレッジ検索装置が既存する場合に、この既存するナレッジ検索装置からタクソノミを検索する方法を、本実施形態によるタクソノミ検索装置1により拡張する場合に好適である。
また、タクソノミ検索装置1は、上述したようにタクソノミクラスを出力してもよいし、タクソノミクラスを識別するクラスID、または、このクラスIDと関連付けられているクラス名を出力してもよい(図3参照)。この場合でも、ユーザは自身が必要とするナレッジに対応するタクソノミクラス(クラスID)またはクラス名を取得することができる。そしてユーザは、取得したタクソノミクラス(クラスID)またはクラス名により、上述したナレッジ検索装置を用いてナレッジを検索することも可能である。なお、ユーザの利便性を考慮すると、タクソノミ検索装置1とナレッジ検索装置とは、一体となっていることが望ましい。
また事前処理部8は、上述した事前処理を、1日毎や1週間など予め定められた一定期間毎に実行してもよいし、タクソノミ記憶部2に記憶されたデータ量が予め定められた一定の量だけ増加する毎に実行してもよい。
なお、タクソノミ記憶部2または文書ベクトル記憶部3は、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記憶媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。
なお、図1における文書クラスタリング部4、正例文書生成部5またはユーザインタフェース部6という各処理部は、専用のハードウェアにより実現されるものであってもよく、また、この各処理部はメモリおよびCPU(中央演算装置)により構成され、この各処理部の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
また、図1における文書クラスタリング部4、正例文書生成部5またはユーザインタフェース部6という各処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、この各処理部の処理を実行させてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1…タクソノミ検索装置、2…タクソノミ記憶部、3…文書ベクトル記憶部、4…文書クラスタリング部、5…正例文書生成部、6…ユーザインタフェース部、7…検索部、8…事前処理部、41…文書ベクトル生成部、42…ベクトル類似度演算部、51…フィルタリング処理部、52…正例文書化部、61…クエリ受付部、62…タクソノミ表示部、411…第1の文書ベクトル生成部、412…第2の文書ベクトル生成部

Claims (10)

  1. 情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部と、
    入力された文書をベクトル化し、当該ベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを前記文書ベクトル記憶部から検索する検索部と、
    を有することを特徴とするタクソノミ検索装置。
  2. 前記タクソノミクラスとタクソノミとが予め関連付けて記憶されているタクソノミ記憶部、
    を有し、
    前記検索部が、
    前記検索したタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する、
    ことを特徴とする請求項1に記載のタクソノミ検索装置。
  3. 前記検索部が、
    前記検索したタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する場合に、
    前記検索したタクソノミクラスと同一階層となるタクソノミクラス間の関係を示す関係図を出力するとともに、当該出力した関係図において前記検索したタクソノミクラスの位置を強調表示して出力する、
    ことを特徴とする請求項2に記載のタクソノミ検索装置。
  4. 前記検索部が、
    前記出力した関係図に含まれているタクソノミクラスが選択されたことに応じて、当該選択されたタクソノミクラスに対応するタクソノミを前記タクソノミ記憶部から読み出して出力する、
    ことを特徴とする請求項3に記載のタクソノミ検索装置。
  5. 前記検索部が、
    入力された文書をベクトル化する第1の文書ベクトル生成部と、
    前記第1の文書ベクトル生成部がベクトル化した文書と、前記文書ベクトル記憶部から読み出した正例文書ベクトルとの類似度を算出するベクトル類似度演算部と、
    前記ベクトル類似度演算部が算出した類似度が最も高い正例文書ベクトルと対応付けられているタクソノミクラスを前記文書ベクトル記憶部から読み出して出力するタクソノミ表示部と、
    を有することを特徴とする請求項1から請求項4のいずれか1項に記載のタクソノミ検索装置。
  6. 前記タクソノミ記憶部から読み出したタクソノミに基づいて正例文書を生成する正例文書生成部と、
    前記正例文書生成部が生成した正例文書をベクトル化するとともに、当該ベクトル化した正例文書を前記正例文書ベクトルとして、当該タクソノミに対応する前記タクソノミクラスと関連付けて前記文書ベクトル記憶部に記憶させる第2の文書ベクトル生成部と、
    を有することを特徴とする請求項2から請求項5のいずれか1項に記載のタクソノミ検索装置。
  7. 前記正例文書生成部が、
    前記タクソノミ記憶部から読み出したタクソノミクラスにおいて、親クラスとなるタクソノミクラスを示す文字列と子クラスとなるタクソノミクラスを示す文字列とで重複する文字列を、前記子クラスとなるタクソノミクラスを示す文字列から削除するフィルタリング処理部と、
    前記フィルタリング処理部が重複を削除したタクソノミクラスを示す文字列において、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する前記正例文書として生成する正例文書化部と、
    を有することを特徴とする請求項6に記載のタクソノミ検索装置。
  8. 前記正例文書化部が、
    前記自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせた文字列を、当該自タクソノミクラスに対応する前記正例文書として生成する場合に、
    前記タクソノミの階層構造における前記親クラスと自タクソノミクラスとの間の階層数に基づいて、自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列よりも自タクソノミクラスの文字列を組み合わせた文字列の方が前記正例文書における出現頻度が多くなるように、前記自タクソノミクラスの親クラスとなるタクソノミクラスを示す文字列および自タクソノミクラスを示す文字列を組み合わせて前記正例文書を生成する、
    ことを特徴とする請求項6に記載のタクソノミ検索装置。
  9. 情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する検索手順、
    を有することを特徴とするタクソノミ検索方法。
  10. タクソノミ検索装置としてのコンピュータに、
    情報を階層構造に分類したタクソノミにおけるクラスを示すタクソノミクラスと、当該タクソノミクラスに対応付けられている文書ベクトルである正例文書ベクトルとが関連付けて予め記憶されている文書ベクトル記憶部から、入力された文書をベクトル化した文書と類似度の高い正例文書ベクトルに対応付けられているタクソノミクラスを検索する検索手順、
    を実行させるためのタクソノミ検索プログラム。
JP2009031498A 2009-02-13 2009-02-13 タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム Active JP5382917B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009031498A JP5382917B2 (ja) 2009-02-13 2009-02-13 タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009031498A JP5382917B2 (ja) 2009-02-13 2009-02-13 タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム

Publications (2)

Publication Number Publication Date
JP2010186421A true JP2010186421A (ja) 2010-08-26
JP5382917B2 JP5382917B2 (ja) 2014-01-08

Family

ID=42767022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009031498A Active JP5382917B2 (ja) 2009-02-13 2009-02-13 タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム

Country Status (1)

Country Link
JP (1) JP5382917B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020113048A (ja) * 2019-01-11 2020-07-27 富士ゼロックス株式会社 情報処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096799A (ja) * 1995-06-19 1997-01-10 Sharp Corp 文書分類装置及び文書検索装置
JP2002099572A (ja) * 2000-09-25 2002-04-05 Toshiba Corp 類似文書検索装置、類似文書検索方法、類似文書検索プログラムが記録された記録媒体
JP2006251975A (ja) * 2005-03-09 2006-09-21 Omron Corp テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096799A (ja) * 1995-06-19 1997-01-10 Sharp Corp 文書分類装置及び文書検索装置
JP2002099572A (ja) * 2000-09-25 2002-04-05 Toshiba Corp 類似文書検索装置、類似文書検索方法、類似文書検索プログラムが記録された記録媒体
JP2006251975A (ja) * 2005-03-09 2006-09-21 Omron Corp テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020113048A (ja) * 2019-01-11 2020-07-27 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7238411B2 (ja) 2019-01-11 2023-03-14 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP5382917B2 (ja) 2014-01-08

Similar Documents

Publication Publication Date Title
US11599714B2 (en) Methods and systems for modeling complex taxonomies with natural language understanding
Li et al. Mining opinion summarizations using convolutional neural networks in Chinese microblogging systems
Li et al. Using text mining and sentiment analysis for online forums hotspot detection and forecast
Kaushik et al. A comprehensive study of text mining approach
Hu et al. Document sentiment classification by exploring description model of topical terms
US9189541B2 (en) Evidence profiling
CN112148889A (zh) 一种推荐列表的生成方法及设备
KR20180126577A (ko) 관련 엔티티 탐색
US20150269691A1 (en) Legal reasoning graphs and usage thereof
Paul et al. Focused domain contextual AI chatbot framework for resource poor languages
KR102059743B1 (ko) 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템
Kochtchi et al. Networks of Names: Visual Exploration and Semi‐Automatic Tagging of Social Networks from Newspaper Articles
JP2017146720A (ja) 特許要件適否予測装置および特許要件適否予測プログラム
Tayal et al. Fast retrieval approach of sentimental analysis with implementation of bloom filter on Hadoop
Bordoloi et al. Keyword extraction using supervised cumulative TextRank
Gramyak et al. Intelligent Method of a Competitive Product Choosing based on the Emotional Feedbacks Coloring.
Paul et al. TexTonic: Interactive visualization for exploration and discovery of very large text collections
Ouared et al. Capitalizing the database cost models process through a service‐based pipeline
Özen et al. Opinion mining in tourism: a study on “Cappadocia home cooking” restaurant
US20210271637A1 (en) Creating descriptors for business analytics applications
Fernandes et al. Automated disaster news collection classification and geoparsing
JP2010198278A (ja) 評判情報分類装置、評判情報分類方法及びプログラム
KR101602342B1 (ko) 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템
JP5382917B2 (ja) タクソノミ検索装置、タクソノミ検索方法およびタクソノミ検索プログラム
ElGindy et al. Capturing place semantics on the geosocial web

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130930

R150 Certificate of patent or registration of utility model

Ref document number: 5382917

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250