JP4896268B2 - 情報価値を反映した情報検索方法及びその装置 - Google Patents

情報価値を反映した情報検索方法及びその装置

Info

Publication number
JP4896268B2
JP4896268B2 JP2011205200A JP2011205200A JP4896268B2 JP 4896268 B2 JP4896268 B2 JP 4896268B2 JP 2011205200 A JP2011205200 A JP 2011205200A JP 2011205200 A JP2011205200 A JP 2011205200A JP 4896268 B2 JP4896268 B2 JP 4896268B2
Authority
JP
Japan
Prior art keywords
information
similarity
search
text
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011205200A
Other languages
English (en)
Other versions
JP2011253572A (ja
Inventor
イ、スン‐ジュン
キム、ヒョン‐ゴン
キム、ビョン‐ハク
ナム、ソ‐ドン
シン、ジュン‐ホ
Original Assignee
チョンヌン インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by チョンヌン インコーポレイテッド filed Critical チョンヌン インコーポレイテッド
Publication of JP2011253572A publication Critical patent/JP2011253572A/ja
Application granted granted Critical
Publication of JP4896268B2 publication Critical patent/JP4896268B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索に係り、より詳細には、情報の価値に基づいてユーザに情報を提供したり、推薦する情報検索方法及びその装置に関する。
インターネットを介した情報提供者及びその利用者の爆発的な増加に伴い、現在、数えられぬほど多い情報が溢れている。このため、これらの情報の中からユーザの所望する情報のみを選別して提供する検索エンジンの役割は、ますます重要になってきている。すなわち、従来の検索エンジンは、所望の情報をより多く探すことに重点を置いていたのに対し、現在は、所望の情報のみを正確に選別して提供することに重点が置かれている。このように所望の情報を探し、これを選別して提供するためには、検索された情報に対して重要度を付け、その重要度順にユーザに提供する必要がある。
従来の検索方法では、入力された検索語と検索対象文書間の類似度を計算していた。すなわち、検索語が検索対象文書内で出現する頻度数によって類似度を計算する。例えば、"ネオウィズ"という検索語に対し、文書1ではそれが10回出現し、文書2では5回出現するとしたら、文書1の類似度は100%となり、文書2の類似度は50%となる。
このような類似度計算方法には、ブーリアン検索モデル、拡張ブーリアン検索モデル、ベクトル空間モデル、確率分布、ポアソンモデル、ラグランジモデルなどが用いられる。しかしながら、これらの方法は、単に検索語が重複的に出現する頻度によって類似度を計算するだけであって、検索された情報の価値自体は反映されない。
一方、情報の重要度をハイパーリンクで連結されているウェブの構造的な特性を用いて測定する方法がある。すなわち、情報の価値を、その情報を参照しているインターネットリンクの数を用いて測定する。例えば、検索された文書を他のサイトで参照している回数を計算し、多く参照されている情報を重要な情報として判断する。しかしながら、このような方法も、あらゆる種類の情報には適用し難い。例えば、ハングル文書をリンクしているサイトが、英語文書をリンクしているサイトよりも相対的に少ない場合、上記方法を適用し難い。
したがって、本発明は、同じ内容を含む情報を一つ以上のグループにグルーピングし、各グループから代表情報を抽出し、各グループ別情報の価値に基づいて当該情報をユーザに提供する情報検索方法及びその装置を提供することを目的とする。
本発明の一側面による情報検索方法は、(a)複数個の情報間の類似度を計算する段階と、(b)前記類似度によって同じ情報をグルーピングし、実質的に同じ情報と判定された情報の個数によってそれぞれの情報の価値を計算する段階と、(c)前記計算された価値が反映された情報検索結果を表示する段階と、を含むことを特徴とする。
また、前記(a)段階は、(a1)前記テキスト情報に含まれた単語の数及び助詞の数によって前記テキスト情報を一つ以上のグループに分割する段階と、(a2)前記グループ内における単語のそれぞれに対する逆ファイルを生成する段階と、(a3)前記逆ファイルを分析して所定の閾値以下の頻度を持つテキスト情報を除去し、類似度を計算すべきテキスト情報を選定する段階と、(a4)前記選定されたテキスト情報間の類似度を計算し、実質的に同じテキスト情報と判定された情報を一つのグループにまとめる段階と、を含むことができる。
上記(a4)段階における類似度計算は、本文内容よりも題名により高い(大きい)重みをつけて類似度を計算することができる。
また、本発明の他の側面における情報検索装置は、インターネット上で収集された情報のうちテキスト情報を保存するテキスト文書保存部と、前記テキスト文書間の類似度を計算する類似度分析部と、前記類似度によって同じ文書と判定された文書を一つのグループにまとめ、各グループ内から代表文書を抽出する代表文書抽出部と、前記類似度によって類似の文書と判定された文書を抽出する類似文書抽出部と、入力された検索語に対応する代表文書と類似文書を、代表文書の出現頻度順にしたがって出力位置を調整してディスプレイし、前記類似文書はリンク形態に提供する検索部と、を備えることを特徴とする。
本発明によれば、同一情報の個数によって情報の価値を判断し、情報の価値順に該当情報をユーザに表示するため、ユーザの所望する情報をより正確に提供することが可能になる。
また、本発明によれば、類似の文書は別のリンクを介して提供するため、検索結果をひと目で確認可能になる。
また、本発明によれば、重複する情報は検索結果から削除されるので、ユーザの検索結果を確認するのにかかる余分の時間と労力を削減することが可能になる。
以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。
図1は、同じ内容の情報をまとめてグルーピングし、各グループから代表情報を抽出し、各グループ別情報の価値によって該当の情報をユーザに提供する方法を説明するための参照図である。
図1に示すように、インターネットなどを介して収集した情報を、同じ内容を持つグループにまとめる。ここで、"同じ内容"とは、"完全に一致する内容"ではなく、"所定の閾値以上の類似性を持つ内容"、つまり、"実質的に同じ内容"のことを意味する。すなわち、一つの検索語に対し、同じ内容を持つ情報が多くのサイトに共通して含まれており、このような情報を一つのグループにまとめる。例えば、"ネオウィズ"という検索語に関する情報として、"...インターネットに存在するあらゆる情報を検索できる検索エンジンが出現した。ネオウィズ(取締役代表:ナ・セォンギュン)の第2大株主のジャン・ビョンギュ(33歳)が設立した検索サービス企業'チョッヌン(http://www.1noon.com)'は、最近、ユーザがあらゆるインターネット情報を便利に検索できるようにした検索エンジンを開発した。"という内容を含む様々なインターネットサイトがある場合、グループA(110)は、上述の情報を含むことができ、グループB(120)は、"...[ネオウィズ/セイクラブ]ネオウィズ会社紹介及びE−Community紹介..."という内容を扱う情報の集合を含むことができ、グループC(130)は、"...ネオウィズ運営、カード、カジュアル、モバイル、マッゴー、ゴーストップなどオンラインゲーム提供..."という内容を扱う情報の集合を含むことができる。
すなわち、同じ内容を含む情報を一つのグループにまとめる。なお、一つのグループに含まれた内容は互いに同じ内容であるから、重複したディスプレイを防止するために各グループから代表情報を抽出する。代表情報は、それぞれのグループを代表する情報で、グループ内の情報のうち、最も最近に生成された情報又はイメージを含んでいる情報を代表情報とすることができる。
その後、検索語を含む情報の出現頻度に基づいてユーザに検索結果を表示する。言い換えると、同じ検索語を含む情報の出現頻度が高いほど重要な情報と判断し、該当する情報の表示の際にその順位を高くし、価値ある情報がよくユーザの目につくようにする。
図2は、本発明の一実施例に係る情報の価値を反映したテキスト検索方法を示すフローチャートである。
まず、検索対象となる情報を収集し(S210)、収集した情報間の類似度を計算する(S220)。従来方法では、例えば、収集した情報が100個である場合、全ての情報に対して類似度を計算するためには100×100回の計算が必要とされていた。類似度計算過程の詳細は、図3、図4乃至図8を参照して後述する。類似度計算の後に、同じ内容を持つ複数個の情報を一つのグループにまとめ、重複情報を除去し、且つ、代表情報を抽出する(S230)、次に、実質的に同じ情報の個数を用いて情報の価値を計算する(S240)。その後、抽出した代表情報を、各グループの重要度によって出力する(S250)。このとき、該当内容を含む情報の出現頻度が高いグループの代表情報を重要度の高い情報と判断し、これを、結果出力画面の最初に位置させる、又はハイライトなどの手段を用いてよく目に付くようにして出力する。
図3は、図2におけるテキスト検索方法を詳細に示すフローチャートである。
図3を参照して、情報がテキスト文書である場合に類似度を計算し、その検索結果を提供する過程について詳述する。文書間の類似度を計算するために、その文書を構成するテキストの中から索引キーワードを抽出する(S310)。抽出されたキーワードを比較して文書間の類似度を計算する(S320)。両文書間に同じ索引キーワードが多いほど互いにより類似な文書となる。類似度の計算では、題名と本文内容に相互に異なる重みをつけて計算することができる。例えば、両文書の題名に類似のキーワードが多く存在するほどより類似の文書である確率が高いから、類似度計算の際に題名に重み値を与えることができる。計算された類似度を参照して、各文書に対して同じ文書及び類似の文書を決定する(S330)。各グループ別に代表文書を抽出し(S340)、代表文書を、その重要度によって出力位置を調整してユーザに提供する(S350)。
図4乃至図6は、テキスト文書から索引キーワードセットを抽出する過程の一例を示す図である。
図4に示すように、文書410は、題名に相当する単語列401と、本文内容に相当する単語列402とで構成されている。図5に示すように、例えば、題名は"ネオウィズ関連検索事業分社"421とし、本文内容は"ネオウィズから分社した新しいサービスメーカである'チョッヌン'が、本格的なサービスに取り組む。チョッヌン(1noon.com)は、早ければ来月にベータテストを開始し、今年10月からは正式サービスを開始する予定である。今年はじめから..."とする。図6に示すように、索引キーワードセット430は、題名に対するキーワードとしてネオウィズ、検索、分社が抽出され、内容に対するキーワードとしてはネオウィズ、分社、検索、チョッヌン、テスト、サービス開始などが抽出される。
図7及び図8は、抽出された索引キーワードセットを用いて文書間の類似度を計算し、同一文書と類似文書を探す方法の一例を示す図である。
図7は、図4乃至図6を参照して類似性を比較する方法を示す図である。文書Aと文書Bとの類似度は75%で、文書Aと文書Cとの類似度は4%で、文書Aと文書Dとの類似度は96%である。類似度の計算は、前述したように、様々な方法によって行われることができる。例えば、題名に対するキーワードと文書内容に対するキーワードをいずれも同じ条件によって比較してもよく、題名に対するキーワードに重みをつけて類似度を計算してもよい。
図8は、図7のように計算された類似度情報に基づいて各文書と同じ文書及び類似の文書を探す方法の一例を示す図である。同一文書と類似文書を決定する類似度値の基準値は状況により可変可能である。図8から、文書Aと同じ文書は25個で、同じ文書は文書B、D等で、類似の文書は文書X、Tなどであることがわかる。
図9は、類似度を計算すべき対象文書の数を減らす方法を示すフローチャートである。
全ての文書に対して索引キーワードリストを作り、全文書に対してそれぞれの類似度を計算すると、計算量が多いことはもとより、時間が非常にかかってしまう。この点から、類似度を計算すべき対象文書の数を減らす工夫が必要である。このため、まず、文書をグルーピングする(S610)。文書のグルーピング基準は、文書を構成する単語の数と助詞の数によって定められる。文書を構成する単語の数と助詞の数が類似していると、互いに類似の文書である可能性が多いので、これらを同じグループにまとめる。なお、クルーピングの基準は場合によって可変することが可能である。例えば、単語の数及び助詞の数をいずれも5個単位にして、又は単語の数及び助詞の数をそれぞれ異なる単位数にして同じグループにまとめることができる。
続いて、各グループに対して逆ファイルを生成する(S620)。逆ファイルは、文書を構成する単語を全て抽出し、該当する単語を含む文書のIDを集めて作ったファイルである。例えば、DocID1,DocID2,...,DocID100の文書があり、DocID1は単語A,B,C,...,Jを含んでいる場合、DocID1と類似する文書を探そうとする場合に生成される逆ファイルの例は、次のようである。
単語Aの逆ファイル:DocID2,DocID3
単語Bの逆ファイル:DocID2,DocID3,DocID4,DocID5
単語Cの逆ファイル:DocID2,DocID3,DocID5,DocID6,DocID7
...
単語Jの逆ファイル:DocID2,DocID3,DocID5,DocID7,DocID10,...,DocID85
このようにして逆ファイルを生成した後に、逆ファイルを分析して閾値以下の頻度を持つ文書を除去する(S630)。上記実施例において、順に小さい逆ファイルの大きさを持つ単語Aと単語Bの逆ファイルを比較してから単語Cの逆ファイルを比較すると、出現頻度の低いDocID4は比較対象から削除される。このような方式で単語Jの逆ファイルまで比較し、出現頻度の低い全てのDocIDを削除すると、DocID1の文書と類似度を判断しなければならない対象文書が大幅に減る。
図10は、本発明の一実施例に係る情報の価値を反映したテキスト検索装置の構成図である。
同図で、テキスト検索装置は、ウェブデータ保存部710、テキスト文書保存部720、類似度分析部730、代表文書抽出部740、類似文書抽出部750、検索部760及び情報推薦部770を備える。
ウェブデータ保存部710は、インターネット上に存在する情報を収集して保存する。テキスト文書保存部720は、これらの情報のうち、テキスト文書を保存する。類似度分析部730は、前述のようにテキスト文書に含まれた単語の数及び助詞の数によって当該テキスト文書をグルーピングし、これら単語のそれぞれに対する逆ファイルを生成し、これを分析して所定の閾値以下の頻度を持つテキスト文書を除去することによって類似度を計算すべきテキスト文書を選定し、これらの文書間の類似度を計算する。代表文書抽出部740は、同じテキスト文書と判定された文書を一つのグループにまとめ、それぞれのグループから代表文書を抽出する。代表文書抽出の一例には、前述のように、最も最近の文書又はイメージを含む文書を代表文書として抽出する方法かある。類似文書抽出部750は、類似度分析部730で計算された類似度に基づき、予め定められた値以上の類似度を持つ文書を類似のテキスト文書として抽出する。
一方、ユーザが検索部760に検索語を入力すると、検索部760は、それに対する結果を代表文書保存部740及び類似文書保存部750を検索して出力する。この時、代表文書の中でも価値ある代表文書を検索結果ページの上位に位置させる。なお、類似文書情報は、その詳細な内容を確認できるようなリンクの形態に提供される。情報推薦部770は、価値ある情報を予め設定された条件によって出力する。例えば、インターネット上で多く出現する情報は、価値ある情報と判断し、ユーザが検索語を入力しない場合にも自動的に代表文書から出力されるようにする。例えば、一日に1000回以上出現する文書は、人々にビックイシューとなっている重要な内容であるから自動的に出力されるようにする。
図11は、本発明によるテキスト検索方法を適用した結果の一例を示す図である。
本発明のテキスト検索方法によれば、類似度の高い文を出力画面上の上位に位置させる。類似度の判断は、上述の方法によってなされ、類似な文が多いほど相対的に重要な文書と判断する。例えば、検索ウィンドウで"バク・ジソン"を入力すると、検索結果は、重要な文書の順に出力される。上述のように、最も重要な文書はその文書の出現頻度が最も高い文書、例えば"ジソンパルコ(バク・ジソン)の家で撮った写真"810となり、これをクリックするとより詳細な内容が出力される。そして、これと類似の内容を含んでいる類似文820の項目をクリックすると、その詳細な内容820−1が新しい窓又は現在窓内で出力される。
なお、上述のテキスト検索方法は、コンピュータプログラムで作成可能である。該プログラムを構成するコード及びコードセグメントは、当該技術分野におけるコンピュータプログラマーによって容易に推論可能である。なお、これらのプログラムはコンピュータ読取可能な記憶媒体に保存され、コンピュータによって読み取られて実行されることによってテキスト検索方法を具現する。当該記憶媒体は、磁気記録媒体、光記録媒体、及びキャリアウェーブ媒体を含む。
以上では本発明を具体的な実施例に則して説明したが、本発明は、これらの具体例に限定されず、本発明の本質的な特性を逸脱しない範囲で様々な変更が可能であるということは、当該技術分野における通常の知識を持つ当業者にとっては明らかである。したがって、本発明の技術範囲は、上記説明に限定されることなく特許請求の範囲によって定められるべきであり、これと均等な範囲内にある相違点はいずれも本発明に含まれるものとして解釈しなければならない。
同じ内容の情報をまとめてグルーピングし、各グループから代表情報を抽出し、各グループ別情報の価値によって該当する情報をユーザに提供する方法を説明するための図である。 本発明の一実施例に係る情報の価値を反映したテキスト検索方法を示すフローチャートである。 図2のテキスト検索方法の詳細フローチャートである。 テキスト文書から索引キーワードセットを抽出する過程の一例を示す図である。 テキスト文書から索引キーワードセットを抽出する過程の一例を示す図である。 テキスト文書から索引キーワードセットを抽出する過程の一例を示す図である。 抽出された索引キーワードセットを用いて文書間類似度を計算し、同一文書と類似文書を探す方法の一例を示す図である。 抽出された索引キーワードセットを用いて文書間類似度を計算し、同一文書と類似文書を探す方法の一例を示す図である。 類似度を計算すべき対象文書の数を減らす方法を示すフローチャートである。 本発明の一実施例に係る情報の価値を反映したテキスト検索装置の構成図である。 本発明のテキスト検索方法を適用した結果の一例を示す図である。

Claims (8)

  1. 情報検索方法であって、コンピュータにより実行されるステップが、
    (a)テキスト情報を含む複数個の情報毎の各テキスト情報を構成する単語の数及び助詞の数に基づいて、前記複数個の情報を一つ以上のグループにグルーピングする第1グルーピング処理を遂行する段階と、
    (b)前記グループ内に属する一つ以上の情報それぞれに含まれるテキスト情報を構成する単語ごとにその単語を含むテキスト情報の出現頻度を求め、前記テキスト情報の出現頻度が所定の閾値以下である情報を、前記グループから除いて得られる情報を、類似度を計算すべき対象情報として選定して前記選定された対象情報間の類似度を計算する段階と、
    (c)前記類似度に基づいて前記情報をグルーピングする第2グルーピング処理を遂行するとともに、前記類似度に基づいて所定の閾値以上の類似性を有する同じ情報と判定された情報の個数に応じて、それぞれの情報の価値を計算する段階と、
    (d)前記計算された価値が反映された情報検索結果を表示する段階と、
    を含むことを特徴とする情報検索方法。
  2. 前記(b)段階は、
    前記テキスト情報に含まれる題名及び本文内容を用いて前記情報間の類似度を計算することを特徴とする請求項1に記載の情報検索方法。
  3. 前記(a4)段階は、
    前記本文内容によりも前記題名に対してより高い重み値を付与して前記類似度を計算することを特徴とする請求項2に記載の情報検索方法。
  4. 前記(c)段階は、
    前記類似度に基づいて前記情報をグルーピングする前記第2グルーピング処理を遂行し、前記第2グルーピング処理によってグルーピングされたそれぞれのグループ内における前記類似度に基づいて所定の閾値以上の類似性を有する情報と判定された情報の個数に基づいてそれぞれの情報の価値を算出することを特徴とする請求項1から3のいずれか1項に記載の情報検索方法。
  5. 前記(c)段階は、
    前記類似度に基づいて前記情報をグルーピングする前記第2グルーピング処理を遂行し、前記第2グルーピング処理によってグルーピングされたそれぞれのグループ内における情報の中から、最も最近の情報又はイメージを含んでいる情報を当該グループの代表文書として抽出することを特徴とする請求項1から4のいずれか1項に記載の情報検索方法。
  6. 前記(d)段階は、
    ユーザからの検索語入力に応答して情報検索を遂行し、該情報検索の結果を、情報の価値の高い順に表示することを特徴とする請求項1から5のいずれか1つに記載の情報検索方法。
  7. 前記(d)段階は、
    ユーザからの検索語入力がない場合には、予め定められた条件に基づいて最も価値の高い情報を含むグループの代表文書をユーザに表示することを特徴とする請求項1から5のいずれか1つに記載の情報検索方法。
  8. コンピュータに請求項1から7のいずれか1つに記載の情報検索方法を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
JP2011205200A 2005-07-15 2011-09-20 情報価値を反映した情報検索方法及びその装置 Active JP4896268B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050064495A KR100645614B1 (ko) 2005-07-15 2005-07-15 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치
KR10-2005-0064495 2005-07-15

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008521324A Division JP4896132B2 (ja) 2005-07-15 2006-07-13 情報価値を反映した情報検索方法及びその装置

Publications (2)

Publication Number Publication Date
JP2011253572A JP2011253572A (ja) 2011-12-15
JP4896268B2 true JP4896268B2 (ja) 2012-03-14

Family

ID=37654523

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008521324A Active JP4896132B2 (ja) 2005-07-15 2006-07-13 情報価値を反映した情報検索方法及びその装置
JP2011205200A Active JP4896268B2 (ja) 2005-07-15 2011-09-20 情報価値を反映した情報検索方法及びその装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008521324A Active JP4896132B2 (ja) 2005-07-15 2006-07-13 情報価値を反映した情報検索方法及びその装置

Country Status (3)

Country Link
JP (2) JP4896132B2 (ja)
KR (1) KR100645614B1 (ja)
WO (1) WO2007011129A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5286712B2 (ja) * 2007-08-17 2013-09-11 日本電気株式会社 情報評価装置、情報評価方法、及び情報評価プログラム
JP5682113B2 (ja) * 2010-01-22 2015-03-11 カシオ計算機株式会社 情報表示装置およびプログラム
KR101544142B1 (ko) * 2010-04-06 2015-08-17 네이버 주식회사 화제도 기반의 검색 제공 방법 및 시스템
CN102411583B (zh) * 2010-09-20 2013-09-18 阿里巴巴集团控股有限公司 一种文本匹配方法及装置
JP5834815B2 (ja) * 2011-11-22 2015-12-24 株式会社リコー 情報処理装置、プログラムおよび文書を検索するための方法
KR101527198B1 (ko) * 2012-01-06 2015-06-09 (주)광개토연구소 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템
JP5921379B2 (ja) 2012-08-10 2016-05-24 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テキスト処理方法、システム及びコンピュータ・プログラム。
JP2015092398A (ja) * 2015-01-13 2015-05-14 カシオ計算機株式会社 情報表示制御装置およびプログラム
JP7267714B2 (ja) * 2018-11-06 2023-05-02 株式会社東芝 知識情報作成支援装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5924090A (en) * 1997-05-01 1999-07-13 Northern Light Technology Llc Method and apparatus for searching a database of records
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
KR20010104873A (ko) * 2000-05-16 2001-11-28 임갑철 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템
KR100643979B1 (ko) * 2000-05-18 2006-11-13 엘지전자 주식회사 인터넷을 이용한 정보검색 결과 제공방법
JP2003044490A (ja) * 2001-07-30 2003-02-14 Toshiba Corp 知識分析システムおよび同システムにおける知識重複登録設定方法
JP4142881B2 (ja) * 2002-03-07 2008-09-03 富士通株式会社 文書類似度算出装置、クラスタリング装置および文書抽出装置
KR100505848B1 (ko) * 2002-10-02 2005-08-04 씨씨알 주식회사 검색 시스템
US7536408B2 (en) * 2004-07-26 2009-05-19 Google Inc. Phrase-based indexing in an information retrieval system
KR100685277B1 (ko) * 2004-08-23 2007-02-22 현인호 검색엔진을 이용한 검색결과의 재구성 장치 및 방법

Also Published As

Publication number Publication date
KR100645614B1 (ko) 2006-11-14
JP2009500764A (ja) 2009-01-08
JP4896132B2 (ja) 2012-03-14
JP2011253572A (ja) 2011-12-15
WO2007011129A1 (en) 2007-01-25

Similar Documents

Publication Publication Date Title
JP4896268B2 (ja) 情報価値を反映した情報検索方法及びその装置
US9652537B2 (en) Identifying terms associated with queries
US9348935B2 (en) Systems and methods for augmenting a keyword of a web page with video content
TWI461939B (zh) 補充文章內容之方法、設備、電腦可讀取紀錄媒體、電腦程式產品、以及電腦系統
US8886661B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
KR100898456B1 (ko) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
US20060212441A1 (en) Full text query and search systems and methods of use
US8880536B1 (en) Providing book information in response to queries
US9864768B2 (en) Surfacing actions from social data
Sun et al. CWS: a comparative web search system
EP2307951A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
CN111506727B (zh) 文本内容类别获取方法、装置、计算机设备和存储介质
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
US20130031075A1 (en) Action-based deeplinks for search results
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
CN111538903A (zh) 搜索推荐词确定方法、装置、电子设备及计算机可读介质
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
CN113486226A (zh) 用于搜索结果注释的方法和系统
Brilakis et al. Multimodal image retrieval from construction databases and model-based systems
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
WO2008063615A2 (en) Apparatus for and method of performing a weight-based search
KR101172487B1 (ko) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템
Carter et al. Dig: a task-based approach to product search
Escudero et al. Obtaining knowledge from the web using fusion and summarization techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111220

R150 Certificate of patent or registration of utility model

Ref document number: 4896268

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250