JP2011215950A - キーワード提示装置、方法及びプログラム - Google Patents

キーワード提示装置、方法及びプログラム Download PDF

Info

Publication number
JP2011215950A
JP2011215950A JP2010084329A JP2010084329A JP2011215950A JP 2011215950 A JP2011215950 A JP 2011215950A JP 2010084329 A JP2010084329 A JP 2010084329A JP 2010084329 A JP2010084329 A JP 2010084329A JP 2011215950 A JP2011215950 A JP 2011215950A
Authority
JP
Japan
Prior art keywords
keyword
keywords
similar
main
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010084329A
Other languages
English (en)
Other versions
JP5156047B2 (ja
Inventor
Masayuki Okamoto
昌之 岡本
Nayuko Watanabe
奈夕子 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010084329A priority Critical patent/JP5156047B2/ja
Priority to US12/883,626 priority patent/US8782049B2/en
Publication of JP2011215950A publication Critical patent/JP2011215950A/ja
Application granted granted Critical
Publication of JP5156047B2 publication Critical patent/JP5156047B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/748Hypervideo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 本発明の目的は、閲覧文書から類似するキーワードを集約し提示するキーワード提示装置を提供することである。
【解決手段】 閲覧文書から複数のキーワードを抽出する抽出部と、複数の前記キーワードの中で互いに表記が類似するキーワード毎にまとめて、複数の類似キーワード群を得る判別部と、前記類似キーワード群毎に、見出しとなる主キーワードと、それ以外の従キーワードとに分類し、前記従キーワードを前記主キーワードに集約する集約部と、前記主キーワードを提示する提示部とを備えるキーワード提示装置。
【選択図】 図1

Description

本発明は、テキスト情報を閲覧中のユーザに対し、関連する情報を検索するためのクエリとして用いられるキーワードを提示するキーワード提示装置に関する。
従来、Webページや原稿などのテキスト情報(以下、文書)閲覧時において、関連する情報を簡単に検索・入手したいという要求がある。これまでに、ユーザが指定した注目語彙およびその周辺語彙をキーワードとして抽出してWebページの検索を行う手法が提案されてきた(例えば特許文献1参照)。
特開2009−129098号公報(第10頁、図2)
しかし、上記手法では、携帯端末のディスプレイなど画面が小さい場合、一度にページ全体を表示できないため、ページ内の他の箇所でユーザが見たキーワードを用いることができなかった。
本発明の目的は、閲覧文書から類似するキーワードを集約し提示するキーワード提示装置を提供することである。
本発明の実施形態に係るキーワード提示装置は、閲覧文書から複数のキーワードを抽出する抽出部と、複数の前記キーワードの中で互いに表記が類似するキーワード毎にまとめて、複数の類似キーワード群を得る判別部と、前記類似キーワード群毎に、見出しとなる主キーワードと、それ以外の従キーワードとに分類し、前記従キーワードを前記主キーワードに集約する集約部と、前記主キーワードを提示する提示部とを備える。
本発明によれば、閲覧文書から類似するキーワードを集約し提示するキーワード提示装置を提供することができる。
本実施形態に係るキーワード提示装置100の全体構成をブロック図。 本実施形態に係るキーワード提示動作を示すフローチャート。 Webページ閲覧画面および本文抽出の具体例を示す図。 本文及び、そこから抽出されるキーワード、意味属性、スコアを示す図。 検索ルールの例を示す図。 類似キーワード判別ルールの例を示す図。 集約された主キーワード及び従キーワードの構造例を示す図。 提示される主キーワード及びその検索方式の配置例を示す図。 従キーワードの選択例を示す図。 従キーワードの選択例を示す図。 従キーワードの選択例を示す図。 本実施形態に係るキーワード選択の動作を示すフローチャート。 本実施形態に係る検索結果の表示例を示す図。
以下、本発明の実施の形態について図面を参照しながら説明する。
本実施形態では、ユーザが所有する端末においてキーワード提示装置100が使用されることを想定しているが、キーワード提示装置100の一部がサーバ上に構成されるなど分離して使用される場合も同様である。また、本実施形態においては、閲覧する情報あるいは文書として主にウェブページを対象とする。ここで、ウェブページとしてはテキスト情報に加え、静止画像や動画像を内部に含むものも同様に扱われる。
図1は本実施形態に係るキーワード提示装置100の全体構成をブロック図である。閲覧情報入力部101は、携帯端末のディスプレイであり、閲覧ウィンドウに文書のテキスト情報を入力する。本文領域抽出部102は、閲覧情報入力部101によって入力されたHTMLなどの文書構造情報から本文とみなされる領域を抽出する。キーワード抽出部103は、閲覧情報入力部101から入力された文書の本文領域から、検索クエリの候補となる単語をキーワードとして抽出する。キーワード抽出辞書・ルール格納部104は、キーワード抽出部103においてキーワードを抽出するために必要とされる語彙や抽出ルールを格納する。検索ルール格納部105は、キーワード抽出部103による抽出キーワードの意味属性に対応する(i)検索方式、(ii)利用する検索サービス、(iii)拡張クエリを決定するためのルールを格納する。なお、場合によっては拡張クエリが無くてもよい。
類似キーワード集約部106は、キーワード抽出部103によって抽出された複数のキーワードから見出しとして集約するキーワードを決定する。類似キーワード集約ルール格納部107は、類似キーワード集約部106による集約方法を決めるルールを格納する。キーワード・検索方式提示部108は、類似キーワード集約部106により表記が集約されたキーワードの見出し一覧を提示する。検索部109は、キーワード・検索方式提示部108により提示されたキーワードのうち、ユーザにより選択されたものに基づき、ウェブサービス(例えば、外部の検索サービス)またはデータベースを対象に検索処理を実行し、検索結果を整理する。検索結果表示部110は、検索部109により検索された結果の一覧を表示する。選択履歴格納部111は、キーワード・検索方式提示部108により提示されたキーワードのうち、ユーザにより選択されたものの履歴を格納する。選択傾向算出部112は、選択履歴格納部111に格納された選択履歴に基づき、ユーザが選択するキーワードや検索方式の統計情報を算出し、キーワード抽出辞書・ルール格納部104あるいは類似キーワード集約ルール格納部107に反映する。関連語辞書格納部113は、キーワード抽出部103によるキーワード抽出において、本文領域に表示されているキーワードと関連する他のキーワード(他のキーワード自体も本文領域内の言葉であることを要する)を抽出結果に加えるために用いられる。ここで関連語とは、類義語、上位語、下位語などであり、例えば「パソコン」の関連語としては「コンピュータ」、「PC」などが挙げられる。
図2は、本実施形態に係るキーワード提示装置のキーワード提示動作を示すフローチャートである。
まず、現在ユーザが閲覧中のウェブページの文書構造(例えばHTML形式の文書構造)から、本文にあたる領域を抽出する(ステップS21)。本実施形態では、パラグラフを表すタグや、本文、メニューなどの領域を示すタグ、あるいは一定量のテキスト情報が含まれる範囲を本文領域とみなすことで、本文となるテキスト情報が抽出される。
本文が抽出された後、キーワード抽出を行う(ステップS22)。抽出されるキーワードには人名、地名などの意味属性が付与される。また、意味属性に応じて検索方式が決定される。抽出されたキーワードと検索方式を用いて、ユーザは閲覧中のWebページの関連情報を検索する。
キーワード抽出後、類似するキーワードが判別・集約される(ステップS23)。ここで、類似とは、キーワード同士に表層的な包含関係がある場合や、言い換え、略称、他言語表記といった、ユーザが容易に類似性を認めることができるが表記としては異なるものを指す。類似するキーワード群は、見出しとなる主キーワードと、見出しに対する操作により選択可能となる従キーワードに分類され、主キーワードに集約される。集約されたキーワード群の見出し(すなわち主キーワード)と検索方式の一覧が最終的に並べられてユーザに提示される。このようにすれば、ページ内に出現するキーワードを検索クエリの候補として提示する際に、似た表記のキーワードを集約して提示することができる。
提示された見出しあるいは検索方式をユーザが選択すると、選択された見出しあるいは検索方式に応じてWebあるいはデータベースの検索が実行され、検索結果がユーザに提示される(S24)。検索結果からユーザが所望のものを選択すると、当該Webページに遷移し、関連する情報の閲覧を続けることができる。
キーワード提示の具体例を、図3乃至図9を用いて説明する。
図3は、Webページ閲覧画面ウィンドウおよび本文抽出の具体例を示す。図3(a)は、Webページ閲覧画面ウィンドウを表し、閲覧情報入力部101に入力されるニュース記事の閲覧例である。中央の列に記事本文が段落毎に分けて記載され、記事本文の上に記事の見出し「サカナさん症候群」が表示されている。本文の左側には図やキャプションなどのメニューが表示され、また本文の右側には広告が表示される。
図3(b)は、Webページの各領域とHTML形式の文書構造との対応関係を示す例である。それぞれの領域はHTMLのタグによって階層的に構成されている。本実施形態では、本文の記事は文章の分量が多い範囲であると想定し、特定のタグ(例えば段落を示すタグ)で囲まれた文字列長が予め定められた閾値よりも長い領域を本文とみなして抽出する。この結果、Webサイトのメニューや広告など、ユーザが閲覧するページの内容と直接は関係しない情報を省き、閲覧している本文内容に即したキーワードを抽出しやすくなる。さらに、閲覧しているWebページ本文の内容が長く、携帯端末の表示ウィンドウにWebページ本文全ての内容が表示できない場合であっても、スクロール操作などにより再度表示し直すことなく同じWebページ内の他の箇所で見たキーワードを全て抽出できる。
図4は、本文の例を示す。図4(a)は、本文抽出処理の結果、閲覧文書から抽出された本文の例である。この例では、「サカナさん症候群」という病名について書かれた記事を示し、人名、地名といったキーワードとなる固有表現の例として、病名である「サカナさん症候群」、放送局会社である「富士テレビ」、テレビ番組名である「サカナさん」などが抽出対象である。
まず、本文領域に含まれるテキスト中のキーワードを抽出する(ステップS22)。キーワード抽出方式としては、形態素解析あるいは固有表現抽出処理、あらかじめ登録された辞書に含まれる単語とのマッチングなど、一般的なキーワード抽出手法を用いる。ここで抽出用の辞書やルールに用いられる優先度をスコアとして表現してもよく、後述の通りユーザによるキーワード選択傾向を重み付けに反映してもよい。図4(b)は、抽出されたキーワード、その意味属性およびスコアの一覧を示す。
図5は、キーワードの意味属性と検索方式を対応付けした検索ルールの例を示す。意味属性に応じて、検索方式名と、キーワードが選択された時に利用される検索サービスと、検索方式に対応する拡張クエリが検索ルール格納部105に格納されている。
ユーザには、後述の通り、最終的にキーワードと対応する検索方式が提示される。なお、1つの意味属性に対して複数の検索方式が対応しても構わない。
類似するキーワードを判別・集約し、ユーザに提示する(ステップS23)。類似するキーワードを判別するルールは、類似キーワード集約ルール格納部107に格納されている。図6にこの判別ルールの一例を示す。この判別ルールには、キーワードの表記パターンによって2つ以上のキーワードが類似である関係が記述され、例えば「キーワード1とキーワード2の共通部分が3文字以上ある場合、キーワード1とキーワード2は類似」、「『人名1こと人名2』という表記がある場合、人名1と人名2は類似」等と記述されている。その結果、類似するキーワードの群(集合)を判別し、類似するキーワードの集合が形成される。このように、キーワードの表記パターンは、表記の包含関係や、読み替え、略称・愛称・別名など表記の類似性を有している。
類似するキーワードの集合から、主キーワードを求める。主キーワードが代表的な見出し語としてユーザに提示される。主キーワードは、キーワードの持つ属性によって決定される。例えば、キーワードのスコアがもっとも高いもの、表記が最も短いもの又は、優先順位の高い意味属性を持つものなどによって決定される。本実施形態では、スコアが最も高い類似キーワードを主キーワードとし、それ以外の類似キーワードは従キーワードとしてスコア順に並べることによって、類似するキーワードを集約している。このようにすれば、ページ内の互いに表層的な包含関係にあるキーワードを検索クエリの候補として提示する際似た表記のキーワードが煩雑に並ぶことを回避でき、また集約して提示する場合はどの表記で提示するかの選択も容易になる。
図7は、類似キーワード集約部106によって集約された主キーワード及び従キーワードの構造例を示す。主キーワードとして「サカナさん」、「富士テレビ」などが選択され、順にIDが付与される。また、「サカナさん」(主キーワードIDは1)に従属する従キーワードとして「サカナさん症候群」、「大長編サカナさん」などが集約され、これらの主キーワードIDは「サカナさん」と同じ”1”が付与され、従キーワードIDが順に付与される。
図8は、キーワード・検索方式提示部108により提示されるキーワード及びその検索方式の配置例を示す。主キーワードと検索方式の組が順にタッチスクリーンに提示される。従キーワードが存在する場合、キーワード・検索方式提示部108はその旨を表示する。 本実施形態では、ボタンが、主キーワードの前後に「…」のようなキーワード表記に続きが存在することを示している。さらに、このボタンは、選択用のリストを展開するためのボタンでもある。詳細は後述する。
図9は、提示された主キーワードから従キーワードを選択する方法を説明する図である。図9(a)のように「サカナさん…」と表記されている場合に、「…」の部分を指でスライドすると、より長い表記である「サカナさん症候群」が展開表示される。このとき、「サカナさん症候群」の意味属性に対応する検索方式を図5の検索ルールから求め、更新表示される。
図9(b)のように前後に展開可能である場合は、「…サカナさん…」のように表示され、前後どちらかをスライドすることで、従キーワードは前後どちらでも展開可能である。複数の候補がある場合は、図9(b)右下のように、複数の従キーワード候補が一度に表示され、ユーザが選択することによって従キーワードが決定される。このようにすれば、主キーワードよりも長い文字数のキーワードを従キーワードとして集約表示できる。
図10は、リスト表示による従キーワードの選択例を示す図である。図10(a)のように展開可能であることを示す「▽」ボタンを押すことで、従キーワードおよび検索方式の一覧が展開される。この方式の場合、図10(b)のように表記が包含関係でない類似キーワードについても、ユーザにとって自然な展開表示が可能となる。
図11は、より短い表記の従キーワードに展開する例を示す図である。キーワード自体を指で挟む操作により、別名での表記(例えば略称)に変換することができる。同図(a)はカタカナ表記のキーワードを略称に変換した場合を、同図(b)は英語表記のキーワードを略称に変換した場合を示す。
このように、長い表記を主キーワードにして、より短い表記を従キーワードにすることは、選択傾向算出部112によってユーザが選択するキーワードの統計情報を求めることによって可能になる。
次に、表示されたキーワードを検索のために選択する流れを説明する。図12は、本実施形態に係るキーワード選択の動作を示すフローチャートである。
ユーザはキーワード・検索方式提示部108により表示されたキーワードを選択する(ステップS101)。次に、検索部109は、(i)選択されたキーワード、このキーワードの意味属性に対応する(ii)検索方式、(iii)検索サービス、(iv)拡張クエリを用いて検索を実行する(ステップS102)。なお、検索ルール格納部105に拡張クエリが無い場合は、拡張クエリを追加せずに検索を実行する。
検索結果表示部110は、この検索結果をユーザに提示する(ステップS103)。本実施形態では、ウェブサービスを用いた検索を想定している。しかし、キーワード提示装置100自身に格納された辞書などのデータベース検索など、ウェブサービス以外の検索手段を用いても構わない。図13は、選択されたキーワードが従キーワード「サカナさん症候群」の場合の検索結果の表示例を示す図である。ここで、検索結果表示部110は、図3(a)に示す閲覧情報入力部101とは別のウィンドウとして表示されている。
表示された検索結果のうち1つをユーザが選択すると、そのウェブページに移動し、閲覧情報入力部101に次のウェブページ情報が入力される。このように、ユーザがウェブページを閲覧している時に、関連情報を調べるための手掛かりとなるキーワードおよび検索方式を煩雑な操作なく行うことができる。
本実施形態は、ユーザの閲覧内容に基づき、関連情報の検索に用いることのできるキーワードのうち類似するキーワードを1つの見出しにまとめ、この見出しと、その意味属性に対応した検索方式とを表示し、ユーザの選択操作によって見出しが変更した場合、変更した見出しに対応した検索方式に切り替えることができる。これによって、ユーザは、ディスプレイ上に表示された多数の表記から1つのキーワードを見つけるのではなく、表示された1つの見出しを、指でスライド操作する等により、類似する見出しを容易に選択し、関連情報検索を行えるようになる。
(変形例)
閲覧情報入力部101では、ウェブページの他に、現在ユーザが置かれている状況を表すキーワードを追加で入力してもよい。例えば、ウェブブラウザが携帯端末に搭載されている場合は、現在地を表すキーワードとして「川崎」などの単語を入力することが考えられる。
本実施形態では、ユーザが所有する端末においてキーワード提示装置100が使用されることを想定しているが、これはキーワード提示装置100の一部がサーバ上に構成されるなど分離して構成されてもよい。キーワード提示装置100は、CPUなどの制御装置と、ROMやRAMなどの記憶装置と、HDDなどの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボード、マウスなどの入力装置とを備えた、一般的なコンピュータに適用することもできる。
また、上記の各実施形態のキーワード提示装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。実行されるプログラムは、上述した各機能を含むモジュール構成となっている。プログラムはインストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(R)ディスク、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供しても、ROM等に予め組み込んで提供してもよい。
なお、このキーワード提示装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。すなわち、閲覧情報入力部101、本文領域抽出部102、キーワード抽出部103、類似キーワード集約部106、キーワード・検索方式提示部108、検索部109、検索結果表示部110、選択傾向算出部112は、上記のコンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、キーワード提示装置は、上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、キーワード抽出辞書・ルール格納部104、検索ルール格納部105、類似キーワード集約ルール格納部107、検索結果表示部110、選択履歴格納部111および関連語辞書格納部113は、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。
上述した実施の形態は、本発明の好適な具体例であるから、技術的に好ましい種々の限定が付されているが、本発明の趣旨を逸脱しない範囲であれば、適宜組合わせ及び変更することができることはいうまでもない。
100 キーワード提示装置
101 閲覧情報入力部
102 本文領域抽出部
103 キーワード抽出部
104 キーワード抽出辞書・ルール格納部
105 検索ルール格納部
106 類似キーワード集約部
107 類似キーワード集約ルール格納部
108 キーワード・検索方式提示部
109 検索部
110 検索結果表示部
111 選択履歴格納部
112 選択傾向算出部
113 関連語辞書格納部

Claims (6)

  1. 閲覧文書から複数のキーワードを抽出する抽出部と、
    複数の前記キーワードの中で互いに表記が類似するキーワード毎にまとめて、複数の類似キーワード群を得る判別部と、
    前記類似キーワード群毎に、見出しとなる主キーワードと、それ以外の従キーワードとに分類し、前記従キーワードを前記主キーワードに集約する集約部と、
    前記主キーワードを提示する提示部とを備えるキーワード提示装置。
  2. キーワードの意味属性に対応する検索方式及び検索サービスを決定するための検索ルールを格納する格納部をさらに備え、
    前記集約部は、前記検索ルールを用いて、前記主キーワード及び前記従キーワードの意味属性に対応する検索方式及び検索サービスを求めることを特徴とする請求項1記載のキーワード提示装置。
  3. 前記検索ルールはさらに拡張クエリを備え、
    前記集約部はさらに前記主キーワード及び前記従キーワードの意味属性に対応する拡張クエリを求めることを特徴とする請求項1記載のキーワード提示装置。
  4. 前記提示部により提示されたキーワードをユーザが選択したキーワードの統計情報を算出する算出部をさらに備えることを特徴とする請求項1記載のキーワード提示装置。
  5. 閲覧文書から複数のキーワードを抽出するステップと、
    複数の前記キーワードの中で互いに表記が類似するキーワード毎にまとめて、複数の類似キーワード群を得るステップと、
    前記類似キーワード群毎に、見出しとなる主キーワードと、それ以外の従キーワードとに分類し、前記従キーワードを前記主キーワードに集約するステップと、
    前記主キーワードを提示するステップとを備えるキーワード提示方法。
  6. コンピュータを、
    閲覧文書から複数のキーワードを抽出する手段と、
    複数の前記キーワードの中で互いに表記が類似するキーワード毎にまとめて、複数の類似キーワード群を得る手段と、
    前記類似キーワード群毎に、見出しとなる主キーワードと、それ以外の従キーワードとに分類し、前記従キーワードを前記主キーワードに集約する手段と、
    前記主キーワードを提示する手段と、
    として実行させるためのキーワード提示プログラム。
JP2010084329A 2010-03-31 2010-03-31 キーワード提示装置、方法及びプログラム Expired - Fee Related JP5156047B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010084329A JP5156047B2 (ja) 2010-03-31 2010-03-31 キーワード提示装置、方法及びプログラム
US12/883,626 US8782049B2 (en) 2010-03-31 2010-09-16 Keyword presenting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010084329A JP5156047B2 (ja) 2010-03-31 2010-03-31 キーワード提示装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2011215950A true JP2011215950A (ja) 2011-10-27
JP5156047B2 JP5156047B2 (ja) 2013-03-06

Family

ID=44710846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010084329A Expired - Fee Related JP5156047B2 (ja) 2010-03-31 2010-03-31 キーワード提示装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US8782049B2 (ja)
JP (1) JP5156047B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225226A (ja) * 2012-04-23 2013-10-31 Kyocera Corp 情報端末、表示制御プログラムおよび表示制御方法
JP2016133960A (ja) * 2015-01-19 2016-07-25 日本電気株式会社 キーワード抽出システム、キーワード抽出方法、及び、コンピュータ・プログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5156047B2 (ja) * 2010-03-31 2013-03-06 株式会社東芝 キーワード提示装置、方法及びプログラム
KR101541306B1 (ko) * 2013-11-11 2015-08-04 주식회사 엘지씨엔에스 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
US10319020B2 (en) * 2014-03-04 2019-06-11 Rakuten, Inc. Information processing device, information processing method, program and storage medium
CN105260462B (zh) * 2015-10-16 2019-03-26 北京百度网讯科技有限公司 图片展示方法和装置
US10628522B2 (en) * 2016-06-27 2020-04-21 International Business Machines Corporation Creating rules and dictionaries in a cyclical pattern matching process
CN109213848B (zh) * 2018-11-23 2022-03-11 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备
CN110232183B (zh) * 2018-12-07 2022-05-27 腾讯科技(深圳)有限公司 关键词提取模型训练方法、关键词提取方法、装置及存储介质
US11501183B2 (en) * 2019-07-15 2022-11-15 HCL Australia Services Pty. Ltd Generating a recommendation associated with an extraction rule for big-data analysis

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH10162012A (ja) * 1996-11-27 1998-06-19 Matsushita Electric Ind Co Ltd 文分類装置
JP2002269135A (ja) * 2001-03-13 2002-09-20 Matsushita Electric Ind Co Ltd 情報検索支援装置
JP2006134183A (ja) * 2004-11-08 2006-05-25 Nippon Telegr & Teleph Corp <Ntt> 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6321226B1 (en) * 1998-06-30 2001-11-20 Microsoft Corporation Flexible keyboard searching
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
GB2368149B (en) * 2000-10-17 2004-10-06 Ncr Int Inc Information system
JP2003242176A (ja) * 2001-12-13 2003-08-29 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
US20040039689A1 (en) * 2002-06-19 2004-02-26 Neill Penney Method and apparatus for managing financial transactions involving multiple counterparties and processing data pertaining thereto
US7373171B2 (en) * 2003-02-14 2008-05-13 Tdk Corporation Front end module
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US7383171B2 (en) * 2003-12-05 2008-06-03 Xerox Corporation Semantic stenography using short note input data
JP2005352888A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 表記揺れ対応辞書作成システム
US7493273B1 (en) * 2005-01-19 2009-02-17 Earthtrax, Inc. Method, medium, and apparatus for identifying similar auctions
US8340957B2 (en) * 2006-08-31 2012-12-25 Waggener Edstrom Worldwide, Inc. Media content assessment and control systems
JP4475273B2 (ja) * 2006-12-21 2010-06-09 ソニー株式会社 情報処理装置及び方法
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US20080294619A1 (en) * 2007-05-23 2008-11-27 Hamilton Ii Rick Allen System and method for automatic generation of search suggestions based on recent operator behavior
US20090083255A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Query spelling correction
JP5232449B2 (ja) 2007-11-21 2013-07-10 Kddi株式会社 情報検索装置およびコンピュータプログラム
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
US20090292677A1 (en) * 2008-02-15 2009-11-26 Wordstream, Inc. Integrated web analytics and actionable workbench tools for search engine optimization and marketing
US20090299998A1 (en) * 2008-02-15 2009-12-03 Wordstream, Inc. Keyword discovery tools for populating a private keyword database
JP5043735B2 (ja) * 2008-03-28 2012-10-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報分類システム、情報処理装置、情報分類方法およびプログラム
CN101551803A (zh) * 2008-03-31 2009-10-07 华为技术有限公司 一种建立模式匹配状态机、模式识别的方法和装置
KR20090112095A (ko) * 2008-04-23 2009-10-28 삼성전자주식회사 방송 컨텐츠의 저장 방법, 디스플레이 방법 및 그 장치
US8312057B2 (en) * 2008-10-06 2012-11-13 General Electric Company Methods and system to generate data associated with a medical report using voice inputs
US20100161406A1 (en) * 2008-12-23 2010-06-24 Motorola, Inc. Method and Apparatus for Managing Classes and Keywords and for Retrieving Advertisements
US8447609B2 (en) * 2008-12-31 2013-05-21 Intel Corporation Adjustment of temporal acoustical characteristics
US20100208984A1 (en) * 2009-02-13 2010-08-19 Microsoft Corporation Evaluating related phrases
JP5395461B2 (ja) 2009-02-27 2014-01-22 株式会社東芝 情報推薦装置、情報推薦方法および情報推薦プログラム
JP5156047B2 (ja) * 2010-03-31 2013-03-06 株式会社東芝 キーワード提示装置、方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH10162012A (ja) * 1996-11-27 1998-06-19 Matsushita Electric Ind Co Ltd 文分類装置
JP2002269135A (ja) * 2001-03-13 2002-09-20 Matsushita Electric Ind Co Ltd 情報検索支援装置
JP2006134183A (ja) * 2004-11-08 2006-05-25 Nippon Telegr & Teleph Corp <Ntt> 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200501562008; 酒井 浩之 他: '略語とその原形語との対応関係のコーパスからの自動獲得手法の改良' 自然言語処理 第12巻,第5号, 20051010, pp.207-231., 言語処理学会 *
JPN6011058791; 酒井 浩之 他: '略語とその原形語との対応関係のコーパスからの自動獲得手法の改良' 自然言語処理 第12巻,第5号, 20051010, pp.207-231., 言語処理学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225226A (ja) * 2012-04-23 2013-10-31 Kyocera Corp 情報端末、表示制御プログラムおよび表示制御方法
JP2016133960A (ja) * 2015-01-19 2016-07-25 日本電気株式会社 キーワード抽出システム、キーワード抽出方法、及び、コンピュータ・プログラム

Also Published As

Publication number Publication date
JP5156047B2 (ja) 2013-03-06
US20110246464A1 (en) 2011-10-06
US8782049B2 (en) 2014-07-15

Similar Documents

Publication Publication Date Title
JP5156047B2 (ja) キーワード提示装置、方法及びプログラム
US8001135B2 (en) Search support apparatus, computer program product, and search support system
JP5241828B2 (ja) 辞書の単語及び熟語の判定
WO2009154153A1 (ja) 文書検索システム
US20120036144A1 (en) Information and recommendation device, method, and program
KR20110127126A (ko) 검색 결과 또는 링크된 페이지를 위한 사이트 구조의 시각화 및 사이트 내비게이션의 활성화
CN103064956A (zh) 用于搜索电子内容的方法、计算系统和计算机可读介质
US10078672B2 (en) Search device, search method, and computer program product
CN103430172A (zh) 检索装置、检索方法及程序
JP6529133B2 (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
TWI461942B (zh) An ad management apparatus, an advertisement selecting apparatus, an advertisement management method, an advertisement management program, and a recording medium on which an advertisement management program is recorded
JP5185402B2 (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
KR101391107B1 (ko) 검색 대상의 타입을 인터렉티브하게 표시하는 검색 서비스 제공 방법 및 장치
JP5345987B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
JP6157965B2 (ja) 電子機器、方法、およびプログラム
TWI447662B (zh) An ad management apparatus, an advertisement selecting apparatus, an advertisement management method, an advertisement management program, and a recording medium on which an advertisement management program is recorded
JP2008077252A (ja) 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体
JP5269399B2 (ja) 構造化文書検索装置、方法およびプログラム
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP6488399B2 (ja) 情報提示システム、及び情報提示方法
JP2002189744A (ja) Webページ検索システム
JP2007128224A (ja) 文書インデキシング装置、文書インデキシング方法及び文書インデキシングプログラム
JP4783563B2 (ja) インデックス生成プログラム、検索プログラム、インデックス生成方法、検索方法、インデックス生成装置および検索装置
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121009

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees