JP6226314B2 - 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム - Google Patents
検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム Download PDFInfo
- Publication number
- JP6226314B2 JP6226314B2 JP2012214227A JP2012214227A JP6226314B2 JP 6226314 B2 JP6226314 B2 JP 6226314B2 JP 2012214227 A JP2012214227 A JP 2012214227A JP 2012214227 A JP2012214227 A JP 2012214227A JP 6226314 B2 JP6226314 B2 JP 6226314B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- document
- search
- search index
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
具体的には、HTML(HyperText Markup Language)データにおけるヘッダーと呼ばれる表示されないデータ領域に、ウェブページに関係するキーワードを埋め込んでおく。検索エンジンのシステムでは、周期的にインターネット上で公開されているウェブページを巡回し、ヘッダーに埋め込まれたキーワードを収集して、そのウェブページと収集したキーワードとを関連付けてデータベース化する。
したがって、ヘッダーに埋め込まれたキーワードを適切に採用することにより、特定のウェブページを検索結果として表示させやすくすることができる。
しかし、前記楽曲を紹介するウェブページの作成時点においては、前記CMに関するワードはヘッダーに埋め込まれていないため、前記CMに関するワードを検索ワードとして検索が行われても、検索結果として前記楽曲を紹介するウェブページは表示されない。
本発明は、この点に鑑みてなされたものであり、ウェブページの作成後において、そのウェブページと関連付けるべきキーワードが増えた場合であっても、そのキーワードを当該ウェブページの検索用のキーワードとして機能させることなどを解決課題とする。
<第1実施形態>
<1.検索用インデックス構築装置の概要>
図1は、本発明の第1実施形態に係る検索用インデックス構築装置1が用いられる環境を説明するためのブロック図である。ここで、検索用インデックスとは、検索装置3によって第1文書の検索に利用される情報であり、メインキーワードと関連キーワードとで構成される。メインキーワードは検索対象としての第1文書の主題を表すキーワードであり、関連キーワードは検索対象としての第1文書の内容に関連するキーワードのことである。検索用インデックスの詳細については後述する。図1に示すように、検索用インデックス構築装置1は、インターネットなどの通信網NETを介して、楽曲DB(データベース)4、公開サーバ5、ホスティングサーバ6のそれぞれに対して通信可能になっている。また、利用者端末2は、通信網NETを介して、汎用の検索装置3、公開サーバ5、ホスティングサーバ6のそれぞれに対して通信可能になっている。さらに、汎用の検索装置3は、通信網NETを介して、公開サーバ5及びホスティングサーバ6のそれぞれに対して通信可能になっている。
なお、図1においては、一つの公開サーバ5のみを示しているが、複数の公開サーバ5に楽曲紹介ページのHTMLデータを格納するようにしてもよい。また、公開サーバ5は、ホスティングサーバに置き換えることも可能である。
抽出部11は、判断部10により前記メインキーワードがQ&Aページの回答欄に含まれていると判断した場合には、Q&Aページの質問欄からメインキーワードに対応するキーワードを抽出する。メインキーワードに対応するキーワードとは、メインキーワードとの関連で質問欄に記載されているキーワードである。詳しくは後述する。
なお、本実施形態では、楽曲DB4が、検索用インデックス構築装置1と別体に構成された例について説明したが、検索用インデックス構築装置1の構成要素の一つして楽曲DB4を備えるようにしてもよい。
本実施形態において、CPU30は判断部10、抽出部11、及び、更新部12として動作し得る。
以下、図4乃至図7を参照して、本実施形態の検索用インデックス構築装置1の動作について説明する。
まず、図4のフローチャートを参照して、キーワード抽出処理について説明する。検索用インデックス構築装置1のCPU30は、楽曲DB4に対して、どのような楽曲名が登録されているのかを問い合わせる(S200)。検索用インデックス構築装置1のCPU30から問合せ要求を受けた楽曲DB4は、登録されている情報の中から、楽曲名だけを抽出して、楽曲リストの作成を行う(S300)。本実施形態の場合は、図2に示すように、楽曲名として、「DDD」、「EEE」、「FFF」等が記憶されており、これらの楽曲名を抽出して楽曲リストを作成する。楽曲リストの作成が完了すると、楽曲DB4は、検索用インデックス構築装置1に対して、作成した楽曲リストを通知する(S301)。
次に、図5を参照して本実施形態の楽曲紹介ページの更新処理について説明する。楽曲紹介ページの更新処理は、図4に示すキーワードの取得処理が終了した後に続けて行うようにしてもよいし、あるいは、キーワードの取得処理とは独立に行うようにしてもよい。本実施形態では、図4に示すキーワードの取得処理が終了した後に続けて行う例について説明する。
検索用インデックス構築装置1の記憶部13には、楽曲紹介ページのURLが予め記憶されており、検索用インデックス構築装置1のCPU30は、この楽曲紹介ページのURLを参照することにより、楽曲紹介ページにアクセスする。そして、楽曲紹介ページの文書テキストデータを取得する(S221)。
次に、図8及び図9を参照して、本発明の第2実施形態について説明する。第1実施形態においては、検索装置として汎用の検索装置を用いる例について説明したが、第2実施形態は、図8に示すように、DB(データベース)3bを備えた楽曲紹介ページ用の専用の検索装置3Aを用いる構成が第1実施形態とは異なる。
本発明は、上述した実施形態に限定されるものではなく、以下に述べる各種の変形が可能である。また、各変形例及び実施形態は、適宜、組み合わせてもよいことは勿論である。
Claims (10)
- 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築する検索用インデックス構築装置であって、
前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断する判断部と、前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出する抽出部と、前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新する更新部とを備え、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの回答部分にメインキーワードが含まれていると判断された場合は、前記抽出部は、前記メインキーワードに対応するキーワードを質問部分から抽出する
ことを特徴とする検索用インデックス構築装置。 - 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築する検索用インデックス構築装置であって、
前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断する判断部と、前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出する抽出部と、前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新する更新部とを備え、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの質問部分にメインキーワードが含まれていると判断された場合は、前記抽出部は、前記メインキーワードに対応するキーワードを回答部分から抽出する
ことを特徴とする検索用インデックス構築装置。 - 前記更新部は、前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記第1文書内の前記検索用インデックスを更新することを特徴とする請求項1または請求項2に記載の検索用インデックス構築装置。
- 前記第1文書及び前記第2文書は、マークアップ言語で記述されたウェブページであり、前記更新部は、前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記ウェブページのヘッダー内の前記検索用インデックスを更新することを特徴とする請求項3に記載の検索用インデックス構築装置。
- 前記更新部は、前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとしてデータベースに記憶された前記検索用インデックスを更新することを特徴とする請求項1ないし請求項4のいずれか一に記載の検索用インデックス構築装置。
- 前記抽出部は、固有名詞をキーワードとして抽出することを特徴とする請求項1ないし請求項5のいずれか一に記載の検索用インデックス構築装置。
- 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築し、判断部、抽出部、および更新部を備える検索用インデックス構築装置による検索用インデックス構築方法であって、
前記判断部により、前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断し、
前記抽出部により、前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出し、
前記更新部により、前記抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新し、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの回答部分にメインキーワードが含まれていると判断された場合は、前記抽出部により、前記メインキーワードに対応するキーワードを質問部分から抽出する
ことを特徴とする検索用インデックス構築方法。 - 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築し、判断部、抽出部、および更新部を備える検索用インデックス構築装置による検索用インデックス構築方法であって、
前記判断部により、前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断し、
前記抽出部により、前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出し、
前記更新部により、前記抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新し、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの質問部分にメインキーワードが含まれていると判断された場合は、前記抽出部により、前記メインキーワードに対応するキーワードを回答部分から抽出する
ことを特徴とする検索用インデックス構築方法。 - 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築するコンピュータを備える検索用インデックス構築装置のプログラムであって、
前記コンピュータを、
前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断する判断部と、
前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出する抽出部と、
前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新する更新部として機能させ、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの回答部分にメインキーワードが含まれていると判断された場合は、前記抽出部は、前記メインキーワードに対応するキーワードを質問部分から抽出する
ことを特徴とする検索用インデックス構築装置のプログラム。 - 予め定められた第1文書の検索装置による検索に利用される検索用インデックスを構築するコンピュータを備える検索用インデックス構築装置のプログラムであって、
前記コンピュータを、
前記第1文書とは異なる予め定められた第2文書に、前記第1文書と関連付けて記憶されたキーワードから読み取った所定のメインキーワードが含まれているか否かを判断する判断部と、
前記判断部により前記メインキーワードが含まれていると判断した前記第2文書から前記メインキーワードに対応するキーワードを抽出する抽出部と、
前記抽出部により抽出したキーワードを前記第1文書の関連キーワードとして前記検索用インデックスを更新する更新部として機能させ、
前記第2文書として、質問に対する回答を投稿可能な質問ページを用い、前記判断部により前記質問ページの質問部分にメインキーワードが含まれていると判断された場合は、前記抽出部は、前記メインキーワードに対応するキーワードを回答部分から抽出する
ことを特徴とする検索用インデックス構築装置のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012214227A JP6226314B2 (ja) | 2012-09-27 | 2012-09-27 | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012214227A JP6226314B2 (ja) | 2012-09-27 | 2012-09-27 | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014067374A JP2014067374A (ja) | 2014-04-17 |
JP6226314B2 true JP6226314B2 (ja) | 2017-11-08 |
Family
ID=50743666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012214227A Active JP6226314B2 (ja) | 2012-09-27 | 2012-09-27 | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6226314B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7179630B2 (ja) * | 2019-01-28 | 2022-11-29 | ヤフー株式会社 | 決定装置、決定方法及び決定プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008204227A (ja) * | 2007-02-21 | 2008-09-04 | Fuji Xerox Co Ltd | キーワード付与装置およびキーワード付与プログラム |
JP2009140089A (ja) * | 2007-12-04 | 2009-06-25 | Internatl Business Mach Corp <Ibm> | ウェブコンテンツに検索用キーワードを付加するシステムおよび方法 |
-
2012
- 2012-09-27 JP JP2012214227A patent/JP6226314B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014067374A (ja) | 2014-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5264892B2 (ja) | 多言語情報検索 | |
US9218414B2 (en) | System, method, and user interface for a search engine based on multi-document summarization | |
JP6423845B2 (ja) | 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム | |
CN101809572B (zh) | 在搜索结果页面上包括交互式元素的系统和方法 | |
US20150088846A1 (en) | Suggesting keywords for search engine optimization | |
US8631097B1 (en) | Methods and systems for finding a mobile and non-mobile page pair | |
US10783192B1 (en) | System, method, and user interface for a search engine based on multi-document summarization | |
CN106471497B (zh) | 使用上下文的辅助浏览 | |
CN104090757A (zh) | 针对浏览器的富媒体信息展示方法 | |
CN104090923A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
JP6226314B2 (ja) | 検索用インデックス構築装置、検索用インデックス構築方法、及び、検索用インデックス構築装置のプログラム | |
JP4796527B2 (ja) | ドキュメント絞り込み検索装置、方法及びプログラム | |
WO2013047512A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
Witte et al. | Connecting wikis and natural language processing systems | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP5228529B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
JP4477931B2 (ja) | 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2006236221A (ja) | ウエブページ検索のための管理サーバ装置 | |
US11150871B2 (en) | Information density of documents | |
JP2007025753A (ja) | ウェブログサーバ及びウェブログサービス提供システム | |
Ke et al. | Advanced information retrieval Web services for digital libraries | |
JP7323484B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2011192222A (ja) | 情報処理装置、データ抽出方法、及びプログラム | |
JP2008165785A (ja) | 検索システムおよびその方法 | |
US10783199B2 (en) | Web site presentation method, non-transitory computer-readable recording medium, and web site presentation device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150414 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160824 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20161011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161228 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170106 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20170310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6226314 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |