JP2018151841A - 検索語分類プログラム、検索語分類方法および情報処理装置 - Google Patents

検索語分類プログラム、検索語分類方法および情報処理装置 Download PDF

Info

Publication number
JP2018151841A
JP2018151841A JP2017047441A JP2017047441A JP2018151841A JP 2018151841 A JP2018151841 A JP 2018151841A JP 2017047441 A JP2017047441 A JP 2017047441A JP 2017047441 A JP2017047441 A JP 2017047441A JP 2018151841 A JP2018151841 A JP 2018151841A
Authority
JP
Japan
Prior art keywords
search
words
word
unit
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017047441A
Other languages
English (en)
Other versions
JP6891552B2 (ja
Inventor
佐藤 洋一
Yoichi Sato
洋一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017047441A priority Critical patent/JP6891552B2/ja
Priority to EP18155263.9A priority patent/EP3376410A1/en
Priority to US15/891,213 priority patent/US20180260418A1/en
Publication of JP2018151841A publication Critical patent/JP2018151841A/ja
Application granted granted Critical
Publication of JP6891552B2 publication Critical patent/JP6891552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

【課題】検索語を分類できる検索語分類プログラム、検索語分類方法および情報処理装置を提供する。【解決手段】検索語分類プログラムは、複数の語を取得する処理をコンピュータに実行させる。検索語分類プログラムは、取得した複数の語のそれぞれについて、検索により画像が検出されるか否か判定する処理をコンピュータに実行させる。検索語分類プログラムは、判定結果に応じて、複数の語を分類する処理をコンピュータに実行させる。【選択図】図1

Description

本発明は、検索語分類プログラム、検索語分類方法および情報処理装置に関する。
例えば、旅行プランを作成する際に、訪れたい地方の観光スポットの情報を調べるために検索を行う場合がある。検索を行うユーザは、訪れたい地方にどの様な観光スポットがあるかを知らない場合、例えば、都道府県名と観光という様な曖昧なキーワードを用いて検索を行うことがある。
また、検索の手法としては、例えば、文書データベースから文書を検索する際に、入力された検索語が検出される頻度に応じた関連語グループを獲得し、検索された文書と獲得した関連語グループとを対応させて一覧表示することが提案されている。また、例えば、ユーザが入力した質問文を解析して検索キーワードを抽出し、検索キーワードを主要タイプと非主要タイプとに分類し、分類結果に基づいて、類似度のランキング付き検索結果を得ることが提案されている。
特開2004−021915号公報 特開2004−139553号公報
しかしながら、例えば、曖昧なキーワード、つまり検索語を用いて検索を行うと、検索語が検索対象のコンテンツ内で差別化された検索語とならないため、ほとんどのコンテンツがヒットするか、全くヒットしないといった両極端な結果となる場合がある。このため、ユーザは、所望の検索結果を得るために、自ら検索語を組み合わせて何度も検索し、良好な検索結果が得られる検索語を自ら分類することになるので、適切な検索語を得るために多大な手間がかかることになる。
一つの側面では、検索語を分類できる検索語分類プログラム、検索語分類方法および情報処理装置を提供することにある。
一つの態様では、検索語分類プログラムは、複数の語を取得する処理をコンピュータに実行させる。検索語分類プログラムは、取得した前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定する処理をコンピュータに実行させる。検索語分類プログラムは、判定結果に応じて、前記複数の語を分類する処理をコンピュータに実行させる。
検索語を分類できる。
図1は、実施例1の情報処理システムの構成の一例を示すブロック図である。 図2は、観光情報記憶部の一例を示す図である。 図3は、実施例1の検索語分類処理の一例を示すフローチャートである。 図4は、実施例2の情報処理システムの構成の一例を示すブロック図である。 図5は、実施例2の検索語分類処理の一例を示すフローチャートである。 図6は、検索語分類プログラムを実行するコンピュータの一例を示す図である。
以下、図面に基づいて、本願の開示する検索語分類プログラム、検索語分類方法および情報処理装置の実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組みあわせてもよい。
図1は、実施例1の情報処理システムの構成の一例を示すブロック図である。図1に示す情報処理システム1は、端末装置10と、情報処理装置100とを有する。なお、端末装置10の数は限定されず、任意の数の端末装置10を有してもよい。端末装置10と、情報処理装置100との間は、ネットワークNを介して相互に通信可能に接続される。かかるネットワークNには、有線または無線を問わず、インターネットを始め、LAN(Local Area Network)やVPN(Virtual Private Network)などの任意の種類の通信網を採用できる。
端末装置10は、例えば、情報処理装置100が提供する観光情報の検索サービスをユーザが利用するための情報処理装置であり、据置型や可搬型のパーソナルコンピュータ等を用いることができる。また、端末装置10には、タブレット端末やスマートフォン等の移動体通信端末等を用いるようにしてもよい。端末装置10は、例えば、情報処理装置100が提供する検索サービスの検索画面において、ユーザから観光情報を検索するための検索語が入力される。端末装置10は、ネットワークNを介して、入力された検索語を情報処理装置100に送信する。また、端末装置10は、ネットワークNを介して、情報処理装置100から検索結果を受信する。端末装置10は、受信した検索結果を表示して、ユーザに検索結果を提供する。
情報処理装置100は、端末装置10から受け付けた検索語に関連する関連語を取得し、検索語および関連語を分類する情報処理装置である。情報処理装置100は、複数の語を取得する。情報処理装置100は、取得した複数の語のそれぞれについて、検索により画像が検出されるか否か判定する。情報処理装置100は、判定結果に応じて、複数の語を分類する。これにより、情報処理装置100は、検索語を分類できる。
次に、情報処理装置100の構成について説明する。図1に示すように、情報処理装置100は、通信部110と、表示部111と、操作部112と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、図1に示す機能部以外にも既知のコンピュータが有する各種の機能部、例えば各種の入力デバイスや音声出力デバイス等の機能部を有することとしてもかまわない。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワークNを介して端末装置10と有線または無線で接続され、端末装置10との間で情報の通信を司る通信インタフェースである。通信部110は、制御部130から入力された検索画面および検索結果等を端末装置10に送信する。また、通信部110は、端末装置10から受信した検索語を制御部130に出力する。
表示部111は、情報処理装置100の管理者に対して各種情報を表示するための表示デバイスである。表示部111は、例えば、表示デバイスとして液晶ディスプレイ等によって実現される。表示部111は、制御部130から入力された表示画面等の各種画面を表示する。
操作部112は、情報処理装置100の管理者から各種操作を受け付ける入力デバイスである。操作部112は、例えば、入力デバイスとして、キーボードやマウス等によって実現される。操作部112は、管理者によって入力された操作を操作情報として制御部130に出力する。なお、操作部112は、入力デバイスとして、タッチパネル等によって実現されるようにしてもよく、表示部111の表示デバイスと、操作部112の入力デバイスとは、一体化されるようにしてもよい。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、ハードディスクや光ディスク等の記憶装置によって実現される。記憶部120は、観光情報記憶部121を有する。また、記憶部120は、制御部130での処理に用いる情報を記憶する。
観光情報記憶部121は、観光スポットと、例えば、観光スポットに関するウェブページから取得した観光スポットの説明文とを対応付けて記憶する。図2は、観光情報記憶部の一例を示す図である。図2に示すように、観光情報記憶部121は、「スポットID(Identifier)」、「スポット名」、「URL(Uniform Resource Locator)」、「説明文」といった項目を有する。観光情報記憶部121は、例えば、スポットIDごとに1レコードとして記憶する。
「スポットID」は、観光スポットを紹介するウェブページを識別する識別子である。なお、「スポットID」は、例えば同じ観光スポットを紹介するウェブページが複数ある場合には、異なるスポットIDを付与することで識別する。「スポット名」は、観光スポットの名称を示す情報である。「URL」は、ウェブページのURLを示す情報である。なお、「URL」は、URI(Uniform Resource Identifier)であってもよい。「説明文」は、ウェブページから取得した観光スポットの説明文、すなわち観光情報を示す情報である。図2の1行目の例では、スポットID「101」のスポット名「スポットA」を紹介するウェブページは、URLが「http://○△□」であり、当該ウェブページから取得した説明文が「三内丸山遺跡・・・」であることを示す。
図1の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。制御部130は、取得部131と、判定部132と、分類部133と、検索部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図1に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
取得部131は、例えば、端末装置10から受け付けた検索語に関連する関連語を取得する。取得部131は、通信部110およびネットワークNを介して、検索サービスの検索画面を端末装置10に送信する。取得部131は、ネットワークNおよび通信部110を介して、端末装置10から検索語を受信すると、受信した検索語を受け付ける。取得部131は、受け付けた検索語で、図示しないサーチエンジンを用いて検索を行う。なお、検索語は、例えば1つまたは2つとすることができる。取得部131は、検索の結果、検索語に関連する複数の関連語を取得する。取得部131は、取得した複数の関連語を検索語とともに判定部132に出力する。
すなわち、取得部131は、複数の語を取得する。また、取得部131は、入力された語を用いて入力された語に関連する語を検索し、検索結果である複数の関連する語および入力された語を取得する。
判定部132は、取得部131から検索語および関連語が入力されると、検索語または関連語を1つ選択する。判定部132は、選択した検索語または関連語について、所定の用語検索サイトを検索する。所定の用語検索サイトは、例えば、ウィキペディア(登録商標)等のように、実体のあるものについては画像を用いて解説が記述されている百科事典等のサイトが挙げられる。判定部132は、用語検索サイトを検索し、検索語または関連語と関連付いた画像を抽出する。すなわち、判定部132は、用語検索サイトの各用語のウェブページに共通するような画像は検索語または関連語と関連付いた画像ではないので抽出しない。つまり、判定部132は、用語検索サイトの用語を解説する解説文が記述される領域や、予め用語に関連する画像が配置される領域に画像がある場合に、当該画像を検索語または関連語と関連付いた画像として抽出する。
判定部132は、例えば、用語のウェブページのHTML(HyperText Markup Language)の解説文が記述される領域や、予め用語に関連する画像が配置される領域にIMGタグがある場合に、当該IMGタグで指定される画像を抽出する。なお、画像には、静止画像だけでなく動画像も含まれる。言い換えると、判定部132で抽出される画像は、所定の用語検索サイトの検索語または関連語に対応するページに関連付けられた画像である。判定部132は、検索語または関連語と、画像の抽出成否とを分類部133に出力する。
判定部132は、分類部133から未検索判定指示が入力されると、未検索の検索語または関連語があるか否かを判定する。判定部132は、未検索の検索語または関連語があると判定した場合には、検索語および関連語群から次の検索語または関連語を1つ選択し、所定の用語検索サイトを検索する処理に戻る。判定部132は、未検索の検索語または関連語がないと判定した場合には、検索部134に検索指示を出力する。
言い換えると、判定部132は、取得した複数の語のそれぞれについて、検索により画像が検出されるか否かを判定する。また、画像が検出されるか否かの検索は、所定の用語検索サイトを利用して実行される。
分類部133は、判定部132から入力された検索語または関連語と、画像の抽出成否とに基づいて、入力された検索語または関連語を分類する。分類部133は、画像を抽出できない検索語または関連語として分類した場合には、当該検索語または関連語は、実体のない概念的な用語であるとする。この場合、分類部133は、当該検索語または関連語を破棄し、判定部132に対して、未検索の検索語または関連語があるか否かを判定するように未検索判定指示を出力する。
分類部133は、画像を抽出できた検索語または関連語として分類した場合には、当該検索語または関連語は、実体がある検索語であるとする。この場合、分類部133は、実体がある検索語または関連語を実体がある検索語群として記憶部120に一時的に記憶し、判定部132に対して、未検索の検索語または関連語があるか否かを判定するように未検索判定指示を出力する。すなわち、分類部133は、実体がある検索語または関連語を実体がある検索語群として記憶部120に一時的に記憶し、実体がない検索語または関連語を破棄することで、検索語または関連語を分類する。
言い換えると、分類部133は、判定部132における判定結果に応じて、複数の語を分類する。また、複数の語は、入力された語および/または入力された語に関連する語として検索された語である。
検索部134は、判定部132から検索指示が入力されると、記憶部120に一時的に記憶された実体がある検索語群を取得する。検索部134は、取得した実体がある検索語群を用いて観光情報記憶部121を検索する。検索部134は、通信部110およびネットワークNを介して、検索結果を端末装置10に送信する。
すなわち、検索部134は、複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する。また、観光情報は、観光スポットである。
次に、実施例1の情報処理装置100の動作について説明する。図3は、実施例1の検索語分類処理の一例を示すフローチャートである。
端末装置10は、ユーザから検索語が入力されると、入力された検索語を情報処理装置100に送信する。情報処理装置100の取得部131は、端末装置10から検索語を受信すると、受信した検索語を受け付ける(ステップS1)。取得部131は、受け付けた検索語で、図示しないサーチエンジンを用いて検索を行う(ステップS2)。取得部131は、検索の結果、検索語に関連する複数の関連語を取得する(ステップS3)。取得部131は、取得した複数の関連語を検索語とともに判定部132に出力する。
判定部132は、取得部131から検索語および関連語が入力されると、検索語または関連語を1つ選択する(ステップS4)。判定部132は、選択した検索語または関連語について、所定の用語検索サイトを検索し、検索語または関連語と関連付いた画像を抽出する(ステップS5)。判定部132は、検索語または関連語と、画像の抽出成否とを分類部133に出力する。
分類部133は、判定部132から入力された検索語または関連語と、画像の抽出成否とに基づいて、検索語または関連語を分類する。すなわち、分類部133は、検索語または関連語について、画像を抽出できたか否かを判定する(ステップS6)。分類部133は、画像を抽出できないと判定した場合には(ステップS6:否定)、選択した検索語または関連語を実体のない概念的な用語であるとして破棄し、判定部132に対して未検索判定指示を出力し、ステップS8に進む。
分類部133は、画像を抽出できたと判定した場合には(ステップS6:肯定)、選択した検索語または関連語は実体がある検索語であるので、当該検索語または関連語を実体がある検索語群として記憶部120に一時的に記憶する(ステップS7)。また、分類部133は、判定部132に対して、未検索の検索語または関連語があるか否かを判定するように未検索判定指示を出力し、ステップS8に進む。
判定部132は、分類部133から未検索判定指示が入力されると、未検索の検索語または関連語があるか否かを判定する(ステップS8)。判定部132は、未検索の検索語または関連語があると判定した場合には(ステップS8:肯定)、ステップS4に戻る。判定部132は、未検索の検索語または関連語がないと判定した場合には(ステップS8:否定)、検索部134に検索指示を出力する。
検索部134は、判定部132から検索指示が入力されると、記憶部120に一時的に記憶された実体がある検索語群を取得する。検索部134は、取得した実体がある検索語群を用いて観光情報記憶部121を検索する(ステップS9)。検索部134は、検索結果を端末装置10に送信する(ステップS10)。これにより、情報処理装置100は、検索語を分類できる。すなわち、情報処理装置100は、観光情報として実体のある検索結果を端末装置10のユーザに提供できる。また、情報処理装置100は、ユーザの潜在的なニーズに合った検索結果を当該ユーザに提供できる。つまり、情報処理装置100は、ユーザが所望する情報を上手く検索語にできない場合であっても、ユーザが所望する情報を提供することができる。
ここで、具体例を用いて検索語分類処理を説明する。まず、端末装置10は、ユーザにより検索語「青森」が入力されると、検索語「青森」を情報処理装置100に送信する。情報処理装置100の取得部131は、検索語「青森」を受信すると、検索語「青森」を受け付ける。取得部131は、受け付けた検索語「青森」で、図示しないサーチエンジンを用いて検索を行う。取得部131は、検索の結果、検索語「青森」に関連する複数の関連語、例えば「見どころ」、「オススメ情報」、「八甲田山」、「酸ヶ湯温泉」等を取得する。なお、以下の説明では、関連語として上述の4つを用いて説明する。取得部131は、取得した複数の関連語「見どころ」、「オススメ情報」、「八甲田山」および「酸ヶ湯温泉」を検索語「青森」とともに判定部132に出力する。
判定部132には、取得部131から検索語「青森」ならびに関連語「青森県」、「見どころ」、「オススメ情報」、「八甲田山」および「酸ヶ湯温泉」が入力される。判定部132は、入力されたこれらの語を1つずつ選択して、所定の用語検索サイト、例えばウィキペディア(登録商標)で検索する。判定部132は、それぞれを解説するウェブページのうち、「青森県」、「八甲田山」および「酸ヶ湯温泉」のウェブページには写真があるので、画像の抽出が成功した旨の情報を生成する。また、判定部132は、用語検索サイトの検索の結果、「見どころ」および「オススメ情報」は、これらの語そのものを解説するウェブページがなく、これらの語を解説内容に含むウェブページの一覧を示すウェブページとなる場合がある。この場合、判定部132は、画像の抽出が失敗した旨の情報を生成する。
また、判定部132は、「青森」について用語検索サイトを検索すると、曖昧さ回避のためのウェブページが表示される場合がある。この場合、判定部132は、例えば、選択項目の一番目の項目「青森県」を選択した際のウェブページについて、画像の抽出成否を判定してもよい。なお、本具体例の場合には、一番目の項目「青森県」を選択すると、「青森県」を解説するウェブページには写真があるので画像の抽出が成功した旨の情報を生成する。判定部132は、検索語または関連語「青森」、「青森県」、「見どころ」、「オススメ情報」、「八甲田山」および「酸ヶ湯温泉」を、それぞれ順番に画像の抽出成否ととともに分類部133に出力する。
分類部133は、判定部132から検索語「青森」および「抽出成功」が入力されると、「青森」を実体がある検索語であると分類し、実体がある検索語群として記憶部120に一時的に記憶する。分類部133は、同様に、関連語「青森県」、「八甲田山」および「酸ヶ湯温泉」を実体がある検索語であると分類し、実体がある検索語群として記憶部120に一時的に記憶する。
分類部133は、判定部132から関連語「見どころ」および「抽出失敗」が入力されると、「見どころ」を実体のない概念的な用語であると分類し、実体がある検索語群とはせずに、関連語「見どころ」を破棄する。分類部133は、同様に、関連語「オススメ情報」を実体のない概念的な用語であると分類し、関連語「オススメ情報」を破棄する。
判定部132は、検索語または関連語「青森」、「青森県」、「見どころ」、「オススメ情報」、「八甲田山」および「酸ヶ湯温泉」について、画像抽出の判定が終了すると、検索部134に検索指示を出力する。
検索部134は、判定部132から検索指示が入力されると、記憶部120に一時的に記憶された実体がある検索語群を取得する。実体がある検索語群には、「青森」、「青森県」、「八甲田山」および「酸ヶ湯温泉」が含まれる。検索部134は、取得した実体がある検索語群を用いて観光情報記憶部121を検索する。検索部134は、検索結果として、例えば、観光スポット「八甲田山」および「酸ヶ湯温泉」の情報を取得し、これらの検索結果を端末装置10に送信する。これにより、情報処理装置100は、観光情報として実体のある検索結果を端末装置10のユーザに提供できる。
このように、情報処理装置100は、複数の語を取得する。また、情報処理装置100は、取得した複数の語のそれぞれについて、検索により画像が検出されるか否か判定する。また、情報処理装置100は、判定結果に応じて、複数の語を分類する。その結果、情報処理装置100は、検索語を分類できる。
また、情報処理装置100では、検索は、所定の用語検索サイトを利用して実行される。その結果、情報処理装置100は、所定の用語検索サイトで画像が検出された語を分類できる。
また、情報処理装置100は、複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する。その結果、情報処理装置100は、実体のある観光スポットの情報を検索できる。
また、情報処理装置100では、観光情報は、観光スポットである。その結果、情報処理装置100は、実体のある観光スポットの情報を検索できる。
また、情報処理装置100では、複数の語は、入力された語および/または入力された語に関連する語として検索された語である。その結果、情報処理装置100は、入力された語が曖昧であったとしても、実体のある検索結果を提供できる。
また、情報処理装置100は、入力された語を用いて入力された語に関連する語を検索し、検索結果である複数の関連する語および入力された語を取得する。その結果、情報処理装置100は、入力された語が曖昧であったとしても、実体のある検索結果を提供できる。
上記実施例1では、ユーザにより入力された検索語でサーチエンジンを用いて検索することで関連語を取得し、複数の語を取得したが、ユーザから複数の語の入力を受け付けてもよく、この場合の実施の形態につき、実施例2として説明する。図4は、実施例2の情報処理システムの構成の一例を示すブロック図である。図4に示す情報処理システム2は、端末装置10と、情報処理装置200とを有する。なお、実施例1の情報処理システム1と同一の構成には同一符号を付すことで、その重複する構成および動作の説明については省略する。
実施例2の情報処理装置200の制御部230は、実施例1の情報処理装置100の制御部130と比較して、取得部131、判定部132および分類部133に代えて取得部231、判定部232および分類部233を有する。
取得部231は、ネットワークNおよび通信部110を介して、端末装置10から複数の検索語を受信すると、受信した複数の検索語を受け付ける。取得部231は、受け付けた複数の検索語を判定部232に出力する。
判定部232は、取得部131から複数の検索語が入力されると、入力された複数の検索語から、検索語を1つ選択する。判定部232は、選択した検索語について、所定の用語検索サイトを検索する。なお、所定の用語検索サイトは、実施例1と同様である。判定部232は、用語検索サイトを検索し、実施例1と同様に検索語と関連付いた画像を抽出する。判定部232は、検索語と、画像の抽出成否とを分類部233に出力する。
判定部232は、分類部233から未検索判定指示が入力されると、未検索の検索語があるか否かを判定する。判定部232は、未検索の検索語があると判定した場合には、検索語群から次の検索語を1つ選択し、所定の用語検索サイトを検索する処理に戻る。判定部232は、未検索の検索語がないと判定した場合には、検索部134に検索指示を出力する。
分類部233は、判定部232から入力された検索語と、画像の抽出成否とに基づいて、入力された検索語を分類する。分類部233は、画像を抽出できない検索語として分類した場合には、当該検索語は、実体のない概念的な用語であるとする。この場合、分類部233は、当該検索語を破棄し、判定部232に対して、未検索の検索語があるか否かを判定するように未検索判定指示を出力する。
分類部233は、画像を抽出できた検索語として分類した場合には、当該検索語は、実体がある検索語であるとする。この場合、分類部233は、実体がある検索語を実体がある検索語群として記憶部120に一時的に記憶し、判定部232に対して、未検索の検索語があるか否かを判定するように未検索判定指示を出力する。すなわち、分類部233は、実体がある検索語を実体がある検索語群として記憶部120に一時的に記憶し、実体がない検索語を破棄することで、検索語を分類する。
次に、実施例2の情報処理装置200の動作について説明する。図5は、実施例2の検索語分類処理の一例を示すフローチャートである。以下の説明では、検索語分類処理のステップS9,S10の処理は、実施例1と同様であるので、その説明を省略する。
端末装置10は、ユーザから複数の検索語が入力されると、入力された複数の検索語を情報処理装置200に送信する。情報処理装置200の取得部231は、端末装置10から複数の検索語を受信すると、受信した複数の検索語を受け付ける(ステップS21)。取得部231は、受け付けた複数の検索語を判定部232に出力する。
判定部232は、取得部131から複数の検索語が入力されると、入力された複数の検索語から、検索語を1つ選択する(ステップS22)。判定部232は、選択した検索語について、用語検索サイトを検索し、検索語と関連付いた画像を抽出する(ステップS23)。判定部232は、検索語と、画像の抽出成否とを分類部233に出力する。
分類部233は、判定部232から入力された検索語と、画像の抽出成否とに基づいて、検索語を分類する。すなわち、分類部233は、検索語について、画像を抽出できたか否かを判定する(ステップS6)。分類部233は、画像を抽出できないと判定した場合には(ステップS6:否定)、当該検索語を実体のない概念的な用語であるとして破棄し、判定部232に対して、未検索判定指示を出力し、ステップS25に進む。
分類部233は、画像を抽出できたと判定した場合には(ステップS6:肯定)、選択した検索語は、実体がある検索語であるので、当該検索語を実体がある検索語群として記憶部120に一時的に記憶する(ステップS24)。また、分類部233は、判定部232に対して、未検索の検索語があるか否かを判定するように未検索判定指示を出力し、ステップS25に進む。
判定部232は、分類部233から未検索判定指示が入力されると、未検索の検索語があるか否かを判定する(ステップS25)。判定部232は、未検索の検索語があると判定した場合には(ステップS25:肯定)、ステップS22に戻る。判定部232は、未検索の検索語がないと判定した場合には(ステップS25:否定)、検索部134に検索指示を出力する。これにより、情報処理装置200は、ユーザによって入力された複数の検索語に基づいて、観光情報として実体のある検索結果を端末装置10のユーザに提供できる。
なお、上記各実施例では、観光情報として、観光スポット名と説明文とを一例として挙げたが、これに限定されない。例えば、観光情報は、観光スポットの位置、平均滞在時間、画像、特徴、開催日時および料金等を含んでもよい。また、観光情報は、観光スポットへの交通情報、例えば、路線の名称、時刻表および料金等を含んでもよい。さらに、観光情報は、旅行商品、例えば、名称、旅程、開催日時、最少人数、料金等を含んでもよい。
また、上記実施例では、所定の用語検索サイトとして、日本語のウェブページおよびサイトを用いたが、これに限定されない。例えば、英語等の他の言語であっても構わない。
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、判定部132と分類部133とを統合してもよい。また、図示した各処理は、上記の順番に限定されるものでなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウェア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。
ところで、上記の実施例で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図6は、検索語分類プログラムを実行するコンピュータの一例を示す図である。
図6に示すように、コンピュータ300は、各種演算処理を実行するCPU301と、データ入力を受け付ける入力装置302と、モニタ303とを有する。また、コンピュータ300は、記憶媒体からプログラム等を読み取る媒体読取装置304と、各種装置と接続するためのインタフェース装置305と、他の情報処理装置等と有線または無線により接続するための通信装置306とを有する。また、コンピュータ300は、各種情報を一時記憶するRAM307と、ハードディスク装置308とを有する。また、各装置301〜308は、バス309に接続される。
ハードディスク装置308には、図1に示した取得部131、判定部132、分類部133および検索部134の各処理部と同様の機能を有する検索語分類プログラムが記憶される。また、ハードディスク装置308には、図4に示した取得部231、判定部232、分類部233および検索部134の各処理部と同様の機能を有する検索語分類プログラムが記憶されるようにしてもよい。また、ハードディスク装置308には、観光情報記憶部121、および、検索語分類プログラムを実現するための各種データが記憶される。入力装置302は、例えば、コンピュータ300の管理者から操作情報等の各種情報の入力を受け付ける。モニタ303は、例えば、コンピュータ300の管理者に対して表示画面等の各種画面を表示する。インタフェース装置305は、例えば印刷装置等が接続される。通信装置306は、例えば、図1に示した通信部110と同様の機能を有しネットワークNと接続され、端末装置10と各種情報をやりとりする。
CPU301は、ハードディスク装置308に記憶された各プログラムを読み出して、RAM307に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ300を図1に示した取得部131、判定部132、分類部133および検索部134として機能させることができる。また、これらのプログラムは、コンピュータ300を図4に示した取得部231、判定部232、分類部233および検索部134として機能させることができる。
なお、上記の検索語分類プログラムは、必ずしもハードディスク装置308に記憶されている必要はない。例えば、コンピュータ300が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ300が読み出して実行するようにしてもよい。コンピュータ300が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこの検索語分類プログラムを記憶させておき、コンピュータ300がこれらから検索語分類プログラムを読み出して実行するようにしてもよい。
以上、本実施例を含む実施の形態に関し、さらに以下の付記を開示する。
(付記1)複数の語を取得し、
取得した前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定し、
判定結果に応じて、前記複数の語を分類する、
処理をコンピュータに実行させることを特徴とする検索語分類プログラム。
(付記2)前記検索は、所定の用語検索サイトを利用して実行される、
ことを特徴とする付記1に記載の検索語分類プログラム。
(付記3)前記複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する、
ことを特徴とする付記1に記載の検索語分類プログラム。
(付記4)前記観光情報は、観光スポットである、
ことを特徴とする付記3に記載の検索語分類プログラム。
(付記5)前記複数の語は、入力された語および/または入力された語に関連する語として検索された語である、
ことを特徴とする付記1に記載の検索語分類プログラム。
(付記6)前記取得する処理は、入力された語を用いて前記入力された語に関連する語を検索し、検索結果である複数の前記関連する語および前記入力された語を取得する、
ことを特徴とする付記1に記載の検索語分類プログラム。
(付記7)複数の語を取得し、
取得した前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定し、
判定結果に応じて、前記複数の語を分類する、
処理をコンピュータが実行することを特徴とする検索語分類方法。
(付記8)前記検索は、所定の用語検索サイトを利用して実行される、
ことを特徴とする付記7に記載の検索語分類方法。
(付記9)前記複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する、
ことを特徴とする付記7に記載の検索語分類方法。
(付記10)前記観光情報は、観光スポットである、
ことを特徴とする付記9に記載の検索語分類方法。
(付記11)前記複数の語は、入力された語および/または入力された語に関連する語として検索された語である、
ことを特徴とする付記7に記載の検索語分類方法。
(付記12)前記取得する処理は、入力された語を用いて前記入力された語に関連する語を検索し、検索結果である複数の前記関連する語および前記入力された語を取得する、
ことを特徴とする付記7に記載の検索語分類方法。
(付記13)複数の語を取得する取得部と、
取得された前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定する判定部と、
判定結果に応じて、前記複数の語を分類する分類部と、
を有することを特徴とする情報処理装置。
(付記14)前記検索は、所定の用語検索サイトを利用して実行される、
ことを特徴とする付記13に記載の情報処理装置。
(付記15)さらに、前記複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する検索部を有する、
ことを特徴とする付記13に記載の情報処理装置。
(付記16)前記観光情報は、観光スポットである、
ことを特徴とする付記15に記載の情報処理装置。
(付記17)前記複数の語は、入力された語および/または入力された語に関連する語として検索された語である、
ことを特徴とする付記13に記載の情報処理装置。
(付記18)前記取得部は、入力された語を用いて前記入力された語に関連する語を検索し、検索結果である複数の前記関連する語および前記入力された語を取得する、
ことを特徴とする付記13に記載の情報処理装置。
1,2 情報処理システム
10 端末装置
100,200 情報処理装置
110 通信部
111 表示部
112 操作部
120 記憶部
121 観光情報記憶部
130,230 制御部
131,231 取得部
132,232 判定部
133,233 分類部
134 検索部
N ネットワーク

Claims (8)

  1. 複数の語を取得し、
    取得した前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定し、
    判定結果に応じて、前記複数の語を分類する、
    処理をコンピュータに実行させることを特徴とする検索語分類プログラム。
  2. 前記検索は、所定の用語検索サイトを利用して実行される、
    ことを特徴とする請求項1に記載の検索語分類プログラム。
  3. 前記複数の語のうち、検索により画像が検出される語として分類された語を用いて、観光情報の検索を実行する、
    ことを特徴とする請求項1に記載の検索語分類プログラム。
  4. 前記観光情報は、観光スポットである、
    ことを特徴とする請求項3に記載の検索語分類プログラム。
  5. 前記複数の語は、入力された語および/または入力された語に関連する語として検索された語である、
    ことを特徴とする請求項1に記載の検索語分類プログラム。
  6. 前記取得する処理は、入力された語を用いて前記入力された語に関連する語を検索し、検索結果である複数の前記関連する語および前記入力された語を取得する、
    ことを特徴とする請求項1に記載の検索語分類プログラム。
  7. 複数の語を取得し、
    取得した前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定し、
    判定結果に応じて、前記複数の語を分類する、
    処理をコンピュータが実行することを特徴とする検索語分類方法。
  8. 複数の語を取得する取得部と、
    取得された前記複数の語のそれぞれについて、検索により画像が検出されるか否か判定する判定部と、
    判定結果に応じて、前記複数の語を分類する分類部と、
    を有することを特徴とする情報処理装置。
JP2017047441A 2017-03-13 2017-03-13 検索語分類プログラム、検索語分類方法および情報処理装置 Active JP6891552B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017047441A JP6891552B2 (ja) 2017-03-13 2017-03-13 検索語分類プログラム、検索語分類方法および情報処理装置
EP18155263.9A EP3376410A1 (en) 2017-03-13 2018-02-06 Method of searching information, information processing apparatus and non-transitory computer-readable storage medium
US15/891,213 US20180260418A1 (en) 2017-03-13 2018-02-07 Method of searching information, information processing apparatus and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017047441A JP6891552B2 (ja) 2017-03-13 2017-03-13 検索語分類プログラム、検索語分類方法および情報処理装置

Publications (2)

Publication Number Publication Date
JP2018151841A true JP2018151841A (ja) 2018-09-27
JP6891552B2 JP6891552B2 (ja) 2021-06-18

Family

ID=61192675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017047441A Active JP6891552B2 (ja) 2017-03-13 2017-03-13 検索語分類プログラム、検索語分類方法および情報処理装置

Country Status (3)

Country Link
US (1) US20180260418A1 (ja)
EP (1) EP3376410A1 (ja)
JP (1) JP6891552B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021915A (ja) 2002-06-20 2004-01-22 Ricoh Co Ltd 文書検索装置、文書検索システム、文書検索方法および記録媒体
JP2004139553A (ja) 2002-08-19 2004-05-13 Matsushita Electric Ind Co Ltd 文書検索システムおよび質問応答システム
US8694494B2 (en) * 2005-03-25 2014-04-08 Vistaprint Schweiz Gmbh Selecting images using associated keywords
US8280886B2 (en) * 2008-02-13 2012-10-02 Fujitsu Limited Determining candidate terms related to terms of a query

Also Published As

Publication number Publication date
JP6891552B2 (ja) 2021-06-18
US20180260418A1 (en) 2018-09-13
EP3376410A1 (en) 2018-09-19

Similar Documents

Publication Publication Date Title
CA2854886A1 (en) Systems and methods for generating and displaying hierarchical search results
JP2015176165A (ja) 料理価格検索装置
JP2016507812A5 (ja)
EP3220285A1 (en) Data acquisition program, data acquisition method and data acquisition device
US9600579B2 (en) Presenting search results for an Internet search request
JP6780548B2 (ja) 特徴語分類プログラム、特徴語分類方法および情報処理装置
JP2018205978A (ja) 情報抽出装置及び情報抽出方法
JP2019153271A5 (ja)
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
JP6891552B2 (ja) 検索語分類プログラム、検索語分類方法および情報処理装置
WO2016011699A1 (zh) 一种用于配置浏览器的导航页的方法与装置
JP5228529B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2018072873A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6528341B1 (ja) 情報処理装置、情報処理方法及びプログラム
JP7081155B2 (ja) 選択プログラム、選択方法、及び選択装置
JP6880859B2 (ja) 位置情報出力プログラム、位置情報出力方法および情報処理装置
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム
US10726076B2 (en) Information acquisition method, and information acquisition device
US20170242839A1 (en) Data acquisition method, data acquisition device, and recording medium
WO2016075836A1 (ja) データ検証プログラム、データ検証方法及びデータ検証装置
JP7314381B1 (ja) レコメンド装置、レコメンド方法、およびプログラム
JP2018152015A (ja) 記憶制御装置、記憶制御プログラムおよび記憶制御方法
WO2020148844A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2002351734A (ja) 構造化文書変換システム及び構造化文書変換プログラム
JP2019212193A (ja) 企業検索装置、端末装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210510

R150 Certificate of patent or registration of utility model

Ref document number: 6891552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150