JP2012190167A - Information processor and information processing method - Google Patents
Information processor and information processing method Download PDFInfo
- Publication number
- JP2012190167A JP2012190167A JP2011051941A JP2011051941A JP2012190167A JP 2012190167 A JP2012190167 A JP 2012190167A JP 2011051941 A JP2011051941 A JP 2011051941A JP 2011051941 A JP2011051941 A JP 2011051941A JP 2012190167 A JP2012190167 A JP 2012190167A
- Authority
- JP
- Japan
- Prior art keywords
- information
- area
- content
- word
- transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、コンテンツ検索用の情報を生成する情報処理装置および情報処理方法に関する。 The present invention relates to an information processing apparatus and an information processing method for generating information for content search.
近年、インターネット上での情報発信手段が多様化しており、日記や掲示板、ブログ、マイクロブログ、ソーシャル・ネットワーキング・サービス(SNS)などの様々なサービスが提供されている。また、スマートフォンなどの携帯端末の普及により、これらのサービスをいつでもどこでも利用できる環境が整い、ユーザは現在位置の周辺で話題となっている情報(今起きている事件や最新のトレンドなど)をリアルタイムに入手することが可能となった。 In recent years, information transmission means on the Internet have been diversified, and various services such as diaries, bulletin boards, blogs, microblogs, and social networking services (SNS) have been provided. In addition, the spread of mobile devices such as smartphones has created an environment where these services can be used anytime, anywhere, and users can view information (such as current events and latest trends) in real time around the current location. It became possible to obtain it.
このような情報入手を補助するための手法として、下記特許文献1には、あるブログに関連するブログを抽出し提示する関連ブログ提示装置が記載されている。この装置は、検索元となるブログから重要語を抽出して記憶し、インターネット上のブログに含まれる単語が登録されている索引データと重要語とを照合することで、検索元のブログに関連するブログを検索し提示する。 As a technique for assisting such information acquisition, Patent Document 1 below describes a related blog presenting apparatus that extracts and presents a blog related to a certain blog. This device extracts important words from the blog that is the search source, stores them, and collates the index data in which the words included in the blog on the Internet are registered with the important words. Search for and present your blog.
しかしながら、上記特許文献1に記載の装置では、ブログ同士を関連付けることはできるが、ブログと、そのブログに記載されている話題に対応するコンテンツ(例えば、話題となっている事項を詳細に説明する別のウェブサイト)との関連付けはできない。そのため、ユーザは話題になっている情報の詳細を得るために自ら検索操作を行う必要がある。 However, in the apparatus described in Patent Document 1, blogs can be associated with each other, but the content corresponding to the topic described in the blog and the blog (for example, a topic is described in detail). It cannot be associated with another website. Therefore, the user needs to perform a search operation himself / herself in order to obtain the details of the information that has become a hot topic.
そこで本発明は、ある場所にいるユーザにその場所の周辺に関する情報を効率よく提供し得る検索用情報を生成することが可能な情報処理装置および情報処理方法を提供することを目的とする。 Therefore, an object of the present invention is to provide an information processing apparatus and an information processing method capable of generating search information that can efficiently provide information on the periphery of a place to a user at the place.
本発明の情報処理装置は、通信ネットワーク上において投稿された発信情報を解析して、該発信情報に対応するエリアを特定するエリア特定手段と、コンテンツに対応するエリアと該コンテンツに関連する語句とを示すコンテンツ情報を記憶する第1の記憶手段を参照して、エリア特定手段により特定されたエリアに対応するコンテンツ情報を抽出するコンテンツ抽出手段と、コンテンツ抽出手段により抽出されたコンテンツ情報と発信情報との双方に関連する語句が存在する場合に、該発信情報と、該コンテンツ情報と、該コンテンツ情報に対応する検索用エリアを示すエリア情報とを関連付けることで検索用情報を生成し、該検索用情報を第2の記憶手段に格納する格納手段とを備える。 The information processing apparatus of the present invention analyzes transmission information posted on a communication network, specifies an area corresponding to the transmission information, an area corresponding to the content, and a phrase related to the content, The content extracting means for extracting the content information corresponding to the area specified by the area specifying means, the content information extracted by the content extracting means and the transmission information with reference to the first storage means for storing the content information indicating When there is a phrase related to both, the search information is generated by associating the transmission information, the content information, and area information indicating a search area corresponding to the content information, and the search Storage means for storing the business information in the second storage means.
本発明の情報処理方法は、情報処理装置により実行される情報処理方法であって、通信ネットワーク上において投稿された発信情報を解析して、該発信情報に対応するエリアを特定するエリア特定ステップと、コンテンツに対応するエリアと該コンテンツに関連する語句とを示すコンテンツ情報を記憶する第1の記憶手段を参照して、エリア特定ステップにおいて特定されたエリアに対応するコンテンツ情報を抽出するコンテンツ抽出ステップと、コンテンツ抽出ステップにおいて抽出されたコンテンツ情報と発信情報との双方に関連する語句が存在する場合に、該発信情報と、該コンテンツ情報と、該コンテンツ情報に対応する検索用エリアを示すエリア情報とを関連付けることで検索用情報を生成し、該検索用情報を第2の記憶手段に格納する格納ステップとを含む。 An information processing method of the present invention is an information processing method executed by an information processing apparatus, which analyzes transmission information posted on a communication network and specifies an area corresponding to the transmission information; A content extracting step of extracting content information corresponding to the area specified in the area specifying step with reference to the first storage means for storing content information indicating an area corresponding to the content and a word / phrase related to the content Area information indicating a search area corresponding to the transmission information, the content information, and the content information when there is a phrase related to both the content information extracted in the content extraction step and the transmission information To generate search information and store the search information in the second storage means. And a storage step of.
このような発明によれば、まず発信情報に対応するエリアが特定され、続いて、そのエリアに対応するコンテンツ情報が抽出される。これにより、エリアという要素を介して発信情報と対応するコンテンツ情報が得られる。そして、これら双方の情報に関連する語句が存在する場合に、その発信情報およびコンテンツ情報と、コンテンツ情報に対応する検索用エリアを示すエリア情報とが関連付けられた検索用情報が生成され、所定の記憶手段に格納される。これにより、投稿された発信情報(すなわち、何らかの話題を含む情報)と、その発信情報との間で関連する語句を含むコンテンツ情報とが、エリアという要素を介して関連付けられる。このように得られた検索用情報により、ある場所にいるユーザにその場所の周辺に関連する情報を効率よく提供することが可能になる。 According to such an invention, the area corresponding to the transmission information is first specified, and then the content information corresponding to the area is extracted. Thereby, the content information corresponding to the transmission information can be obtained through the element called area. When words related to both pieces of information exist, search information in which the transmission information and content information are associated with area information indicating a search area corresponding to the content information is generated, and a predetermined information is generated. Stored in storage means. Thereby, the posted transmission information (that is, information including some topic) and the content information including a phrase related to the transmission information are associated with each other through an element called area. The search information obtained in this way makes it possible to efficiently provide information related to the vicinity of the location to the user at the location.
本発明の情報処理装置では、エリア特定手段が、所定のエリアと関連付けられたエリア関連語句を記憶する第3の記憶手段を参照し、発信情報がエリア関連語句を含む場合に、該エリア関連語句で示されるエリアを該発信情報に対応するエリアとして特定し、関連する語句がエリア関連語句とは異なる語句であってもよい。 In the information processing apparatus of the present invention, when the area specifying unit refers to the third storage unit that stores the area-related phrase associated with the predetermined area, and the transmission information includes the area-related phrase, the area-related phrase May be specified as an area corresponding to the transmission information, and the related phrase may be different from the area-related phrase.
本発明の情報処理装置では、発信情報が位置情報を含む場合に、エリア特定手段が該位置情報で示されるエリアを該発信情報に対応するエリアとして特定してもよい。 In the information processing apparatus of the present invention, when the transmission information includes position information, the area specifying unit may specify the area indicated by the position information as an area corresponding to the transmission information.
本発明の情報処理装置は、所定のジャンルと関連付けられたジャンル関連語句を記憶する第4の記憶手段を更に備え、関連する語句がジャンル関連語句であってもよい。 The information processing apparatus of the present invention may further include a fourth storage unit that stores a genre related phrase associated with a predetermined genre, and the related phrase may be a genre related phrase.
本発明によれば、投稿された発信情報と、その発信情報との間で関連する語句を含むコンテンツ情報とが、エリアという要素を介して関連付けられる。これにより、ある場所にいるユーザにその場所の周辺に関連する情報を効率よく提供し得る検索用情報を生成することができる。 According to the present invention, posted transmission information and content information including a phrase related to the transmission information are associated with each other through an element called an area. Accordingly, it is possible to generate search information that can efficiently provide information related to the periphery of the place to a user at the place.
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the description of the drawings, the same or equivalent elements are denoted by the same reference numerals, and redundant description is omitted.
(第1実施形態)
まず、図1〜6を用いて、第1実施形態に係る情報処理装置10の機能及び構成を説明する。情報処理装置10は、携帯型のユーザ端末Tの現在位置付近で旬なキーワードをユーザに提示し、選択されたキーワードに関連するコンテンツをそのユーザに提供するサーバ装置である。図1の例では、新橋付近にいるユーザの端末上にまず話題一覧画面Pが表示される。この話題一覧画面Pには、新橋付近で旬な5個のキーワードが表示されている。その後、ユーザが提示されたキーワードから「店B」を選択すると、そのキーワード「店B」の店舗情報に関するコンテンツが詳細画面Qとして表示される。
(First embodiment)
First, the function and configuration of the
情報処理装置10は、図2に示すように、機能的構成要素として単語属性記憶部(第3及び第4の記憶手段)11、コンテンツ情報記憶部(第1の記憶手段)12、収集部13、単語登録部(エリア特定手段)14、関連付け部(エリア特定手段、コンテンツ抽出手段、格納手段)15、単語記憶部(第2の記憶手段)16、および配信部17を備えている。情報処理装置10は、通信ネットワークであるインターネットNを介して、日記や掲示板、ブログ、マイクロブログ、ソーシャル・ネットワーキング・サービス(SNS)などで投稿されている情報(発信情報)にアクセスすることができる。また、情報処理装置10は携帯通信網や他の無線通信網(例えばWiFiやBluetooth(どちらも商標又は登録商標))などで構成される所定の通信ネットワーク(図示せず)を介して任意の台数のユーザ端末Tと通信することができる。
As shown in FIG. 2, the
図3に示すように、情報処理装置10は、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU101と、ROM及びRAMで構成される主記憶部102と、ハードディスクなどで構成される補助記憶部103と、ネットワークカードなどで構成される通信制御部104と、キーボードやマウスなどの入力部105と、モニタなどの出力部106とで構成される。情報処理装置10の各機能は、CPU101や主記憶部102の上に所定のソフトウェアを読み込ませ、CPU101の制御の下で通信制御部104や入力部105、出力部106などを動作させ、主記憶部102や補助記憶部103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部102や補助記憶部103内に格納される。
As shown in FIG. 3, the
なお、図3では情報処理装置10が1台のコンピュータで構成されているように示しているが、このサーバの機能を複数台のコンピュータに分散させてもよい。例えば、各記億部11,12,16を備えるコンピュータとそれ以外の機能的構成要素を備えるコンピュータとにより、情報処理装置10又はこれに相当する情報処理システムを構成してもよい。
In FIG. 3, the
図2に戻って、単語属性記憶部11は、各単語の属性を示す単語属性情報を予め記憶している手段であり、後述する単語登録部14により参照される。単語属性情報は単語とその属性とを含む。例えば、インターネットN上で頻繁に出現する単語や、社会で話題になっている単語などに関する単語属性情報を用意しておくことが考えられるが、単語の選択基準は任意に定めてよい。単語属性情報の例を図4に示す。この例では、単語属性記憶部11は、地域名や駅名を示す単語に対して「エリア」という属性が関連付けられた単語属性情報と、施設のカテゴリを示す単語に対して「ジャンル」という属性が関連付けられた単語属性情報とを記憶する。属性が「ジャンル」である単語としては、例えば、「イタリアン」「ラーメン」「寿司」などのような飲食店に関する単語や、チェーン店の名称などが挙げられるが、属性「ジャンル」と関連付ける単語は任意に定めてよい。
Returning to FIG. 2, the word
本実施形態では、単語属性として「エリア」「ジャンル」の2種類が設定されているものとするが、単語の属性は任意に定めてよい。以下では、属性が「エリア」である単語(エリア関連語句)を「エリアワード」といい、属性が「ジャンル」である単語(ジャンル関連語句)を「ジャンルワード」という。また、単語属性記憶部11に登録されていない単語を「他属性ワード」という。
In the present embodiment, two types of “area” and “genre” are set as the word attributes, but the word attributes may be arbitrarily determined. Hereinafter, a word (area-related phrase) having the attribute “area” is referred to as an “area word”, and a word (genre-related phrase) having the attribute “genre” is referred to as a “genre word”. A word that is not registered in the word
コンテンツ情報記憶部12は、コンテンツに関する各種の情報を示すコンテンツ情報を予め記憶している手段であり、後述する関連付け部15により参照される。コンテンツ情報は、コンテンツを一意に特定する識別子であるコンテンツIDと、コンテンツに関する施設のジャンル、名称、住所及び位置(緯度経度)を含んでいる。なお、施設の例としては店舗や観光地などが挙げられるが、施設の種類は何ら限定されない。施設のジャンルや名称は、コンテンツに関連する語句であり、施設の住所や緯度経度は、コンテンツに対応するエリアを示す語句である。コンテンツ情報の項目「ジャンル」は、単語属性情報で示される単語属性「ジャンル」とは別個の概念である。なお、コンテンツ情報の項目(構成)は図5の例に限定されない。
The content
コンテンツ情報の例を図5に示す。例えば図5から、コンテンツID「aaa001」で特定されるコンテンツが、ジャンル「ラーメン」に属する施設「ラーメン屋P」に関するものであることや、その施設の住所が「東京都千代田区…」であり、位置(緯度経度)が「X1,Y1」であることがわかる。 An example of content information is shown in FIG. For example, from FIG. 5, the content identified by the content ID “aaa001” relates to the facility “Ramen shop P” belonging to the genre “Ramen”, and the address of the facility is “Chiyoda-ku, Tokyo ...” It can be seen that the position (latitude and longitude) is “X1, Y1”.
収集部13は、インターネットN上に存在する発信情報を収集する手段である。収集部13は、日記や掲示板、ブログ、マイクロブログ、SNSなどの各種サービスにアクセスすることで、インターネット上に掲載されている情報(発信情報)を収集する。発信情報は、日記やブログなどであれば一つの記事に相当し、掲示板であれば一つのスレッドに相当し、マイクロブログであれば一つのつぶやきに相当する。収集部13は、各インターネットサービスから提供されたアプリケーション・プログラミング・インタフェース(API)を用いて情報を収集してもよいし、クローリングの手法を用いて情報を収集してもよい。情報収集の方法はこれらに限定されず、任意の方法を用いてよい。収集部13は、取得した発信情報を単語登録部14に出力する。収集部13は、このような収集処理を定期的に又は常に実行する。
The
単語登録部14は、収集部13から入力された発信情報に含まれる単語を単語記憶部16に格納する手段である。単語登録部14は発信情報に含まれるテキストを抽出し、形態素解析によりそのテキストを1以上の単語に分解し、該1以上の単語の中から名詞のみを抽出する。なお、単語登録部14は発信情報に含まれる画像を解析することでテキストを抽出してもよい。
The
続いて、単語登録部14は抽出した各名詞に対応する単語属性情報を単語属性記憶部11から読み出す。この処理において単語属性情報を一つも抽出できなければ、単語登録部14はこの時点でその発信情報に関する処理を終了する。一方、1以上の単語属性情報を抽出できた場合には、単語登録部14は、発信情報を特定する発信情報IDと、抽出された1以上の単語属性情報とを関連付けることで単語情報を生成し、その単語情報を単語記憶部16に格納する。エリアワード又はジャンルワード以外の別の単語(すなわち他属性ワード)も存在する場合には、単語登録部14は格納する単語情報に当該他属性ワードも含める。
Subsequently, the
単語情報を生成する際に、単語登録部14は、インターネットN上における発信情報の格納場所を示すURL(Uniform Resource Locator)や、マイクロブログ・サービスやSNS内で発信情報に付されている識別子をそのまま発信情報IDとして用いてもよい。
When generating the word information, the
単語情報を生成及び格納した場合には、単語登録部14はその単語情報及び対応する発信情報を関連付け部15に出力する。単語登録部14は、入力された各発信情報について上記の処理を実行する。
When the word information is generated and stored, the
関連付け部15は、単語記憶部16に記憶されている単語情報のうち所定の条件を満たすものに対して、関連するコンテンツの情報を付加する手段である。関連付け部15は、入力された単語情報及び発信情報の組のそれぞれについて上記の処理を実行する。
The associating
まず、関連付け部15は入力された単語情報にエリアワードが含まれているか否かを判定する。エリアワードが存在しない場合には、関連付け部15はその単語情報に関する処理を終了する。一方、エリアワードが存在する場合(すなわち、発信情報にエリアワードが存在する場合)には、関連付け部15はジャンルワード又は他属性ワードが単語情報に含まれているか否かを判定する。これらの単語が単語情報に存在しない場合には、関連付け部15はその単語情報に関する処理を終了する。
First, the associating
ジャンルワード及び他属性ワードの少なくとも一方が存在する場合(すなわち、発信情報にジャンルワード又は他属性ワードが存在する場合)には、関連付け部15はエリアワードに対応するコンテンツ情報をコンテンツ情報記憶部12から抽出する。例えば、関連付け部15は施設の住所がエリアワードを含んでいるコンテンツ情報を抽出してもよい。また、エリアワードが駅名を示しているならば、関連付け部15はその駅の周辺(例えば1km以内)に位置する施設のコンテンツ情報を抽出してもよい。エリアワードに対応するコンテンツ情報を抽出できなかった場合には、関連付け部15はこの時点で単語情報に関する処理を終了する。
When at least one of the genre word and the other attribute word exists (that is, when the genre word or the other attribute word exists in the transmission information), the associating
エリアワードに対応するコンテンツ情報を抽出できた場合には、関連付け部15は単語情報に含まれるジャンルワード又は他属性ワードがそのコンテンツ情報内に存在するか否かを判定する。ジャンルワード及び他属性ワードのどちらも存在しない場合には、関連付け部15はこの時点で単語情報に関する処理を終了する。一方、ジャンルワード及び他属性ワードのうち少なくとも一つがコンテンツ情報に存在する場合、すなわち単語情報とコンテンツ情報とで共通の語句が存在する場合には、関連付け部15はそのコンテンツ情報に対応するエリアを特定する。このエリアは、後述する配信部17での検索処理用に用いられ、したがって「検索用エリア」ということができる。検索用エリアは、都道府県や市町村などの区画そのものであってもよいし、予めメッシュ状に区分けされた所定の区画であってもよい。また、コンテンツ情報で示される施設の所在地や緯度経度そのものを検索用エリアとして特定してもよい。
When the content information corresponding to the area word can be extracted, the associating
コンテンツ情報に対応する検索用エリアを特定すると、関連付け部15は単語記憶部16内の対応する単語情報に、その検索用エリアを示すエリアコード(エリア情報)と、抽出されたコンテンツ情報のID(関連コンテンツID)とを関連付ける。
When the search area corresponding to the content information is specified, the associating
以上をまとめると、関連付け部15は、発信情報(入力された単語情報)に対して下記の要件(a)〜(d)がすべて満たされている場合に、その発信情報に関連コンテンツの情報を付加する。
(a)発信情報がエリアワードを含んでいる。
(b)発信情報がジャンルワード又は他属性ワードを含んでいる。
(c)エリアワードに対応するコンテンツ情報が存在する。
(d)コンテンツ情報が発信情報と共通のジャンルワード又は他属性ワードを含んでいる。
In summary, the associating
(A) The transmission information includes an area word.
(B) The transmission information includes a genre word or another attribute word.
(C) Content information corresponding to the area word exists.
(D) The content information includes a genre word or other attribute word common to the transmission information.
単語記憶部16は、単語登録部14により生成され、場合により関連付け部15により更新された単語情報を記憶する手段である。図6の例では、発信情報ID「xxxxx1」「xxxxx2」で特定される二つの単語情報には関連コンテンツの情報(エリアコード及び関連コンテンツID)が付加されているが、発信情報「xxxxx3」で特定される単語情報には関連コンテンツの情報は付加されていない。
The
配信部17は、端末ユーザの現在位置周辺に関連する旬なキーワードやコンテンツをユーザ端末Tに配信する手段である。以下では、ユーザ端末Tでの処理も示しつつ配信部17の機能を説明する。
The
ユーザ端末T上で図1に示す話題一覧画面Pを表示させるための操作が行われると、ユーザ端末Tが自端末の現在位置を示す位置情報を取得する。位置情報を取得する方法は任意である。例えば、ユーザ端末TがGPSモジュールを備えていれば、複数のGPS(Global PositioningSystem)衛星からの電波を受信して、それらの強度から現在位置を算出することができる。また、ユーザ端末Tは、WiFiやBluetooth(どちらも商標又は登録商標)等の規格に基づく複数の無線通信基地局から受信した電波の強度により現在位置を算出してもよい。ユーザ端末Tはこれら二種類の方式を併用して現在位置を算出してもよい。あるいは、ユーザ端末Tはユーザにより選択又は入力された地図情報や住所などをユーザ端末Tの位置情報として取得してもよい。ユーザ端末Tは、取得した位置情報を情報処理装置10に送信する。
When an operation for displaying the topic list screen P shown in FIG. 1 is performed on the user terminal T, the user terminal T acquires position information indicating the current position of the terminal itself. The method for acquiring the position information is arbitrary. For example, if the user terminal T includes a GPS module, it is possible to receive radio waves from a plurality of GPS (Global Positioning System) satellites and calculate the current position from their intensities. Further, the user terminal T may calculate the current position from the strength of radio waves received from a plurality of wireless communication base stations based on standards such as WiFi and Bluetooth (both are trademarks or registered trademarks). The user terminal T may calculate the current position by using these two methods together. Alternatively, the user terminal T may acquire map information or an address selected or input by the user as position information of the user terminal T. The user terminal T transmits the acquired position information to the
配信部17は、その位置情報を受信してユーザ端末Tの現在位置を取得し、その現在位置を含むエリアを示すエリアコードを取得する。続いて、配信部17はそのエリアコードに対応し、且つエリアコード及び関連コンテンツIDを含む単語情報を単語記憶部16から抽出する。続いて、配信部17は抽出した単語情報で示されるジャンルワードおよび他属性ワードを、話題一覧画面Pに表示させるキーワードとして設定する。続いて、配信部17は設定したキーワードおよび対応する関連コンテンツIDを含む話題一覧画面Pのウェブページを生成し、そのページをユーザ端末Tに送信する。これにより、ユーザ端末T上に図1に示すような話題一覧画面Pが表示される。
The
なお、話題一覧画面P上に表示させるキーワードの個数や表示順は任意に定めてよい。例えば、配信部17は発信情報の投稿日時に基づいて時系列にキーワードを並べてもよいし、ユーザ端末Tの現在位置に近いコンテンツに対応するものから順にキーワードを並べてもよい。また、配信部17は所定のアルゴリズムで算出されたランキングに応じてキーワードを並べ替えてもよい。
The number of keywords to be displayed on the topic list screen P and the display order may be arbitrarily determined. For example, the
端末ユーザが話題一覧画面Pで一のキーワードを選択すると、ユーザ端末Tはそのキーワードに関連付けられている関連コンテンツIDを情報処理装置10に送信する。配信部17は、その関連コンテンツIDを受信し、該IDに対応するコンテンツ情報をコンテンツ情報記憶部12から抽出する。そして、配信部17は抽出したコンテンツ情報を用いて詳細画面Qのウェブページを生成し、そのページをユーザ端末Tに送信する。これにより、ユーザ端末T上に図1に示すような詳細画面Qが表示される。
When the terminal user selects one keyword on the topic list screen P, the user terminal T transmits the related content ID associated with the keyword to the
次に、図7を用いて、情報処理装置10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。なお、図7は一の発信情報に関する処理を示しており、情報処理装置10は収集した発信情報のそれぞれについて図7の処理を実行する。
Next, the operation of the
まず、収集部13がインターネットN上にある一の発信情報を収集する(ステップS11)。続いて、単語登録部14がその発信情報からエリアワード、ジャンルワード、又は他属性ワードを抽出し、抽出した単語を含む単語情報を生成して単語記憶部16に格納する(ステップS12、エリア特定ステップ)。
First, the
続いて、関連付け部15が下記の条件(a)〜(d)がすべて満たされるか否かを判定し、全条件を満たしているならば、登録した単語情報にエリアコードおよび関連コンテンツIDを関連付ける(ステップS17、格納ステップ)。
Subsequently, the associating
(a)発信情報がエリアワードを含んでいる(ステップS13(エリア特定ステップ);YES)。
(b)発信情報がジャンルワード又は他属性ワードを含んでいる(ステップS14;YES)。
(c)エリアワードに対応するコンテンツ情報が存在する(ステップS15(コンテンツ抽出ステップ);YES)。
(d)コンテンツ情報が発信情報と共通のジャンルワード又は他属性ワードを含んでいる(ステップS16;YES)。
(A) The transmission information includes an area word (step S13 (area specifying step); YES).
(B) The transmission information includes a genre word or another attribute word (step S14; YES).
(C) Content information corresponding to the area word exists (step S15 (content extraction step); YES).
(D) The content information includes a genre word or other attribute word common to the transmission information (step S16; YES).
上記条件(a)〜(d)のうち一つでも充足しない場合には(ステップS13〜S16のいずれかにおいて「NO」)、関連付け部15はその時点で一の発信情報に関する処理を終了する。
If any one of the above conditions (a) to (d) is not satisfied (“NO” in any of steps S13 to S16), the associating
以上説明したように、本実施形態によれば、まず発信情報に対応するエリアが特定され、続いて、そのエリアに対応するコンテンツ情報が抽出される。これにより、エリアという要素を介して発信情報と対応するコンテンツ情報が得られる。そして、これら双方の情報に共通のジャンルワード又は他属性ワードが存在する場合に、その発信情報およびコンテンツ情報と、コンテンツ情報に対応する検索用エリアを示すエリアコードとが関連付けられた単語情報(検索用情報)が生成され、単語記憶部16に格納される。これにより、投稿された発信情報(すなわち、何らかの話題を含む情報)と、その発信情報との間で共通の語句を含むコンテンツ情報とが、エリアという要素を介して関連付けられる。このように得られた単語情報により、ある場所にいるユーザにその場所の周辺で話題となっている情報を効率よく提供することが可能になる。
As described above, according to the present embodiment, an area corresponding to outgoing information is first identified, and then content information corresponding to that area is extracted. Thereby, the content information corresponding to the transmission information can be obtained through the element called area. If there is a common genre word or other attribute word in both pieces of information, the transmission information and content information are associated with an area code indicating a search area corresponding to the content information (search Information) is generated and stored in the
また、エリアの共通性だけでなく、発信情報およびコンテンツ情報が共通の語句を有する場合に初めて双方の情報が関連付けられるので、発信情報で示される話題とコンテンツとを精度よく関連付けることができる。これにより、検索精度の向上が期待できる。 In addition, not only the commonality of the areas but also both pieces of information are associated for the first time when the transmission information and the content information have a common word / phrase, so the topic indicated by the transmission information and the content can be accurately associated. Thereby, improvement of search accuracy can be expected.
図6に示すような単語情報を生成して検索処理のために保持しておくことで、ユーザは、図1に示すように、現在いる場所の周辺で話題となっているキーワードを入手できる。そして更に、ユーザはその中で興味のあるキーワードを選択するだけで、そのキーワードに対応するコンテンツにアクセスすることができる。つまり、キーワードを別途入力することなく簡単にコンテンツを見ることができる。キーワードの表示順を投稿日時やランキングなどに基づいて制御すれば、ユーザは「その時」「その場所で」「旬な」情報を得ることができる。 By generating word information as shown in FIG. 6 and holding it for search processing, the user can obtain a keyword that is a topic around the current location as shown in FIG. Furthermore, the user can access the content corresponding to the keyword only by selecting the keyword of interest. That is, the content can be easily viewed without inputting a keyword separately. If the keyword display order is controlled based on the posting date, ranking, etc., the user can obtain “at that time”, “at that location”, and “seasonal” information.
(第2実施形態)
次に、第2実施形態に係る情報処理装置10について説明する。第2実施形態が第1実施形態と異なるのは、関連付け部15により実行される、発信情報に対応するエリアの特定方法である。本実施形態の他の構成は第1実施形態と同じなので、その説明は省略する。
(Second Embodiment)
Next, the
関連付け部15は、まず、第1実施形態と同様に、入力された単語情報にエリアワードが含まれているか否かを判定する。エリアワードが存在するならば、関連付け部15は第1実施形態と同様に以降の処理を実行する。
The
一方、エリアワードが存在しない場合には、関連付け部15は入力された単語情報に関する処理をこの時点で終了するのではなく、続いて、対応する発信情報に位置情報が含まれているか否かを判定する。発信情報に含まれる位置情報の例としては、記事に記載された住所や、ジオタグ(geotag)などのメタデータとして付加されている緯度経度などが挙げられる。もっとも、位置情報の種類は限定されず、その位置情報から何かしらのエリアを特定できるものであればよい。
On the other hand, if the area word does not exist, the associating
発信情報に位置情報が含まれていなければ、関連付け部15は入力された単語情報に関する処理をこの時点で終了する。
If the location information is not included in the transmission information, the associating
一方、発信情報に位置情報が含まれているならば、関連付け部15はその位置情報からエリアを特定する。例えば、関連付け部15は、予め保持している地図情報を参照することで、取得した緯度経度または住所に対応するエリアを特定してもよい。また、関連付け部15は、コンテンツ情報記憶部12に記憶されている各コンテンツ情報の位置情報(緯度経度)を用いて発信情報のエリアを特定してもよい。具体的には、関連付け部15は、発信情報で示される緯度経度と、コンテンツ情報記憶部12内の各コンテンツ情報の緯度経度とを比較して、2点間の距離が所定の閾値内(例えば1km以内)である場合に、コンテンツ情報で示されるエリアを発信情報のエリアとして特定する。
On the other hand, if the location information is included in the transmission information, the associating
発信情報のエリアを特定すると、関連付け部15は第1実施形態と同様に、ジャンルワード又は他属性ワードが単語情報に含まれているか否かを判定する。そして、これらの単語のうちの少なくとも一方が存在する場合(すなわち、発信情報にジャンルワード又は他属性ワードが存在する場合)には、関連付け部15は特定したエリアに対応するコンテンツ情報をコンテンツ情報記憶部12から抽出する。このときのコンテンツ情報の抽出方法は、第1実施形態と同様である。また、コンテンツ情報を抽出できた場合に行う後続の処理も第1実施形態と同様である。
When the area of the transmission information is specified, the associating
すなわち、関連付け部15は、発信情報(入力された単語情報)に対して下記の要件(a´)〜(d)がすべて充足する場合に、その発信情報に関連コンテンツの情報を付加する。第1実施形態と異なるのは下記(a´),(c´)である。
(a´)発信情報がエリアワード又は位置情報を含んでいる。
(b)発信情報がジャンルワード又は他属性ワードを含んでいる。
(c´)エリアワード、又は位置情報から特定されたエリアのいずれかに対応するコンテンツ情報が存在する。
(d)コンテンツ情報が発信情報と共通のジャンルワード又は他属性ワードを含んでいる。
That is, when the following requirements (a ′) to (d) are satisfied for the transmission information (input word information), the associating
(A ′) The transmission information includes an area word or position information.
(B) The transmission information includes a genre word or another attribute word.
(C ′) Content information corresponding to either the area word or the area specified from the position information exists.
(D) The content information includes a genre word or other attribute word common to the transmission information.
したがって、第2実施形態における情報処理方法は図8のように示すことができる。ステップS21〜S23の処理は第1実施形態におけるステップS11〜S13の処理と同じである。ただし、ステップS13において発信情報がエリアワードを含まない場合には(ステップS13;NO)、関連付け部15は発信情報が位置情報を含むか否かを更に判定する(ステップS28)。そして、発信情報が位置情報を含んでいるならば(ステップS28;YES)、第1実施形態におけるステップS14〜S17と同様のステップS24〜S27の処理が実行される。ただし、ステップS25では、関連付け部15はエリアワード、又は位置情報から特定したエリアのいずれかに対応するコンテンツ情報が存在するか否かを判定する。
Therefore, the information processing method in the second embodiment can be shown as shown in FIG. The processing of steps S21 to S23 is the same as the processing of steps S11 to S13 in the first embodiment. However, when the transmission information does not include an area word in step S13 (step S13; NO), the associating
このような第2実施形態によっても、第1実施形態と同様の効果が得られる。 Also by such 2nd Embodiment, the effect similar to 1st Embodiment is acquired.
本実施形態では、関連付け部15が発信情報のエリアを特定する際にまずエリアワードの有無を判定し、その後必要に応じて発信情報内の位置情報の有無を判定したが、関連付け部15はエリアワードについては検査せず、位置情報に基づく判定のみを行ってもよい。
In this embodiment, when the associating
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。 The present invention has been described in detail based on the embodiments. However, the present invention is not limited to the above embodiment. The present invention can be variously modified without departing from the gist thereof.
上記各実施形態では、発信情報及びコンテンツ情報の双方に共通の語句が存在する場合に関連付け部15が双方の情報を関連付けたが、関連付け部15は、共通語句以外の語句が存在する場合にもその関連付けを実行してよい。
In each of the above-described embodiments, the
具体的には、関連付け部15は、単語情報とコンテンツ情報との双方に関連する語句が存在する場合に双方の情報を関連付けてもよい。ここで、「単語情報とコンテンツ情報との双方に関連する語句が存在する」とは、共通(一致)する語句が双方に存在する場合だけでなく、互いに類似する語句が双方に存在する場合も含む概念である。類似関係の例として、一方の情報に含まれる語句が、他方の情報に含まれる語句の上位概念若しくは下位概念にあたる場合(例えば、「麺類」と「ラーメン」)が挙げられる。また、双方の語句に表記の揺れが認められる場合(例えば、「カフェ」と「カフェテリア」や、片仮名表記と平仮名表記など)も類似関係の一種である。
Specifically, the associating
関連付け部15は、関連する語句を判定するために、予め用意されている語句の対応表を用いてもよいし、所定の学習型アルゴリズムを用いてもよい。この場合、上記各実施形態における条件(d)は、「(d´)コンテンツ情報が、発信情報内のジャンルワード又は他属性ワードと関連するジャンルワード又は他属性ワードを含んでいる」と言い換えることができる。
The
上記各実施形態では関連付け部15がエリアワード以外の単語としてジャンルワード及び他属性ワードについての処理を実行したが、これらのうちのどちらか一方の単語のみに基づいて処理を行ってもよい。すなわち、上記各実施形態における条件(b),(d)に関する処理において、関連付け部15はジャンルワード及び他属性ワードのどちらか一つのみの存在を判定してもよい。
In each of the embodiments described above, the associating
上記各実施形態では収集部13がインターネットN上の発信情報を収集したが、発信情報を収集する範囲(通信ネットワーク)は何ら限定されない。
In each of the above embodiments, the
上記各実施形態では単語登録部14が発信情報を形態素解析して単語を抽出したが、情報処理装置は複数の単語から成る語句を抽出し、その語句を用いて上記各実施形態と同様に検索用情報を生成してもよい。
In each of the above embodiments, the
上記各実施形態では、端末ユーザが話題一覧画面Pで一のキーワードを選択すると、そのキーワードに関連付けられたコンテンツ情報がユーザ端末Tに送信されたが、コンテンツの配信方法はこれに限定されない。例えば、話題一覧(1以上のキーワード)と、各キーワードに対応するコンテンツ情報とが同時に該端末Tに送られるように情報処理装置10及びユーザ端末Tを構成してもよい。この場合には、配信部17は上記各実施形態と同様に1以上のキーワードを抽出し、続いて、各キーワードに対応する関連コンテンツIDに基づいて1以上のコンテンツ情報をコンテンツ情報記憶部12から抽出する。そして、配信部17は抽出したキーワードおよびコンテンツ情報をユーザ端末Tに送信する。ユーザ端末Tは、これらの情報に基づいてまず話題一覧画面Pを表示し、その後のキーワード選択に応じて、情報処理装置10と通信することなく詳細画面Qを表示する。
In the above embodiments, when the terminal user selects one keyword on the topic list screen P, the content information associated with the keyword is transmitted to the user terminal T, but the content distribution method is not limited to this. For example, the
10…情報処理装置、11…単語属性記憶部(第3及び第4の記憶手段)、12…コンテンツ情報記憶部(第1の記憶手段)、13…収集部、14…単語登録部(エリア特定手段)、15…関連付け部(エリア特定手段、コンテンツ抽出手段、格納手段)、16…単語記憶部(第2の記憶手段)、17…配信部、N…インターネット、T…ユーザ端末。
DESCRIPTION OF
Claims (5)
コンテンツに対応するエリアと該コンテンツに関連する語句とを示すコンテンツ情報を記憶する第1の記憶手段を参照して、前記エリア特定手段により特定されたエリアに対応する前記コンテンツ情報を抽出するコンテンツ抽出手段と、
前記コンテンツ抽出手段により抽出されたコンテンツ情報と前記発信情報との双方に関連する語句が存在する場合に、該発信情報と、該コンテンツ情報と、該コンテンツ情報に対応する検索用エリアを示すエリア情報とを関連付けることで検索用情報を生成し、該検索用情報を第2の記憶手段に格納する格納手段と
を備える情報処理装置。 Analyzing the outgoing information posted on the communication network, and specifying an area corresponding to the outgoing information;
Content extraction for extracting the content information corresponding to the area specified by the area specifying means with reference to a first storage means for storing content information indicating an area corresponding to the content and a word / phrase related to the content Means,
Area information indicating the transmission information, the content information, and a search area corresponding to the content information when there are phrases related to both the content information extracted by the content extraction means and the transmission information An information processing apparatus comprising: storage means for generating search information by associating and storing the search information in a second storage means.
前記関連する語句が前記エリア関連語句とは異なる語句である、
請求項1に記載の情報処理装置。 The area specifying unit refers to a third storage unit that stores an area-related phrase associated with a predetermined area. When the transmission information includes the area-related phrase, an area indicated by the area-related phrase is determined. Specify the area corresponding to the outgoing information,
The related phrase is a different phrase from the area-related phrase;
The information processing apparatus according to claim 1.
請求項1又は2に記載の情報処理装置。 When the transmission information includes position information, the area specifying unit specifies an area indicated by the position information as an area corresponding to the transmission information.
The information processing apparatus according to claim 1 or 2.
前記関連する語句が前記ジャンル関連語句である、
請求項1〜3のいずれか一項に記載の情報処理装置。 A fourth storage means for storing a genre-related phrase associated with the predetermined genre;
The related phrase is the genre-related phrase;
The information processing apparatus according to any one of claims 1 to 3.
通信ネットワーク上において投稿された発信情報を解析して、該発信情報に対応するエリアを特定するエリア特定ステップと、
コンテンツに対応するエリアと該コンテンツに関連する語句とを示すコンテンツ情報を記憶する第1の記憶手段を参照して、前記エリア特定ステップにおいて特定されたエリアに対応する前記コンテンツ情報を抽出するコンテンツ抽出ステップと、
前記コンテンツ抽出ステップにおいて抽出されたコンテンツ情報と前記発信情報との双方に関連する語句が存在する場合に、該発信情報と、該コンテンツ情報と、該コンテンツ情報に対応する検索用エリアを示すエリア情報とを関連付けることで検索用情報を生成し、該検索用情報を第2の記憶手段に格納する格納ステップと
を含む情報処理方法。 An information processing method executed by an information processing apparatus,
Analyzing the posted information posted on the communication network and identifying an area corresponding to the transmitted information; and
Content extraction for extracting the content information corresponding to the area specified in the area specifying step with reference to first storage means for storing content information indicating an area corresponding to the content and a word / phrase related to the content Steps,
Area information indicating the transmission information, the content information, and a search area corresponding to the content information when there are phrases related to both the content information extracted in the content extraction step and the transmission information And a storing step of generating search information by associating and storing the search information in the second storage means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011051941A JP2012190167A (en) | 2011-03-09 | 2011-03-09 | Information processor and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011051941A JP2012190167A (en) | 2011-03-09 | 2011-03-09 | Information processor and information processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012190167A true JP2012190167A (en) | 2012-10-04 |
Family
ID=47083270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011051941A Withdrawn JP2012190167A (en) | 2011-03-09 | 2011-03-09 | Information processor and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012190167A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016541058A (en) * | 2013-11-27 | 2016-12-28 | インテル コーポレイション | High-detail news map and image overlay |
JP2017058599A (en) * | 2015-09-18 | 2017-03-23 | ヤフー株式会社 | Information processing device |
JP2018005953A (en) * | 2017-10-12 | 2018-01-11 | ヤフー株式会社 | Information processing apparatus |
-
2011
- 2011-03-09 JP JP2011051941A patent/JP2012190167A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016541058A (en) * | 2013-11-27 | 2016-12-28 | インテル コーポレイション | High-detail news map and image overlay |
JP2017058599A (en) * | 2015-09-18 | 2017-03-23 | ヤフー株式会社 | Information processing device |
JP2018005953A (en) * | 2017-10-12 | 2018-01-11 | ヤフー株式会社 | Information processing apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101490677B (en) | Presenting search result information | |
US10114898B2 (en) | Providing additional functionality with search results | |
US9690804B2 (en) | Information processing device, information processing method, information processing program, and recording medium | |
JP2019028647A (en) | Training information providing device, method and program | |
JP5543384B2 (en) | Local query extraction apparatus, local query extraction program, and local query extraction method | |
US9158790B2 (en) | Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program | |
US20190095536A1 (en) | Method and device for content recommendation and computer readable storage medium | |
JP5231514B2 (en) | Action support information providing apparatus, method, and program | |
JP5731940B2 (en) | Text position determination apparatus and text position determination method | |
JP2010287048A (en) | Device and program for retrieving information and mobile terminal device | |
CN108153785B (en) | Method and device for generating display information | |
JP2012190167A (en) | Information processor and information processing method | |
KR20120032290A (en) | Providing personalized poi information using client information and client terminal implementing the same | |
JP5615423B2 (en) | Information search apparatus and information search program | |
US20140297613A1 (en) | Method for customizing search queries to optimized search results | |
KR101233902B1 (en) | Server, dictionary creation method, and computer-readable recording medium for recording dictionary creation program | |
JP2013206387A (en) | Data retrieval system and data retrieval method | |
US20100306190A1 (en) | Retrieval-Time Ranking for Community Content | |
JP6027468B2 (en) | Recommendation information acquisition apparatus, recommendation information acquisition method, and recommendation information provision system | |
KR101878937B1 (en) | System for providing personalized information, method thereof, and recordable medium storing the method | |
JP6207121B2 (en) | Sales information providing system and sales information providing server | |
JP2020042848A (en) | Information providing system, information providing method, and information providing program | |
JP6403842B1 (en) | Information processing apparatus, content providing system, information processing method, and program | |
KR20130131865A (en) | Method and device for comparing travel packages | |
JP6050273B2 (en) | Search function link creation device, method, user terminal, and advertisement distribution method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140513 |