JP7081155B2 - 選択プログラム、選択方法、及び選択装置 - Google Patents

選択プログラム、選択方法、及び選択装置 Download PDF

Info

Publication number
JP7081155B2
JP7081155B2 JP2018000199A JP2018000199A JP7081155B2 JP 7081155 B2 JP7081155 B2 JP 7081155B2 JP 2018000199 A JP2018000199 A JP 2018000199A JP 2018000199 A JP2018000199 A JP 2018000199A JP 7081155 B2 JP7081155 B2 JP 7081155B2
Authority
JP
Japan
Prior art keywords
target data
data
keyword
advertisement
supplementary information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018000199A
Other languages
English (en)
Other versions
JP2019121159A (ja
Inventor
照宣 粂
正智 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018000199A priority Critical patent/JP7081155B2/ja
Publication of JP2019121159A publication Critical patent/JP2019121159A/ja
Application granted granted Critical
Publication of JP7081155B2 publication Critical patent/JP7081155B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、選択プログラム、選択方法、及び選択装置に関する。
近年、Webサービス上に広告を表示することで、様々なサービスが利益を生み出している。
ユーザにとって最も価値が高い広告を提示するために、例えば、Web検索サービスでは、広告会社がキーワードを購入し、ユーザが入力したキーワードにより広告が提示されるようになっている。
提示する広告を選択する手法として、ユーザから得られるキーワード又は取り出される文書から得られるキーワードを使用し、ユーザのデータの関連情報である広告を生成する技術等が知られている。
特表2009-520269号公報 特開2014-41615号公報 特開2011-34394号公報 特開2012-037920号公報
しかしながら、ユーザが閲覧中のWebページ内の広告表示枠に対して選択した広告の数が少なく、ユーザが広告会社が購入していないキーワードを利用した場合には、広告データの中からランダムに広告が選択される。
この場合、広告会社が購入するキーワード、特に、人気のあるキーワードは限定されており、あまり人気の無いキーワードを利用した場合には、まったく意味のない広告が提示される場合がある。
また、広告会社は、宣伝のために特殊なキーワードを選定している場合もあるため、単純な評価方法では評価値の低い広告は利用者にとって全く意味のない可能性が高い。このような利用者の意図しない広告を提示した場合、サービス側の信頼度が低下するだけでなく、広告会社側の印象を落とすことになりかねない。
したがって、1つの側面では、ユーザに対して価値のある情報を選択することを目的とする。
一態様によれば、目的データごとに、該目的データに係る補足情報と、予め決められたキーワードとを対応付けたデータベースを作成し、前記データベースの前記補足情報と該キーワードとを用いて、前記目的データに対応付けられた該補足情報又は該キーワードと、該補足情報又は該キーワードに関連する公開データとを関連付けることで、該目的データから該補足情報又は該キーワードを介して該公開データまでを連結した連結グラフを作成し、検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する処理をコンピュータに行わせる選択プログラムが提供される。
また、上記課題を解決するための手段として、選択方法、及び選択装置とすることもできる。
ユーザに対して価値のある情報を選択できる。
本実施例におけるシステム構成例を示す図である。 ハードウェア機能構成を示す図である。 選択装置の機能構成例を示す図である。 データ構成例を示す図である。 サブグラフとLODとの結合を説明するための図である。 LOD連結グラフの例を示す図である。 部分グラフの例を示す図である。 広告情報DB作成処理を説明するためのフローチャート図である。 LOD連結グラフ作成処理を説明するためのフローチャート図である。 LOD連結検索処理を説明するためのフローチャート図である。 広告枠に表示する優先度を説明するための図である。 検索システムへの応用例を説明するための図である。 経路の選択を説明するための図である。 登録キーワードによるLOD連結検索処理の例について説明するための図である。
以下、本発明の実施の形態を図面に基づいて説明する。本実施例では、情報間の関係性を表すデータベースを構築し、価値の高い情報を選択する選択プログラム、選択方法、及び選択装置を開示する。選択する目的となる情報は、広告、論文、新薬に係る情報などが相当するが、これらに限定されない。以下の説明では、選択する情報の一例として、広告データを例として説明する。
図1は、本実施例におけるシステム構成例を示す図である。図1に示すシステム1000は、選択装置100と、複数のユーザ端末3と、様々な企業が提供するWebページ群200と、LOD300とを有する。
選択装置100は、検索エンジン等のインターネット2上で公開されている情報の検索機能を提供するサーバ装置である。
各ユーザ端末6は、インターネット2を介して選択装置100へ接続し、Webページ5wからキーワード検索を行うことで、様々な情報を取得する端末装置である。ユーザ端末6は、Web機能を有し、Webページ5wを表示して、キーワード検索により、様々な情報(テキスト、画像、動画等)を取得可能な情報処理端末である。
Webページ群200は、様々な企業(以下、広告会社という場合がある)が提供する広告用のWebページ(以下、広告用ページ7mという)の集まりを表す。Webページ群200の各広告用ページ7mは、広告会社と、選択装置100を保有する検索関連等のサービス会社との間の契約によって、選択装置100の広告DB31にリンク先が登録されたWebページである。
LOD(Linked Open Data)300は、ネットワーク2に公開され、ユーザにより参照、利用等を可能とする、Webページ群200以外の公開データの集まりを表す。
本実施例に係る選択装置100は、少なくとも、LOD連結グラフ作成部40と、LOD連結検索部50と、広告DB31と、LOD連結グラフ33gとを有する。
LOD連結グラフ作成部40は、広告DB31と、広告DB31のリンク先から得られる広告用ページ7mと、LOD300とを利用して、本実施例に係るLOD連結による検索処理で利用するLOD連結グラフ33gを作成する処理部である。広告用ページ7mは、リンク先Webページに相当する。
LOD連結グラフ作成部40は、広告DB31から得られるリンク先の広告用ページ7mを解析して広告に関する種々の情報を取得し、広告DB31のキーワードと、解析により取得した情報(以下、補足情報という)とに結合する情報(以下、結合候補という)
を、LOD300から更に取得する。
そして、LOD連結グラフ作成部40は、キーワード、補足情報、及び結合候補をノードとし、ノード間の関連付けを示すことにより、キーワード及び補足情報のいずれか1以上にLOD300のデータを連結したLOD連結グラフ33gを作成する。
LOD連結グラフ作成部40は、選択装置100とは、異なるサーバ装置により行われてもよい。この場合、選択装置100から広告DB31がサーバ装置に提供されることにより、LOD連結グラフ33gがサーバ装置から選択装置100へと提供される。LOD連結グラフ33gは、LOD連結検索部50により利用される。
LOD連結検索部50は、ユーザ端末6からのキーワードを含む検索要求の受信に応じて、LOD連結グラフ33gを参照して、検索要求のキーワードから関連性を辿り広告データを特定し、広告DB31から広告データと、広告データに対応付けられているリンク先とを取得する。広告データは、画像、動画等のデータである。
特定した広告データとリンク先とが、ユーザ端末6に送信され、ユーザ端末6に表示されているWebページ5w内の広告枠に広告データが表示される。広告データとリンク先とは、ユーザ端末6に表示されているWebページ5w内の広告枠の個数分提供されることが望ましい。
ユーザ端末6のユーザは、Webページ5w内において、所望の広告データが表示されている広告枠を選択することで、ユーザ端末6は、広告データと関連付けられているリンク先へとアクセスし、広告データに関する広告用ページ7mをユーザ端末6に表示する。ユーザは、広告用ページ7mを参照することで、広告データで表現されていた製品やサービス等の商品の詳細を知ることができる。
本実施例では、ユーザ端末6からの検索要求に対して、広告DB31に登録されていないキーワードに対しても、LOD連結グラフ33gを参照して検索要求のキーワードからノードを辿ることで、登録された広告データへと精度よく辿りつくことができる。従って、ユーザに対して、価値がある(即ち、検索要求のキーワードに関連性の高い)広告を適切に選択することができる。
図2は、ハードウェア機能構成を示す図である。図2において、選択装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)111と、主記憶装置112と、補助記憶装置113と、入力装置114と、表示装置115と、通信I/F(インターフェース)117と、ドライブ装置118とを有し、バスB1に接続される。
CPU111は、主記憶装置12に格納されたプログラムに従って選択装置100を制御するプロセッサに相当する。主記憶装置112には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU111にて実行されるプログラム、CPU111での処理に必要なデータ、CPU111での処理にて得られたデータ等を記憶又は一時保存する。
補助記憶装置113には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置113に格納されているプログラムの一部が主記憶装置112にロードされ、CPU111に実行されることによって、各種処理が実現される。主記憶装置112、補助記憶装置113、選択装置100がアクセス可能なネットワーク2上のデータベースサーバ、オンラインストレージ等を総称して、記憶部130aと呼ぶ。
入力装置114は、マウス、キーボード等を有し、ユーザが選択装置100による処理に必要な各種情報を入力するために用いられる。表示装置115は、CPU111の制御のもとに必要な各種情報を表示する。入力装置114と表示装置115とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F117は、有線又は無線などのネットワークを通じて通信を行う。通信I/F117による通信は無線又は有線に限定されるものではない。
選択装置100によって行われる処理を実現するプログラムは、例えば、CD-ROM(Compact Disc Read-Only Memory)等の記憶媒体119によって選択装置100に提供される。
ドライブ装置118は、ドライブ装置118にセットされた記憶媒体119(例えば、CD-ROM等)と選択装置100とのインターフェースを行う。
また、記憶媒体119に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体119に格納されたプログラムは、ドライブ装置118を介して選択装置100にインストールされる。インストールされたプログラムは、選択装置100により実行可能となる。
尚、プログラムを格納する記憶媒体119はCD-ROMに限定されず、コンピュータが読み取り可能な、データの構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD-ROMの他に、DVDディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
ユーザ端末6は、コンピュータによって制御されるタブレット型、携帯電話等の情報処理端末であって、CPU(Central Processing Unit)11bと、主記憶装置12bと、ユーザI/F(インターフェース)16bと、通信I/F17bと、ドライブ装置18bとを有し、バスB2に接続される。
CPU11bは、主記憶装置12bに格納されたプログラムに従ってユーザ端末6を制御するプロセッサに相当する。主記憶装置12bには、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11bにて実行されるプログラム、CPU11bでの処理に必要なデータ、CPU11bでの処理にて得られたデータ等を記憶又は一時保存する。主記憶装置12bに格納されているプログラムが、CPU11bに実行されることによって、各種処理が実現される。
ユーザI/F16bは、CPU11bの制御のもとに必要な各種情報を表示し、また、ユーザによる操作入力を可能とするタッチパネル等である。通信I/F17bによる通信は無線又は有線に限定されるものではない。
ユーザ端末6によって行われる処理を実現するプログラムは、ネットワーク2を介して外部装置からダウンロードされる。或いは、予めユーザ端末6の主記憶装置12b又は記憶媒体19bに記憶されていても良い。主記憶装置12b、記憶媒体19b、ユーザ端末6がアクセス可能なネットワーク2上のオンラインストレージ等を総称して、記憶部130aと呼ぶ。
ドライブ装置18bは、ドライブ装置18bにセットされた記憶媒体19b(例えば、SD(Secure Digital)メモリカード等)とユーザ端末6とのインターフェースを行う。尚、記憶媒体19bは、コンピュータが読み取り可能な、データの構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。
ユーザ端末6は、デスクトップ型、ノートブック型、ラップトップ型等の情報処理端末であっても良く、そのハードウェア構成は、選択装置100のハードウェア構成と同様であるので、その説明を省略する。
本実施例における選択装置100の機能構成について説明する。図3は、選択装置の機能構成例を示す図である。図3において、選択装置100は、LOD連結グラフ作成部40と、LOD連結検索部50とを有する。選択装置100の記憶部130aは、広告DB31、広告情報DB32、サブグラフ33a、LOD連結グラフ33g等を有する。
LOD連結グラフ作成部40と、LOD連結検索部50とは、選択装置100にインストールされたプログラムが、選択装置100のCPU111に実行させる処理により実現される。
LOD連結グラフ作成部40は、広告DB31を用いて、広告に関連する補足情報32rを取得して、LOD300の個々のデータと連結させたLOD連結グラフ33gを作成する。LOD連結グラフ作成部40は、更に、広告情報DB作成部43と、LOD連結グラフ作成部45とを有する。
広告情報DB作成部43は、広告DB31を用いて、登録されたリンク先の広告用ページ7mを解析することで、広告会社、広告する商品(製品、サービスを含む)等の情報を補足情報32rとして取得し、広告情報DB32を作成する。広告情報DB32は、記憶部130aに出力され記憶される。
広告情報DB32の作成は、広告DB31に新たに、キーワード、広告データ、リンク先等の広告データが検索されるための情報が登録される毎に行われてもよいし、所定間隔(例えば、1日間隔)で行われてもよい。
LOD連結グラフ作成部45は、広告情報DB32において、各広告データに関連性の強い補足情報32rを用いて、LOD300から補足情報32rを検索した場合に有効なデータを取得して、LOD連結グラフ33gを作成する。
まず、LOD連結グラフ作成部45は、広告情報DB32の広告データを検索するターゲットノードとし、広告DB31のキーワードと補足情報32rとを直近ノードとして、直近ノードをターゲットノードへと関連付けたサブグラフ33aを作成する。サブグラフ33aは、記憶部130aに出力され記憶される。
次に、LOD連結グラフ作成部45は、サブグラフ33aの直近ノードが検索結果となり得るデータをLOD300から取得して、LOD連結グラフ33gを作成する。LOD連結グラフ33gは、記憶部130aに出力され記憶される。
LOD連結検索部50は、ユーザ端末6から検索要求を受けると、LOD連結グラフ33gにおいて、検索要求で指定された検索用キーワードと一致するノードから開始して、関連付けられたノードを辿りターゲットノードを特定する。特定されるターゲットノードは1以上であってもよい。
LOD連結検索部50は、広告DB31から、特定したターゲットノードと一致するキーワードのレコードを取得し、広告データとリンク先とを取得して、検索要求を送信したユーザ端末6に取得した広告データとリンク先とを送信する。広告データは、ユーザ端末6のWebページ5wの広告枠に表示される。Webページ5wの広告枠の数だけ、異なるターゲットノードで広告DB31から広告データとリンク先と取得して、ユーザ端末6に送信する。
本実施例では、ユーザが広告DB31に登録したキーワード以外のキーワードで検索した場合であっても、LOD連結グラフ33gを利用することで、広告DB31から広告データを特定できる機会をより多くすることができる。
広告DB31は、広告会社から提供された広告の表示に係る情報を記憶し管理するデータベースであり、キーワード、広告データ、リンク先等の広告を有する。広告情報DB32は、リンク先の広告用ページ7mを解析することによって得られた補足情報32rをメタデータとして記憶し管理するデータベースであってもよい。
サブグラフ33aは、広告データをターゲットノードとして、各補足情報を表す直近ノードを関連付けたグラフを表すデータファイル等である。LOD連結グラフ33gは、LOD300のデータを更に、サブグラフ33aの各直近ノードに関連付けることでLODのデータを含めたデータファイル等である。
広告DB31と広告情報DB32について説明する。図4は、データ構成例を示す図である。図4において、広告DB31は、キーワード、広告データ、リンク先等の項目を有する。
キーワードは、広告会社が定めたキーワードを示す。広告データは、広告会社が販売促進を行う商品の広告の画像、動画等のデータファイルの格納先を示す。リンク先は、ユーザ端末6のWebページ5w内の広告枠に表示された広告データをユーザが選択した場合に、リンクされる広告用ページ7mのURL等のアドレスを示す。
この例では、キーワード「LOD」に対して、広告データ「File://ABTech1.jpg」と、リンク先「http://jp. ABTech.com/」とを示す。また、キーワード「Open Data」に対して、広告データ「File://ABTech2.jpg」と、リンク先「http://jp.ABTech.com/」とを示す。
広告情報DB作成部43は、リンク先の広告用ページ7mの内容を解析して、広告用ページ7mのタイトルを抽出する。又は、解析結果から、広告購入時の登録情報として製品・サービス名等を抽出する。また、広告情報DB作成部43は、ドメイン管理者情報を検索することで、企業名を抽出する。又は、解析結果から、広告購入時の登録情報として製品・サービス名等を抽出する。抽出する情報は、これらに限定されない。様々な情報を抽出して、広告データ毎に抽出した情報が対応付けられることで、広告情報DB32が作成される。
図5は、サブグラフとLODとの結合を説明するための図である。図5に示すサブグラフ33aは、LOD連結グラフ作成部45が、広告情報DB32(図4)の広告データ「File://ABTech1.jpg」と「File://ABTech2.jpg」とについて作成した場合の例を示している。
広告情報DB32では、製品・サービス名「ABテク株式会社」が、広告データ「File://ABTech1.jpg」と「File://ABTech2.jpg」とで同一であるため、サブグラフ33aでは、「ABテク株式会社」を表す直近ノードは、「File://ABTech1.jpg」と「File://ABTech2.jpg」の2つのターゲットノードへと関連付けられる。
直近ノード「LOD for all」と、「LOD」とはそれぞれ、ターゲットノード「File://ABTech1.jpg」へと関連付けられる。直近ノード「コンバージェンスPF」は、「File://ABTech2.jpg」へと関連付けられる。
広告情報DB作成部43は、LOD300から直近ノードに結合する結合候補を選択し、関連性の高い結合候補(以下、候補ノードという)を直近ノードに結合させる。この例では、直近ノード「LOD」は候補ノード「BigData」と「SemanticWeb」とに結合され、直近ノード「コンバージェンスPF」が候補ノード「Intelligent Society」に結合される。しかし、直近ノード「ABテク株式会社」には、結合ノードは存在しない。直近ノード「LOD for all」は、LOD300のいずれかの候補ノードに結合される。
図6は、LOD連結グラフの例を示す図である。図6では、広告情報DB32から得られた補足情報32rと、広告DB31に登録されているキーワード(登録キーワードという)とが、LOD300のデータと連結されたLOD連結グラフ33gの例が示されている。
この例では、登録キーワード「LOD」は、ターゲットノード「File://ABTech1.jpg」と、候補ノード「BigData」と「SemanticWeb」とに関連付けられている。補足情報「ABテク株式会社」は、ターゲットノード「File://ABTech1.jpg」と「File://ABTech2.jpg」とに関連付けられ、LODのデータには結合されていない。
補足情報「コンバージェンスPF」は、ターゲットノード「File://ABTech2.jpg」と、候補ノード「Intelligent Society」に関連付けされ結合されている。候補ノード「Intelligent Society」、「BigData」、及び「SemanticWeb」は、互いに関連付けられている。
補足情報「LOD for all」は、ターゲットノード「File://ABTech1.jpg」と、ある候補ノードとに関連付けられている。登録キーワードと補足情報32rとが直近ノードに相当する。
このように、登録キーワードに加えて補足情報32rを広告データに関連付けて直近ノードを定義し、登録キーワードと補足情報32rとのLOD300におけるデータを特定する。この場合、広告データとのリンク関係をLOD300から取得する場合に比べて、より精度よくデータを特定でき、また、LOD300において特定できるデータの数を増やすことができる。
図7は、部分グラフの例を示す図である。図7では、「BigData」が検索要求のキーワード(検索キーワード)であった場合に、LOD連結検索部50が、LOD連結グラフ33gから検索要求のキーワード(検索キーワード)を用いて抽出した部分グラフ33fを示す図である。
部分グラフ33fでは、検索キーワード「BigData」を起点として、関連付けられるノードを辿りターゲットノードを終端とする。部分グラフ33fの抽出では、検索キーワード「BigData」からターゲットノードへの経路を抽出するため、LOD連結グラフ33gにおける連結方向(矢印の方向)とは無関係に行われる。検索キーワード「BigData」から複数の経路が抽出されている。
上段から1番目の経路では、検索キーワード「BigData」に関連付けられた直近ノード「LOD」からターゲットノード「File://ABTech1.jpg」に辿り着く。2番目の経路では、検索キーワード「BigData」に関連付けられた候補ノード「SemanticWeb」を介して直近ノード「LOD」からターゲットノード「File://ABTech1.jpg」に辿り着く。
3番目の経路では、検索キーワード「BigData」に関連付けられた候補ノード「Intelligent Society」を介して直近ノード「コンバージェンスPF」からターゲットノード「File://ABTech2.jpg」に辿り着く。そして、4番目以降の経路についても同様である。
このように、抽出された部分グラフ33fを参照することで、ターゲットノードから少なくとも「File://ABTech1.jpg」と「File://ABTech2.jpg」とを広告データとして特定することができる。
LOD連結検索部50は、特定した広告データで広告DB31を参照し、リンク先を取得することで、広告データとリンク先のペアを検索結果として検索要求元のユーザ端末6へ送信することができる。
図8は、広告情報DB作成処理を説明するためのフローチャート図である。図8において、広告情報DB作成部43は、広告会社から提供されたキーワード、広告データ、及びリンク先を登録した広告DB31を読み込む(ステップS61)。登録を契機にその都度、広告情報DB作成処理が行われることが望ましいが、1日単位の所定期間ごと等で広告情報DB作成処理を行ってもよい。
広告情報DB作成部43は、広告DBから1レコードを読み込む(ステップS62)。広告情報DB作成部43は、読み込んだレコードのリンク先をアクセスして得られる広告用ページ7mから製品名又はサービス名を抽出する(ステップS63)。また、広告情報DB作成部43は、リンク先を示すURLから企業名を抽出する(ステップS64)。
そして、広告情報DB作成部43は、補足情報の項目の値を全て抽出したか否かを判断する(ステップS65)。全て抽出していない場合(ステップS65のNO)、広告情報DB作成部43は、リンク先を示すURLから補足情報の項目の値を抽出する(ステップS66)ことを、全ての補足情報の項目の値を抽出するまで繰り返し行う。
全て抽出した場合(ステップS66のYES)、広告情報DB作成部43は、広告情報DB32に広告データと補足情報の各種項目の値とを示すレコードを追加する(ステップS67)。
そして、広告情報DB作成部43は、広告DB31の全てのレコードを処理したか否かを判断する(ステップS68)。未処理のレコードが存在する場合(ステップS68のNO)、広告情報DB作成部43は、ステップS62へと戻り、上記同様の処理を繰り返す。一方、
全てのレコードを処理した場合(ステップS68のYES)、広告情報DB作成部43は、この広告情報DB作成処理を終了する。広告情報DB作成部43によって、一例として、図4に示すような広告情報DB32が作成される。
図9は、LOD連結グラフ作成処理を説明するためのフローチャート図である。図9において、LOD連結グラフ作成部45は、広告DB31と、広告情報DB32とを参照して、広告データ毎のサブグラフ33aを作成する(ステップS71)。
次に、LOD連結グラフ作成部45は、公開データ群のLOD300に対して、各サブグラフ33aの直近ノードの値を用いて、検索及び類推により結合候補を選択する(ステップS72)。
LOD連結グラフ作成部45は、結合候補の中から一番適合する結合候補を候補ノードとし、直近ノードと関連付けることで、LOD300の公開データとサブグラフ33aとを連結してLOD連結グラフ33gを作成する(ステップS73)。連結してLOD連結グラフ33gは、記憶部130aに保持される。その後、LOD連結グラフ作成部45は、LOD連結グラフ作成処理を終了する。
図10は、LOD連結検索処理を説明するためのフローチャート図である。図10において、LOD連結検索部50は、LOD連結グラフ33gにおける検索要求で指定された検索キーワードを起点ノードに設定し、検索キーワードから探索を開始する(ステップS81)。
LOD連結検索部50は、ノードに接続される次のノードを全て取得する(ステップS82)。LOD連結検索部50は、取得した各ノードについて広告データか否かを判断する(ステップS83)。LOD連結検索部50は、広告データでないノードに対して、ステップS82を回帰的に繰り返す。
LOD連結検索部50は、得られた広告データのノードが2以上である場合、複数の広告データを得られたと判断し、広告データに辿りつくまでのノード数に基づいてランク付けし、各広告データの広告枠に表示する優先度を作成する(ステップS84)。
LOD連結検索部50は、ユーザ端末6へ未提供の広告データのうち、優先度の高い順に、広告枠の数だけ広告データを選択し(ステップS85)、広告DB31からリンク先を取得して、選択した広告データと、取得したリンク先とをユーザ端末6へ送信する(ステップS86)。その後、LOD連結検索部50は、LOD連結検索処理を終了する。
図11は、広告枠に表示する優先度を説明するために図である。図11では、検索キーワード「BigData」に対して、3つの広告データ「File://ABTech1.jpg」、「File://ABTech2.jpg」、及び「File://xxxx.jpg」が特定された場合で説明する。
一例として、経路毎のノード数(ホップ数)をカウントし、ノード数の少ない順に優先度を高くする。この例では、広告データ「File://ABTech1.jpg」への経路ではノード数が「2」であり、広告データ「File://ABTech2.jpg」への経路ではノード数が「3」であり、広告データ「File://xxxx.jpg」への経路ではノード数が「4」である。
したがって、広告データ「File://ABTech1.jpg」、「File://ABTech2.jpg」、そして「File://xxxx.jpg」の順に優先度が付けられる。広告データ「File://ABTech1.jpg」が最も高い優先度となり、広告データ「File://xxxx.jpg」が最も低い優先度となる。
ユーザ端末6のWebページ5wの広告枠が1つであれば、最も高い優先度の「File://ABTech1.jpg」と、この広告データに対応するリンク先の1組がユーザ端末6に提供される。広告枠が2つであれば、この組に加えて、次に優先度の高い「File://ABTech2.jpg」と、この広告データに対応するリンク先の1組がユーザ端末6に提供される。つまり、2組の広告データとリンク先とが提供される。
次に、検索システムへの応用例について説明する。図12は、検索システムへの応用例を説明するための図である。ユーザは、Windows(登録商標)等で作成した広告データのファイルに対してタグ付けしておいてもよい。
タグのテキストから単語を取得することにより、補足情報32rを増やすことができる。タグ付けの単語の類似性を用いることで、LOD300への結合時に、より多くのデータと連結でき、検索時の探索において、適切な広告データへと辿り着くことができる。
検索時に、起点ノード(検索キーワード)からターゲットノード(広告データ)へのつながりは必ずしも直接(1ホップ)ではない場合がある。つまり、検索時に起点ノードとターゲットノードが同じ場合であっても複数の経路が存在し、その中から1つの経路を選択しておくことについて図13で説明する。
図13は、経路の選択を説明するための図である。図13では、一例として、図7の部分グラフ33fにおける検索キーワード「BigData」からターゲットノード「File://ABTech1.jpg」へは2つの経路A、Bが存在する。ノード数を優先度とした場合、同じ広告データに対して2つの優先度が存在してしまう。この場合の処理について説明する。
経路Aでは検索キーワード「BigData」に接続されるノード数は2個であるのに対して、経路Bではノード数は3個である。このようにして得られるノード数を重みの値とすることで、重みの少ない経路を選択すればよい。検索キーワード「BigData」からターゲットノード「File://ABTech1.jpg」への経路は、経路Aが選択される。
つまり、部分グラフ33fに同一ターゲットノードへの複数の経路が存在する場合には、最短の経路を選択することで、同一の広告データが選択され、2以上の広告枠にそれぞれ同じ広告データが表示されてしまうことを防止できる。
このように、ユーザが、広告DB31に登録されていないキーワードで検索した場合であっても、広告DB31に登録された広告データへの経路を作成及び選択しておくことで、より適切な広告データをユーザ端末6に表示させることができる。
最短の経路を選択して、1つの広告データが2つの優先度を持つことが無いようにすることについて説明したが、複数の経路が存在する広告データに対して、ノード数の平均値を優先度として与えてもよい。優先度の値が小さいほど、優先度が高いことを示す。
上記では、広告DB31に登録されていないキーワードが検索キーワードとなった場合で説明してきたが、広告DB31に登録されていないキーワードが検索キーワードであっても、広告DB31を用いただけでは、広告データを適切に検索できない場合がある。
図14は、登録キーワードによるLOD連結検索処理の例について説明するための図である。図14では、破線が広告DB31に登録されたデータのみを用いた既存技術の広告データの提供例を示し、実線が本実施例における広告データの提供例を示している。
ユーザは、Webページ5wにおいて、「LOD」を検索キーワードとして入力したとする。既存技術では、検索キーワード「LOD」で広告DB31を検索し、検索できたレコードから得られた広告データをユーザが参照しているWebページ5wの広告枠に表示する。
更に、広告枠が存在する場合には、広告DB31から検索キーワード「LOD」に1部一致する等により他のレコードを用いて得られた広告データをユーザが参照しているWebページ5wのもう1つの広告枠に表示する。
このような広告DB31を検索するのみの既存技術では、2番目の広告枠には、ユーザが意図しないまったく異なる分野の広告データが表示される可能性がある。
一方、本実施例では、広告DB31の広告データとリンク先の広告用ページ7mとから広告情報DB32を作成し、補足情報32rを用いてLOD300との連結により得たLOD連結グラフ33gを作成する。
検索時には、LOD連結グラフ33gから、検索キーワードを起点として広告データに辿り着く部分グラフ33fを抽出し、検索キーワードからノード数が最も少ない順に広告データを特定し、広告枠に表示させる。
図14の例では、検索キーワード「LOD」と、ノード「コンバージェンスPF」とにおいて、文字の一致は全く無いにも関わらず、LOD300のデータとの連結により、「BigData」、そして「Intelligent Society」を経てターゲットノード「File://ABTech2.jpg」に辿り着く。
したがって、検索キーワード「LOD」と直結する広告データ「File://ABTech1.jpg」が最も最短の経路であるため、最も有効な位置の広告枠に表示され、広告データ「File://ABTech2.jpg」は、次の広告枠に表示されればよい。
本実施例では、上述の例以外に、既存技術では起こりがちな女性用の広告に対して子供用の広告が表示されるといった、ユーザにとって価値のない広告の表示を低減することができる。具体的には、ユーザによる広告用ページ7mへのアクセスがなされない広告データを広告枠に表示してしまうことを防止できる。
また、本実施例は、広告データ以外に、以下の検索等に適用可能である。
・ある技術論文に関係する論文を検索する場合、LOD300に組み込まれた技術論文との関連性により確度の高い文献を検索できる。
・医療系の公開データを使って、新薬の副作用などを検索する場合、新薬情報を細分化してグラフ化し、LOD300と連結することで類似する症状、症例等を検索できる。
上述した、広告情報DB作成部43はDB作成部の一例であり、LOD連結グラフ作成部45は連結グラフ作成部の一例であり、LOD連結検索部50は連結検索部の一例である。また、本実施例は、上述したように様々な分野に適応可能であることから、広告データに限定されない。検索キーワードに応じて、第三者が検索者のユーザに知って貰うことを目的とした目的データの一例として例示したにすぎない。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
目的データごとに、該目的データに係る補足情報を対応付けたデータベースを作成し、
前記データベースの前記補足情報を用いて、前記目的データに対応付けられた該補足情報と、該補足情報に関連する公開データとを関連付けることで、該目的データから該補足情報を介して該公開データまでを連結した連結グラフを作成し、
検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する
処理をコンピュータに行わせる選択プログラム。
(付記2)
前記データベースの作成では、前記コンピュータに、
前記目的データにリンクされるリンク先Webページの内容を解析し、該目的データに係る補足情報を抽出する
処理を行わせることを特徴とする付記1記載の選択プログラム。
(付記3)
前記コンピュータに、
前記目的データのファイルのタグ付けから前記補足情報を取得させる
処理を更に行わせることを特徴とする付記2記載の選択プログラム。
(付記4)
前記目的データの選択では、前記コンピュータに、
前記連結グラフにおける前記検索キーワードを起点ノードに設定し、該検索キーワードから開始し、関連付けに従って前記目的データへと探索し、
前記距離を前記目的データに辿りつくまでのノード数で表し、該ノード数に基づいて、辿り着いた各目的データをランク付けし、ランクの高い順に該目的データを選択する
処理を行わせることを特徴とする付記1乃至3のいずれか一項記載の選択プログラム。
(付記5)
前記コンピュータに、
前記目的データへと探索により、同一の目的データへ辿り着く経路が2以上存在する場合、該目的データに対して、ノード数の少ない経路を選択させる
ことを特徴とする付記3記載の選択プログラム。
(付記6)
前記コンピュータに、
前記目的データへと探索により、同一の目的データへ辿り着く経路が2以上存在する場合、該目的データに対して、ノード数の平均を採用する
ことを特徴とする付記3記載の選択プログラム。
(付記7)
目的データごとに、該目的データに係る補足情報を対応付けたデータベースを作成し、
前記データベースの前記補足情報を用いて、前記目的データに対応付けられた該補足情報と、該補足情報に関連する公開データとを関連付けることで、該目的データから該補足情報を介して該公開データまでを連結した連結グラフを作成し、
検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する
処理をコンピュータが行う選択方法。
(付記8)
目的データごとに、該目的データに係る補足情報を対応付けたデータベースを作成するDB作成部と、
前記データベースの前記補足情報を用いて、前記目的データに対応付けられた該補足情報と、該補足情報に関連する公開データとを関連付けることで、該目的データから該補足情報を介して該公開データまでを連結した連結グラフを作成する連結グラフ作成部と、
検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する連結検索部と
を有する選択装置。
2 ネットワーク
5w Webページ
6 ユーザ端末
7m 広告用ページ
31 広告DB
32 広告情報DB
32r 補足情報
33a サブグラフ
33g LOD連結グラフ
33f 部分グラフ
40 LOD連結グラフ作成部
43 広告情報DB作成部
45 LOD連結グラフ作成部
50 LOD連結検索部
100 選択装置
200 Webページ群
300 LOD
1000 システム

Claims (6)

  1. 目的データごとに、該目的データに係る補足情報と、予め決められたキーワードとを対応付けたデータベースを作成し、
    前記データベースの前記補足情報と該キーワードとを用いて、前記目的データに対応付けられた該補足情報又は該キーワードと、該補足情報又は該キーワードに関連する公開データとを関連付けることで、該目的データから該補足情報又は該キーワードを介して該公開データまでを連結した連結グラフを作成し、
    検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する
    処理をコンピュータに行わせる選択プログラム。
  2. 前記データベースの作成では、前記コンピュータに、
    前記目的データにリンクされるリンク先Webページの内容を解析し、該目的データに係る補足情報を抽出する
    処理を行わせることを特徴とする請求項1記載の選択プログラム。
  3. 前記目的データの選択では、前記コンピュータに、
    前記連結グラフにおける前記検索キーワードを起点ノードに設定し、該検索キーワードから開始し、関連付けに従って前記目的データへと探索し、
    前記距離を前記目的データに辿りつくまでのノード数で表し、該ノード数に基づいて、辿り着いた各目的データをランク付けし、ランクの高い順に該目的データを選択する
    処理を行わせることを特徴とする請求項1又は2記載の選択プログラム。
  4. 前記コンピュータに、
    前記目的データへと探索により、同一の目的データへ辿り着く経路が2以上存在する場合、該目的データに対して、ノード数の少ない経路を選択させる
    ことを特徴とする請求項3記載の選択プログラム。
  5. 目的データごとに、該目的データに係る補足情報と、予め決められたキーワードとを対応付けたデータベースを作成し、
    前記データベースの前記補足情報と該キーワードとを用いて、前記目的データに対応付けられた該補足情報又は該キーワードと、該補足情報又は該キーワードに関連する公開データとを関連付けることで、該目的データから該補足情報又は該キーワードを介して該公開データまでを連結した連結グラフを作成し、
    検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する
    処理をコンピュータが行う選択方法。
  6. 目的データごとに、該目的データに係る補足情報と、予め決められたキーワードとを対応付けたデータベースを作成するDB作成部と、
    前記データベースの前記補足情報と該キーワードとを用いて、前記目的データに対応付けられた該補足情報又は該キーワードと、該補足情報又は該キーワードに関連する公開データとを関連付けることで、該目的データから該補足情報又は該キーワードを介して該公開データまでを連結した連結グラフを作成する連結グラフ作成部と、
    検索要求に応じて、前記連結グラフを参照し、該検索要求で指定された検索キーワードから前記目的データまでの距離に基づく関連性の高さを用いて該関連性の高い順に該目的データを選択する連結検索部と
    を有する選択装置。
JP2018000199A 2018-01-04 2018-01-04 選択プログラム、選択方法、及び選択装置 Active JP7081155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018000199A JP7081155B2 (ja) 2018-01-04 2018-01-04 選択プログラム、選択方法、及び選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018000199A JP7081155B2 (ja) 2018-01-04 2018-01-04 選択プログラム、選択方法、及び選択装置

Publications (2)

Publication Number Publication Date
JP2019121159A JP2019121159A (ja) 2019-07-22
JP7081155B2 true JP7081155B2 (ja) 2022-06-07

Family

ID=67307346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018000199A Active JP7081155B2 (ja) 2018-01-04 2018-01-04 選択プログラム、選択方法、及び選択装置

Country Status (1)

Country Link
JP (1) JP7081155B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560496B (zh) * 2020-12-09 2024-02-02 北京百度网讯科技有限公司 语义分析模型的训练方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007524918A (ja) 2003-06-30 2007-08-30 グーグル、インコーポレイテッド 広告主ウェブ情報の検索を用いた広告提供
JP2008146219A (ja) 2006-12-07 2008-06-26 Fuji Xerox Co Ltd データ検索システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2016088230A1 (ja) 2014-12-04 2016-06-09 株式会社 日立製作所 因果関係分析装置、及び因果関係分析方法
JP2017174405A (ja) 2016-03-24 2017-09-28 富士通株式会社 オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP2018517956A (ja) 2015-03-24 2018-07-05 キンダイ、インコーポレイテッドKyndi, Inc. コグニティブメモリによるグラフのインデキシング、格納、および検索

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11345238A (ja) * 1998-06-02 1999-12-14 Hitachi Ltd www上のHTML文書のキーワード検索の結果の提示方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007524918A (ja) 2003-06-30 2007-08-30 グーグル、インコーポレイテッド 広告主ウェブ情報の検索を用いた広告提供
JP2008146219A (ja) 2006-12-07 2008-06-26 Fuji Xerox Co Ltd データ検索システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2016088230A1 (ja) 2014-12-04 2016-06-09 株式会社 日立製作所 因果関係分析装置、及び因果関係分析方法
JP2018517956A (ja) 2015-03-24 2018-07-05 キンダイ、インコーポレイテッドKyndi, Inc. コグニティブメモリによるグラフのインデキシング、格納、および検索
JP2017174405A (ja) 2016-03-24 2017-09-28 富士通株式会社 オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
張 建偉,地域ウェブ情報源の収集のためのクローリング手法の提案,DEWS2005論文集 [online],(社)電子情報通信学会データ工学研究専門委員会,2005年05月02日,Internet<URL:http://www.ieice.org/iss/de/DEWS/DEWS2005/procs/papers/4B-i5.pdf>

Also Published As

Publication number Publication date
JP2019121159A (ja) 2019-07-22

Similar Documents

Publication Publication Date Title
US11741173B2 (en) Related notes and multi-layer search in personal and shared content
US9323827B2 (en) Identifying key terms related to similar passages
US8745039B2 (en) Method and system for user guided search navigation
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
US12008032B2 (en) Automatic detection and transfer of relevant image data to content collections
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
JP5550669B2 (ja) 検索装置、検索方法およびプログラム
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
US9639627B2 (en) Method to search a task-based web interaction
KR20080024208A (ko) 검색 결과를 제공하기 위한 시스템 및 방법
KR20090080561A (ko) 검색 결과에 컬렉션 아이템을 포함시키기 위한 기술
JP5989170B2 (ja) 代表者の信頼度を用いた検索結果順位化装置および方法
JP2014505945A (ja) 検索情報の提供
JP3803961B2 (ja) データベース生成装置、データベース生成処理方法及びデータベース生成プログラム
US20120239657A1 (en) Category classification processing device and method
JP5103051B2 (ja) 情報処理システム及び情報処理方法
CN109408777A (zh) 基于快速浏览的文档处理方法、装置和文档服务器
JP2018504686A (ja) 検索データを処理するための方法及び装置
US9600579B2 (en) Presenting search results for an Internet search request
JP7081155B2 (ja) 選択プログラム、選択方法、及び選択装置
JP2007122398A (ja) フラグメントの同一性判定方法およびコンピュータプログラム
JP6568284B1 (ja) 提供装置、提供方法及び提供プログラム
KR101172487B1 (ko) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템
WO2017056164A1 (ja) 情報提示システム、及び情報提示方法
JP5746912B2 (ja) テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220509

R150 Certificate of patent or registration of utility model

Ref document number: 7081155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150