JP7261107B2 - 情報検索方法及び情報検索装置 - Google Patents

情報検索方法及び情報検索装置 Download PDF

Info

Publication number
JP7261107B2
JP7261107B2 JP2019124148A JP2019124148A JP7261107B2 JP 7261107 B2 JP7261107 B2 JP 7261107B2 JP 2019124148 A JP2019124148 A JP 2019124148A JP 2019124148 A JP2019124148 A JP 2019124148A JP 7261107 B2 JP7261107 B2 JP 7261107B2
Authority
JP
Japan
Prior art keywords
impression
target data
user
search target
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019124148A
Other languages
English (en)
Other versions
JP2021009633A (ja
Inventor
健治 川崎
悠一 小林
三揮 米原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019124148A priority Critical patent/JP7261107B2/ja
Publication of JP2021009633A publication Critical patent/JP2021009633A/ja
Application granted granted Critical
Publication of JP7261107B2 publication Critical patent/JP7261107B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報検索方法及び情報検索装置に関する。
情報検索を行う方法の1つとして、検索者がキーワードを指定すると、該キーワードを含むデータを検索結果として出力するものがある。本方法では、検索者が適切なキーワードを思いつければ良いが、思いつかない場合は適切なデータを検索することが難しい。これを解決する方法の1つとして、感性検索が提案されている。例えば特許文献1の方法では、テキスト文書の著者単位の感性ベクトルを作成し、入力検索条件との距離が近いものほど感性的に近いとして扱う。これにより、検索対象を入力するだけで検索結果が得られる感性的な検索が可能となるとともに、検索対象に対するメタデータ等を、人手を介して付与する必要がなく、運用コストを低減できると述べている。
また特許文献2の方法では、検索者の感性を計測するために用いられる複数の計測用画像を表示させ、当該画像に関するアンケートを行い、アンケート結果に基づいて、当該検索者の所定の感性語に関する感性量を計測し、作品画像の特徴量との相関値を求める。これにより、簡単かつ高精度に、自分の感性に合致した作品画像を検索することができると述べている。
特開2010-113511号公報 特開2011-22829号公報
上記特許文献はどちらも、検索者が適切なキーワードを思いつかなくても感性的に近い対象を検索可能とするものであった。しかしながら特許文献1の方法では、感性表現となりうる単語を、感性表現辞書にあらかじめ登録しておく必要がある。また、各感性表現に対する感性ベクトルを、感性ベクトル辞書にあらかじめ登録しておく必要があり、これらの辞書作成が煩雑である。一方で特許文献2の方法では、5つの感性語「温かみ」、「柔らかさ」、「自然さ」、「明るさ」、「派手さ」に対する傾向を数値で表現した特徴量を、画像から効率的に抽出できる。しかしながら、前記特徴量は画像の色相、彩度および明度に基づいて抽出されるため、例えば旅行や映画の体験記のような、高度かつ多様な要因によって形成される感動に関する特徴量は抽出できない。さらに、検索者が誰か他人の体験記、例えば旅行記を読んで同じような感動を追体験したいと思ったと仮定する。その場合、その体験記に紹介されているホテルが満室で予約できない、あるいは、旅程の一部のイベント施設が閉鎖・移転されていてもはや利用できない、といったことが考えられる。そのような状況では、単に検索結果を表示するだけで感動の追体験を可能とすることは難しいという問題もある。
本発明は上記の点に鑑みてなされたもので、その一つの目的は、検索に使用する特殊な辞書を作成する必要なく、検索者の感動ポイントを適切に反映した検索結果を得ることを可能とする情報検索方法及び情報検索装置を提供することである。
上記の目的を達成するために、本発明の一態様によれば、人の感動を引き起こす複数の
要因をそれぞれ示すデータである感動項目と、各前記感動項目に関する該当性を表す指標である感動量とが対応づけられてなる一群のデータである感動ベクトルが、人の感動に対する感受傾向を調べるための資料として人に提示される基準試料についてあらかじめ設定されて該当基準試料とともに格納されている記憶デバイスと、プロセッサとを備えるコンピュータが、検索対象データのコンテンツを解析して、当該検索対象データについて各前記感動項目ごとの前記感動量を計算して前記検索対象データについての前記感動ベクトルを算出し、各前記基準試料に対する利用者の応答内容に基づいて、当該利用者が要求する事象についての感動ベクトルを算出し、前記検索対象データについて算出された前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとを比較演算することにより、前記利用者について算出された前記感動ベクトルに近い前記感動ベクトルを示す前記検索対象データを抽出する情報検索方法が提供される。
本発明の一態様によれば、検索に使用する特殊な辞書を作成する必要なく、検索者の感動ポイントを適切に反映した検索結果を得ることを可能とする情報検索方法及び情報検索装置を提供することができる。
図1は、本発明の実施形態に係る情報検索システムの構成例を示す図である。 図2は、図1中の情報検索サーバの構成例を示す図である。 図3は、対象感動ベクトル算出部のデータ処理例を示すフローチャートである。 図4は、要求感動ベクトル算出部のデータ処理例を示すフローチャートである。 図5は、類似度算出部のデータ処理例を示すフローチャートである。 図6は、リソース割当て・表示部のデータ処理例を示すフローチャートである。 図7は、感動ベクトル算出ルールテーブルの構成例を示す図である。 図8は、感動ベクトルテーブルの構成例を示す図である。 図9は、利用者が利用する情報端末に表示される検索画面例を示す図である。 図10は、感動項目ごとのマッチ度の表示画面例を示す図である。
以下、本発明の一実施形態を、図面を参照しながら詳細に説明する。本実施形態では、利用者が求める感動要素に合う旅行の体験記を検索する例について説明する。
情報検索システムの構成
図1は、本実施形態に係る情報検索システム1の構成例を示す図である。情報検索システム1は、情報検索サーバ100、リソース管理サーバ200、関連情報サーバ300、及び情報端末1040を備えている。情報検索サーバ100は、本実施形態に係る情報検索処理の主要な部分を担当し、利用者の要求に応じて適切な旅行の体験記の検索を行う装置である。リソース管理サーバ200は、ホテル等の宿泊施設、レストラン、イベント会場の入場券・座席券、飛行機、特急列車の座席指定券など、旅行を実現するのに必要な各種のリソースについての予約管理を行う装置である。関連情報サーバ300は、SNS(Social Networking Service)、Webベースのオンライン百科事典、オークションサイ
トなど、様々な関連情報を管理するシステムである。情報端末400は、利用者が検索条件を入力し、検索結果を表示する装置である。これらの装置・システムは、通信ネットワークNを介して相互に通信可能に接続されている。
図1の構成において、例えば情報検索サーバ100、リソース管理サーバ200、関連情報サーバ300をパーソナルコンピュータ、ワークステーションなどの計算機で、情報端末400をスマートフォン、車載端末などの計算機で構成することができる。また通信ネットワークNを、LAN(Local Area Network)、インターネット等の伝送路構成することにより実現できる。
情報検索サーバの構成
図2は、情報検索サーバ100のハードウェア構成例を示す図である。符号110は、プログラムの実行処理を行う演算部である。符号120は、システム管理者からのプログラム実行開始指示やパラメータなどの入力を行う入力部である。符号130は、プログラムの実行結果などの出力を行う出力部である。符号140は、通信ネットワークNを通じて他の計算機とのデータ交換を行う通信処理部である。符号150は、データの読み出し、記録を行う記憶管理部である。符号160は、上記各部間のデータ交換を行う通信部である。演算部110では、対象感動ベクトル算出手段111、要求感動ベクトル算出手段112、類似度算出手段113、リソース割当て・表示手段114が実行される。記憶管理部150には、検索対象データ151、要求分析用データ152、感動ベクトル算出ルールテーブル153、及び感動ベクトルテーブル154が格納される。
上記の情報検索サーバ100において、例えば、演算部110をCPU等のプロセッサで、入力部120をキーボード、マウス等の入力デバイスで、出力部130を液晶ディスプレイ等の出力デバイスで、通信処理部140を有線LAN、無線LANと通信可能とするネットワークインタフェースカード(NIC)で、記憶管理部150をハードディスクドライブ、半導体ドライブ、フラッシュメモリ等の記憶デバイスで、通信部160をBusで構成することができる。また入力部120と出力部130をタッチパネルで構成することも可能である。
ここで、本実施形態における「感動ベクトル」について説明する。人がある物や事象に接して感動する場合、一般に、いくつかの「感動を引き起こす要因」に接して心が動かされたと考えることができる。その場合、ある人の体験について、その体験記、例えば旅行記等のテキスト情報から前記感動を引き起こす要因となる項目要素(以下「感動項目」と称する。)に分類してあらかじめ各感動項目に関する評価を0点-10点といった範囲の数値で評価しておけば、これらの感動項目に関する評点の集合を、ある別の人について所定の質問等に基づいて取得された感動項目に関する評点の集合との近さを定量的に評価することで、対象の旅行記と同様の体験をした場合に、その人が潜在的に求めていたような種類の感動を得られる蓋然性が高くなると考えられた。本明細書では、前記感動項目に関する評点の集合を「感動ベクトル」と称する。そして、一例として、インターネット上に投稿された旅行ブログのテキスト情報から求められる感動ベクトル(対象感動ベクトル)と、本システムの利用者について所定の手法に基づいて取得された感動ベクトル(要求感動ベクトル)との類似度を算出することにより、その利用者が求めている感動に極力近い感動が得られると評価された旅行ブログを選択し、それに関する旅程を提示する構成を案出した。
情報検索システムの動作例
ここで、情報検索サーバ100の機能によって実現される情報検索処理の概要について説明する。図9は、利用者の情報端末400に表示される検索画面例を示す図である。最初に、利用者は情報検索サーバ100から送信されて情報端末400に表示される画像(基準試料としての要求分析用画像データ)について、その画像が、利用者が要望している旅行の気分に合っている画像であるか否かを、検索画面に表示される「いいね!」か「イマイチ」のボタンを選択することで入力する(画面9010)。通常複数の異なる画像が順次表示されるので、利用者は各画像について、前記画像評価処理を繰り返す。次に、情報端末400は、情報検索サーバ100でのデータ処理結果に基づいて、利用者の気分に合うとして抽出された旅行の候補を数件表示する(画面9020)。
次に、利用者が該候補の中から気になる候補をリンク先のタッチ等の操作により選択すると、情報端末400は、情報検索サーバ100でのデータ処理結果に基づいて、該旅行内容の詳細(検索対象データの1つ)を表示する(画面9030)。
次に、利用者が、該候補を気に入ったものとして情報端末400を通じて選択すると、該候補の旅行を予約するための条件を入力する画面に遷移する(画面9040)。本画面では、旅行の出発日や帰着日、旅行する大人・子供の人数、予算の下限・上限などの、当該旅行を利用者の要望に従ってカスタマイズするための条件を指定して情報検索サーバ400に送信することができる。画面9030の例では「予約する」ボタンが設けられており、このボタンを操作することにより、情報検索サーバ100から画面9040の画面データが情報端末400に送信される。
次に、情報検索サーバ100は、宿泊施設などの旅行実施に必要なリソースの利用可否をリソース管理サーバ200に問い合わせて、実際に実施可能な旅程を構成して情報端末400に表示する(画面9050)。画面9040で入力された旅行条件がすべて満足される宿泊施設などのリソースが確保可能と判定された場合、図画面9050には、画面9030のモデル旅行旅程と同様の内容が表示される。図9の例では、画面9030の旅行内容では1日目の宿泊施設がサッポロホテルとなっていたが、該ホテルに指定日に空き室(リソース)がないと判定された場合は、別の空き室があるホテルとして選択されたホテル新北海道を予約した結果を表示している。
なお、図9に示した画面は例示であって、画面設計、操作体系は具体的なシステムごとに設計することができる。
情報検索サーバ100によるデータ処理
次に、情報検索サーバ100で実行されるデータ処理について説明する。情報検索サーバ100では、対象感動ベクトル算出処理、要求感動ベクトル算出処理、類似度算出処理、及びリソース割当て処理が実行される。
対象感動ベクトル算出処理
対象感動ベクトル算出部111でのデータ処理例を、図3のフローチャートを用いて説明する。対象感動ベクトル算出部111は、情報検索サーバ100の演算部110によって実行されるプログラムである。本プログラムは、利用者が旅行体験記の検索を行う際に最新の情報(インターネット等の外部情報)に基づいて検索を行えるように、定期的に実行するものとする。あるいは、システム運用者が新たな検索対象データを追加した時、利用者が情報検索を行う時の最初に対象感動ベクトル算出処理を実行するようにしてもよい。
図3の処理フロー例が開始されると、最初に、対象感動ベクトル算出部111は、検索対象データを1つ読み込む(S3010)。ここで検索対象データは、例えば旅行業者のウェブサイトなどに投稿された旅行記ブログ、旅行業者が作成したモデルコース紹介の記事などの、インターネット上で取得可能なテキスト情報である。次に、対象感動ベクトル算出部111は、感動ベクトル算出ルールテーブル123のレコードを1つ読み込む(S3020)。
図7に、本実施形態における感動ベクトル算出ルールテーブルの構成例を示す。図7に例示する感動ベクトル算出ルールテーブル153は、感動を引き起こす要因である感動項目ごとに、感動項目ID1531、感動項目名1532、時系列ストーリー1533、及び関連情報ソース1534を関連付けて一のレコードとして格納している。感動項目ID1531は、各感動項目を一意に識別するための識別符号である。感動項目名1532は、各感動項目の内容を端的に表現しているテキスト情報である。
時系列ストーリー1533は、分析対象となるテキスト情報等について、対応する感動項目1532に該当するか否かを判定するために使用される、複数の検出条件の配列である。#1等の検出条件には、検索対象データから感動ベクトルを算出する方法が登録されている。時系列ストーリー1533は、各検出条件の出現数だけでなく、その時間的な出現頻度をも考慮して設定されている。具体的な時系列ストーリーの設定例、感動ベクトル算出方法については後述する。関連情報ソース1534は、前記検出条件が、通信ネットワークで接続されている他サーバの情報を利用する場合に、そのサーバの名前やアドレスを登録する。
図3の対象感動ベクトル算出処理に戻ると、次に、対象感動ベクトル算出部111は、読み込んだ感動ベクトル算出ルールの算出方法に関して、感動ベクトル算出ルールテーブル153の関連情報ソース1534の項目を参照して関連データが必要であるか否かを調べ(S3030)、必要であれば関連情報サーバ1030にアクセスして関連データを取得する(S3030、Yes;S3040)。
次に、対象感動ベクトル算出部111は、前記時系列ストーリーの検出条件にしたがって、感動ベクトルを算出する(S3050)。以下に、感動項目と、該感動項目について数値指標(以下「感動量」)の算出方法の例を示す。
図7に例示している順に説明すると、まず感動項目「苦労の末に達成する」は、検索対象データである旅行ブログ等のテキスト情報において、「苦労」、「苦戦」といった意味を含む文章が検出され、該文章より後の文章に「ついに出来た」、「達成」といった意味を含む文章が検出された場合に、感動量を1として算出する。さらに、「苦労」、「苦戦」といった意味を含む文章で、「苦労」、「苦戦」の度合が大きい意味を含む文章が検出された場合、感動量の数値が大きくなるように算出することができる。ここで、検索対象データの文章から意味を抽出する方法については、自然言語処理の意味解析などの既存技術を用いることができる。
次に、感動項目「堪能する」では、検索対象データの複数の文章で時間や場所が遷移していても、同種のトピック(例えば「温泉」、「大浴場」、「露天風呂」などの入浴が共通するトピック)が複数回検出された場合に、該回数が多い程、感動量が大きくなるように算出することができる。ここで、検索対象データの文章からトピックを抽出する方法については、トピックモデルなどの既存技術を用いることができる。
また、感動項目「歴史を感じる」では、対応する関連情報ソース1534に定義されたオンライン百科事典サイトAから、該ブログ記事の旅程で訪問する施設などに関する情報を取得し、該施設などの項目の経歴量(創建1654年、創業120年の老舗等)が一定以上であれば、該経歴量が大きい、または経歴の開始年が古い程、感動量が大きくなるように算出することができる。
また、感動項目「希少価値のある」は、対応する関連情報ソース1534に定義されたオークションサイトBから、該ブログ記事の旅程中に登場するアイテムに関する情報を取得し、該ブログ記事の旅行日時の前後で該アイテムの価格変化率が一定以上であれば、該変化量が大きい程、感動量が大きくなるように算出することができる。アイテムの例としては、訪問先の特産品である宝飾品、嗜好品、食品等が考えられる。
以下、図7に例示している以外の感動項目の例についても、本発明の理解に資するように説明する。感動項目「長時間待った甲斐がある」では、「待たされた」といった意味を含む文章が検出され、該文章より後の文章に、「おいしかった」、「嬉しかった」といっ
た肯定的、好意的な意味を含む文章が検出された場合に、感動量を1とする。さらに、「待たされた」といった意味を含む文章で、待ち時間が抽出できた場合、該時間が長いほど感動量が大きくなるように算出することができる。
感動項目「意外なことに遭遇する」では、検索対象データにおいて、「偶然」といった意味を含む文章が検出され、該文章より後の文章に、「驚き」、「感心」といった意味を含む文章が検出された場合に、感動量を1とする。さらに、「驚き」、「感心」といった意味を含む文章で、「驚き」、「感心」の度合が大きい意味を含む文章が検出された場合、感動量が大きくなるように算出することができる。例えば感嘆符「!」の数が多いほど、感動量が大きくなるようにしてもよい。
感動項目「仲良くなる」では、関連情報ソース153に定義されたSNSサイトから、該ブログ記事の投稿日時の前後の該ブログ記事投稿者のフレンド数やフォロワー数、ダイレクトメッセージ数などの変化量を取得し、該変化量が一定以上であれば、該変化量が大きい程、感動量が大きくなるように算出することができる。
上記のように、感動においては時系列のストーリー性(例えば苦戦した後の達成、複数回繰り返すことによる堪能)が重要であると考えられるため、単にキーワードの組合せではなく、その出現順序や回数をも考慮した抽出を行うようにしている。また感動においては背景知識(例えば経歴、歴史、履歴)やある出来事の前後での特定指標の変化(例えばSNSにおけるフレンド数の増加)が重要であると考えられるため、関連情報と組合せて判断した抽出も行う。これらの処理によって、高度かつ多様な要因のある感動項目ごとの感動量を算出することができる。
図3の対象感動ベクトル算出処理に戻ると、次に、対象感動ベクトル算出部111は、感動ベクトル算出ルールテーブル153に未実行の次レコードがあるか否かを調べ(S3060)、あれば該レコードを読み込み(S3020)、感動ベクトル算出処理を繰り返す。S3060で次レコードがないと判定すれば、対象感動ベクトル算出部111は、検索対象データに未実行のデータがあるか否かを調べ(S3070)、あれば該検索対象データを読み込み(S3010)、感動ベクトル算出処理を繰り返す。S3070で次データがないと判定すれば、対象感動ベクトル算出部111は、感動ベクトルテーブル154に算出した感動ベクトルを出力し(S3080)、本フローを終了する。
図8に感動ベクトルテーブルの構成例を示す。図8に例示する感動ベクトルテーブル154は、旅行ブログ等の検索対象データ、あるいは後述する利用者が求める感動についての感動ベクトル算出の基準となる各材料について算出された感動ベクトルを格納している。図8に例示する感動ベクトルテーブル154は、旅行ブログ等の検索対象データ、あるいは利用者が求める感動を分析する基準となる資料を一意に識別するための符号であるアイテムID1541、と、各アイテムID1541について対応づけられている感動項目1542,1543,1544,1545、・・・ごとの感動量を格納している。アイテムID1541に旅行ブログ1等と記載されている場合、対応する感動項目1542等に記録されている数値データは、当該旅行ブログ1について対象感動ベクトル算出処理を実行した結果得られた感動量である。アイテムID1541に分析用1等と記載されている場合、対応する感動項目1542等に記録されている数値データは、分析用1で特定される感動ベクトル算出の基準となる資料(本実施形態では画像データ)について、各感動項目1542についてシステム運用者等があらかじめ設定した感動量である。
要求感動ベクトル算出処理
続いて、要求感動ベクトル算出部112の処理例を、図4のフローチャートを用いて説明する。要求感動ベクトル算出処理は、本システムの利用者、例えばその利用者の気分、嗜好にマッチする旅行プランを探している人について、その人の潜在的な嗜好、気分を分
析するための機能を有する。本実施形態では、要求感動ベクトル算出処理は、利用者が情報検索を開始する時に実行するものとする。要求感動ベクトル算出処理は、図9の符号9010に対応する処理である。
処理を開始すると、要求感動ベクトル算出部112は、最初に、記憶管理部150の要求分析用データ152から複数の要求分析用画像データを取得して、要求分析用画像を含む画面(図9の符号9010で例示)を作成して表示し、利用者にとって該画像が、利用者が考えている旅行の気分に合っているか否かの入力を受け付ける(S4010)。利用者が該画像を旅行の気分に合っていると考えて肯定的、好意的な回答を入力した(本実施形態の例では「いいね!」ボタンを押した)場合(S4020,Yes)、要求感動ベクトル算出部112は、該画像の感動項目ごとの感動量を順次加算するとともに、各感動量を処理済みの画像数で除して、要求感動ベクトルとする(S4030)。S4020がNoであれば、処理はS4040に進む。ここで、前記のように、要求分析用画像の感動項目ごとの感動量は、あらかじめシステム運用者等が定義しており、感動ベクトルテーブル154に格納されているものとする。S4030では、要求感動ベクトル算出部112は、該画像の感動項目ごとの感動量を、感動ベクトルテーブル154から読み取って使用する。次に、未表示の要求分析用画像があると判定した場合(S4040,Yes)、要求感動ベクトル算出部112は、該画像を含む画面9010の表示を繰り返す(S4010)。S4040、未表示の要求分析用画像がなくなったと判定した場合(S4040,No)、本フローは終了する。なお、蓄積されている要求分析画像について、一定回数(例えば5回)本フローを繰り返したら、本フローを終了するようにしてもよい。
以上の要求感動ベクトル算出処理によれば、システム利用者が言語化する必要なく、求めている旅行の気分が感動ベクトルとして数値データ化される。
類似度算出処理
続いて、類似度算出部113の処理例を、図5のフローチャートを用いて説明する。類似度算出処理は、対象感動ベクトル算出処理及び要求感動ベクトル算出処理によってそれぞれ算出された感動ベクトルを比較することで、要求感動ベクトルに近い対象感動ベクトルを有する検索対象データを検索する機能を有する。類似度算出処理は、利用者が複数枚の要求分析用画像(図9の符号9010)の選択を全て完了した時に実行されるものとする。
類似度算出処理が開始されると、類似度算出部113は、最初に、感動ベクトルテーブル154に格納されている検索対象データのレコード(例えば旅行ブログ1)を読み込む(S5010)。次に、類似度算出部113は、要求感動ベクトル算出処理で算出した利用者の気分を表す感動ベクトルである要求感動ベクトルと、S5010で読み込んだ検索対象データのレコードについての感動ベクトルである対象感情ベクトルとを比較し、その類似度を算出する(S5020)。ここで類似度は、例えばベクトル間のユークリッド距離によって計算することができる。例えば5つの感動項目からなる要求感動ベクトルが(a1、a2、a3、a4、a5)で、読み込んだ検索対象データのレコードの感動ベクトルが(b1、b2、b3、b4、b5)の場合、類似度dは下記の数式で計算することができる。なお、感動ベクトル間の類似度の算出には、コサイン距離、ピアソン相関、Jaccard係数、協調フィルタリングなどの、既存技術を用いることもできる。
Figure 0007261107000001
次に、類似度算出部113は、感動ベクトルテーブル154に検索対象データについての次レコードがあるか否かを調べ(S5030)、次レコードがあると判定した場合(S
5030)、S5010に戻って該当レコードを読み込み類似度の計算を繰り返す。S5030で次レコードがないと判定した場合(S5030,No)、類似度算出部113は、算出した類似度に応じて検索対象データの絞り込みやソートを行い(S5040)、本フローを終了する。この際、絞り込みは、類似度が一定の閾値以上のものを全て抽出するようにしてもよい。あるいは、類似度が高い順に一定数を抽出するようにしてもよい。
抽出された検索対象データは、例えば図9の画面例9020に示すように、情報端末400に表示することができる。利用者が画面例9020においていずれか気に入った候補を選択すると、この選択を受けた情報検索サーバ100は、該当する旅程を含む画面データを情報端末400に返し、情報端末400には図9の画面例9030で示す旅程が、予約操作ボタンとともに表示される。
以上の類似度算出処理によれば、利用者が持っている旅行についての気分を表す感動ベクトルに近い感動ベクトルを有する旅行ブログ等の検索対象データを抽出することができる。
リソース割当て・表示処理
続いて、リソース割当て・表示部114の処理例を、図6のフローチャートを用いて説明する。リソース割当て・表示処理は、類似度算出処理において、要求感動ベクトルに近いとして抽出された旅行ブログの中から、利用者が選択した旅行ブログの旅程に従って、宿泊施設、交通機関などの予約を行って利用者に提示する機能である(図9の符号9040、9050)。リソース割当て・表示処理は、利用者が気に入った旅行を見つけて、予約処理を選択した時に実行するものとする。
リソース割当て・表示処理部114は、利用者が使用している情報端末400から予約処理開始指示を受けることで処理を開始する。リソース割当て・表示部114は、最初に、情報端末400に画面9040の画面データを送って表示させ、利用者から予約条件の入力を受け付ける(S6010)。ここで予約条件は、例えば該当する旅行の出発日及び帰着日、旅行する大人・子供の人数、予算の下限・上限などであるがこれらの項目に限られない(禁煙ルームの指定などの条件を含めてもよい)。次に、リソース割当て・表示部114は、利用者が選択した旅行の旅程データを読み込み、複数の行程に分割する(S6020)。ここで行程とは、例えば飛行機でAからBへ移動する、観光施設Cで過ごす、店舗Dで食事する、ホテルEで宿泊する、などの、旅程に含まれるアクティビティの要素である。なお、旅程データとしては、旅行業者などの運営サイトに投稿された旅行ブログ等のテキストデータ自体を用いて文章解析により抽出することができ、また、該当する旅行ブログにすでに旅程表が付随している場合であれば、それを利用することもできる。
次に、リソース割当て・表示部114は、前記行程から、予約が必要な行程(例えばホテルの部屋、観光施設の入場券、飛行機の座席など)を抽出し、S6010で入力された予約条件での予約が可能か否かをリソース管理サーバ1020に問い合わせる(S6030)。予約できない行程があると判定した場合(S6040,No)、リソース割当て・表示部114は、まず代替の他の行程がリソースとして確保できるかを調べる(S6050)。代替の他の行程がないと判定した場合(S6050,No)、リソース割当て・表示部114はそのまま処理を終了する。
一方、代替の他の行程が確保できると判定した場合(S6050,Yes)、リソース割当て・表示部114は、該行程に対して別の行程を割り当てた旅程を作成した後、該旅程についての感動ベクトルを算出し、要求感動ベクトル算出処理で算出されている利用者の感動ベクトルとの類似度を類似度算出部114によって算出する(S6060)。例えば図9の例では、利用者が選択した旅行の旅程では、「サッポロホテル」での宿泊となっているところ(符号9030)、予約条件に応じた当該ホテルの空きがなかったため、画
面例9050に示すように、「ホテル新北海道」が提示されている。このホテルの変更に伴う対象感動ベクトルの再計算に当たっては、例えば対象旅行ブログ中に含まれている「サッポロホテル」に関する記載を「ホテル新北海道」について記載されている他の記事等のテキスト情報と入れ替えて再度対象感動ベクトルを算出するといった手法が考えられる。例えば旅程に含まれているイベントが入力された予約条件による旅行期間では開催されていないといった場合には、対象旅行ブログ中に含まれる当該イベントに関する記載を削除した上で対象感動ベクトルを再計算するといった対応をとることができる。
次に、図6において、リソース割当て・表示部114は、S6050で算出したリソース変更後の旅程についての類似度と、リソース変更前の旅程についての類似度とを比較し、類似度が一定以上低下していると判定した場合(S6070,Yes)別のリソースに変更した行程は利用者が要求する感動体験に合っていないとみなし、さらに別のリソース割当ての試行を繰り返す(S6060)。S6070で類似度が一定以上低下しないと判定するか(S6070,No)、S6040で空きリソースがあると判定された場合(S6040,Yes)、リソース割当て・表示部114は、該旅程を情報端末400に、図9の画面例9050で示すように表示し(S6080)、本フローを終了する。
以上のリソース割当て・表示処理によれば、利用者が気に入った旅行についてその旅行に必要な宿泊施設、交通機関、イベント、食事などのリソースを、希望の条件の下に予約して確保することができる。また、いずれかのリソースが確保できないと判定された場合には、感動ベクトルの類似度が一定以上低下しないという条件の下で、代替のリソースが提案される。したがって、利用者が求める感動と近い感動を体験することが可能と考えられる旅程が提案される。
なお、本実施形態では、利用者が気分に合う旅行を検索・予約する例を説明したが、本発明の適用範囲はそれに限定されるものではない。映画、美術、工芸、音楽といったアートの紹介、人やサービスの仲介など、利用者の気分や嗜好に合った感動をもたらすコンテンツの検索対象となる他データに対して適用することもできる。
このように、本発明の一実施形態によれば、感動ベクトルという指標を導入して利用者の潜在的な要望を要求感動ベクトルの形態で取得することにより、キーワード検索用の辞書作成の手間をかけることなく、旅行や映画の体験記のような、高度かつ多様な要因のある感動を伴うコンテンツに関して、感動ベクトルの比較演算に基づく適切な情報検索を実現することができる。さらに感動のポイントとなる要素を損なうことなく、検索者が指定した予約条件、および予約対象リソースの空き状況を考慮して再構成されたコンテンツを用いて、感動の追体験を容易に行うことができる。
変形例
本実施形態では、検索対象データとして旅行ブログのようなテキストデータを処理する例で説明したが、それに限定されるものではなく、静止画、音声、動画データなども検索対象データとすることができる。例えば画像データの場合は、感動項目名として画像から判断できる感動項目名(例えば「一瞬の自然美に見とれる」)を定義し、時系列ストーリーとして画像の特徴を抽出するルール(例えば「画像検出で山を検出し、さらに山と山影の位置関係が線対称であることを検出する」)を定義することで実現できる。
また本実施形態では、利用者が要求する事象に対する感動ベクトルを算出するために、利用者に複数の要求分析用画像を提示し、選択させているが、それ以外の方法で要求する感動ベクトルを算出してもよい。例えば、あるWebサイト上で他のWebサイトへ誘導する方法の1つとしてバナー広告があるが、複数種類のバナーをランダムに切り替えて情報端末400に表示し、どの画像のバナーが選択されたかによって感動ベクトルを算出するようにしてもよい。
また本実施形態では、図9の画面9020に例示するように、類似度が高い方の候補名のみを表示しているが、同時に感動項目ごとのマッチ度を表示するようにしてもよい。図10に、感動項目ごとのマッチ度の表示画面例10010を示す。例えば要求分析用画像が利用者の気分に合っているかを選択した結果、自分がどの感動項目に対する要求度が高いのかを、要求感動ベクトルを用いて表示することができる。あるいは選択した旅行プランの候補が持っている対象感動ベクトルが、要求感動ベクトルにどれくらい合っているかを、感動項目ごとの類似度を用いて表示することができる。例えば図10の例では、感動項目1については利用者の要求度が高い、あるいは旅行プラン候補とのマッチ度が高く、感動項目3についてはいずれも低い、ということが直感的に把握される。
あるいは、図10の感動項目ごとのマッチ度の表示画面例10010は、コンテンツ登録者に対して提供するようにしてもよい。検索対象データ全体に対して算出された感動ベクトルの傾向を表示することで、コンテンツ登録者(例えば旅行ブログ作者)は、登録数が少ない感動項目に関する記事を狙って投稿すればアクセスを伸ばすことができるといったように利用することができる。あるいは、利用者によって追体験された旅行プランに関して算出された感動ベクトルの傾向を表示することで、コンテンツ登録者はより利用者に訴求するような、アクセス・予約率を伸ばせる記事を狙って投稿することができる。
あるいは、図10の感動項目ごとのマッチ度の表示画面例10010は、宿泊施設等のリソース運営者に対して提供するようにしてもよい。運営者が管理するリソース(例えばホテルなど)について算出された感動ベクトルと、当該リソースを含む旅行プランを検索・予約した利用者の要求感動ベクトルとを比較することにより、例えば利用者は感動項目1に対する要求が高かったが、ホテルは異なる感動項目2に対する感動量が高く判定されたとすれば、ホテルの認識と利用者の要求との間にミスマッチが生じていると考えられる。そこで、ホテルとしては、利用者の要求が高い感動項目1の感動量が上がるようにホテルを改装する、といった誘客のための施策検討に役立てることができる。
また本実施形態で例示した「意外なことに遭遇する」という感動項目では、追体験する前に「意外なこと」の内容が利用者に分かってしまうと、追体験した時の感動が小さくなると考えられる。そこで本感動項目の場合には、図9の画面9030や画面9050で示される旅程を表示する時に、意外なこと(例えば図9の画面9030,9050における「大自然を」の語句)を隠して表示するようにしてもよい(なお、図9では理解に資するために破線で囲んで示している)。このような表示制御は、例えば、図3の対象感動ベクトル算出ステップであるS3050で、検索対象データ中の驚きを示す単語や感嘆符や絵文字が検出された文章の部分を記憶しておき、図5の類似度算出処理におけるS5040や図6のリソース割当て・表示処理におけるS6080で表示する時に当該部分を削除したり、別の文字や図形に置換したりすることで実現することができる。
なお、本発明の技術的範囲は上記の実施形態に限定されることはなく、他の変形例、応用例等も、特許請求の範囲に記載した事項の範囲内に含まれるものである。
100…情報検索サーバ 110…演算部 111…対象感動ベクトル算出部
112…要求感動ベクトル算出部 113…類似度算出手段
114…リソース割当て・表示部 120…入力部 130…出力部
140…通信処理部 150…記憶管理部 151…検索対象データ
152…要求分析用データ 153…感動ベクトル算出ルールテーブル
154…感動ベクトルテーブル 200…リソース管理サーバ
300…関連情報サーバ 400…情報端末 N…通信ネットワーク

Claims (10)

  1. 人の感動を引き起こす複数の要因をそれぞれ示すデータである感動項目と、各前記感動項目に関する該当性を表す指標である感動量とが対応づけられてなる一群のデータである感動ベクトルが、人の感動に対する感受傾向を調べるための資料として人に提示される基準試料についてあらかじめ設定されて該当基準試料とともに格納されている記憶デバイスと、プロセッサとを備えるコンピュータが、
    検索対象データのコンテンツを解析して、当該検索対象データについて各前記感動項目ごとの前記感動量を計算して前記検索対象データについての前記感動ベクトルを算出し、
    各前記基準試料に対する利用者の応答内容に基づいて、当該利用者が要求する事象についての感動ベクトルを算出し、
    前記検索対象データについて算出された前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとを比較演算することにより、前記利用者について算出された前記感動ベクトルに近い前記感動ベクトルを示す前記検索対象データを抽出する、
    情報検索方法。
  2. 前記検索対象データについて算出された前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとの第1の類似度を算出し、
    抽出された前記検索対象データによって特定される内容を前記利用者が体験するときに確保すべきリソースについて、前記利用者が入力する条件に応じて当該リソースを検索し、該当するリソースが確保可能である場合にはその旨を出力し、
    該当するリソースが確保できない場合には、前記利用者が入力する条件を満足する、確保可能な他のリソースを検索して抽出し、
    抽出された前記他のリソースによって前記検索対象データに含まれる前記リソースを置き換えた上で当該検索対象データについて前記感動ベクトルを算出し、
    前記他のリソースに置き換えた前記検索対象データについて算出した前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとの第2の類似度を算出し、
    前記他のリソースに置き換える前の前記検索対象データを用いて算出された前記第1の類似度から前記他のリソースに置き換えた後の前記検索対象データを用いて算出された前記第2の類似度への減少が一定値以内であると判定した場合、当該他のリソースが確保可能である旨を出力し、前記第1の類似度からの減少が一定値を超えていると判定した場合、さらに他のリソースの検索を実行する、
    請求項1に記載の情報検索方法。
  3. 前記感動項目のうちに、複数の特定の条件が、時系列に充足されると判定された場合に、当該感動項目に関する前記感動量が増加される感動項目が含まれる、請求項1に記載の情報検索方法。
  4. 前記感動項目のうちに、当該感動項目と関連付けられた関連情報を解析した結果、特定の条件が充足されると判定された場合、当該感動項目に関する前記感動量が増加される感動項目が含まれる、請求項1に記載の情報検索方法。
  5. 前記関連情報が、前記コンピュータが通信可能に接続されている、ソーシャルネットワーキングサービス、オンライン百科事典サービス、及びオンラインオークションサービスのいずれかを提供するサーバから取得されるデータである、請求項に記載の情報検索方法。
  6. 前記感動項目に対応づけられている、人の感動を引き起こす要因に関して、前記検索対象データ中に、当該要因に対応するとして抽出された前記検索対象データのコンテンツ部分について、前記検索対象データを表示する場合に、当該コンテンツ部分のみが表示されないように加工して表示する、請求項1に記載の情報検索方法。
  7. 前記プロセッサが、前記基準試料又は前記検索対象データについて、前記感動項目と、前記感動項目それぞれに関する前記感動量とを対応づけて出力する、請求項1に記載の情報検索方法。
  8. 人の感動を引き起こす複数の要因をそれぞれ示すデータである感動項目と、各前記感動項目に関する該当性を表す指標である感動量とが対応づけられてなる一群のデータである感動ベクトルが、人の感動に対する感受傾向を調べるための資料として人に提示される基準試料についてあらかじめ設定されて該当基準試料とともに格納されている記憶デバイスと、プロセッサとを備え、前記プロセッサが、
    検索対象データのコンテンツを解析して、当該検索対象データについて各前記感動項目ごとの前記感動量を計算して前記検索対象データについての前記感動ベクトルを算出し、
    各前記基準試料に対する利用者の応答内容に基づいて、当該利用者が要求する事象についての感動ベクトルを算出し、
    前記検索対象データについて算出された前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとを比較演算することにより、前記利用者について算出された前記感動ベクトルに近い前記感動ベクトルを示す前記検索対象データを抽出する、
    情報検索装置。
  9. 前記プロセッサが、
    前記検索対象データについて算出された前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとの第1の類似度を算出し、
    抽出された前記検索対象データによって特定される内容を前記利用者が体験するときに確保すべきリソースについて、前記利用者が入力する条件に応じて当該リソースを検索し、該当するリソースが確保可能である場合にはその旨を出力し、
    該当するリソースが確保できない場合には、前記利用者が入力する条件を満足する、確保可能な他のリソースを検索して抽出し、
    抽出された前記他のリソースによって前記検索対象データに含まれる前記リソースを置き換えた上で当該検索対象データについて前記感動ベクトルを算出し、
    前記他のリソースに置き換えた前記検索対象データについて算出した前記感動ベクトルと、前記利用者について算出された前記感動ベクトルとの第2の類似度を算出し、
    前記他のリソースに置き換える前の前記検索対象データを用いて算出された前記第1の類似度から前記他のリソースに置き換えた後の前記検索対象データを用いて算出された前記第2の類似度への減少が一定値以内であると判定した場合、当該他のリソースが確保可能である旨を出力し、前記第1の類似度からの減少が一定値を超えていると判定した場合、さらに他のリソースの検索を実行するリソース割当て部をさらに備えている、
    請求項に記載の情報検索装置。
  10. 前記感動項目のうちに、複数の特定の条件が、時系列に充足されると判定された場合に、当該感動項目に関する前記感動量が増加される感動項目が含まれる、請求項に記載の情報検索装置。
JP2019124148A 2019-07-03 2019-07-03 情報検索方法及び情報検索装置 Active JP7261107B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019124148A JP7261107B2 (ja) 2019-07-03 2019-07-03 情報検索方法及び情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019124148A JP7261107B2 (ja) 2019-07-03 2019-07-03 情報検索方法及び情報検索装置

Publications (2)

Publication Number Publication Date
JP2021009633A JP2021009633A (ja) 2021-01-28
JP7261107B2 true JP7261107B2 (ja) 2023-04-19

Family

ID=74199519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019124148A Active JP7261107B2 (ja) 2019-07-03 2019-07-03 情報検索方法及び情報検索装置

Country Status (1)

Country Link
JP (1) JP7261107B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7353318B2 (ja) * 2021-03-19 2023-09-29 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7046254B1 (ja) 2021-06-14 2022-04-01 エヌ・ティ・ティ・コミュニケーションズ株式会社 作成装置、作成方法及び作成プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140123165A1 (en) 2011-06-28 2014-05-01 Tata Consultancy Services Limited Method and system for context-aware recommendation

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3140944B2 (ja) * 1995-06-20 2001-03-05 松下電器産業株式会社 感性入力装置及びデータ検索装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140123165A1 (en) 2011-06-28 2014-05-01 Tata Consultancy Services Limited Method and system for context-aware recommendation

Also Published As

Publication number Publication date
JP2021009633A (ja) 2021-01-28

Similar Documents

Publication Publication Date Title
Li et al. Making restaurant reviews useful and/or enjoyable? The impacts of temporal, explanatory, and sensory cues
Toral et al. Identification of the unique attributes of tourist destinations from online reviews
Choi et al. Understanding the sources of online travel information
Mehraliyev et al. Sentiment analysis in hospitality and tourism: a thematic and methodological review
Twenge et al. Declines in American adults’ religious participation and beliefs, 1972-2014
Lecheler et al. The mediating role of emotions: News framing effects on opinions about immigration
Ahmad et al. How do expressed emotions affect the helpfulness of a product review? Evidence from reviews using latent semantic analysis
Ayeh et al. “Do we believe in TripAdvisor?” Examining credibility perceptions and online travelers’ attitude toward using user-generated content
Barlas et al. To" see" is to stereotype: Image tagging algorithms, gender recognition, and the accuracy-fairness trade-off
Filieri et al. E-WOM and accommodation: An analysis of the factors that influence travelers’ adoption of information from online reviews
Nunkoo et al. Use of structural equation modeling in tourism research: Past, present, and future
Kern et al. The online social self: An open vocabulary approach to personality
US10235470B2 (en) User retrieval enhancement
Teso et al. Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective
Wickham et al. Examining temporal processes in diary studies
Etemad-Sajadi et al. Airline passenger loyalty: The distinct effects of airline passenger perceived pre-flight and in-flight service quality
Zheng et al. Identifying unreliable online hospitality reviews with biased user-given ratings: A deep learning forecasting approach
JP6381775B2 (ja) 情報処理システム及び情報処理方法
KR101448228B1 (ko) 소셜 데이터 분석 장치 및 방법
Moro et al. Evaluating a guest satisfaction model through data mining
Torche et al. Declining racial stratification in marriage choices? Trends in black/white status exchange in the United States, 1980 to 2010
Phillips et al. The influence of geographic and psychic distance on online hotel ratings
Morosan Information disclosure to biometric e-gates: the roles of perceived security, benefits, and emotions
Yousefian Jazi et al. An emotion-aware music recommender system: bridging the user’s interaction and music recommendation
JP7261107B2 (ja) 情報検索方法及び情報検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230407

R150 Certificate of patent or registration of utility model

Ref document number: 7261107

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150