JP2022136506A - 検索システム、検索方法、及びプログラム - Google Patents

検索システム、検索方法、及びプログラム Download PDF

Info

Publication number
JP2022136506A
JP2022136506A JP2021036147A JP2021036147A JP2022136506A JP 2022136506 A JP2022136506 A JP 2022136506A JP 2021036147 A JP2021036147 A JP 2021036147A JP 2021036147 A JP2021036147 A JP 2021036147A JP 2022136506 A JP2022136506 A JP 2022136506A
Authority
JP
Japan
Prior art keywords
search
tags
remaining candidate
tag
candidate tags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021036147A
Other languages
English (en)
Inventor
康高 畠
Yasutaka Hata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP2021036147A priority Critical patent/JP2022136506A/ja
Publication of JP2022136506A publication Critical patent/JP2022136506A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】データに対応付けられたタグを利用してデータの検索を行うにあたり、絞り込み検索が効率よく行われるようにする。【解決手段】検索条件を取得する検索条件取得部と、タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索部と、前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外部と、前記タグ除外部により除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出部と、少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定部と、前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定部とを備えて検索システムを構成する。【選択図】図8

Description

本発明は、検索システム、検索方法、及びプログラムに関する。
コンテンツにタグを付与し、入力タグとコンテンツに付与されるタグとを照合してコンテンツの検索を行うようにされた技術が知られている(例えば、特許文献1参照)。
特開2016-62338号公報
多数のデータが検索された場合には、検索された多数のデータからさらに検索候補となるデータを絞り込むための絞り込み検索を行うことが有効である。データに対応付けられたタグを利用してデータの検索を行う場合においても絞り込み検索が効率よく行われるようにすることが好ましい。
本発明は、このような事情に鑑みてなされたもので、データに対応付けられたタグを利用してデータの検索を行うにあたり、絞り込み検索が効率よく行われるようにすることを目的とする。
上述した課題を解決する本発明の一態様は、検索条件を取得する検索条件取得部と、タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索部と、前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外部と、前記タグ除外部により除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出部と、少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定部と、前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定部とを備える検索システムである。
本発明の一態様は、検索システムにおける検索方法であって、検索条件を取得する検索条件取得ステップと、タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索ステップと、前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外ステップと、前記タグ除外ステップにより除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出ステップと、少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定ステップと、前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定ステップとを含む検索方法である。
本発明の一態様は、検索システムにおいて備えられるコンピュータを、検索条件を取得する検索条件取得部、タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索部、前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外部、前記タグ除外部により除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出部、少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定部、前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定部として機能させるためのプログラムである。
本発明によれば、データに対応付けられたタグを利用してデータの検索を行うにあたり、絞り込み検索が効率よく行われるようになるという効果が得られる。
第1実施形態に係る検索システムの全体的構成例を示す図である。 第1実施形態に係るチャットボットアプリケーションのアプリケーション画面の態様例を示す図である。 第1実施形態に係る仕様書の管理態様例を示す図である。 第1実施形態に係る検索結果の一例を示す図である。 第1実施形態に係る検索結果から非有用タグを序がした結果を示す一例を示す図である。 第1実施形態に係る残存候補タグごとに付与先を要素とした集合間の関係の一例を示す図である。 第1実施形態に係る残存候補タグごとの総合類似度の一例を示す図である。 第1実施形態に係る残存候補タグごとの総合類似度、網羅度、優先度の一例を示す図である。 第1実施形態に係る選択肢抽出処理の結果の一例を示す図である。 第1実施形態に係る仕様書サーバの機能構成例を示す図である。 第1実施形態に係る仕様書サーバが仕様書の検索に対応して実行する処理手順例を示すフローチャートである。 第1実施形態に係る仕様書サーバが仕様書の検索に対応して実行する処理手順例を示すフローチャートである。 第2実施形態に係る仕様書の管理態様例を示す図である。 第2実施形態に係る残存候補タグを商品のカテゴリごとに区分した結果を示す図である。 第2実施形態に係るカテゴリ単位における残存候補タグごとの総合類似度、網羅度、及び優先度の算出結果の一例を示す図である。 第2実施形態に係るチャットボットアプリケーションのアプリケーション画面の態様例を示す図である。 第2実施形態に係る仕様書サーバが実行する選択肢抽出処理の手順例を示すフローチャートである。 実施形態の変形例に係る付与先重複タグの除外の手順例を説明する図である。
<第1実施形態>
[検索システムの構成例]
図1は、本実施形態の検索システムの全体的な構成例を示している。本実施形態の検索システムとして、各種商品のパッケージを製品として提供する企業の営業担当者等が、スマートフォン等の携帯型の端末に実装されたチャットボットを利用して、当該企業が製品として販売するパッケージの仕様書(検索対象のデータの一例)の検索を行うようにされた構成を例に挙げる。
同図に示されるように、本実施形態の検索システムは、ユーザ端末100、チャットボットサーバ200、及び仕様書サーバ300を備える。
ユーザ端末100は、営業担当者等のユーザが仕様書の検索に利用する携帯型の端末である。ユーザ端末100は、例えばスマートフォンやタブレット端末等であってよい。なお、ユーザ端末100は、ラップトップ型あるいはデスクトップ型のパーソナルコンピュータ等であってもよいが、以降においては、携帯型の端末である場合を例に説明する。
ユーザ端末100には、チャットボットアプリケーション(対話アプリケーションの一例)がインストールされる。チャットボットアプリケーションが動作するユーザ端末100チャットボットサーバ200と通信を行うことで、ユーザとチャットボットアプリケーション上のキャラクタとの間での音声またはテキストによる会話(対話)が実現される。
仕様書サーバ300は、パッケージを製品として提供する企業が運用するサーバであって、当該企業が製品として提供しているパッケージごとの仕様を記述した仕様書を記憶するサーバである。
チャットボットサーバ200は、仕様書サーバ300と通信可能に接続されている。このようにチャットボットサーバ200と仕様書サーバ300とが接続されていることで、ユーザは、ユーザ端末100上で動作するチャットボットアプリケーションを利用して仕様書の検索を行うことができる。
[検索手順例]
本実施形態の検索システムにおいて行われる仕様書の検索の手順例について説明する。
ユーザは、仕様書を検索するにあたり、自分の所持するユーザ端末100にてチャットボットアプリケーションを起動させる。チャットボットアプリケーションが起動されて、チャットボットアプリケーションのアプリケーション画面が表示された状態のもとで、ユーザは、仕様書を検索するための検索キー(検索条件)を反映させた内容のメッセージを入力する。
本実施形態において、チャットボットアプリケーションは、テキスト入力操作と音声入力とのいずれによってもメッセージの入力を受け付け可能とされてよい。音声入力の場合には、ユーザ端末100が入力された音声について音声認識処理を行ってテキストメッセージに変換する。
図2(A)は、チャットボットアプリケーションのアプリケーション画面の一例を示している。同図のアプリケーション画面においては、チャットボットのキャラクタが検索キーの入力を促すメッセージMS1が表示されており、当該メッセージMS1に応じて、ユーザが、メーカAの仕様書の検索を指示するメッセージMS2を入力した例が示されている。つまり、この場合には、仕様書検索のための検索キーとしてユーザにより「メーカA」が指定された。
メッセージMS2の入力を受け付けたユーザ端末100のチャットボットアプリケーションは、当該メッセージMS2のテキストを含む検索要求をチャットボットサーバ200に送信する。チャットボットサーバ200は、送信された検索要求を仕様書サーバ300に転送する。
仕様書サーバ300は、転送された検索要求を受信する。仕様書サーバ300は、受信した検索要求に含まれているメッセージMS2のテキストから検索キーを取得する。この際、仕様書サーバ300は、例えば自然言語処理によりメッセージMS2のテキストを解析した結果に基づいて検索キーを抽出するようにされてよい。
同図の例では、仕様書サーバ300は、「メーカAの仕様書を見せて」とのメッセージMS2のテキストから「メーカA」との名詞としての単語の文字列を検索キーとして取得する。
仕様書サーバ300は、仕様書を記憶している。図3は、仕様書サーバ300が記憶する仕様書の管理態様例を示している。同図においては、仕様書ごとにレコードが設けられたテーブルによる形式として示されている。
同図のテーブルにおける1レコードが1つの仕様書に対応する。1の仕様書に対応するレコードは、仕様書ID、仕様書データ、及びタグの領域を含む。
仕様書IDの領域は、対応の仕様書を一意示す仕様書IDを格納する。
仕様書データの領域は、対応の仕様書の実体的内容を示すデータ(仕様書データ)を格納する。
タグの領域は、対応の仕様書に対応付けられた(付与された)タグを格納する。タグは、仕様書の検索にあたり、検索キーと比較される単語、語句等として機能する。つまり、本実施形態における仕様書の検索は、検索キーと一致するタグを有する仕様書を検索するものである。
同図においては、具体例として、仕様書サーバ300が、SF001~SF009の仕様書IDごとに対応する9つの仕様書を記憶している例が示されている。また、具体的に、仕様書IDがSF001の仕様書については、「メーカA」、「菓子」、「パウチ」、「スナック」の4つのタグが対応付けられた例が示されている。
説明を図2に戻す。仕様書サーバ300は、取得した検索キーと一致するタグが付与された仕様書を検索する。検索の結果、検索された仕様書の数(検索件数)が所定以下の場合には、仕様書サーバ300は、検索された仕様書の情報を含む検索結果情報を、チャットボットサーバ200に送信する。
チャットボットサーバ200は、受信された検索結果情報に基づいて、チャットボットアプリケーションに対応するメッセージ形式による検索結果メッセージを生成する。チャットボットサーバ200は、生成した検索結果メッセージを検索要求の送信元のユーザ端末100に送信する。検索結果メッセージを受信したユーザ端末100のチャットボットアプリケーションは、受信された検索結果メッセージを表示する。
図2(B)は、検索結果メッセージMS4(MS4-1、MS4-2)の態様例を示している。同図の検索結果メッセージMS4は、まず、検索結果メッセージMS4-1により例えば「3件の品目があります。」のようにして、検索件数を報知したうえで、次に検索結果メッセージMS4-2により、検索された仕様書の一覧を示す仕様書リストが示される。例えばユーザが仕様書リストにおけりリスト項目Itmに対してタップ操作を行うことで、ユーザ端末100が対応の仕様書のURLにアクセスし、仕様書を表示するようにされている。これにより、ユーザは、検索された仕様書を閲覧することができる。
一方、検索件数が所定以上である場合に仕様書リストによる検索結果メッセージMS4-2を表示させると、仕様書リストにおけるリスト項目Itmの数も多くなるため、かえって、目的の仕様書のリスト項目Itmを見つけにくい。
そこで、検索件数が所定以上である場合には、仕様書サーバ300は、検索された仕様書に付与されているタグのうちから、絞り込み検索での検索条件の選択肢を抽出する処理(選択肢抽出処理)を行う。仕様書サーバ300は、選択肢抽出処理による選択肢の抽出結果が反映された絞り込み検索情報をチャットボットサーバ200に送信する。
チャットボットサーバ200は、受信された絞り込み検索情報に基づいて、チャットボットアプリケーションに対応するメッセージ形式による絞り込み検索メッセージを生成する。チャットボットサーバ200は、生成した絞り込み検索メッセージを検索要求の送信元のユーザ端末100に送信する。絞り込み検索メッセージを受信したユーザ端末100のチャットボットアプリケーションは、受信された絞り込み検索メッセージを表示する。
図2(C)は、絞り込み検索メッセージMS5(MS5-1、MS5-2)の態様例を示している。同図の絞り込み検索メッセージMS5として、まず、絞り込み検索メッセージMS5-1が表示されている。絞り込み検索メッセージMS5-1は、7件の検索結果が得られたことから、絞り込み検索のための検索条件(絞り込み条件)を選択してもらうことをユーザに案内するメッセージ内容を有する。
次に、絞り込み検索メッセージMS5として、絞り込み検索メッセージMS5-2が表示されている。
絞り込み検索メッセージMS5-2においては、絞り込み検索のための操作が行われる絞り込み検索画面が表示されている。同図の絞り込み検索画面においては、絞り込み条件選択ボタンBT11(BT11-1、BT11-2、BT11-10が配置された例が示されている。
この場合、絞り込み条件選択ボタンBT11-1、BT11-2は、それぞれ、絞り込み条件として「パウチ」、「うま塩」が示されている。絞り込み条件選択ボタンBT11-1、BT11-2のそれぞれに対応する「パウチ」、「うま塩」の絞り込み条件は、チャットボットサーバ200の選択肢抽出処理によって、検索された仕様書に付与されているタグのうちから抽出されたタグである。
絞り込み条件選択ボタンBT11-10に対応する「その他」の絞り込み条件は、検索された仕様書のうちで選択肢抽出処理によって抽出されたタグが付与されていない仕様書に対応して付加されたものである。
ユーザは、絞り込み検索メッセージMS5-2において表示された絞り込み検索画面に対する操作として、絞り込み条件選択ボタンBT11のうちから、適切と判断した絞り込み条件に対応する絞り込み条件選択ボタンBT11に対するタップ操作を行う。タップ操作が行われた絞り込み条件選択ボタンBT11は、所定の態様による強調表示に変化することで、対応の絞り込み条件が選択状態であることを示す。
このようにして1つの絞り込み条件を選択したうえで、ユーザは実行ボタンBT21に対するタップ操作を行う。つまり、絞り込み検索の実行を指示する操作を行う。
なお、絞り込み条件選択ボタンBT11を選択状態とする操作と、絞り込み検索の実行を指示する操作は、ユーザの音声入力によって行えるようにされてもよい。
上記のように絞り込み検索の実行を指示する操作が行われたことに応じて、ユーザ端末100のチャットボットアプリケーションは、実行ボタンBT21が操作されたときに選択状態にあった絞り込み条件選択ボタンBT11に対応する絞り込み条件を含む検索要求をチャットボットサーバ200に送信する。チャットボットサーバ200は、受信された検索要求を仕様書サーバ300に送信(転送)する。
仕様書サーバ300は、先の検索結果に含まれる仕様書のうちから、受信された検索要求に含まれる絞り込み条件と一致するタグが付与された仕様書を検索する。
検索の結果として、検索件数が所定以下の場合には、仕様書サーバ300が検索結果情報をチャットボットサーバ200に送信する。チャットボットサーバ200は、受信した検索情報に応じて生成した検索結果メッセージを、検索要求の送信元のユーザ端末100に送信する。これにより、ユーザ端末100にて、図2(B)の例のようにして、チャットボットアプリケーションのアプリケーション画面にて、検索要求の送信元の検索結果メッセージの表示による検索結果の提示が行われる。
一方、検索の結果として、検索件数が所定以上の場合には、仕様書サーバ300が、さらに今回検索された仕様書に付与されたタグを対象として選択肢抽出処理を行う。仕様書サーバ300は、選択肢抽出処理によるタグ抽出結果が反映された絞り込み検索情報をチャットボットサーバ200に送信する。チャットボットサーバ200は、受信した絞り込み検索情報に応じて生成した絞り込み検索メッセージを送信する。絞り込み検索メッセージを受信したユーザ端末100のチャットボットアプリケーションは、図2(C)に例示したように絞り込み検索メッセージを表示する。
[選択肢抽出処理について]
上記のようにして、本実施形態においては、ユーザがユーザ端末100にインストールされたチャットボットアプリケーションを利用して検索を行うことができる。また、検索件数が一定以上となった場合には、検索結果(検索された仕様書)の提示に代えて、図2(C)に例示したように、絞り込み検索のための条件の選択肢(絞り込み条件選択肢)が提示される。
絞り込み条件選択肢は、前述のように、仕様書サーバ300が、選択肢抽出処理を行うことにより得られる。
そこで、図4~図9を参照して、仕様書サーバ300が実行する選択肢抽出処理の一具体例について説明する。
図4は、「メーカA」を検索キーとして仕様書を検索した結果の一具体例が示されている。同図は、図3に示すようにして仕様書サーバ300が記憶する9つの仕様書を対象に検索を行った結果を示している。図4においては、検索結果として、仕様書サーバ300が記憶するSF001~SF009ごとに対応する9つの仕様書のうちから、SF001~SF007ごとに対応する7つの仕様書が検索された例を示している。
また、図4においては、検索された仕様書ごとに付与されているタグとして、検索キーとされた「メーカA」以外のタグが示されている。同図によれば、例えば仕様書IDがSF001の仕様書については、「菓子」「パウチ」「スナック」の3つのタグが付与されることが把握される。
また、同図によっては、検索された7つの仕様書において、どのようなタグがどの仕様書に対して共通に付与されているにかについては把握される。例えば、「菓子」のタグは、検索された7つの仕様書のいずれにも付与されていることが把握される。また、「うま塩」のタグは、検索された7つの仕様書のうち、SF004~SF006の3つの仕様書に付与されていることが把握される。
また、同図によっては、検索された7つの仕様書に付与されているタグ(候補タグ)のそれぞれがどのようなものであるのかも把握される。以降において、検索された仕様書に付与されているタグについては、絞り込み条件選択肢の候補となることから、「候補タグ」とも記載する。
同図では、具体例として、検索された7つの仕様書に付与された候補タグが「菓子」、「パウチ」、「スナック」、「うま塩」、「二次容器」、「焼きそば」の6つであることが示される。
また、以降の説明において、検索された7つの仕様書については、「絞り込み検索対象の仕様書」とも記載する場合がある。
ここでは、図4のように7つの仕様書が検索された場合は、検索件数が一定以上である場合となる。そこで、この場合の仕様書サーバ300は、選択肢抽出処理を実行する。
選択肢抽出処理として、仕様書サーバ300は、まず、図4のように検索された7つの仕様書に対応する6つの候補タグのうちから非有用タグを除外する。
非有用タグは、候補タグのうちで絞り込み条件として有用でないものである。
非有用タグは、1つには、検索された仕様書の全体において付与先の仕様書の占める度合いが一定以上の候補タグ(多数付与タグ)である。このような候補タグを検索キーとして絞り込み検索対象の仕様書を再検索しても、検索結果としては、ほぼ同じ絞り込み検索対象の仕様書が検索されてしまう結果となることから、絞り込みを行うことができないため、絞り込み条件としての有用性はない。
非有用タグは、もう1つには、付与先の仕様書が他の候補タグの付与先の仕様書と重複する度合いが一定以上(一致の場合も含む)の候補タグ(付与先重複タグ)である。図4の場合には、例えば「スナック」の候補タグは、SF001~SF005の仕様書IDによる5つの仕様書が付与先となっている。同様に、「パウチ」の候補タグも、SF001~SF005の仕様書IDによる5つの仕様書が付与先となっている。つまり、「スナック」の候補タグと「パウチ」の候補タグは、付与先の仕様書の内訳が一致している。このような付与先の仕様書の内訳が一致している複数の候補タグのそれぞれを絞り込み条件とした場合、それぞれの絞り込み条件により絞り込み検索を行った結果としては、いずれもSF001~SF005の仕様書IDによる5つの仕様書が検索される。つまり、「スナック」の候補タグにより絞り込み検索を行った場合と、「パウチ」の候補タグにより絞り込み検索を行った場合とでは、検索結果が重複する。この場合、「パウチ」の候補タグと「スナック」の候補タグとのうちのいずれか1つが絞り込み条件とされればよく、残る1つは絞り込み条件とされても有用性はない。
そこで、仕様書サーバ300は、候補タグのうちから非有用タグ(多数付与タグ、付与先重複タグ)を特定し、特定した非有用タグを候補タグから除外する処理を実行する。
ここでの説明では、多数付与タグが、検索された仕様書の全てに付与されている候補タグ(全件付与タグ)とした場合を例に挙げる。この場合、仕様書サーバ300は、「菓子」が全件付与タグであることを特定することになる。そこで、仕様書サーバ300は、「菓子」を候補タグから除外する。
また、ここでの説明では、付与先重複タグとして、付与先の仕様書の内訳が他の候補タグに対して一致している候補タグ(付与先一致タグ)とした場合を例に挙げる。
また、この場合の仕様書サーバ300は、「パウチ」と「スナック」の2つの候補タグが互いに付与先が一致していることを認識することができる。そこで、この場合の仕様書サーバ300は、「パウチ」と「スナック」のうちのいずれか1つを付与先一致タグとして特定したうえで、候補タグから除外する。この場合において、仕様書サーバ300は、「パウチ」と「スナック」のうちからランダムに選択したものを付与先一致タグとして、候補タグから除外するようにしてよい。あるいは、仕様書サーバ300は、例えば過去における検索キーとしての利用頻度や、「メーカA」の検索キーとの関連性などに基づいて、「パウチ」と「スナック」のうちで有用性が高いと判定した一方を候補タグとして残し、他方を付与先一致タグとして候補タグから除外してもよい。ここでは、仕様書サーバ300は、「パウチ」と「スナック」のうち、「スナック」を付与先一致タグとして候補タグから除外した。
図5は、図4の検索結果に対して、上記のようにして候補タグから非有用タグを除外した結果を示している。図5においては、図4において示されていた「菓子」、「スナック」が除外され、「パウチ」、「うま塩」、「二次容器」、「焼きそば」の4つが候補タグとして残されている。以降において、これら4つの候補タグのように、非有用タグとして除外されることなく残された候補タグについては、「残存候補タグ」とも記載する。
上記のようにして非有用タグを除外した後、仕様書サーバ300は、1の残存候補タグの他の残存候補タグの全てに対する総合的な類似度(総合類似度:類似指標値の一例)を、残存候補タグごとに算出する。
統合類似度の算出にあたり、仕様書サーバ300は、まず、残存候補タグの1対1の組み合わせごとの類似度(個別類似度)を算出する。個別類似度の算出にあたり、仕様書サーバ300は、残存候補タグごとに、付与先の仕様書を要素とする集合を形成し、集合間での1対1の類似度を求めるようにされる。このように求められる集合間での類似度が、残存候補タグの組みあわせごとの個別類似度となる。
図6は、図5に示される残存候補タグごとに付与先を要素とした集合間の関係を示す図である。
仕様書サーバ300は、同図に示される集合間の個別類似度を算出する。個別類似度は、一例としてDice係数として求めてよく、以下の(式1)により算出することができる。式1において、残存候補タグの組み合わせは、(tag,tag)により表される。図6との対応では、例えば変数x、yに代入される1~4に、それぞれ「パウチ」、「うま塩」、「二次容器」、「焼きそば」の残存候補タグが対応する。
このように求められる集合間の個別類似度が、「パウチ」、「うま塩」、「二次容器」、「焼きそば」の残存候補タグ間での1対1の組み合わせごとの個別類似度となる。
Figure 2022136506000002
次に、仕様書サーバ300は、上記のようにして算出した個別類似度を利用して、例えば以下の(式2)により残存候補タグごとの総合類似度sim(tag)を算出する。
Figure 2022136506000003
図7は、図6に示される集合関係に対応して求められた残存候補タグの1対1の組み合わせごとの個別類似度と、個別類似度により求められた残存候補タグごとの総合類似度を示している。
例えば、「パウチ」の残存候補タグに注目した場合、「パウチ」と「うま塩」との個別類似度は0.50、「パウチ」と「二次容器」との個別類似度は0.57、「パウチ」と「焼きそば」との個別類似度は0.33である。これら3つの個別類似度を利用して求められる「パウチ」の総合類似度は0.47である。
例えば、算出された総合類似度が高い残存候補タグを選別し、選別された残存候補タグを絞り込み条件選択肢とすることも可能であり、このようにして抽出された絞り込み条件も一定以上の有意性を有している。
しかしながら、付与先の仕様書が少ない残存候補タグであっても総合類似度が比較的高くなる場合がある。付与先の仕様書が少ない残存候補タグは絞り込み検索対象とされた場合に、検索結果が非常に少なくなることから、ユーザの求める検索結果から乖離している場合も多い。そこで、本実施形態においては、より的確な検索結果が得られるようにするため、残存候補タグのうちから付与先の仕様書が少ない残存候補タグについては、絞り込み条件選択肢として除外されるようにする。
このために、仕様書サーバ300は、上記の総合類似度の算出に加えて、残存候補タグごとの網羅度(網羅指標値の一例)を算出する。1の残存候補タグに対応する網羅度は、対応の残存候補タグが付与先となっている絞り込み検索対象の仕様書の数が、絞り込み検索対象の仕様書の総数に対して占める度合い(網羅度合い)である。仕様書サーバ300は、例えば1の残存候補タグに対応する網羅度cv(tag)を、以下の(式3)により求めることができる。つまり、網羅度cv(tag)は、対応の残存候補タグが付与先となっている絞り込み検索対象の仕様書の数を、絞り込み検索対象の仕様書の総数で除算することにより求められる。
Figure 2022136506000004
次に、仕様書サーバ300は、上記のようにして残存候補タグごとに算出された総合類似度と網羅度とに基づいて、残存候補タグごとの優先度を算出する。仕様書サーバ300は、以下の(式4)により、残存候補タグごとの優先度pr(tag)を算出してよい。
Figure 2022136506000005
(式4)において係数cは、優先度の算出における網羅度の重みを調整する機能を有する。係数cが小さいほど、優先度の算出における網羅度の影響が少なくなる。
図8は、上記のようにして残存候補タグごとに算出された総合類似度、網羅度、優先度を示している。
仕様書サーバ300は、残存候補タグごとに算出された優先度に対応する優先順位に従って、上位の所定数の残存候補タグを、絞り込み条件選択肢として決定する。図8の例では、優先順位が高い順から2つの残存候補タグを絞り込み条件選択肢として決定した場合の例が示されている。この場合には、優先度が1番目に高い残存候補タグが「パウチ」であり、優先度が2番目に高い残存候補タグが「うま塩」となっている。この場合、仕様書サーバ300は、「パウチ」と「うま塩」の2つの残存候補タグを絞り込み条件選択肢として決定する。
同図の例では、「二次容器」と「焼きそば」の2つの残存候補タグが絞り込み条件選択肢から除外されたことになる。このように絞り込み条件選択とされずに除外された残存候補タグのうちには、検索された仕様書全体に対する付与先の仕様書の割合が少ないタグ(付与先少数タグ)が含まれ得る。
付与先少数タグが絞り込み条件として使用されて検索が行われたとしても、検索条件に該当する仕様書が相当に少ないために、ユーザが目的とする仕様書を検索できる可能性も相当に低くなってしまう。つまり、付与先少数タグも、多数付与タグ、付与先重複タグと同様に非有用タグに含まれる。上記のように優先順位に従って絞り込み条件選択肢を決定することによっては、非有用タグである付与先少数タグを除外することも可能とされる。
図8の例の場合、9つの絞り込み検索対象の仕様書のうち、仕様書IDがSF001~SF006までの6つの仕様書に対しては、絞り込み条件選択肢として決定された「パウチ」と「うま塩」の2つの残存候補タグのうちの少なくとも1つが付与されている。これに対して、仕様書IDがSF007の仕様書には、絞り込み条件選択肢として決定された「パウチ」と「うま塩」の2つの残存候補タグのいずれも付与されていない。このため、絞り込み条件選択肢が「パウチ」と「うま塩」の2つの残存候補タグのみとされた場合には、いずれの選択肢を検索キーとしても、絞り込み検索により仕様書IDがSF007の仕様書を検索することができなくなる。
そこで、絞り込み検索対象の仕様書のうちで、絞り込み条件選択肢として決定された残存候補タグが付与されていない仕様書(タグ非付与仕様書)がある場合、仕様書サーバ300は、「その他」の選択肢を追加する。仕様書サーバ300は、図8に示すようにして、「その他」の選択肢に対して、タグ非付与仕様書を対応付ける。
これまでの選択肢抽出処理によって、仕様書サーバ300は、図9に示すようにして、絞り込み条件選択肢として、「パウチ」、「うま塩」、「その他」の3つを取得した。仕様書サーバ300は、このように取得した3つの絞り込み条件選択肢が反映された絞り込み検索情報をチャットボットサーバ200に送信する。この結果、ユーザ端末100にて、図2(C)の態様の絞り込み検索メッセージMS5(MS5-1、MS5-2)が表示される。
ユーザが、絞り込み検索メッセージMS5-2における絞り込み条件選択ボタンBT11-1を選択したうえで実行ボタンBT21を操作して絞り込み検索を指示した場合、仕様書サーバ300は、「パウチ」のワードを検索キーとして絞り込み検索対象の仕様書のうちから検索する。
また、ユーザが、絞り込み検索メッセージMS5-2における絞り込み条件選択ボタンBT11-2を選択したうえで絞り込み検索を指示した場合、仕様書サーバ300は、「うま塩」のワードを検索キーとして絞り込み検索対象の仕様書のうちから検索する。
また、ユーザが、絞り込み検索メッセージMS5-3における絞り込み条件選択ボタンBT11-10を選択したうえで絞り込み検索を指示した場合、「その他」が検索キーとなる。この場合、仕様書サーバ300は、絞り込み検索対象の仕様書のうちから「その他」に対応付けたタグ非付与仕様書を検索する。
なお、仕様書サーバ300は、絞り込み検索の指示に応じて、先の仕様書の検索に用いた「メーカA」と今回選択された絞り込み条件選択肢との論理積を検索条件として、全ての仕様書を対象に検索を行ってもよい。
[仕様書サーバの機能構成例]
図10を参照して、本実施形態の仕様書サーバ300の機能構成例について説明する。同図の構成は、仕様書サーバ300が備えるCPU(Central Processing Unit)がプログラムを実行することにより実現される。
同図の仕様書サーバ300は、通信部301、制御部302、及び記憶部303を備える。
通信部301は、ネットワーク経由でチャットボットサーバ200と通信を行う。
制御部302は、仕様書サーバ300における制御を実行する。同図の制御部302は、検索条件取得部321、検索部322、タグ除外部323、類似指標値算出部324、網羅指標値算出部325、優先順位設定部326、及び選択肢決定部327を備える。
検索条件取得部321は、チャットボットサーバ200から送信された検索要求の受信に応じて、受信された検索要求から検索キー(検索条件)を取得する。
検索部322は、検索条件取得部321により取得された検索キー(検索条件)に該当する仕様書(該当データの一例)を、仕様書記憶部331から検索する。
タグ除外部323は、検索部322により検索された仕様書のそれぞれに対応付けられていたタグ(候補タグ)のうちから非有用タグを除外する。
類似指標値算出部324は、タグ除外部により除外されずに残った残存候補タグごとの類似指標値として、総合類似度を算出する。
網羅指標値算出部325は、残存候補タグごとの網羅指標値としての網羅度を算出する。
優先順位設定部326は、残存候補タグの優先順位を設定する。本実施形態において、優先順位設定部326は、総合類似度と網羅度とに基づいて残存候補タグごとの優先度を算出し、算出した優先度に従って、残存候補タグの優先順位を設定する。
選択肢決定部327は、優先順位設定部326により設定された優先順位に基づいて残存候補タグのうちから、絞り込み条件選択肢を決定する。また、選択肢決定部327は、絞り込み検索対象の仕様書のうちで、絞り込み条件選択肢として決定された残存候補タグが付与されていない仕様書(タグ非付与仕様書)がある場合には、当該タグ非付与仕様書を対応付けた「その他」の絞り込み条件選択肢を生成する。
記憶部303は、仕様書サーバ300に関連する情報を記憶する。記憶部303は、仕様書記憶部331を備える。仕様書記憶部331は、仕様書を記憶する。仕様書記憶部331は、図3に例示した構造により仕様書を記憶するようにされてよい。
[処理手順例]
図11、図12のフローチャートを参照して、本実施形態の仕様書サーバ300が仕様書の検索に対応して実行する処理手順例について説明する。
ステップS101:ユーザ端末100から検索要求がチャットボットサーバ200に送信されると、チャットボットサーバ200は、受信した検索要求を仕様書サーバ300に転送する。
仕様書サーバ300において、検索条件取得部321は、転送された検索要求を通信部301経由で受信する。
ステップS102:仕様書サーバ300において、検索条件取得部321は、ステップS101により受信された検索要求から検索キーを取得する。
検索要求が、チャットボットアプリケーションに対する検索指示のメッセージ(例えば、図2(A)のメッセージMS2)の入力に応じてユーザ端末100から送信されたものである場合、検索条件取得部321は、検索要求に含まれるメッセージのテキストを自然言語処理により解析して検索キーとしての単語、語句の文字列を取得する。また、検索要求が、絞り込み検索画面(図2(C)の絞り込み検索メッセージMS5-2)に対する操作に応じてユーザ端末100から送信されたものである場合、検索条件取得部321は、検索要求に含まれる絞り込み条件選択肢としての単語、語句の文字列(例えば、「パウチ」、「うま塩」、「その他」等の文字列)を検索キーとして取得する。
ステップS103:検索部322は、ステップS102により取得された検索キーを用いて仕様書記憶部331から仕様書を検索する。この場合において、検索指示のメッセージの入力に応じた検索キーである場合、検索部322は、仕様書記憶部331に記憶される全ての仕様書を対象として検索を実行する。
一方、絞り込み検索画面に対する操作に応じた検索キーである場合、検索部322は、前回の検索により検索結果として得られた絞り込み検索対象の仕様書を対象として検索を実行する。あるいは、この場合の検索部322は、前回の検索にて使用された検索キーと、絞り込み検索画面に対する操作に応じた検索キーとの論理積を検索条件として、仕様書記憶部331に記憶される全ての仕様書を対象として検索を実行してもよい。
ステップS104:検索部322は、ステップS103による仕様書の検索件数が所定以上であるか否かを判定する。
ステップS105:ステップS104にて検索件数が所定未満であると判定された場合、検索部322は、今回の検索結果を示す検索結果情報をチャットボットサーバ200に送信する。これにより、ユーザ端末100のチャットボットアプリケーションのアプリケーション画面においては、図2(B)に例示したように検索結果メッセージが表示される。
ステップS106:ステップS104にて検索件数が所定以上であると判定された場合、制御部302は選択肢抽出処理を実行する。
ステップS107:制御部202(選択肢決定部327でもよい)は、ステップS106による選択肢抽出処理による絞り込み条件選択肢の抽出結果が反映された絞り込み検索情報をチャットボットサーバ200に送信する。この場合、ユーザ端末100のチャットボットアプリケーションのアプリケーション画面においては、図2(C)に例示したように、絞り込み検索メッセージが表示される。
図12のフローチャートは、図11のステップS106としての選択肢抽出処理の手順例を示している。
ステップS201:仕様書サーバ300において、タグ除外部323は、図11のステップS103により検索された仕様書(絞り込み検索対象の仕様書)に付与されていたタグの全てを候補タグとして取得する。
ステップS202:タグ除外部323は、非有用タグを除外する処理として、ステップS201により取得された候補タグから全件付与タグを特定し、特定した全件付与タグを候補タグから除外する。
ステップS203:タグ除外部は、非有用タグを除外する処理として、ステップS201により取得された候補タグから付与先一致タグを特定し、特定した付与先一致タグを候補タグから除外する。
ステップS202及びステップS203により除外されることなく残った候補タグが残存候補タグとなる。
なお、ステップS202、S203の処理は、ステップS203、S202の順で実行されてもよいし、同時並行で実行されてもよい。
ステップS204:類似指標値算出部324は、残存候補タグごとの総合類似度を算出する。この際、類似指標値算出部324は、図6、図7にて説明したように残存候補タグごとに付与先の仕様書を要素とした集合間の個別類似度を算出し、算出した個別類似度に基づいて総合類似度を算出するようにしてよい。
ステップS205:網羅指標値算出部325は、残存候補タグごとの網羅度を算出する。
なお、ステップS204、S205の処理は、ステップS205、S204の順で実行されてもよいし、同時並行で実行されてもよい。
ステップS206:優先順位設定部326は、残存候補タグ間の優先順位を設定する。優先順位の設定にあたり、優先順位設定部326は、図8にて説明したように、ステップS204により算出された総合類似度とステップS205により算出された網羅度に基づいて残存候補タグごとの優先度を算出する。
ステップS207:選択肢決定部327は、ステップS206により設定された優先順位が上位N番目までに該当するN個の残存候補タグを、絞り込み条件選択肢として決定する。
ステップS208:選択肢決定部327は、タグ非付与仕様書があるか否かを判定する。タグ非付与仕様書は、絞り込み検索対象の仕様書のうちで、ステップS207により絞り込み条件選択肢として決定された残存候補タグが付与されていない仕様書である。
タグ非付与仕様書が無いと判定された場合には、同図の処理が終了される。この場合には、絞り込み条件選択肢は、「その他」は含まずに、ステップS207により決定された残存候補タグを含むものとなる。
ステップS209:ステップS208にてタグ非付与仕様書が有ると判定された場合、選択肢決定部327は、絞り込み条件選択肢として、タグ非付与仕様書を対応付けた「その他」を追加する。
<第2実施形態>
[概要]
続いて、第2実施形態について説明する。第2実施形態においては、仕様書に付与されるタグについてカテゴリによる分類が行われる。第2実施形態の仕様書サーバ300は、以下に説明するように、カテゴリごとに絞り込み条件選択肢を抽出することができる。
本実施形態における検索システム、仕様書サーバ300の構成は、図1、図10と同様でよい。
図13は、本実施形態の仕様書記憶部331が記憶する仕様書の管理態様例を示している。
同図の仕様書のテーブルは、図3の仕様書のテーブルを基として、仕様書に付与されるタグをカテゴリごとに分類して管理した態様である。具体的に、同図では、タグのカテゴリとして「メーカカテゴリ」、「商品カテゴリ」、「品種カテゴリ」の3つが設けられている。
「メーカカテゴリ」はメーカに対応するカテゴリである。「メーカカテゴリ」には「メーカA」、「メーカB」等のタグが属する。
「商品カテゴリ」は、包装が行われる商品種別に対応するカテゴリである。「商品カテゴリ」には、「菓子」、「スナック」、「焼きそば」、「うま塩」等のタグが属する。
「品種カテゴリ」はパッケージとしての製品の品種に対応するカテゴリである。「品種カテゴリ」には「パウチ」、「二次容器」等のタグが属する。
本実施形態の検索の手順の具体例について説明する。以下の説明にあたり、仕様書記憶部331は、図13のように仕様書を記憶している場合を例に挙げる。
本実施形態においても、ユーザは、ユーザ端末100上で動作するチャットボットアプリケーションにメッセージを入力することで検索を指示できる。ここで、ユーザは、図2(A)と同様にメーカAを検索キーとする検索を指示するメッセージMS2を入力した。
仕様書サーバ300は、メッセージMS2の入力に対応する検索要求を受信すると、受信された検索要求から「メーカA」の検索キーを取得し、「メーカA」と一致するタグが付与された仕様書を仕様書記憶部331から検索する。
この場合の検索結果としては、図4と同様に、仕様書IDがSF001~SF007の7つの仕様書が検索されることとなる。
本実施形態においても、仕様書サーバ300は、検索された仕様書のうちから非有用タグ(全件付与タグ、付与先一致タグ)を除外する処理を行う。非有用タグを除外する処理が行われた結果、残存候補タグは図5と同様の結果となる。
そのうえで、本実施形態の仕様書サーバ300は、図5のようにして得られた残存候補タグについて、カテゴリごとに区分する。
図14は、図5の残存候補タグを商品のカテゴリごとに区分した結果を示す。具体的に、図5の残存候補タグは、図14(A)に示されるように「スナック」、「うま塩」、「焼きそば」の残存候補タグが属する「商品カテゴリ」と、図14(B)に示されるように「二次容器」の残存候補タグが属する「品種カテゴリ」とに区分される。
次に、仕様書サーバ300は、図14のように区分したカテゴリ単位で残存候補タグごとの総合分類度と網羅度とを算出し、算出された総合類似度と網羅度とに基づいて、カテゴリ単位で残存候補タグごとの優先度を算出する。これにより、本実施形態では、残存候補タグはカテゴリ単位で優先順位が設定される。
図15は、図14のように区分されたカテゴリ単位における残存候補タグごとの総合類似度、網羅度、及び優先度の算出結果を示している。図15(A)においては、「商品カテゴリ」に属する「スナック」、「うま塩」、「焼きそば」の残存候補タグごとの総合類似度、網羅度、及び優先度が示されている。図15(B)においては、「品種カテゴリ」に属する「二次容器」の残存候補タグの総合類似度、網羅度、及び優先度が示されている。
仕様書サーバ300は、区分されたカテゴリごとに所定の優先順位までの残存候補タグを絞り込み条件選択肢として決定する。一例として、優先順位が2番目までの残存候補タグを絞り込み条件選択肢として決定するとした場合、図15の優先順位の設定結果に基づいて、以下のように絞り込み条件選択肢を決定する。
仕様書サーバ300は、図15(A)の「商品カテゴリ」のうちから「スナック」、「うま塩」の2つの残存候補タグを絞り込み条件選択肢として決定する。また、図15(B)の「品種カテゴリ」に属する残存候補タグは「二次容器」の1つのみである。このため、仕様書サーバ300は、「品種カテゴリ」に対応して、「二次容器」の残存候補タグのみを絞り込み条件選択肢として決定する。つまり、この場合には、残存候補タグのうちから、「商品カテゴリ」に属する「スナック」、「うま塩」と、「品種カテゴリ」に属する「二次容器」との3つの残存候補タグが絞り込み条件選択肢として決定される。
また、本実施形態においても、仕様書サーバ300は、絞り込み検索対象の仕様書のうちでタグ非付与仕様書が存在する場合には、絞り込み条件選択肢として、タグ非付与仕様書に対応付けた「その他」を設けるようにされる。本実施形態において、「その他」の絞り込み条件選択肢は、カテゴリ単位で区分せずに、第1実施形態と同様に、残存候補タグの全てと絞り込み検索対象の仕様書との関係に基づいて特定された非付与仕様書に応じて設けられてよい。
図15の例では、仕様書IDがSF007の仕様書が非付与仕様書となる。そこで、この場合の仕様書サーバ300は、仕様書IDがSF007の仕様書を対応付けた「その他」の絞り込み条件選択肢を追加する。
この場合の仕様書サーバ300は、絞り込み条件選択肢が「商品カテゴリ」に属する「スナック」、「うま塩」と、「品種カテゴリ」に属する「二次容器」と、「その他」とであることを示す絞り込み検索情報を、チャットボットサーバ200に送信する。これにより、ユーザ端末100においては、チャットボットアプリケーションのアプリケーション画面上で、図16のようにしてチャットボットの絞り込み検索メッセージMS-6(MS6-1、MS6-2)が表示される。
絞り込み検索メッセージMS6-1は、図2(C)の絞り込み検索メッセージMS5-1と同様に、7件の検索結果が得られたことから、絞り込み検索のための検索条件(絞り込み条件)を選択してもらうことをユーザに案内するメッセージ内容を有する。
次の検索メッセージMS5-2は、絞り込み検索画面として機能する。同図の検索メッセージMS5-2としての絞り込み検索画面においては、「商品」(商品カテゴリ)、「品種」(品種カテゴリ)、「その他」のカテゴリ項目ごとに絞り込み条件選択肢が提示された態様となっている。つまり、検索メッセージMS5-2においては、「商品」のカテゴリ項目に対応して、「スナック」、「うま塩」のタグに対応する2つの絞り込み条件選択ボタンBT31-1、BT31-2が配置されている。また、「品種」のカテゴリ項目に対応して、「二次容器」のタグに対応する1つの絞り込み条件選択ボタンBT31-11が配置されている。また、「その他」のカテゴリ項目が設けられたうえで、当該「その他」のカテゴリ項目に対応して「その他」の絞り込み条件選択ボタンBT31-21が配置されている。
この場合にも、ユーザは、絞り込み条件選択ボタンBT31(BT31-1、BT31-2、BT31-11、BT31-21)のうちから任意に選択したものに対してタップ操作を行って選択状態としたうえで、実行ボタンBT21を操作することで、絞り込み条件を指定して絞り込み検索を指示することができる。
[処理手順例]
本実施形態の仕様書サーバ300が仕様書の検索に対応して実行する処理手順例について説明する。
本実施形態においても、仕様書サーバ300は、図11のフローチャートに示されるのと同様の処理手順を実行する。そのうえで、本実施形態の仕様書サーバ300は、ステップS106の選択肢抽出処理にあたり、残存候補タグをカテゴリごとに区分し、区分された残存候補タグごとに絞り込み条件選択肢を抽出する。
図17のフローチャートは、本実施形態の仕様書サーバ300がステップS106の選択肢抽出処理として実行する処理手順例を示している。
ステップS301~S303の処理は、図12のステップS201~S203と同様とされてよい。
ステップS304:仕様書サーバ300において、タグ除外部323は、ステップS302、S303の処理によって除外されることなく残された残存候補タグを、図14に例示したようにカテゴリごとに区分する。
ステップS305:タグ除外部323は、ステップS304により区分されたカテゴリのうちの1つを、絞り込み条件選択肢の抽出対象として選択する。
ステップS306~S309の処理は、図12のステップS204~S207と同様となる。ただし、ステップS306~S309においては、それぞれ、ステップS305により絞り込み条件選択肢の抽出対象として選択されたカテゴリに属する残存候補タグを対象として、総合類似度の算出、網羅度の算出、優先順位の設定が行われる。これにより、例えば図15に例示した結果が得られる。
ステップS310:ステップS306~S309の処理の後、選択肢決定部327は、区分されたカテゴリの全てについての残存候補タグからの絞り込み条件選択肢の抽出が完了したか否かを判定する。
区分されたカテゴリの全てについての残存候補タグからの絞り込み条件選択肢の抽出が完了していない場合には、ステップS305に処理が戻される。これにより、未だ絞り込み条件選択肢が抽出されていない次のカテゴリを対象として、絞り込み条件選択肢を抽出する処理が実行される。
ステップS311:区分されたカテゴリの全てについての残存候補タグからの絞り込み条件選択肢の抽出が完了した場合には、ステップS312に処理が遷移する。ステップS312、S313の処理は、図12のステップS208、S209と同様とされてよい。
同図の処理が実行された後において実行される図11のステップS107として、制御部202は、絞り込み条件選択肢として決定された残存候補タグとカテゴリとの対応関係が示される絞込検索情報を生成する。また、「その他」の絞り込み条件選択肢が追加された場合、制御部202は、「その他」の絞り込み条件選択肢を1つのカテゴリとして示す情報が絞込検索情報を含めるようにされる。これにより、図16に示されるように、カテゴリ項目ごとに対応させて絞り込み条件選択ボタンBT31を配置した態様の絞り込み検索画面をユーザ端末100にて表示させることができる。
なお、上記各実施形態においては、パッケージの仕様書を検索対象とした例を挙げた。しかしながら、上記各実施形態の構成が対応する検索対象データは、パッケージの仕様書に限定されるものではなく、タグが付与された形式の検索対象データの全般に適用が可能である。
なお、タグは、検索対象データに対して予め付与されていてもよいし、例えば検索の実行に際して、仕様書サーバ300が検索対象データを解析してタグを生成し、生成したタグを用いて上記各実施形態による検索が実行されるようにしてもよい。
なお、チャットボットサーバ200に相当する機能を、仕様書サーバ300が備えることで、仕様書サーバ300とユーザ端末100とが、チャットボットサーバ200を介在することなく通信を行って、上記各実施形態の検索が行われるようにされてもよい。
なお、上記各実施形態の仕様書サーバ300としての機能を複数のサーバや装置に分散して付与し、これら複数のサーバや装置が連携して上記各実施形態の検索を実現するようにされてよい。一例として、仕様書を記憶するサーバと、検索機能を有するサーバとが連携することで、上記各実施形態の検索が実現されるようにしてよい。
本実施形態のような絞り込み条件選択肢の提示は、上記各実施形態のようにスマートフォン等の端末上でチャットボットアプリケーションを用いて検索する場合には、簡易な操作で効率よく絞り込み検索を行うことができる。
しかしながら、検索キーの入力は、チャットボットアプリケーションに対するメッセージの入力に限定されない。例えば、検索画面のウェブページに端末をアクセスさせ、端末に表示された検索画面に対して検索キーを入力可能とされてもよい。
<変形例>
以下に、上記各実施形態の変形例について説明する。
[第1変形例]
上記各実施形態においては、多数付与タグが、全件付与タグである場合を例に挙げた。全件付与タグは、検索された仕様書の全てに付与されている候補タグである。
多数付与タグとしては、検索された仕様書の全てに付与されている候補タグでなくとも、検索された全仕様書における付与先の仕様書が一定数以上の候補タグであってもよい。例えば、検索された100件の仕様書のうちの990件程度に付与されている候補タグを検索キーとして絞り込み検索対象の仕様書を再検索しても、検索結果としては、ほぼ同じ絞り込み検索対象の仕様書が検索されてしまう結果となるからである。
そこで、本変形例では、検索された全仕様書における付与先の仕様書が一定数以上の候補タグを多数付与タグとして、候補タグから除外するようにされる。
このような多数付与タグを特定するにあたっては、仕様書サーバ300のタグ除外部323が、候補タグごとに網羅度を算出するようにされてよい。タグ除外部323は、算出された網羅度が所定以上の候補タグを多数付与タグとして除外してよい。
あるいは、多数付与タグを特定するにあたっては、タグ除外部323は、検索された全ての仕様書が属する集合と、候補タグごとに付与先の仕様書を要素とする集合とを形成するようにされる。タグ除外部323は、検索された全ての仕様書が属する集合に対する付与先の仕様書を要素とする集合ごとの類似度(個別類似度)を算出する。タグ除外部323は、類似度が一定以上の集合に対応する候補タグを多数付与タグとして除外してよい。
[第2変形例]
上記各実施形態においては、付与先重複タグが、付与先一致タグである場合を例にあげた。付与先一致タグは、付与先の仕様書の内訳が他の候補タグに対して一致している候補タグである。
しかしながら、付与先の仕様書が他の候補タグと重複している割合が一定以上となるような候補タグも付与先重複タグとされてよい。例えば、複数の候補タグの付与先の仕様書が相当に多数である場合において、複数の候補タグで互いに重複する付与先の仕様書の占める度合いが一定以上に高いような場合、複数の候補タグのそれぞれを検索キーとして絞り込み検索対象の仕様書を再検索した場合には、ほぼ同じとみてよい検索結果が得られるからである。
そこで、本変形例では、複数の候補タグごとの付与先の仕様書において、重複する仕様書の占める度合いが一定以上に高い候補タグのうちから選択した1の候補タグ以外を付与先重複タグとして、候補タグから除外するようにされる。
図18を参照して、本変形例における付与先重複タグの特定と、特定した付与先重複タグの除外の手順例について説明する。
或る検索キーにより仕様書を検索したところ、検索された仕様書に対応してタグA、B、C、Dの4つの候補タグが得られた。そこで、仕様書サーバ300のタグ除外部323は、候補タグとされたタグA、B、C、Dについての個別類似度を算出するようにされる。
図18(A)は、タグ除外部323が、タグAについての、タグB、タグC、タグDのそれぞれに対する個別類似度を算出した結果が示されている。個別類似度が所定の閾値以上の2つのタグの組み合わせがあった場合に、当該組み合わせの2つのタグが付与先重複タグとなり得る。図18(A)の場合には、算出された個別類似度のうち0.95の個別類似度が閾値以上であった。この場合には、個別類似度が0.95の関係にあるタグAとタグCとのうちの一方が付与先重複タグとなり得る。そこで、この場合のタグ除外部323は、タグAとタグCのうち、タグCを付与先重複タグとして決定することとし、タグCを候補タグから除外した。図18(B)は、タグCを候補タグから除外した結果が示されている。
次に、タグ除外部323は、図18(B)の状態のもとで、タグBについてのタグDに対する個別類似度を算出する。算出された個別類似度は、図18(C)に示されるように0.99であり閾値以上であった。この場合、タグBとタグDとのうちの一方が付与先重複タグとなり得る。そこで、この場合のタグ除外部323は、タグDを付与先重複タグとして決定することとし、タグCを候補タグから除外した。図18(D)は、タグCを候補タグから除外した結果が示されている。
これまでの処理によって、タグCとタグDとが候補タグから除外されたことで、候補タグは、タグAとタグBとの2つとなった。タグAとタグBとの個別類似度は0.41として既に算出されている。0.41の個別類似度は閾値未満であることから、これ以上、付与先重複タグとなり得るタグは存在しないことになる。そこで、タグ除外部323は、ここまでの段階で付与先重複タグの除外の処理を終了させてよい。
なお、上述のユーザ端末100、チャットボットサーバ200、仕様書サーバ300等の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述の各システムや装置の処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD-ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
100 ユーザ端末、200 チャットボットサーバ、202 制御部、300 仕様書サーバ、301 通信部、302 制御部、303 記憶部、321 検索条件取得部、322 検索部、323 タグ除外部、324 類似指標値算出部、325 網羅指標値算出部、326 優先順位設定部、327 選択肢決定部、331 仕様書記憶部

Claims (10)

  1. 検索条件を取得する検索条件取得部と、
    タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索部と、
    前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外部と、
    前記タグ除外部により除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出部と、
    少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定部と、
    前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定部と
    を備える検索システム。
  2. 前記タグ除外部は、検索された仕様書の全体において付与先の仕様書の占める度合いが一定以上の候補タグを除外する
    請求項1に記載の検索システム。
  3. 前記タグ除外部は、非有用タグとして、付与先の仕様書が他の候補タグの付与先の仕様書と重複する度合いが一定以上の候補タグを除外する
    請求項1または2に記載の検索システム。
  4. 類似指標値算出部は、前記残存候補タグごとに付与先の検索データを要素とする集合間の類似度を算出し、算出された集合間の類似度に基づいて、前記残存候補タグごとの類似指標値を算出する
    請求項1から3のいずれか一項に記載の検索システム。
  5. 前記選択肢決定部は、前記絞り込み条件の選択肢として決定された残存候補タグが付与されていないタグ非付与の検索データが存在する場合には、当該タグ非付与の検索データに対応付けた絞り込み条件の選択肢を追加する
    請求項1から4のいずれか一項に記載の検索システム。
  6. 前記検索データの全体における前記残存候補タグの付与先の検索データが占める度合いを示す網羅指標値を、前記残存候補タグごとに算出する網羅指標値算出部を備え、
    前記優先順位設定部は、前記残存候補タグごとの類似指標値と、前記残存候補タグごとの網羅指標値とに基づいて算出した前記残存候補タグごとの優先度に基づいて、前記残存候補タグの優先順位を設定する
    請求項1から5のいずれか一項に記載の検索システム。
  7. 前記タグは、いずれかのカテゴリに属するように分類されており、
    前記類似指標値算出部は、カテゴリ単位で残存候補タグごとの類似指標値を算出し、
    前記優先順位設定部は、前記カテゴリ単位で前記残存候補タグの優先順位を設定し、
    前記選択肢決定部は、前記カテゴリ単位で設定された前記優先順位に基づいて、前記カテゴリごとに絞り込み条件の選択肢を決定する
    請求項1から5のいずれか一項に記載の検索システム。
  8. 前記カテゴリ単位で、前記検索データの全体における前記残存候補タグの付与先の検索データが占める度合いを示す網羅指標値を、前記残存候補タグごとに算出する網羅指標値算出部を備え、
    前記優先順位設定部は、前記カテゴリ単位で、前記残存候補タグごとの類似指標値と、前記残存候補タグごとの網羅指標値とに基づいて算出した前記残存候補タグごとの優先度に基づいて、前記残存候補タグの優先順位を設定する
    請求項7に記載の検索システム。
  9. 検索システムにおける検索方法であって、
    検索条件を取得する検索条件取得ステップと、
    タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索ステップと、
    前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外ステップと、
    前記タグ除外ステップにより除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出ステップと、
    少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定ステップと、
    前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定ステップと
    を含む検索方法。
  10. 検索システムにおいて備えられるコンピュータを、
    検索条件を取得する検索条件取得部、
    タグが対応付けられた検索対象のデータのうちから検索条件を満たす検索データを検索する検索部、
    前記検索データのそれぞれに付与されていたタグである候補タグのうちから、絞り込み検索に用いる検索条件としての有用性がない非有用タグを除外するタグ除外部、
    前記タグ除外部により除外されずに残った残存候補タグごとの他の残存候補タグに対する類似の度合いを示す類似指標値を算出する類似指標値算出部、
    少なくとも前記残存候補タグごとの類似指標値に基づいて、前記残存候補タグの優先順位を設定する優先順位設定部、
    前記優先順位に基づいて前記残存候補タグのうちから絞り込み条件の選択肢を決定する選択肢決定部
    として機能させるためのプログラム。
JP2021036147A 2021-03-08 2021-03-08 検索システム、検索方法、及びプログラム Pending JP2022136506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021036147A JP2022136506A (ja) 2021-03-08 2021-03-08 検索システム、検索方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021036147A JP2022136506A (ja) 2021-03-08 2021-03-08 検索システム、検索方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2022136506A true JP2022136506A (ja) 2022-09-21

Family

ID=83312056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021036147A Pending JP2022136506A (ja) 2021-03-08 2021-03-08 検索システム、検索方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2022136506A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116627972A (zh) * 2023-05-25 2023-08-22 成都融见软件科技有限公司 一种覆盖指标的结构化数据离散存储系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116627972A (zh) * 2023-05-25 2023-08-22 成都融见软件科技有限公司 一种覆盖指标的结构化数据离散存储系统
CN116627972B (zh) * 2023-05-25 2024-03-01 成都融见软件科技有限公司 一种覆盖指标的结构化数据离散存储系统

Similar Documents

Publication Publication Date Title
US11429673B2 (en) Displaying sort results on a mobile computing device
US10984192B2 (en) Application list providing method and device therefor
US20180239827A1 (en) Identifying relevant apps in response to queries
US8793270B2 (en) System and method for providing personalized recommended word and computer readable recording medium recording program for implementing the method
US11675845B2 (en) Identifying merchant data associated with multiple data structures
US9614790B2 (en) Apparatus for controlling execution of software, method for controlling thereof, and computer-readable recording medium having computer program for controlling thereof
JP2009043263A (ja) 質問分類方法およびそのシステム
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US9201968B2 (en) System and method for finding mood-dependent top selling/rated lists
JP2015203961A (ja) 文書抽出システム
JP2022136506A (ja) 検索システム、検索方法、及びプログラム
JP5256273B2 (ja) 意図抽出装置、方法及びプログラム
JP6721935B1 (ja) 管理サーバおよび商品検索方法
US20160267107A1 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium
US20230054525A1 (en) Information processing apparatus, information processing method, and program
WO2017199415A1 (ja) 表示制御プログラム、表示制御装置及び表示制御方法
JP7088656B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2012173781A (ja) 情報推薦システム、情報推薦サーバ、情報推薦方法、及び情報推薦プログラム
US20190163810A1 (en) Search User Interface
KR102384535B1 (ko) 경영 자문 정보 제공 방법 및 장치
JP7224392B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP7455913B2 (ja) レビュー分析によって下位アイテムのカテゴリを自動分類して検索に活用する方法、システム、およびコンピュータプログラム
JP6777907B1 (ja) 業務支援装置、及び業務支援システム
US20230316372A1 (en) Peer-based selection using machine learning
US11687954B2 (en) Linking physical locations and online channels in a database

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240221