JPWO2020240714A1 - 検索システム、検索方法及び検索アプリケーションソフトウェア - Google Patents

検索システム、検索方法及び検索アプリケーションソフトウェア Download PDF

Info

Publication number
JPWO2020240714A1
JPWO2020240714A1 JP2019548079A JP2019548079A JPWO2020240714A1 JP WO2020240714 A1 JPWO2020240714 A1 JP WO2020240714A1 JP 2019548079 A JP2019548079 A JP 2019548079A JP 2019548079 A JP2019548079 A JP 2019548079A JP WO2020240714 A1 JPWO2020240714 A1 JP WO2020240714A1
Authority
JP
Japan
Prior art keywords
information
user
search
technical
technology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019548079A
Other languages
English (en)
Other versions
JP6890671B2 (ja
Inventor
宇雄 國井
宇雄 國井
隆徳 青井
隆徳 青井
悦至 喜多村
悦至 喜多村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LINKERS CORPORATION
Original Assignee
LINKERS CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LINKERS CORPORATION filed Critical LINKERS CORPORATION
Application granted granted Critical
Publication of JP6890671B2 publication Critical patent/JP6890671B2/ja
Publication of JPWO2020240714A1 publication Critical patent/JPWO2020240714A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 適切なキーワード選定が困難な技術情報の検索においても、ユーザの興味が高い技術情報を対話形式で簡単に検索することができる検索システム、検索方法及び検索アプリケーションソフトウェアを提供する。【解決手段】 検索システムは、ユーザが検索条件を入力するユーザ端末10と通信可能な検索サーバ20において実行可能であり、検索サーバ20が備える複数の技術に関する情報を記憶する技術情報データベース24bから複数の第1の技術に関する情報を抽出してユーザ端末10で評価を行わせ、ユーザ端末10において評価された第1の技術に関する情報の評価結果に基づいて、複数の第1の技術に関する情報と、技術情報データベース24bが記憶する第2の技術に関する情報との類似度に所定の処理を行った関連度スコアを関連度スコア算出部27が算出し、技術情報データベース24bが記憶する複数の技術に関する情報をユーザごとに、関連度スコアの高い順に並べ替えて、関連度スコアとともに技術情報リストデータベース24dに記憶し、検索条件に基づいて技術情報リストデータベース24dから所定の技術に関する情報を抽出する。【選択図】 図16

Description

本発明は、文献、人材及び企業等の技術に関連する情報を検索するための検索システム、検索方法及び検索アプリケーションソフトウェアに関する。
従来、複数の情報から所望の情報を検索するための検索エンジンが複数存在する。従来の検索エンジンの多くは、ユーザに検索したい情報に関するキーワードを入力させ、ユーザが入力したキーワードを含む情報を検索している。また、特許技術のような特定の技術情報の検索に関しては、キーワードの他に国際特許分類といった技術分類情報を用いることもあるが、このような場合でキーワードによる検索は不可欠である。
このようにキーワード検索は、技術に関する情報の種類に関わらず、技術に関する情報を検索するユーザにとって最も確実に関心のある情報にたどりつくための重要な手段である。しかし、一般に、ユーザが関心のある情報を膨大な検索結果から適切なキーワードを付与して得ることは難しく、所望の情報をさまざまな情報源から得るためには、試行錯誤してキーワードを入力するほかなく、入力するために相当な時間を要したり、検索を行うユーザの経験や勘に頼ったりするところが大きいという問題があった。
そこで、特許文献1に記載の発明のように、入力された言葉についての連想的関係性を得るために、ユーザによる複数回の単語入力に対し、入力された単語に関連する他の単語の検索を繰り返して生成した単語空間に基づき、入力単語間に存在する単語又は単語情報を出力する検索システムがある。
特開2012−123639号公報
しかしながら、特許文献1に記載の発明は、ユーザに提示される検索結果がユーザ自身の入力された単語間に限定されているために、ユーザが適切なキーワードを選定できないような場合には、適切な検索結果を得ることが困難であり、また、ユーザが全く予想していなかった新たな情報を得ることも困難である。さらに、検索行為がキーワード入力の結果出力の繰り返しに過ぎず、ユーザが検索行為そのものに興味を持って行うことができるような工夫がなされていない。
本発明は、このような事情に鑑みてなされたものであり、適切なキーワード選定が困難な技術情報の検索においても、ユーザが検索行為そのものを楽しみながら、対話的に簡単に所望の技術情報を取得することができる検索システム、検索方法及び検索アプリケーションソフトウェアを提供することを目的とする。
上記目的を達成するために、本発明の検索システムは、ユーザが検索条件を入力するためのユーザ端末と、該ユーザ端末とネットワークを介して接続し、該検索条件に基づいて情報を検索する検索サーバとを備える検索システムであって、前記検索サーバは、複数の技術に関する情報を記憶する技術情報データベースと、前記ユーザ端末に評価させる複数の第1の技術に関する情報を該技術情報データベースから抽出する第1の技術情報抽出部と、前記ユーザ端末における前記複数の第1の技術に関する情報の評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定に処理を行った関連度スコアを算出する関連度スコア算出部と、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えたリストを生成する技術情報リスト生成部と、該技術情報リスト生成部が生成した前記リストを記憶する技術情報リストデータベースと、前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2の技術情報抽出部と、を備えることを特徴とする。
なお、第1の技術情報抽出部及び第2の技術情報抽出部は、下記の本実施形態に係る検索サーバが備える制御部と、記憶部と、通信部とから実現され、具体的には、所定の条件に基づいて制御部が記憶部に記憶されている所定の技術に関する情報を抽出して通信部がユーザ端末へ送信することを意味する。
また、検索方法及び検索アプリケーションソフトウェアについても同様であるため、説明は省略する。
また、本発明の検索システムは、前記関連度スコア算出部は、前記複数の第1の技術に関する情報と前記第2の技術に関する情報との類似度を算出し、該類似度を前記複数の第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して前記関連度スコアを算出することを特徴とする。
また、本発明の検索システムは、前記関連度スコア算出部は、ユーザが高評価した前記第1の技術に関する情報と、前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の正数、又は、ユーザが低評価した前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の負数を、前記第1の技術に関する情報の関連度スコアとして算出することを特徴とする。
また、本発明の検索システムは、前記関連度スコア算出部は、前記類似度が−1から+1の範囲の数値で表現される場合に、前記評価結果が高評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、1.0以上の係数を乗算又は加算する調整を行って前記調整後スコアを算出し、前記評価結果が低評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、0以下の係数を乗算又は減算する調整を行って前記調整後スコアを算出することを特徴とする。
また、本発明の検索システムは、前記関連度スコア算出部は、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、前記類似度の大きさの調整を多段階で行って前記調整度スコアを算出することを特徴とする。
また、本発明の検索システムは、前記検索サーバは、ユーザが関心を寄せる技術についての情報を関心情報としてユーザごとに記憶するためのユーザデータベースを備え、前記評価部は、該ユーザデータベースに記憶された前記関心情報に基づいて、前記技術情報データベースからユーザに評価させるための前記複数の技術に関する情報を抽出することを特徴とする。
また、本発明の検索システムは、前記検索サーバは、所定期間内に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第1の抽出部と、過去の評価を考慮せずに、最後に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2の抽出部と、を備え、どちらかの抽出部によって技術に関する情報を抽出させることが選択可能であることを特徴とする。
なお、第1の抽出部及び第2の抽出部は、下記の本実施形態に係る検索サーバが備える制御部と、記憶部と、通信部とから実現され、具体的には、所定の条件に基づいて制御部が記憶部に記憶されている所定の技術に関する情報を抽出して通信部がユーザ端末へ送信することを意味する。
また、検索アプリケーションソフトウェアについても同様であるため、説明は省略する。
また、本発明の検索システムは、前記ユーザ端末は、前記第1の技術情報抽出部によって抽出された前記複数の第1の技術に関する情報を1件ずつ表示し、ユーザに興味の有無を判定させ、該ユーザが興味あり、と判定した前記第1の技術に関する情報は高評価された情報とし、前記ユーザが興味無し、と判定した前記第1の技術に関する情報を低評価した情報とすることを特徴とする。
また、本発明の検索システムは、前記ユーザ端末において評価された前記第1の技術に関する情報に関する評価結果に基づいて、前記関連度スコア算出部及び技術情報リスト生成部の処理に用いられる計算方法又はパラメータを選択することができることを特徴とする。
また、本発明の検索方法は、ユーザが検索条件を入力するユーザ端末と、該ユーザ端末とネットワークを介して接続し、前記検索条件に基づいて情報を検索する検索サーバによる検索方法であって、前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1のステップと、前記ユーザ端末において評価された前記複数の第1の技術に関する情報に関する評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定の処理を行った関連度スコアを算出する第2のステップと、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに前記関連度スコアの高い順に並べ替えて、前記関連度スコアとともに前記技術情報リストデータベースに記憶する第3のステップと、前記検索条件に基づいて、前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4のステップと、を有していることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、ユーザが検索条件を入力するユーザ端末と通信可能な、前記検索条件に基づいて情報を検索する検索サーバにおいて実行可能な検索アプリケーションソフトウェアであって、前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1の機能と、前記ユーザ端末において評価された前記複数の第1の技術に関する情報に関する評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定の処理を行った関連度スコアを算出する第2の機能と、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えて、該関連度スコアとともに技術情報リストデータベースに記憶する第3の機能と、
前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4の機能が、前記検索サーバにおいて実行可能であることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記第2の機能が、前記複数の第1の技術に関する情報のそれぞれと前記第2の技術に関する情報との類似度を算出し、該類似度を前記第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して前記関連度スコアを算出することを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記第2の機能は、ユーザが高評価をした前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後スコアの少なくとも数倍以上の正数、又は、ユーザが低評価をした前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後スコアの少なくとも数倍以上の負数を、前記第1の情報の関連度スコアとして算出することを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記第2の機能は、前記類似度が−1から+1の範囲の数値で表現される場合に、前記評価結果が高評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、1.0以上の係数を乗算又は加算する調整を行って前記調整後スコアを算出し、前記評価結果が低評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、0以下の係数を乗算又は減算する調整を行って前記調整後スコアを算出することを特徴する。
また、本発明の検索アプリケーションソフトウェアは、前記第2の機能が、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、該類似度の大きさの調整を多段階で行って前記調整度スコアを算出することを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記検索サーバが備えるユーザデータベースにユーザの技術に関する関心情報を記憶する第5の機能がさらに実行可能であって、前記第1の機能は、前記ユーザデータベースに記憶された前記関心事項に基づいて、前記検索サーバが備える複数の技術に関する情報を記憶する前記技術情報データベースから前記複数の第1の技術に関する情報を抽出することを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、所定期間内に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第1のモードと、過去の評価を考慮せずに、最後に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2のモードとを選択させる第6の機能がさらに実行可能であることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記第1の機能は、前記ユーザ端末に前記複数の第1の技術に関する情報を1件ずつ表示してユーザに興味の有無を判定させ、該ユーザが興味有りと判定した前記第1の技術に関する情報を高評価がされた情報とし、該ユーザが興味無しと判定した前記第1の技術に関する情報を低評価がされた情報とすることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記ユーザ端末において評価された前記第1の技術に関する情報に関する評価結果に基づいて、前記第2の機能及び前記第3の機能の処理に用いられる計算方法又はパラメータを選択できることを特徴とする。
本発明によれば、適切なキーワード選定が困難な技術情報の検索においても、ユーザの興味が高い技術情報を対話形式で簡単に検索することができる。
また、ユーザの技術に関する興味・関心が変わった場合や、同時に複数の技術に興味・関心を持っているような場合であっても、複数の検索方法を設定及び調整することが可能となる。
本発明の一実施形態に係る検索システムの構成を示す図である。 本実施形態に係る検索システムの一構成要素であるユーザ端末の構成を示すブロック図である。 本実施形態に係る検索システムの一構成要素である検索サーバの構成を示すブロック図である。 本実施形態に係る検索サーバの記憶部の細部構成を示すブロック図である。 本実施形態に係る記憶部に格納されるユーザデータベースの構成を示す図である。 本実施形態に係る記憶部が備える技術情報データベースに格納される文献情報の構成を示す図である。 本実施形態に係る検索システムで用いられる個々の文献情報に関する技術開発の進展度を多段階で定義した指標を説明するための図である。 本実施形態に係る記憶部が備える技術案件情報データベースに格納される案件情報の構成を示す図である。 本実施形態に係る記憶部が備える技術情報リストデータベースに格納される案件情報の構成を示す図である。 本実施形態に係る記憶部が備えるユーザ評価ログデータベースに格納されるユーザ評価情報の構成を示す図である。 本実施形態にかかる関連度スコア算出部で行われる計算ロジックの一例を説明するための図である。 本発明の一実施形態に係る検索システムのユーザ端末においてユーザの技術興味情報を設定する方法を説明するためのフローチャートである。 本発明の一実施形態に係る検索システムの検索サーバにおいてユーザの技術興味情報を設定する方法を説明するためのフローチャートである。 本発明の一実施形態に係る検索システムにおける技術興味情報の設定手順の一例を示すシーケンス図である。 本発明の一実施形態に係る検索システムのユーザ端末における技術情報の検索処理を説明するためのフローチャートである。 本発明の一実施形態に係る検索システムの検索サーバにおける技術情報の検索処理を説明するためのフローチャートである。 本発明の一実施形態に係る検索システムにおける文献検索処理手順の一例を示すシーケンス図である。 本発明の一実施形態に係る検索システムにおける文献検索処理の開始時にユーザ端末に表示されるモード選択画面の一例を示す図である。 本実施形態に係るユーザ端末に表示される特急モード時の検索情報設定画面の一例を示す図である。 ユーザが評価作業を行う際にユーザ端末の表示部に表示される技術評価画面の一例を示す図である。 ユーザ端末の表示部に表示されるフィルター設定画面の一例を示す図である。 ユーザ端末の表示部に表示される探索条件設定変更画面の一例を示す図である。 ユーザ端末の表示部に表示されるユーザの指示入力を促す画面の一例を示す図である。 本実施形態における検索サーバの技術情報リストの出力処理(ステップS409)の詳細を説明するためのフローチャートである。
以下、図面を参照して、本発明の一実施形態に係る検索システム、検索方法及び検索アプリケーションソフトウェアについて説明する。
本実施形態では、技術に関する情報の検索対象として技術系学会誌等の文献を一例として想定し、これらの文献に関する情報や文献に記載の技術に関する情報(以下、「技術情報」という)を検索する処理について説明する。
<検索システム1>
まず、本発明の一実施形態に係る検索システムについて説明する。
図1は、本発明の一実施形態に係る検索システムの構成を示す図である。
図示するように、検索システム1は、複数のユーザ端末10と、検索サーバ20とがネットワーク30を介して接続されている。ユーザ端末10は、民間企業等の開発者や研究者、大学や公的研究機関に所属する研究者や学生等が所持又は割り当てられるスマートフォンのような多機能携帯電話が想定されるが、携帯情報端末(PDA)、パーソナルコンピュータ等であってもよい。
検索サーバ20は、各技術分野の研究論文や製品カタログ等の技術に関する情報を蓄積及び検索サービスを提供するためのサーバであり、共用サーバや専用サーバでもよいし、パーソナルコンピュータやパブリッククラウド等で実現してもよい。
なお、実施形態では、検索サーバ20には技術に関する情報が格納されており、図示する検索システム1内の処理はクローズされているが、検索システム1の外部のデータベース(図示せず)から技術に関する情報をダウンロード等して検索サーバ20に格納する処理を検索処理の前後や検索処理中に適宜行われるようにしてもよい。
また、外部のデータベースのデータを利用する場合には、当該データを本実施形態に係る検索処理で実行可能な形式に適宜加工して格納するものでも、当該データをそのまま格納しておいて検索処理時に必要なデータのみを取り出すようにしてもよい。
ネットワーク30は、ユーザ端末10と検索サーバ20を相互に接続するもので、インターネットや企業・大学内部などの組織内部のLAN等である。また、ユーザ端末10や検索サーバ20では、本発明に係る検索アプリケーションソフトウェア(プログラム)が実行される。これらのプログラムの実行に際しては、ハイパーテキスト転送プロトコル(HTTP)等の通信プロトコルを用いて通信が行われる。なお、本実施形態では、ユーザ端末10と検索サーバ20とが無線接続されたネットワークシステムとして説明するが、一部又は全部が有線接続されたネットワークシステムであってもよい。
<ユーザ端末10>
図2は、本実施形態に係る検索システムの一構成要素であるユーザ端末10の構成を示すブロック図である。
図示するように、本実施形態に係るユーザ端末10は、制御部11と、操作部12と、表示部13と、記憶部14と、通信部15とを備えている。制御部11は、記憶部14に格納されたプログラム命令群やソフトウェア命令群によりユーザ端末10の全体の機能を制御するための各種演算処理を行う。
操作部12は、ユーザによる入力操作を受け付けるものであり、例えば、タッチパネルや操作ボタンで構成されている。表示部13は、制御部11からの指令に基づいて、画像や文字等をユーザ端末10外面の液晶ディスプレイや有機ELディスプレイに表示する。
記憶部14は、プレインストール又はネットワーク30を経由してダウンロードされた各種プログラムや各種データを格納する。通信部15は、アンテナや送受信回路等を備えており、ネットワーク30を介して検索サーバ20との間で各種データを送受信する。
<検索サーバ20>
図3は、本実施形態に係る検索システムの一構成要素である検索サーバ20の構成を示すブロック図である。
図示するように、検索サーバ20は、制御部21と、操作部22と、表示部23と、記憶部24と、通信部25と、技術情報リスト生成部26と、関連度スコア算出部27とを備える。
制御部21は、検索サーバ20全体の機能を制御するための各種演算処理等を行う。操作部22は、例えば、タッチパネル、キーボード及びマウス等で実現され、検索サーバ20を運営・管理する管理者の入力操作を受け付ける。表示部23は、制御部21の指令に基づいて画像・文字等の情報の表示を行う。記憶部24は、検索サーバ20を起動させるための初期プログラム、検索サービスを行うためのプログラム及びユーザ端末10による検索対象となる技術に関する情報等の各種データを格納する。
通信部25は、ユーザ端末10や外部のデータベース等とのデータの送受信を行うための制御を行う。技術情報リスト生成部26は、ユーザ端末10で入力された情報に基づいて、記憶部24に格納されている技術に関する情報を検索して技術文献のリスト情報等の技術情報を生成する。
なお、特許請求の範囲の請求項1に記載の「第1の技術情報抽出部」及び「第2の技術情報抽出部」は、本実施形態に記載の検索サーバ20が備える制御部21と、記憶部24と、通信部25とで実現することができ、具体的には、制御部21が記憶部24から所定の条件に基づいて所定の技術に関する情報を抽出し、通信部25が抽出した所定の技術に関する情報をユーザ端末10へ送信することを意味する。
関連度スコア算出部27は、記憶部24に格納された複数の技術文書等の複数の技術に関する情報間の類似性や、ユーザ端末10でユーザが入力等した当該ユーザの興味と相関し得る各種パラメータ等のユーザ入力情報に基づいて関連度スコアを算出する。
次に、記憶部24の細部構成について説明する。
図4は、本実施形態に係る検索サーバ20の記憶部24の細部構成を示すブロック図である。
図示するように、記憶部24は、本実施形態に係る検索システム1のユーザに関する情報(ユーザ情報)を格納するユーザデータベース24aと、技術文献情報等の各種技術に関する情報を格納する技術情報データベース24bと、ユーザが行った技術に関する情報の検索処理に関する案件単位の情報を格納する検索案件情報データベース24cと、ユーザの検索処理の結果によって作成される技術情報リストを格納する技術情報リストデータベース24dと、ユーザによる技術に関する情報の評価情報を格納するユーザ評価ログデータベース24eとを備える。
また、技術情報リストデータベース24dには、後述するように関連度スコア算出部27で算出されるクラスタリング結果24d4や関連度スコア24d6のような情報を格納する。
次に、記憶部24が備える各種データベース24a〜24eの詳細について説明する。
(A)ユーザデータベース24a
図5は、本実施形態に係る記憶部24に格納されるユーザデータベース24aの構成を示す図である。
図示するように、ユーザデータベース24aは、ユーザごとに割り当てられるユーザID24a1と、ユーザが使用するユーザ端末10に関するユーザ端末情報24a2と、ユーザ端末10への配信情報の制御に必要な情報24a3及びユーザが字算又は検索中に設定した技術的興味に関するキーワード等の技術興味情報24a4を格納している。
図示するように、本実施形態では0001〜9999までの最大9999人のユーザそれぞれに1つずつユーザIDを割り当て、ユーザごとに好みの検索が可能なようにしているが、ユーザ数はそれ以上であってもそれ以下であってもよい。なお、企業内の部門で一人の人格を形成させて使用するために複数のユーザが1個のユーザIDを共有するようにしてもよいし、一人のユーザが複数個のユーザIDを保有するようにすることも可能である。
ユーザ端末情報24a2は、ユーザ端末10のそれぞれを識別するためのユーザ端末10の固有情報であり、例えば、MACアドレス、シリアル番号及びデバイスID等の検索サーバ20からユーザ端末10に正しく情報を配信するために必要な情報である。さらに、ユーザ端末10への配信情報の制御に必要な情報24a3は、例えば、配信頻度や配信件数等のユーザごとの趣向や使い方に応じて設定する複数のパラメータである。
さらに、技術興味情報24a4は、ユーザがユーザ端末10を介して技術に関する情報の検索に先立って設定等する当該ユーザの興味に関する情報である。技術興味情報24a4は、例えば、ユーザが興味を持っている技術や技術分野に関連するキーワード等であり、癌、薬学、AI、ロボティクス、センサ等のユーザ端末10からユーザが入力するキーワードや、検索サーバ20から提供されるキーワードからユーザが選択したキーワード等が設定される。
上述したこれらのユーザデータベース24に格納される情報24a1〜24a4は、ユーザが本実施形態に係る検索システム1を用いて検索サービスを利用する際に、ユーザ端末10を利用して検索サーバ20へ登録する情報となる。なお、ユーザデータベース24においては、個人が特定できる情報(例えば、住所、氏名等)を保持する必要がないため、検索システム1内において匿名の登録及び利用が可能である。
(B)技術情報データベース24b
技術情報データベース24bは、幅広く収集された各種技術に関する情報を格納するデータベースであり、検索サーバ20に接続可能な外部の技術情報データベースからダウンロードした情報や、ダウンロードしたその情報を検索システム1用に加工した情報、あるいは、検索サーバ20で直接入力された技術に関する情報が格納される。
本実施形態では、技術に関する情報として、化学・工学・薬学・医学・建築学等の各種分野の学会誌に投稿された学術論文等や企業がウェブサイト等で公開している技術方向等の技術文書に含まれる情報、特許情報及び技術マニュアル文書等の各種技術情報(文献情報)を対象とする。
これらの技術情報は、例えばオリジナルの技術情報データベースから本実施形態に係る技術情報データベース24に格納する際に格納する項目の種類・内容をあわせることによって、技術文書の種類によらずすべて検索対象に含めることが可能である。もちろん、検索システム1は、学会論文誌に掲載された技術情報だけを検索対象とするものであってもよいし、それ以外の技術情報だけを検索対象にするものであってもよい。
図6は、本実施形態に係る記憶部24が備える技術情報データベース24bに格納される文献情報の構成を示す図である。
図示するように、本実施形態では技術情報として、技術情報ID24b1と、タイトル24b2と、技術情報概要24b3と、技術開発の進展度24b4と、技術タグ24b5と、用途タグ24b6と、研究開発機関24b7と、研究開発機関国名24b8と、発表年24b9と、情報取得元情報24b10と、その他項目24b11と、詳細URL24b12といった技術関連情報が技術情報ごとに格納されている。
技術情報ID24b1は、検索対象となる全文献情報に割り当てられる固有の識別情報である。タイトル24b2は、例えば学術論文や技術報告の題名で示される当該技術情報のインデックス情報である。技術情報概要24b3は、当該文献情報の技術内容を簡単に記述した情報であり、論文の要約(アブストラクト)に相当する情報である。技術開発の進展度24b4は、図7で定義される7つの段階で当該文献情報の主題である技術に関する技術開発の進展度を示す指標に関する情報である。
ここで、図7は、本実施形態に係る検索システム1で用いられる個々の文献情報に関する技術開発の進展度を多段階で定義した指標を説明するための図である。
本実施形態では、一例として、技術開発の進展度を図示するように7つのTechnology readiness levels(TRL)で区分している。
例えば、レベル0は「設計された機能を実現する理論的な裏付けはないアイデア」程度のレベルを意味し、最も技術開発の進展度が低いレベルである。一方、レベル6は「製品が販売されている」程度のレベルを意味し、最も技術開発の進展度が高いレベルである。そして、このレベル0とレベル6の間にレベル1〜5の5つの段階のレベルが定義されている。なお、技術開発の進展度のレベル分けはこの7つに限られず、それ以上でもそれ以下の区分数でレベル分けをしてもよく、また各レベルの定義も本実施形態で説明する定義には限定されない。TRLを定義することにより、ユーザが興味を持っている技術の進展度(研究開発段階なのか、製品に近い技術なのか等)をシステム上で把握することが可能となる。
また、技術タグ24b5は、文献情報を特徴付ける技術のキーワードであり、例えば、センサ、電波、素材、高分子等の当該技術論文で使用されている技術の語句・単語等が用いられる。また。用途タグ24b6は、技術タグ24b5に設定された技術が活用される市場・技術分野におけるキーワードであり、例えば、自動、ロボット、航空機、自動車等の語句・単語等が用いられる。
さらにその他の情報として、当該文献情報に記載の技術の研究・開発、又は当該技術文献の発表を行った研究開発機関24b7、当該研究開発機関が所属する研究開発機関国名24b8、当該文献情報の発表年24b9、当該文献情報の情報取得元(例えば、論文、特許、製品カタログ等)の種類に関する情報(情報取得元情報)24b10、当該文献情報に関する著者情報や掲載雑誌名等の当該技術の属性等のその他の項目24b11、当該文献情報が公開されているウェブサイトの情報を示す詳細URL24b12についての情報を技術情報データベース24は格納する。なお、詳細URL24b12は、各技術情報IDについて複数保持することができ、仮に一つのURLがサイトの移転や閉鎖等で使用不可能になった場合も、別のURLにアクセス可能なようにすることで、検索ユーザが問題なく詳細情報を確認できるようにメンテナンスされる。
(C)検索案件情報データベース24c
図8は、本実施形態に係る記憶部24が備える技術案件情報データベース24cに格納される案件情報の構成を示す図である。
本実施形態に係る検索案件情報データベース24cは、ユーザデータベース24aに格納されたユーザデータのユーザID24a1と関連付けて、ユーザの検索単位ごとに付与される情報を格納するデータベースである。図8に示すように、本実施形態では、ユーザID24c1、案件ID24c2、案件区分24c3、検索キーワードc4、検索条件24c5、検索ステータス24c6、評価回数24c7、評価件数24c8、高評価件数24c9といった検索案件単位の情報を格納する。ここで、案件区分24c3は後述する検索モードに関する情報であり、本実施形態では特急モードと定点観測モードの2つを用意している。
なお、ユーザID24c1は図5に示されるユーザID24a1と同一である。また、検索条件24c5に格納される具体的な情報としては、研究機関の地域情報、技術発表年、技術開発の進展度等のユーザが所望の技術を検索する際にキーワードとして入力する情報以外の技術に関連する複数の情報が挙げられる。さらに、検索ステータス24c6は、ユーザが検索を完了したかどうかの状態を表す。
後述するように、検索の完了は、ユーザ自身で意思決定することもできるし、検索処理が一定回数された場合等の任意の条件を設定し、自動的に完了することもできる。なお、完了した案件情報は一定期間保持され、各ユーザがどのような検索条件で、どのような評価を実施したかを保持することができる。さらにまた、評価回数24c7は、検索サーバ20がユーザに対して技術情報を配信した回数であり、評価件数24c8は、検索サーバ20から過去に配信された技術情報を当該ユーザが評価した累計値である。例えば、図8に示す実施例は、各ユーザが1回の配信あたりに10件の技術情報を評価した場合を示している。
また、高評価件数24c9は、評価件数24c8のうちユーザによって高評価がなされた件数である。すなわち、図8に示すように、ユーザID0001の案件AAAAの場合は、累計で5回の配信が実施され、配信1回あたり10件の技術情報に対してユーザが評価を実施し、合計50件の技術情報のうち10件の技術評価が高評価とされたことを示している。例えば、この情報を活用して、評価件数24c8と24c9の件数の比率を計算すれば、配信された技術情報がどの程度ユーザの興味に合致していたかをシステム上で把握することができる。
また、評価回数24c7が少ない回数で、評価件数24c8と24c9の件数の比率が高い状態で検索ステータス24c6が完了していた場合は、より効率的な技術情報のリコメンドができたことがシステム上で把握することができる。システム上で把握されたユーザの案件単位の検索結果に応じて、後述する関連度スコアの計算方法やパラメータの調整を実施することで、各ユーザにとってより最適な技術情報の検索を実施することができる。
(D)技術情報リストデータベース24d
図9は、本実施形態に係る記憶部24が備える技術情報リストデータベース24dに格納される案件情報の構成を示す図である。
図示するように、技術情報リストデータベース24dは、ユーザが設定したキーワード等に基づいて検索サーバ20で行われた文献情報の検索結果を、ユーザID24d1と案件ID24d2に関連付けて格納する。なお、ユーザID24d1、案件ID24d2は、図8に示されるユーザID24c1、案件ID24c2と同一である。
ここで、技術情報リストデータベース24dに格納される文献情報の検索結果として、案件ID24d2に紐づく検索キーワードや検索条件に従って、技術情報データベース24bに格納されている技術情報から該当する技術情報ID24d3を抽出して格納する。なお、検索件数については、任意の件数に設定することが可能である。
また、技術情報リストデータベース24dに格納するその他の情報として、抽出した技術情報に対して後述するような計算を行って算出される、クラスタリング結果24d4、その他計算結果24d5、関連度スコア24d6等の各種計算結果が挙げられる。ここで、クラスタリング結果24d4とは、各案件で採用されたクラスタリング手法に基づいて計算された距離に基づくクラスタである。クラスタリング手法は、非階層的手法であるk−means法や、階層的手法である最短距離法、最長距離法、群平均法、ウォード法等の一般的なクラスタリング方法を採用することができる。
どのクラスタリング手法を採用した場合にどのような検索結果となったかは、前述のように、技術情報案件データベースに格納された情報から判断できる。また、その他計算結果24d5は、クラスタリング方法以外の機械学習による計算結果を保持することができる。例えば、計算手法として、ニューラルネットワークやベイズ推論等の一般的な手法が挙げられる。この構成により、技術情報リストデータベース24dと検索案件情報リストデータベース24cは、ユーザID、案件IDで紐づいているため、どの計算方法がどのユーザのどの案件で有効だったか、効果的でなかったかをシステム上で把握することができる。
(E)ユーザ評価ログデータベース24e
図10は、本実施形態に係る記憶部24が備えるユーザ評価ログデータベース24eに格納されるユーザ評価情報の構成を示す図である。
図示するように、ユーザ評価ログデータベース24eは、検索サーバ20から提示される各技術情報に対して、ユーザがユーザ端末10を介して、「興味あり」や「興味なし」等の評価結果24e5や当該評価に関する情報を、ユーザID24e1、案件ID24e2、技術情報ID24e3と対応付けて格納する。本実施形態では、評価結果24e5と共に格納する評価に関する情報として、当該評価の番号(評価NO24e4)、ユーザが評価時に技術の詳細情報を確認したかどうかの結果(詳細確認有無24e6)、評価にかかった時間24e7、その他評価パラメータ24e8及びブックマークをしたかどうか(ブックマーク24e9)等の情報を用いる。
<関連度スコア24d6について>
次に、図9に示される技術情報リストデータベース24dに格納される関連度スコア24d6について詳細に説明する。本実施形態において技術情報の関連度スコア24d6とは、あるユーザが、ある案件において、どの程度、その技術情報に対して興味や関心を持っているかを表現する数値指標を示す。関連度スコア24d6は、検索サーバ20の関連度スコア算出部27において算出される。
関連度スコア算出部27は、記憶部24内の技術情報データベース24b、技術情報リストデータベース24d及びユーザ評価ログデータベース24eに格納されているデータを利用して、関連度スコア24d6を計算する。具体的には、関連度スコア算出部27は、ユーザが「興味あり」と評価した技術情報はユーザが直接高評価と認めた技術情報であるため、ユーザが「興味なし」と評価した技術情報(低評価の技術情報)や未評価の技術情報と比較して、相対的に高い値の関連度スコア24d6を算出する。
本実施形態では、後述するように未評価の技術情報の関連度スコア246dは評価済みの技術情報との類似度に基づいて算出している。そこで、高評価の技術情報の関連度スコア24d6として、数個〜数十個の類似度を合算した値と比べても非常に高い値、例えば999や9999等の値を関連度スコア24d6として算出する。一方、関連度スコア算出部27は、ユーザが「興味なし」と評価した技術情報はユーザが直接低評価と認めた技術情報であるため、高評価の技術情報や未評価の技術情報と比較して、相対的に低い値の関連度スコア24d6を算出する。
本実施形態では、低評価の技術情報の関連度スコア24d6として、例えば−999や−9999等の値を関連度スコア24d6として算出する。なお、関連度スコア24d6の算出方法は上記だけに限定されず、高評価の技術情報の関連度スコアが未評価の技術情報の関連度スコアよりも相対的に高い値となり、低評価の技術情報の関連度スコアが未評価の技術情報の関連度スコアよりも相対的に低い値になるように設定することが可能である。
本実施形態では、未評価の技術情報の関連度スコア246dは評価済みの技術情報との類似度に基づいて算出する。ここで、技術情報同士の類似度の計算には、一般的なベクトル空間による文書比較手法(例えば、コサイン類似度、Word2Vec、Retrofitting等)を利用することができる。例えば、コサイン類似度の算出においては、技術情報のタイトルや技術情報概要等のテキスト情報の単語出現頻度に基づいて、各技術情報をベクトルで表現し、二つのベクトル類似度を計算した結果、「1」に近いほど技術情報同士の類似度が高く、「0」に近いほど文献同士の類似度が低いと判定する。なお、類似度の算出については、上記のテキスト情報だけに限られず、その他の技術情報の属性を活用して算出するようにしてもよい。
関連度スコア算出部27では、まず、ユーザによる評価が済んだ複数の技術情報と未評価の技術情報との類似度を上述したような文書比較手法を用いてそれぞれ計算する。次いで、関連度スコア算出部27は、計算された類似度から所定の計算ロジックに基づいて関連度スコア24d6を算出する。
本実施形態においては、未評価の技術情報(スコア計算対象の技術情報)の関連度スコアを算出するための計算ロジックとして、例えば、図11に示すような方法を用いる。図11は、本実施形態にかかる関連度スコア算出部27で行われる計算ロジックの一例を説明するための図である。本実施形態では、ユーザに4件の技術情報を提示し、その情報のそれぞれについて「興味あり」又は「興味なし」の評価を行わせ、評価が行われた4つの技術情報01〜04と未評価の技術情報05のそれぞれの類似度を算出し、その類似度に所定の処理を行って関連度スコアを算出する。
本実施形態では、興味ありと評価された技術情報(高評価の技術情報)と未評価の技術情報(スコア計算対象の技術情報)との類似度はその値をそのまま関連度算出のためのスコアとして使用する。一方、興味なしと評価された技術情報(低評価の技術情報)とスコア計算対象の技術情報との類似度は、所定のしきい値を設け、しきい値との比較結果に基づいて関連度算出のためのスコアを算出する。例えば、類似度がしきい値以上であれば低評価の技術情報との類似度が高いことから、関連度スコア算出部27はより低いスコアを算出する。一方、類似度がしきい値未満であれば低評価の技術情報との類似度が低いことから、関連度スコア算出部27は関連度スコア算出には考慮しないようなスコアを算出する。
以下、関連度スコアの算出について具体的に説明する。図11に示す例では、技術情報01、02についてユーザは興味ありと評価し、技術情報03、04についてユーザは興味なしと評価している。まず、関連度スコア算出部27では、興味ありと評価された技術文書01、02を高評価の技術情報と認定し、高評価の技術文書01、02と未評価の技術文書(スコア計算対象の技術文書)05の類似度を算出した後、その値を調整することなく、当該類似度を調整後のスコアとする。すなわち、技術情報01と技術情報05との類似度が0.453と算出された場合、その値を調整せずに、そのままの値の0.453を調整後スコアとして算出する。関連度スコア算出部27は、興味ありと評価された技術情報02についても同様に、技術情報05との類似度を算出し、その値が0.023の場合はその値を調整することなく、そのままの値の0.023を調整後のスコアとして算出する。
本実施形態では低評価の技術情報とスコア計算対象の技術情報との類似度に対してしきい値を設け、しきい値との比較結果に基づいて関連度算出のためのスコアを算出する。以下では、当該しきい値を0.5として調整後のスコアを算出するが、しきい値の値はそれ以外であってもよく、またしきい値も1つではなく複数設けるようにしてもよい。本実施形態において関連度スコア算出部27は、低評価の技術情報03とスコア計算対象の技術情報05との類似度を算出し、その値が0.567の場合は、しきい値0.5以上であるため、−0.1を調整後スコアとして算出する。関連度スコア算出部27は、低評価の技術情報04についても同様に、技術情報05との類似度を算出し、その値が0.201の場合はしきい値0.5未満なので調整後スコアを0として算出する。そして、評価対象の未評価の技術情報05の関連度スコアとして、上述した技術情報01〜04との類似度を調整した4つの調整後スコアの合計値を当該技術情報05の関連度スコアとして付与する。
このように本実施形態では、類似度が一定のしきい値を超えた場合に算出された類似度の値をより低くして合算する等、関連度スコア24d6の算出にはユーザによる評価結果をより反映するように工夫している。これにより繰り返し評価を行うにつれ、ユーザ端末10に表示される技術情報がより当該ユーザの好みに合った内容の技術情報に近づいてくるという、当該ユーザによってより興味深く評価行為を行えるようなユーザ体験を与えることができる。
また、関連度スコア24d6の算出に際しては、ユーザ評価ログデータベース24eに格納された上記評価結果24e5の他に、詳細確認有無24e6、評価にかかった時間24e7、その他評価パラメータ24e8又はブックマーク24e9等の情報を補助的に、又は、評価のための主情報として用いてもよい。さらに、関連度スコア算出のための計算ロジックは上記方法だけに限られることはなく、その他の方法を用いてもよい。また、複数の計算ロジックパターンを用意することも可能であり、任意の計算ロジックを技術情報の検索場面やユーザの評価結果等に応じて選択して精度をより向上させることも可能である。
このようにして関連度スコア算出部27は、技術情報リストデータベース24dに格納されている全ての技術情報に対して関連度スコア24d6を算出し、技術情報リストデータベース24dに格納する。
次に、本実施形態に係る検索システム1の動作について説明する。
<ユーザの技術興味の設定>
図12は、本発明の一実施形態に係る検索システム1のユーザ端末10においてユーザの技術興味情報24a4を設定する方法を説明するためのフローチャートである。また、図13は、本発明の一実施形態に係る検索システム1の検索サーバ20においてユーザの技術興味情報24a4を設定する方法を説明するためのフローチャートである。さらに、図14は、本発明の一実施形態に係る検索システム1における技術興味情報の設定手順の一例を示すシーケンス図である。
本実施形態では、ユーザ端末10を用いて技術情報を検索しようとするユーザは、技術情報の検索を行う前に、ユーザ自身が興味を持っている技術に関するキーワードを設定しておく。本実施形態では、ユーザがユーザ端末10の画面上に表示される機能リスト「興味設定機能」を選択することで、技術興味情報の入力処理を開始する(ステップS101でYES)。これにより、ユーザ端末10は検索サーバ20に対してキーワードを要求する(ステップS102、A1)。
検索サーバ20は、ユーザ端末10からのキーワード要求を受け付ける(ステップS201でYES)。検索サーバ20は、ユーザ端末10からのキーワードの要求に対して、技術情報データベース24b及び技術情報リストデータベース24dに格納されているデータ等を活用して、ユーザに選択させるキーワードを抽出する(ステップS202)。検索サーバ20におけるキーワード抽出は、例えば、技術情報データベース24bに格納されている技術情報から、過去の様々なユーザによる評価を通じて高評価(興味のあると選択された)件数が多い技術情報の技術タグ24b5として格納されているキーワードや用途タグ24b6として格納されているキーワードをカウントし、頻度の高いキーワードの上位を抽出するようにする。
また、より単純な方法として、あらかじめ設定しておいた一般的な技術キーワード等の一般的に興味が高いと考えられるキーワードをデータベースの情報から推定して候補として抽出するようにしてもよい。さらに、技術情報データベース24bに格納されている技術情報概要24b3のテキスト情報等に基づき、キーワードを抽出してもよい。
検索サーバ20は、抽出した複数のキーワードをユーザ端末10へ送信する(ステップS203、A2)。ユーザ端末10では検索サーバ20からキーワードを受信し(ステップS103)、受信した複数のキーワードを画面表示する(ステップS104)。次いで、ユーザは、ユーザ端末10に画面表示された複数のキーワードから興味あるキーワードを1つ又は複数選択するとともに、キーワードの選択終了後に、「キーワード更新」か「設定完了」かのどちらかを選択する(ステップS105)。その結果、ステップS105で「キーワード更新」が選択された場合、ユーザ端末10は、キーワードの更新に関する情報を検索サーバ20へ送信してキーワード更新を要求する(ステップS106、A3)。
検索サーバ20がユーザ端末10から送信されたキーワード更新に関する情報とキーワード情報を受信すると(ステップS204でキーワード更新の場合)、選択されたキーワードで技術情報データベース24bを検索し、該当する技術IDに付加されている技術IDから別のキーワードを抽出して、再度、ユーザ端末10に送信する(ステップS205、A4)。ユーザ端末10では、検索サーバ20からキーワードを受信する処理(ステップS103)に戻り、ユーザによるキーワードの選択処理(ステップS105)で「設定完了」が選択されるまで上記処理が繰り返される。一方、ステップS105で「設定完了」が選択された場合、ユーザ端末10は、選択されたキーワードを検索サーバ20へ送信する(ステップS107、A5)。検索サーバ20は、ユーザ端末10から送信された設定完了に関する情報とキーワードを受信し(ステップS204で設定完了の場合)、受信したキーワードを送信したユーザ端末10を使用するユーザのユーザID24a1に関連付けた技術興味情報24a4としてユーザデータベース24aに蓄積する(ステップS206)。
<技術に関する情報の検索処理>
以下では、上述した本発明の一実施形態に係る検索システムを用いた文献の検索処理について説明する。
図15は、本発明の一実施形態に係る検索システム1のユーザ端末10における技術情報の検索処理を説明するためのフローチャートである。また、図16は、本発明の一実施形態に係る検索システム1の検索サーバ20における技術情報の検索処理を説明するためのフローチャートである。さらに、図17は、本発明の一実施形態に係る検索システム1における文献検索処理手順の一例を示すシーケンス図である。なお、図18〜図23に、本実施形態に係る技術情報の検索処理の各段階におけるユーザ端末10に表示される画面例を示す。
ユーザは、ユーザ端末10を操作して、技術情報検索のモードを選択する(ステップS301)。図18は、本発明の一実施形態に係る検索システム1における文献検索処理の開始時にユーザ端末10に表示されるモード選択画面の一例を示す図である。ここで、「定点観測モード」は、比較的長期間(例えば、数か月)にわたってユーザ自身の興味のある範囲で技術情報を定期的に確認するという作業を行っておき、どこかの任意のタイミングで目的に応じた技術情報のリスト(例えば、文献リスト)を入手したい場合等に選択するモードである。また、「特急モード」は、検索処理を行って所望の文献リスト等の技術情報を比較的短時間で得たいというような場合に選択するモードである。特急モードに基づく検索結果を受けた文献リスト等の技術情報を提供するサービス提供者は、検索結果に基づいて自動的に検索サーバ20に格納されている検索結果に関する技術情報の一部又は全部を当該ユーザ端末10に送信するようにしてもよいし、検索結果に基づいて例えば1日〜数日程度の時間をかけてサービス提供者側で選択した適切な技術情報を当該ユーザに提供するようにしてもよい。
ここで、特許請求の範囲の請求項7に記載される「第1の抽出部」及び「第2の抽出部」は、ユーザが「定点観測モード」又は「特急モード」のどちらかを選択した場合に、制御部21が記憶部24から目的に応じた所定の技術に関する情報を抽出して通信部25がユーザ端末10へ送信することを意味する。
なお、特急モードによる処理の場合に、ユーザがキーワード入力を行って技術情報の抽出にキーワード検索の結果を併用するようにしてもよい。本実施形態では上記2つのモードを用意し、それぞれ画面上の定点観測モードボタン1801又は特急モードボタン1802をクリック等で選択できるように構成する。
ここでユーザが、ユーザ端末10上で「定点観測モード」1801を選択した場合(ステップS302で定点観測モードの場合)、ユーザ端末10は、ユーザID及びユーザ端末情報の少なくともいずれか1つの情報と、定点観測モードが選択された旨の情報等の所定の情報を検索サーバ20に送信する(ステップS303、B1)。ユーザが「定点観測モード」を選択する目的は、例えば、毎日定期的に自分の興味対象に関連する技術情報を確認し、興味のある技術情報を保存しておきたい等が挙げられる。
検索サーバ20は、ユーザ端末10から送信されてきた定点観測モードに関する情報を通信部25を介して受信したことをトリガーとして(ステップS401でYES)、受信したユーザID又はユーザ端末情報等の所定の情報に基づいて記憶部24内のユーザデータベース24aに格納されている情報から当該ユーザの技術興味情報24a4を抽出し、技術情報の検索条件を作成する(ステップS402)。例えば、ユーザデータベース24aに当該ユーザの技術興味情報として「デジタルヘルスケア」及び「糖尿病」に興味があると設定されていた場合には、制御部21は記憶部24内の技術情報データベース24bをこれらのキーワードや関連するキーワードで検索し、該当する技術情報に関する情報を技術情報リストデータベース24dに格納するとともに、検索案件情報データベース24cに新規の検索案件情報リストのレコードを追加する(ステップS403)。
なお、技術情報リストデータベース24に格納される技術情報の数に特に限定は設けずに、例えば数千件から数万件の技術情報をリストアップできるようにしてもよい。なお、実装を考慮して、技術情報のリストアップ可能数を制限するようにしてもよい。この処理は、初回だけに限らず、例えば、ユーザが定点観測モードを選択する毎に実施され、技術情報リストデータベース24dを、そのたびに更新してもよい。また、同時に複数の技術に興味・関心を持っているような場合であっても、複数の検索方法を設定・調整することができるようにしてもよい。なお、定点観測モードは、例えば数か月にわたってユーザの技術に関する興味を評価するものであり、当該ユーザの興味が途中で変わる可能性もあることから、同じ技術情報を再度評価させるような処理を含めるようにしてもよい。このようにして、ユーザの技術に関する興味・関心が変わった場合であっても、ユーザが所望の技術情報を取得することができる。
そして、検索サーバ20は、ユーザによる評価対象となる技術情報を抽出し、ユーザ端末10へ送信する(ステップS404、B2)。本実施形態では、検索サーバ20は4件の技術情報を抽出してユーザ端末10へ送信して、ユーザに評価させるようにする。技術情報の抽出対象は、ユーザが興味ありと評価する技術情報が一定量含まれるように、技術情報リストデータベース24dにおけるクラスタリング結果24d4やその他計算結果24d5の値をもとに決定する。例えば、なるべく異なるクラスタの重心に近い、すなわち、そのクラスタを代表するような技術情報を抽出対象とするような決定方法が一例である。2回目以降では、ユーザの評価によって、技術情報ID単位に関連度スコア24d6が計算されるため、関連度スコアの大きさから、よりユーザが興味ありと評価する可能性の高い技術情報を抽出することが可能となる。
一方、ユーザがユーザ端末10上で「特急モード」を選択した場合は、図19に示すような検索条件設定画面に遷移する(ステップS304)。図19は、本実施形態に係るユーザ端末10に表示される特急モード時の検索情報設定画面の一例を示す図である。例えば、ユーザは、ユーザ端末10に表示される図19の検索情報設定画面のそれぞれの項目部分をタッチすることで所定のデータを入力することができる。本実施形態では、ユーザは、ユーザ端末10に表示される各項目ボタン(例えば、検索キーワード1901、発表年(From)〜発表年(To)1902、研究組織区分1903、地域条件1904、技術開発の進展度1905等)に指等でタッチし、各項目に関する検索条件を入力し、検索ボタン1906をタッチする。この行為により、ユーザ端末10は、入力された技術情報の検索条件に関する情報を、ユーザID及びユーザ端末情報の少なくともいずれか1つの情報と特急モードが選択された旨の情報とともに、検索サーバ20へ送信する(ステップS305、B1)。ユーザが「特急モード」選択する目的は、具体的な検索したい技術情報の対象が明確であり、より早く対象に合致した検索結果を得たい場合が一例として挙げられる。
検索サーバ20では、ユーザ端末10から送信されてきた上記情報を通信部25を介して受信したことをトリガーとして(ステップS401)、制御部21は受信したユーザID又はユーザ端末情報、及びユーザ端末10で入力された技術情報の検索条件に関する情報に基づいて、以下のような検索処理を実行して、検索案件情報リストデータベース24cにレコードを追加する。
すなわち、検索サーバ20では、ユーザ端末で設定された検索条件の情報に基づいて、技術情報の検索条件が作成される(ステップS402)。例えば、キーワードとして「デジタルヘルスケア」、「2008年から2018年に発表」、「民間企業による研究」、「地域限定なし」等のように細かな検索条件で技術情報データベース24bを検索し、それぞれに該当する技術情報の集合が技術情報リストデータベース24dに格納され、検索案件情報データベース24cに新規のレコードが追加される(ステップS403)。なお、検索される技術情報の集合は、例えば数千件から数万件のような大量のデータ数であってもよい。
次に、「定点観測モード」と同様に、検索サーバ20の文献リスト生成部26は、記憶部24の技術情報リストデータベース24dの格納情報から、ユーザに評価させる対象となる複数の技術情報(例えば4件の技術情報)を抽出する。
そして、検索サーバ20は、抽出した技術情報を1回目にユーザに評価させるための技術情報としてユーザ端末10へ送信する(ステップS404、B2)。本実施形態では、ユーザに評価させる技術情報を4件としているが、例えば10件や30件等、ユーザに1回で評価させる技術情報の数に限定はなく、検索システム1の管理者等が自由に設定できるようにしてもよい。
ユーザ端末10が検索サーバ20から4件の技術情報を受信した場合(ステップS306でYES)、ユーザは、ユーザ端末10の操作部12を操作して受信した4件の技術情報に対して評価作業を行い、この評価結果をユーザ端末10から検索サーバ20へ送信する(ステップS307、B3)。なお、評価結果の送信は、評価作業が終了した時点で送信するようにしてもよいし、後述するフィルター設定画面を通じて設定したフィルター設定情報とともに送信するようにしてもよい。
また、ここでいう評価作業とは、ユーザが検索したかった技術情報であるかどうかや、ユーザがさらに詳細を知りたい技術情報であるかどうか等のユーザが欲している技術情報を選定する作業である。図20は、ユーザが評価作業を行う際にユーザ端末10の表示部13に表示される技術評価画面の一例を示す図である。本実施形態では、ユーザ端末10の表示部13に表示される技術情報をユーザが閲覧して、その技術情報に興味があるかどうかの評価を行う。本実施形態では、図20に示すように、技術タイトル、論文アブストラクト等の技術概要、開発機関名、開発本拠地、開発者名、国名等の技術情報2001が表示部13に1件ごとに表示され、ユーザは当該技術情報のそれぞれに関して興味があれば「興味あり」ボタン2002を選択し、興味がなければ「興味なし」ボタン2003を選択することで技術情報の評価を行う。「興味あり」「興味なし」の意思表示はボタン選択だけでなく、音声による入力やスワイプ処理など任意の方法で選択してもよい。このように本実施形態では、ユーザが対話形式で簡単な操作で技術情報の評価を行うことができる。そして、ユーザによって「興味あり」が選択された技術情報はそのユーザが高評価をした技術情報とし、「興味なし」が選択された技術評価はそのユーザが低評価をした技術情報とする。
なお、ユーザ端末10の表示部13に表示される項目として、技術情報データベース24bに格納された上記項目の他に、ユーザ評価ログデータベース24eに格納されているデータから計算される他のユーザの評価結果等を含めるようにしてもよい。また、表示された技術情報だけでは情報が足らないため評価することが難しい場合は、例えば画面をタップすることで、情報元であるインターネットのウェブページを表示して詳細情報を確認することができる。上述したように、ユーザは、表示された情報等に基づいて各技術情報に対して「興味あり」/「興味なし」を決定するが、ユーザ端末10は、ユーザが決定した興味の有無に関する結果だけでなく、ユーザがその決定に至るまでの評価にかかった時間や詳細情報を確認したかどうか等の評価に関わるその他の情報をパラメータとして保持するようにしてもよい。
また、ユーザは、上記評価作業(ステップS307)において、技術情報に対する「興味あり」/「興味なし」の選定とは別に、気になる技術情報をブックマークすることができる。本実施形態では、ユーザ端末10に表示される画面の中にブックマークボタン2004を含めるようにしている。このブックマーク機能により、評価時点では「興味がない」技術情報ではあるが、後日利用する可能性があるかもしれないとしてメモしておきたい技術情報について、その情報を保持することができる。このようにブックマーク機能を興味の有無と分けて選択させることにより、「興味あり」と選択された技術情報の中に「単純にメモしたい」という技術情報が含まれてしまう事態を排除することができ、評価精度を向上させる効果がある。
なお、ユーザ端末10は、1回目の上記評価作業(ステップS307)において、評価結果を検索サーバ20へ送信するが、その際に評価にかかった時間等の評価パラメータや後述のフィルター条件設定情報も含めて検索サーバ20へ送信するようにしてもよい。また、評価結果は、4件の技術情報の評価が終了した時点で検索サーバ20へ送信してもよいし、技術情報1件ごとにユーザ端末10から検索サーバ20へ送信するようにしてもよい。
ユーザがユーザ端末10において検索サーバ20から送信されてきた4件分の技術情報に対して上述の評価作業(ステップS307)を実施すると、ユーザ端末10の表示部13の表示は図21に示すようなフィルター設定画面を表示する(ステップS308)。図21は、ユーザ端末10の表示部13に表示されるフィルター設定画面の一例を示す図である。フィルター設定画面には、図21に示すように、ユーザが評価作業(ステップS307)で評価した技術情報の代表的なキーワード(例えば、骨、糖尿病等)やその他の属性(例えば、古い技術、大学発等)に関する情報2101が表示される。ユーザが表示部13に表示されるこれらのキーワード等の中から技術情報の選択の際に考慮しないキーワード等を選択して実行ボタン2102を選択すると、フィルター条件(除外条件)が設定され、当該フィルター設定情報がユーザ端末10から検索サーバ20に送信される(ステップS309、B4)。なお、キーワード等の情報2101のうち選択された情報は当該ボタン領域の色や模様等の表示態様を変化させてユーザが識別できるようにする。フィルター設定画面でキーワード等を選択することで、選択されたタイトルやサマリテキストに含む技術情報や設定した属性に該当する技術情報の優先度を下げる効果が得られる。
なお、設定されたフィルター条件の内容は、ユーザ端末10の検索モード選択時(ステップS301)に表示される図18に示す画面の探索条件設定メニュー1803を選択すると、検索案件ごとの探索条件設定変更画面に遷移し、そこで確認することができる。図22は、ユーザ端末10の表示部13に表示される探索条件設定変更画面の一例を示す図である。
また、フィルター設定画面で除外するキーワードを設定した後に、ユーザ端末10の制御部11は、ユーザにもう一度技術情報を評価するか、それ以前の検索結果をリストとして出力するかを選択する図23に示すような画面が表示され、ユーザは、同様の評価を継続するかどうかを選択する(ステップS310)。図23は、ユーザ端末10の表示部13に表示されるユーザの指示入力を促す画面の一例を示す図である。
一方、検索サーバ20がユーザ端末10から1回目の評価結果等を受信した場合(ステップS405でYES)、技術情報リスト生成部26は当該評価結果等に基づいて、各技術情報についてユーザ別の検索案件単位の関連度スコア24d6を算出し、技術情報リストデータベース24dに格納している技術情報の内容を更新するとともに、技術情報リストの優先順位を更新する(ステップS406)。関連度スコア24d6の算出方法の一例は、図11等を用いて前述した通りであり、同様の方法で技術情報リストデータベース24dに格納されている全ての技術情報について、ユーザID、検索案件単位で関連度スコアを計算して更新する。
なお、関連度スコアの計算方法は、上記ルールだけに限られず、その他にも、入力値として技術情報リストデータベース24dの属性値、出力値としてユーザ端末における評価パラメータ(評価結果、ブックマーク結果、評価にかかった時間等)を活用した一般的な機械学習の手法で代替するようにしても良い。
ユーザが図23に示す表示画面上で「もう一度評価する」メニュー2301を選択した場合(ステップS310で再度の評価)、ユーザ端末10から検索サーバ20へその旨に関する情報が送信される(ステップS311、B5)。検索サーバ20は、当該情報を受信した場合(ステップS407で再度の評価)、付与された関連度のスコアに基づいて技術情報リストデータベース24dに格納されている技術情報をソートして次にユーザに評価させる4件の技術情報を抽出し、ユーザ端末10へ送信する(ステップS408、B6)。
本実施形態では、一例として、未評価の上位4件を次の評価対象の技術情報として抽出してユーザ端末10に送信するようにするが、それ以外の別の4件を抽出するようにしてもよい。例えば、抽出される評価対象の技術情報をスコアが上位の技術情報からだけでなく、ランダムに抽出したり、上位のスコアと中位のスコアと下位スコアを一定の比率で組み合わせて抽出する等、検索システム1の目的や使用環境等に応じてシステム管理者が設定したり切り替えたりできるようにしても良い。このように繰り返し評価を行うことで、ユーザ端末10に表示される技術情報がより当該ユーザの好みに合った内容の技術情報に近づいてくるという、当該ユーザによってより興味深く評価行為を行えるような体験をユーザに与えることができる。
一方、ユーザが図23に示す表示画面上で「技術情報リストを出力する」メニュー2302を選択した場合(ステップS310で技術情報リストの出力)、ユーザ端末10から検索サーバ20へその旨に関する情報が送信される(ステップS312、B7)。検索サーバ20は、当該情報を受信した場合(ステップS407で技術情報リストの出力)、付与された関連度スコアに基づいて、技術情報リストデータベース24dに格納されている技術情報をソートして、ユーザに提供する所定数の技術情報を抽出し、ユーザ端末10へ送信する(ステップS409、B8)。そして、ユーザ端末10は検索サーバ20から技術情報のリストを受信し(ステップS313)、ユーザはそれらの文献情報を閲覧することが可能になる。なお、本実施形態では、100件の技術情報をスコア上位から順に抽出して出力するようにするが、それ以外の方法で任意の数(例えば、50件や1000件等)の技術情報を抽出等するようにしてもよい。
図24は、本実施形態における検索サーバ20の技術情報リストの出力処理(ステップS409)の詳細を説明するためのフローチャートである。ここで、ステップS301で選択された検索条件が「特急モード」であれば(ステップS409aで特急モードの場合)、検索サーバ20はそのままリストを出力する(ステップS409b)。一方、ユーザが設定したモードが「定点観測モード」の場合(ステップS409aで定点観測モードの場合)、前述の関連度スコアの付与処理の後、検索サーバ20からユーザ端末10に出力準備が整った旨を通知する(ステップS409c)。そして、ユーザ端末10では、ユーザが図16で示すような検索画面から出力させる技術情報の条件を設定し、設定情報を検索サーバ20へ送信する(ステップS310)。検索サーバ20では、ユーザ端末10から受信した抽出条件に従って技術情報リストを抽出し(ステップS409d)、抽出したリストをユーザ端末10に出力する(ステップS409e)。
本実施形態では、ユーザ端末10及び検索サーバ20に本発明に係る検索アプリケーションソフトウェアがインストールされている。当該検索アプリケーションソフトウェアは、ユーザ端末10におけるユーザ操作に基づいて検索サーバ20において所定の処理が行われるものである。
以上説明したように、本実施形態に係る検索システム、検索方法及び検索アプリケーションソフトウェアを用いて、ユーザによる技術情報の評価、技術情報間の類似度の算出及び評価対象の技術情報の抽出等を繰り返し行うことで、多様かつ膨大な数の技術情報の中から個々のユーザの興味に沿った技術情報を適切に抽出し、ユーザに提供することが可能になる。特に、情報検索モードをユーザの技術情報検索の目的別(本実施形態では定点観測モードと特急モードの2モード)に分けて、その範囲で、繰り返しユーザの評価を実施することにより、よりユーザの興味に沿った検索結果を出力できることにある。
また、本実施形態で説明した技術情報の検索は、テキストの全文検索結果などは活用せず、同一のデータベース内の限定された定型のデータを活用しているため、論文、特許文献、製品情報、研究者・技術者情報、技術的なアイデア等の多様な技術情報について適用できる。
さらに、技術分野に関わらず適用できることも特徴である。技術分野によって、同じ単語が別の意味で使用されていたり、文献の記載のルールが異なっていたりすることが原因で、技術情報同士の類似性を判断することがしばしば困難である場合があるが、ユーザの評価結果(技術情報を求める人間が判断した結果)を目的関数に設定することで、上記の問題を解決している。すなわち、テキスト情報だけで検索するのが困難な技術情報であっても、ユーザが検索する時点でのユーザが判断した興味あり・なしの評価結果に基づいて、データベースから検索・抽出することにより、ユーザの興味に沿った検索結果を得ることができる。
1 検索システム
10 ユーザ端末
20 検索サーバ
30 ネットワーク
11、21 制御部
12、22 操作部
13、23 表示部
14、24 記憶部
24a ユーザデータベース
24b 技術情報データベース
24c 技術案件情報データベース
24d 技術情報リストデータベース
24e ユーザ評価ログデータベース
15、25 通信部
26 技術情報リスト生成部
27 関連度スコア算出部
上記課題を解決するため、本発明の検索システムは、ユーザが検索条件を入力するためのユーザ端末と、該ユーザ端末とネットワークを介して接続し、該検索条件に基づいて情報を検索する検索サーバとを備える検索システムであって、前記検索サーバは、複数の技術に関する情報を記憶する技術情報データベースと、前記ユーザ端末に評価させる複数の第1の技術に関する情報を該技術情報データベースから抽出する第1の技術情報抽出部と、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度を算出し、該類似度を前記複数の第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して関連度スコアを算出し、
さらに、前記ユーザが高評価した前記第1の技術に関する情報と、前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の正数、又は、前記ユーザが低評価した前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の負数を前記第1の技術に関する情報の関連度スコアとして算出する関連度スコア算出部と、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えたリストを生成する技術情報リスト生成部と、該技術情報リスト生成部が生成した前記リストを記憶する技術情報リストデータベースと、前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2の技術情報抽出部と、を備えることを特徴とする。
また、本発明の検索システムは、前記関連度スコア算出部は、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、前記類似度の大きさの調整を多段階で行って前記調整スコアを算出することを特徴とする。
また、本発明の検索方法は、ユーザが検索条件を入力するユーザ端末と、該ユーザ端末とネットワークを介して接続し、前記検索条件に基づいて情報を検索する検索サーバによる検索方法であって、前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1のステップと、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度を算出し、該類似度を前記複数の第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して関連度スコアを算出し、さらに、前記ユーザが高評価した前記第1の技術に関する情報と、前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の正数、又は、前記ユーザが低評価した前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の負数を前記第1の技術に関する情報の関連度スコアとして算出する第2のステップと、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに前記関連度スコアの高い順に並べ替えて、前記関連度スコアとともに技術情報リストデータベースに記憶する第3のステップと、前記検索条件に基づいて、前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4のステップと、
を有していることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、ユーザが検索条件を入力するユーザ端末と通信可能な、前記検索条件に基づいて情報を検索する検索サーバにおいて実行可能な検索アプリケーションソフトウェアであって、前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1の機能と、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度を算出し、該類似度を前記複数の第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して関連度スコアを算出し、さらに、前記ユーザが高評価した前記第1の技術に関する情報と、前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の正数、又は、前記ユーザが低評価した前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の負数を前記第1の技術に関する情報の関連度スコアとして算出する第2の機能と、前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えて、該関連度スコアとともに技術情報リストデータベースに記憶する第3の機能と、
前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4の機能が、前記検索サーバにおいて実行可能であることを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記第2の機能が、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、該類似度の大きさの調整を多段階で行って前記調整スコアを算出することを特徴とする。
また、本発明の検索アプリケーションソフトウェアは、前記検索サーバが備えるユーザデータベースにユーザの技術に関する関心情報を記憶する第5の機能がさらに実行可能であって、前記第1の機能は、前記ユーザデータベースに記憶された前記関心情報に基づいて、前記検索サーバが備える複数の技術に関する情報を記憶する前記技術情報データベースから前記複数の第1の技術に関する情報を抽出することを特徴とする。

Claims (19)

  1. ユーザが検索条件を入力するためのユーザ端末と、該ユーザ端末とネットワークを介して接続し、該検索条件に基づいて情報を検索する検索サーバとを備える検索システムであって、
    前記検索サーバは、複数の技術に関する情報を記憶する技術情報データベースと、
    前記ユーザ端末に評価させる複数の第1の技術に関する情報を該技術情報データベースから抽出する第1の技術情報抽出部と、
    前記ユーザ端末における前記複数の第1の技術に関する情報の評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定に処理を行った関連度スコアを算出する関連度スコア算出部と、
    前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えたリストを生成する技術情報リスト生成部と、
    該技術情報リスト生成部が生成した前記リストを記憶する技術情報リストデータベースと、
    前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2の技術情報抽出部と、
    を備えることを特徴とする検索システム。
  2. 前記関連度スコア算出部は、前記複数の第1の技術に関する情報と前記第2の技術に関する情報との類似度を算出し、該類似度を前記複数の第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して前記関連度スコアを算出することを特徴とする請求項1記載の検索システム。
  3. 前記関連度スコア算出部は、ユーザが高評価した前記第1の技術に関する情報と、前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の正数、又は、ユーザが低評価した前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後のスコアの少なくとも数倍以上の負数を、前記第1の技術に関する情報の関連度スコアとして算出することを特徴とする請求項2記載の検索システム。
  4. 前記関連度スコア算出部は、前記類似度が−1から+1の範囲の数値で表現される場合に、前記評価結果が高評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、1.0以上の係数を乗算又は加算する調整を行って前記調整後スコアを算出し、前記評価結果が低評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、0以下の係数を乗算又は減算する調整を行って前記調整後スコアを算出することを特徴とする請求項3記載の検索システム。
  5. 前記関連度スコア算出部は、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、前記類似度の大きさの調整を多段階で行って前記調整度スコアを算出することを特徴とする請求項4記載の検索システム。
  6. 前記検索サーバは、ユーザが関心を寄せる技術についての情報を関心情報としてユーザごとに記憶するためのユーザデータベースを備え、
    前記第1の技術情報抽出部は、該ユーザデータベースに記憶された前記関心情報に基づいて、前記技術情報データベースからユーザに評価させるための前記複数の第1の技術に関する情報を抽出することを特徴とする請求項5記載の検索システム。
  7. 前記検索サーバは、所定期間内に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第1の抽出部と、
    過去の評価を考慮せずに、最後に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2の抽出部と、を備え、どちらかの抽出部によって技術に関する情報を抽出させることが選択可能であることを特徴とする請求項6記載の検索システム。
  8. 前記ユーザ端末は、前記第1の技術情報抽出部によって抽出された前記複数の第1の技術に関する情報を1件ずつ表示し、ユーザに興味の有無を判定させ、該ユーザが興味あり、と判定した前記第1の技術に関する情報は高評価された情報とし、前記ユーザが興味無し、と判定した前記第1の技術に関する情報を低評価した情報とすることを特徴とする請求項7記載の検索システム。
  9. 前記ユーザ端末において評価された前記第1の技術に関する情報に関する評価結果に基づいて、前記関連度スコア算出部及び技術情報リスト生成部の処理に用いられる計算方法又はパラメータを選択することができることを特徴とする請求項1から8のいずれか1項に記載の検索システム。
  10. ユーザが検索条件を入力するユーザ端末と、該ユーザ端末とネットワークを介して接続し、前記検索条件に基づいて情報を検索する検索サーバによる検索方法であって、
    前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1のステップと、
    前記ユーザ端末において評価された前記複数の第1の技術に関する情報に関する評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定の処理を行った関連度スコアを算出する第2のステップと、
    前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに前記関連度スコアの高い順に並べ替えて、前記関連度スコアとともに前記技術情報リストデータベースに記憶する第3のステップと、
    前記検索条件に基づいて、前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4のステップと、
    を有していることを特徴とする検索方法。
  11. ユーザが検索条件を入力するユーザ端末と通信可能な、前記検索条件に基づいて情報を検索する検索サーバにおいて実行可能な検索アプリケーションソフトウェアであって、
    前記検索サーバが備える複数の技術に関する情報を記憶する技術情報データベースから前記ユーザ端末で評価させるための複数の第1の技術に関する情報を抽出する第1の機能と、
    前記ユーザ端末において評価された前記複数の第1の技術に関する情報に関する評価結果に基づいて、前記複数の第1の技術に関する情報と、前記技術情報データベースが記憶する第2の技術に関する情報との類似度に所定の処理を行った関連度スコアを算出する第2の機能と、
    前記技術情報データベースが記憶する前記複数の技術に関する情報を、前記ユーザごとに、前記関連度スコアの高い順に並べ替えて、該関連度スコアとともに技術情報リストデータベースに記憶する第3の機能と、
    前記検索条件に基づいて前記技術情報リストデータベースから所定の技術に関する情報を抽出する第4の機能が、
    前記検索サーバにおいて実行可能であることを特徴とする検索アプリケーションソフトウェア。
  12. 前記第2の機能が、前記複数の第1の技術に関する情報のそれぞれと前記第2の技術に関する情報との類似度を算出し、該類似度を前記第1の技術に関する情報のそれぞれに関する評価結果に基づいて調整した調整後スコアを算出し、算出された複数の前記調整後スコアを合算して前記関連度スコアを算出することを特徴とする請求項11に記載の検索アプリケーションソフトウェア。
  13. 前記第2の機能は、ユーザが高評価をした前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後スコアの少なくとも数倍以上の正数、又は、ユーザが低評価をした前記第1の技術に関する情報と前記第2の技術に関する情報との前記調整後スコアの少なくとも数倍以上の負数を、前記第1の情報の関連度スコアとして算出することを特徴とする請求項12に記載の検索アプリケーションソフトウェア。
  14. 前記第2の機能は、前記類似度が−1から+1の範囲の数値で表現される場合に、前記評価結果が高評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、1.0以上の係数を乗算又は加算する調整を行って前記調整後スコアを算出し、前記評価結果が低評価の前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の値に応じて、0以下の係数を乗算又は減算する調整を行って前記調整後スコアを算出することを特徴する請求項13に記載の検索アプリケーションソフトウェア。
  15. 前記第2の機能が、前記第1の技術に関する情報と前記第2の技術に関する情報との前記類似度の大きさに基づいて、該類似度の大きさの調整を多段階で行って前記調整度スコアを算出することを特徴とする請求項14に記載の検索アプリケーションソフトウェア。
  16. 前記検索サーバが備えるユーザデータベースにユーザの技術に関する関心情報を記憶する第5の機能がさらに実行可能であって、
    前記第1の機能は、前記ユーザデータベースに記憶された前記関心事項に基づいて、前記検索サーバが備える複数の技術に関する情報を記憶する前記技術情報データベースから前記複数の第1の技術に関する情報を抽出することを特徴とする請求項15に記載の検索アプリケーションソフトウェア。
  17. 所定期間内に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第1のモードと、過去の評価を考慮せずに、最後に評価された技術に関する情報を記憶する前記技術情報リストデータベースから所定の技術に関する情報を抽出する第2のモードとを選択させる第6の機能がさらに実行可能であることを特徴とする請求項16に記載の検索アプリケーションソフトウェア。
  18. 前記第1の機能は、前記ユーザ端末に前記複数の第1の技術に関する情報を1件ずつ表示してユーザに興味の有無を判定させ、該ユーザが興味有りと判定した前記第1の技術に関する情報を高評価がされた情報とし、該ユーザが興味無しと判定した前記第1の技術に関する情報を低評価がされた情報とすることを特徴とする請求項17に記載の検索アプリケーションソフトウェア。
  19. 前記ユーザ端末において評価された前記第1の技術に関する情報に関する評価結果に基づいて、前記第2の機能及び前記第3の機能の処理に用いられる計算方法又はパラメータを選択できることを特徴とする請求項11から18までのいずれか1つに記載の検索アプリケーションソフトウェア。
JP2019548079A 2019-05-28 2019-05-28 検索システム、検索方法及び検索アプリケーションソフトウェア Active JP6890671B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/021156 WO2020240714A1 (ja) 2019-05-28 2019-05-28 検索システム、検索方法及び検索アプリケーションソフトウェア

Publications (2)

Publication Number Publication Date
JP6890671B2 JP6890671B2 (ja) 2021-06-18
JPWO2020240714A1 true JPWO2020240714A1 (ja) 2021-09-13

Family

ID=73553650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019548079A Active JP6890671B2 (ja) 2019-05-28 2019-05-28 検索システム、検索方法及び検索アプリケーションソフトウェア

Country Status (2)

Country Link
JP (1) JP6890671B2 (ja)
WO (1) WO2020240714A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150297B (zh) * 2022-08-15 2023-05-19 雁展科技(深圳)有限公司 一种基于移动互联网的数据过滤及内容评价方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157467A1 (ja) * 2015-03-31 2016-10-06 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157467A1 (ja) * 2015-03-31 2016-10-06 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体

Also Published As

Publication number Publication date
JP6890671B2 (ja) 2021-06-18
WO2020240714A1 (ja) 2020-12-03

Similar Documents

Publication Publication Date Title
US11868386B2 (en) Method and system for sentiment analysis of information
KR101064634B1 (ko) 유저 맞춤형 컨텐츠 제공 방법 및 시스템
CN102609473B (zh) 一种网站访问方法及系统
CN106227815A (zh) 一种多模态线索的个性化应用程序功能推荐方法及其系统
CN110472016B (zh) 文章推荐方法、装置、电子设备及存储介质
CN110968801A (zh) 地产产品搜索方法、存储介质及电子设备
CN112352229A (zh) 文档信息评价装置、文档信息评价方法及文档信息评价程序
JP5223865B2 (ja) 知識発見支援システム、方法、及び、プログラム
JP6890671B2 (ja) 検索システム、検索方法及び検索アプリケーションソフトウェア
KR100925294B1 (ko) 정보의 태그 데이터와 큐브 구조체를 이용하는 검색 시스템및 검색 방법
CN105975508B (zh) 个性化元搜索引擎检索结果合成排序方法
JP2007148476A (ja) 情報検索支援システム、情報検索支援方法、検索支援モジュールプログラムおよび情報検索支援プログラム
CN108431806B (zh) 辅助搜索查询
JP6941802B1 (ja) 検索システム、検索方法及び検索プログラム
JP2006215675A (ja) データマップ作成サーバ、データマップ作成方法、およびデータマップ作成プログラム
CN116992124A (zh) 标签的排序方法、装置、设备、介质及程序产品
JP5368900B2 (ja) 情報提示装置、情報提示方法およびプログラム
JP2018063610A (ja) 文章検索システム、q&a検索システム、クライアントステム及びサーバ
JP6167029B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
CN112084370A (zh) 视频处理方法、装置和电子设备
JP6941803B1 (ja) 検索システム、検索方法及び検索プログラム
JP6941801B1 (ja) 検索システム、検索方法及び検索プログラム
CN114565928B (zh) 文本识别方法、装置、设备及存储介质
US8862592B2 (en) Systems and methods for graphical search interface
CN107220347B (zh) 一种基于Lucene的支持表达式的自定义相关度排序算法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210525

R150 Certificate of patent or registration of utility model

Ref document number: 6890671

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250