JP2023008284A - 検索システム、検索方法及び検索プログラム - Google Patents
検索システム、検索方法及び検索プログラム Download PDFInfo
- Publication number
- JP2023008284A JP2023008284A JP2021111716A JP2021111716A JP2023008284A JP 2023008284 A JP2023008284 A JP 2023008284A JP 2021111716 A JP2021111716 A JP 2021111716A JP 2021111716 A JP2021111716 A JP 2021111716A JP 2023008284 A JP2023008284 A JP 2023008284A
- Authority
- JP
- Japan
- Prior art keywords
- company
- characteristic
- words
- keyword
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000014509 gene expression Effects 0.000 claims abstract description 21
- 238000010801 machine learning Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 33
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 37
- 238000005516 engineering process Methods 0.000 description 28
- 238000010276 construction Methods 0.000 description 15
- 238000004519 manufacturing process Methods 0.000 description 14
- 238000000465 moulding Methods 0.000 description 14
- 239000011347 resin Substances 0.000 description 14
- 229920005989 resin Polymers 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
これまで取引がない新しいビジネスパートナーをインターネットで探す場合、検索ユーザはパーソナルコンピュータ等の画面に表示されるWebブラウザ上でキーワードを入力し、そのキーワードがヒットした企業をビジネスパートナーの候補としてリストアップする。この際に用いられるキーワードの多くは、商材やその特徴等の製品や材料に関する単語であるが、検索ユーザの経験や知識に基づいて選択されるため、ユーザのスキルや経験の差が検索結果に表れてしまうことが多い。そこで、入力されたキーワードに関連するキーワード技術を企業情報から抽出して両者の類似度を算出した上で企業を検索する技術が知られている(例えば、特許文献1参照)。
図1は、本発明の一実施形態に係る検索システム1の構成図である。図1に示すように、本実施形態に係る検索システム1は、複数のユーザ端末10と管理サーバ20で構成され、それぞれインターネット等の有線又は無線のネットワーク30で通信可能に接続されている。以下では、ビジネスパートナー企業の探索を含む企業マッチングサービスを提供する企業(以下、「管理企業」という)に上記検索システム1が導入され、SaaS(Software as a Service)型のクラウドサービスによって以下で詳述するビジネスパートナー候補企業の検索やその他の各種処理が行われるものとする。
管理サーバ20のデータベース構築部26は、ユーザ端末10によるキーワード検索に先立って、ユーザ端末10又はその他の外部装置(不図示)等から候補企業の公開企業情報及び非公開企業情報を取得し、その情報を企業ごとに企業データベース221に新規に記憶又は既存情報の更新を行う。
管理サーバ20のデータベース構築部26は、さらにユーザ端末10によるキーワード検索に先立って各企業が保有する潜在的な技術特徴等をタグ付けするための基礎となる技術タグ情報をユーザ端末10又はその他の外部装置(不図示)から取得し、技術タグデータベース222に新規に記憶又は既存情報を更新する。本実施形態では、上記企業データベース221の構築と同時又はそれと前後して技術タグ情報を取得し、技術タグデータベース222を構築する。技術タグ情報には、前述のように、規格タグ、設備タグ及び受賞歴タグが含まれる。
管理サーバ20の特徴語生成部27は、企業データベース221の企業情報(テキストデータ)から企業ごとに特徴語とそのスコアを生成して、それらを特徴語データベース223に新規に記憶又は既存情報を更新する。
なお、スコアの指標や次元数についてはこれに限定されるものではなく、実装するシステムの性質や目的によって適宜変更するようにしてもよい。
管理サーバ20の学習モデル生成部28は、製造業に関する技術文書中に含まれる特徴語を周辺の特徴語から予測させる深層学習を行ってそれぞれの特徴語を高次元ベクトルの分散表現で構築した学習モデル(学習済みモデル)を生成し、学習モデルデータベース224に特徴語ごとに新規に記憶又は記憶情報を更新する。
ビジネスパートナー候補企業のリストアップをキーワード検索に基づいて行う場合、通常は複数の異なるキーワードを同時に、又は逐次入力し、適切な候補企業がリストアップされるように検索結果を絞り込んでいくという作業が発生する。そこで、本実施形態では、ビジネスパートナー候補企業のリストアップを行うユーザが、ユーザ端末10で一つ目のキーワードを入力し、そのキーワードと一致するテキストデータが企業データベース221に記憶された企業情報に含まれているか、そのキーワードに対応する特徴語が特徴語データベース223に保持されている企業をリストアップする(ステップS12)。この際、管理サーバ20は、入力されたキーワードに基づいて候補企業のリストを生成するが、そのリストに候補企業が持つ複数の特徴語を含めることで、そのユーザが候補企業の絞り込み検索を行う際のキーワード候補をユーザ端末10を介してユーザに示唆することができる。図7は、本発明の一実施形態に係る検索システム1の管理サーバ20における新たなキーワード候補(特徴語)の生成処理(ステップS12)の詳細を説明するためのフローチャートである。
上述の処理により、ユーザは二つのキーワード「樹脂成型」及び「試作」を用いてビジネスパートナー候補企業のリストアップを行うことを決定する。
次に、類似度計算部24は、取得した2つのキーワードと検索された企業との類似度を計算する(ステップS15)。図9は、本発明の一実施形態に係る検索システム1の管理サーバ20における類似度計算処理(ステップS15)の詳細を説明するためのフローチャートである。
ここで、上述した類似度はそのままのレーティングだけではビジネスマッチングシステムとしての信頼性は低い可能性がある。これは単に公開情報等のキーワードだけで類似度を見ているためである。そこで、本実施形態では、過去のビジネスパートナー探索において取得されたプロジェクト案件での入力情報や、さらに実際に発注企業と受注候補企業とが面談に進んでいる等の付加情報を非公開企業情報として企業データベース221に記憶させ、それらを含む結合テキストデータから特徴語を生成することで、より高い信頼性を持つ検索システムを構築している。
ここでは、データベース構築部26による非公開企業情報の取得及び企業データベース221への記憶処理の詳細について説明する。
上述の実施形態では、企業検索のために入力されるキーワード(ステップS121で管理サーバ20が取得するキーワード)と、その取得キーワードに基づいてステップS122で検索され、ステップS123でその取得キーワードとの類似度が計算される候補企業が保有する特徴語との間の類似度を考慮しているが、入力されるキーワードの周辺キーワード(入力キーワードに類似するキーワード)との類似語は考慮していない。そこで、上記類似度計算処理(ステップS123)に代えて、入力されるキーワードの周辺キーワードと候補企業が保有する特徴語との間の類似度を計算する別の実施形態も考えられる。
前述したコサイン類似度計算(ステップS153)を通じた候補企業リスト生成では、各企業の特徴語に重み付けがされていないため、幅広く企業をリストアップしたい場合に有効である。一方、上記の各企業の特徴語を基底としたベクトルを用いた類似度計算を通じた候補企業リストの生成は、よりマッチング確度が高い企業を探す場合に有効である。
また、ユーザ端末10で入力されたキーワードに対応する特徴語や学習モデルが記憶部22内に記憶されていない場合、管理サーバ20はユーザ端末10にエラーを返すような設定にすることができる。このような場合は、エラーが出たキーワードを優先的に特徴語として記憶し、その学習モデルを生成する処理を行うようにすることができる。例えば、入力されたキーワードが学習モデルに登録されていない場合は、そのキーワードを含むコーパス(テキスト)を入力として追加学習する。
10 ユーザ端末
20 管理サーバ
21 通信部
22 記憶部
23 検索部
24 類似度計算部
25 リスト生成部
26 データベース構築部
27 特徴語生成部
28 学習モデル生成部
30 ネットワーク
221 企業データベース
222 技術タグデータベース
223 特徴語データベース
224 学習モデルデータベース
Claims (7)
- ビジネスパートナー探索を目的として企業リストを生成する検索システムであって、
企業の特徴を表す複数の特徴語を該特徴語の出願頻度に基づくスコアと共に企業ごとに記憶する特徴語記憶手段と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデル記憶手段と、
入力装置から入力されたキーワードを取得する取得手段と、
前記キーワードに対応する特徴語を持つ企業を前記特徴語記憶手段から検索する検索手段と、
前記検索手段で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算手段と、
前記検索手段で検索された前記企業が持つ複数の特徴語、該特徴語のスコア及び類似度を含む企業リストを生成するリスト生成手段と
を備えることを特徴とする検索システム。 - 前記類似度計算手段は、前記検索手段で検索された前記企業が持つ複数の特徴語のそれぞれの分散表現を合成した合成分散表現と前記キーワードに対応する特徴語の分散表現との類似度を計算することを特徴とする請求項1に記載の検索システム。
- 前記類似度計算手段は、前記キーワードに対応する特徴語に類似する特徴語を前記学習モデルに基づいて計算し、前記キーワードに対応する特徴語及び該特徴語に類似する複数の特徴語とそれらのスコアを含む第1のベクトルと、各企業が保有する特徴語とそのスコアを含む第2のベクトルとの類似度を計算することを特徴とする請求項1に記載の検索システム。
- 前記類似度計算手段は、前記第1のベクトルと前記第2のベクトルに含まれる同一の特徴語間のスコアの積の総和に基づいて前記類似度を計算することを特徴とする請求項3に記載の検索システム。
- 前記類似度計算手段は、前記検索手段で検索された前記企業が持つ複数の特徴語に基づく分散表現について、それぞれの特徴語のスコアが上位の特徴語をスコアが下位の特徴語よりも大きく重み付けを行った分散表現とし、前記キーワードに対応する特徴語に基づく分散表現との類似度を計算することを特徴とする請求項1から4のいずれか1項に記載の検索システム。
- ビジネスパートナー探索を目的として企業リストを生成する検索サーバにおける検索方法であって、
入力装置から入力されたキーワードを取得する取得工程と、
前記キーワードに対応する特徴語を持つ企業を、該企業の特徴を表す複数の特徴語を該特徴語の出願頻度に基づくスコアと共に企業ごとに記憶する特徴語データベースから検索する検索工程と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデルデータベースを参照して、前記検索工程で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算工程と、
前記検索工程で検索された前記企業が持つ複数の特徴語、該特徴語のスコア及び類似度を含む企業リストを生成するリスト生成工程と
を有することを特徴とする検索方法。 - ビジネスパートナー探索を目的として企業リストを生成する検索サーバに、
入力装置から入力されたキーワードを取得する取得手順と、
前記キーワードに対応する特徴語を持つ企業を、該企業の特徴を表す複数の特徴語を該特徴語の出現頻度に基づくスコアと共に企業ごとに記憶する特徴語データベースから検索する検索手順と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデルデータベースを参照して、前記検索手順で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算手順と、
前記検索手順で検索された前記企業が持つ複数の特徴語、該特徴語のスコア及び類似度を含む企業リストを生成するリスト生成手順と
を実行させるためのコンピュータ読み取り可能な検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021111716A JP6941802B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021111716A JP6941802B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6941802B1 JP6941802B1 (ja) | 2021-09-29 |
JP2023008284A true JP2023008284A (ja) | 2023-01-19 |
Family
ID=77847126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021111716A Active JP6941802B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6941802B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7339708B1 (ja) | 2022-09-29 | 2023-09-06 | 株式会社トランザック | プログラム、事業者情報確認方法及び事業者情報確認システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5398413B2 (ja) * | 2009-08-12 | 2014-01-29 | 株式会社野村総合研究所 | 銘柄推奨システム及び銘柄推奨プログラム |
JP2019211974A (ja) * | 2018-06-04 | 2019-12-12 | 株式会社野村総合研究所 | 企業分析装置 |
US20200233872A1 (en) * | 2019-01-18 | 2020-07-23 | International Business Machines Corporation | System and method for discovering synergistic companies |
-
2021
- 2021-07-05 JP JP2021111716A patent/JP6941802B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5398413B2 (ja) * | 2009-08-12 | 2014-01-29 | 株式会社野村総合研究所 | 銘柄推奨システム及び銘柄推奨プログラム |
JP2019211974A (ja) * | 2018-06-04 | 2019-12-12 | 株式会社野村総合研究所 | 企業分析装置 |
US20200233872A1 (en) * | 2019-01-18 | 2020-07-23 | International Business Machines Corporation | System and method for discovering synergistic companies |
Also Published As
Publication number | Publication date |
---|---|
JP6941802B1 (ja) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8082264B2 (en) | Automated scheme for identifying user intent in real-time | |
US11042591B2 (en) | Analytical search engine | |
CN109906450A (zh) | 用于通过相似性关联对电子信息排名的方法和装置 | |
US20220107980A1 (en) | Providing an object-based response to a natural language query | |
CN111666413B (zh) | 基于评论者可信赖度回归预测的商品评论推荐方法 | |
JP6941802B1 (ja) | 検索システム、検索方法及び検索プログラム | |
Marivate et al. | An intelligent multi-agent recommender system for human capacity building | |
CN115860283A (zh) | 基于知识工作者画像的贡献度预测方法及装置 | |
JP6941801B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP6941803B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP2020067864A (ja) | 知識検索装置、知識検索方法、および、知識検索プログラム | |
JP6773861B1 (ja) | 不適合事例検索システムおよび不適合事例検索方法 | |
CN114707510A (zh) | 资源推荐信息推送方法、装置、计算机设备及存储介质 | |
Surian et al. | The automation of relevant trial registration screening for systematic review updates: an evaluation study on a large dataset of ClinicalTrials. gov registrations | |
JP6890671B2 (ja) | 検索システム、検索方法及び検索アプリケーションソフトウェア | |
CN110717008A (zh) | 基于语意识别的搜索结果排序方法及相关装置 | |
JP7382590B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7234079B2 (ja) | 検索支援システム、検索支援方法、及びプログラム | |
JP7008102B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP6945680B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN117033584B (zh) | 类案文本确定方法、装置及电子设备 | |
JP7385077B1 (ja) | 検索支援システム、検索支援方法及びプログラム | |
EP4280151A1 (en) | Data provision device, system, program, method, data analysis device, data management system, method, and recording medium | |
US20220237568A1 (en) | Online employee search tool and recruitment platform | |
JP6904092B2 (ja) | 理解支援方法、理解支援装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210706 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6941802 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |