JP7418781B2 - 企業類似度算出サーバ及び企業類似度算出方法 - Google Patents
企業類似度算出サーバ及び企業類似度算出方法 Download PDFInfo
- Publication number
- JP7418781B2 JP7418781B2 JP2019146489A JP2019146489A JP7418781B2 JP 7418781 B2 JP7418781 B2 JP 7418781B2 JP 2019146489 A JP2019146489 A JP 2019146489A JP 2019146489 A JP2019146489 A JP 2019146489A JP 7418781 B2 JP7418781 B2 JP 7418781B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- company
- business
- industry
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 275
- 239000011159 matrix material Substances 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 12
- 238000010276 construction Methods 0.000 description 51
- 238000012423 maintenance Methods 0.000 description 27
- 238000000605 extraction Methods 0.000 description 16
- 238000007726 management method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 229910010272 inorganic material Inorganic materials 0.000 description 5
- 239000011147 inorganic material Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 239000003208 petroleum Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出する、
ことを特徴とする。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
以下、実施形態を説明する。
図1は、全体の企業類似度算出システム1の構成図の例である。
企業類似度算出システム1は、複数の利用者端末102、複数の管理者端末103、を備え、それぞれがネットワークを介して企業類似度算出サーバ101に接続されている。なお、ネットワークは有線、無線を問わず、それぞれの端末はネットワークを介して情報を送受信することができる。
本明細書では、各モジュールが、処理を行う主体(主語)として記載をしているが、実際には各種プログラムやアプリケーションなど(モジュール)を処理するプロセッサが処理を実行する。
管理者端末103は、企業類似度算出システム1の管理者などが使用する端末である。
企業類似度算出サーバ101は、上記それぞれの端末などから、判定を行うにあたって必要となる様々な情報の入力を受け付け、これらを補助記憶装置202の中に記憶する。
企業類似度算出サーバ101は、例えばクラウド上に配置されたサーバで構成される。
主記憶装置201には、類似度算出モジュール211、類似企業表示モジュール212、管理モジュール213のプログラムやアプリケーションが記憶されており、これらのプログラムやアプリケーションをプロセッサ203が実行することで企業類似度算出サーバ101の各機能要素が実現される。
類似企業表示モジュール212は、類似する企業同士の情報を利用者端末102や管理者端末103に表示する。詳細は後述するが、例えば、第1の企業と類似する複数の第2の企業の情報、及び当該第1の企業と其々の第2の企業との類似度を表示する。
対象企業DB208は、対象企業基本情報800、対象企業単語情報900及び対象企業分類情報1000を備える。
辞書DB209は、事業単語辞書情報1050、業界単語分類辞書情報1100、業態単語分類辞書情報1200、業界類似度マトリクス情報1300、業態類似度マトリクス情報1400及び業界業態類似度設定情報1500を備える。
利用者端末102は、例えば据置型コンピュータで構成される。
主記憶装置301には、類似度企業表示モジュール311が記憶されており、これらのプログラムやアプリケーションをプロセッサ303が実行することで利用者端末102の各機能要素が実現される。
補助記憶装置302の利用者端末データ321は、利用者に関連する情報を記憶する。
管理者端末103は、例えば据置型コンピュータで構成される。
主記憶装置401には、管理モジュール411が記憶されており、これらのプログラムやアプリケーションをプロセッサが実行することで管理者端末103の各機能要素が実現される。
補助記憶装置402の管理者端末データ421は、企業類似度算出システム1を管理するための情報を記憶する。
基準企業単語情報500は第1の企業に関する情報から抽出した単語の情報を記憶している。
基準企業単語情報500は、案件ID501、企業ID502、基準企業名503、事業単語504、業界単語505及び業態単語506などの情報を有する。
企業ID502は、企業ごとに生成されるユニークなIDである。言い換えれば、1つの企業は1つの企業IDを有する。
基準企業名503は、基準企業(第1の企業)の名称である。
事業単語504は、第1の企業に関する情報から抽出した、第1の企業の事業に関する単語の情報である。
業界単語505は、第1の企業に関する情報から抽出した、第1の企業の業界に関する単語の情報である。
業態単語506は、第1の企業に関する情報から抽出した、第1の企業の業態に関する単語の情報である。
基準企業分類情報600は基準企業(第1の企業)が属する業界及び業態の情報を記憶している。
基準企業分類情報600は案件ID601、企業ID602、基準企業名603、業界604及び業態605などの情報を有する。
業界604は、基準企業(第1の企業)が属する業界の情報である。
業態605は、基準企業(第1の企業)が属する業態の情報である。
類似度情報700は基準企業(第1の企業)と対象企業(第2の企業)との類似度の情報を記憶している。
類似度情報700は案件ID701、企業ID702、基準企業名703、及び類似度704などの情報を有する。
類似度704は基準企業(第1の企業)と複数の対象企業(第2の企業)との類似度の情報である。
対象企業基本情報800は対象企業(第2の企業)に関する企業情報を記憶している。
対象企業基本情報800は企業ID801、対象企業名802、企業情報803、株式時価総額804、当期純利益805及び株価収益率806などの情報を有する。
対象企業名802は、対象企業(第2の企業)の名称である。
企業情報803は、対象企業(第2の企業)に関する文字列の情報であり、実質的に対象企業(第2の企業)に関する文字列の情報に紐づいた情報であればよく、例えば企業URL(Uniform Resource Locator)であってもよい。
対象企業単語情報900は対象企業(第2の企業)に関する情報から抽出した単語の情報を記憶している。
対象企業単語情報900は、企業ID901、対象企業名902、事業単語903、業界単語904及び業態単語905などの情報を有する。
事業単語903は、第2の企業に関する情報から抽出した、第1の企業の事業に関する単語の情報である。
業界単語904は、第2の企業に関する情報から抽出した、第1の企業の業界に関する単語の情報である。
業態単語905は、第2の企業に関する情報から抽出した、第1の企業の業態に関する単語の情報である。
対象企業分類情報1000は対象企業(第2の企業)が属する業界及び業態の情報を記憶している。
対象企業分類情報1000は企業ID1001、対象企業名1002、業界1003及び業態1004などの情報を有する。
業界1003は、対象企業(第2の企業)が属する業界の情報である。
業態1004は、対象企業(第2の企業)が属する業態の情報である。
なお、辞書DB209には、事業単語辞書情報1050も記憶されている。事業単語辞書情報1050は事業に関する単語の情報を記憶している。
業界単語分類辞書情報1100は業界に関する単語及び分類の情報を記憶している。
業界単語分類辞書情報1100は上位業界1101、下位業界1102及び業界単語1103などの情報を有する。
業界単語1103は、業界に関する単語の情報である。
下位業界1102は、業界単語1103に対応付けられた下位の業界の分類の情報である。
上位業界1101は、下位業界1102に対応付けられた上位の業界の分類の情報である。上位業界1101は下位業界1102より広い概念である。
業態単語分類辞書情報1200は業態に関する単語及び分類の情報を記憶している。
業態単語分類辞書情報1200は上位業態1201、下位業態1202及び業態単語1203などの情報を有する。
業態単語1203は、業態に関する単語の情報である。
下位業態1202は、業態単語1203に対応付けられた下位の業態の分類の情報である。
上位業態1201は、下位業態1202に対応付けられた上位の業態の分類の情報である。上位業態1201は下位業態1202より広い概念である。
業界類似度マトリクス情報1300は一方の上位業界及び下位業界と他方の上位業界及び下位業界との類似度を記憶している。
業界類似度マトリクス情報1300は上位業界1301、下位業界1302及び類似度1303などの情報を有する。
業界類似度マトリクス情報1300は、列に属する要素(上位業界及び下位業界)と行に属する要素(上位業界及び下位業界)とがそれぞれ対応している。
類似度1303には、列と行の交点に、列における上位業界及び下位業界と行における上位業界及び下位業界との類似度の情報を記憶している。
業態類似度マトリクス情報1400は一方の上位業態及び下位業態と他方の上位業態及び下位業態との類似度を記憶している。
業態類似度マトリクス情報1400は上位業態1401、下位業態1402及び類似度1403などの情報を有する。
業態類似度マトリクス情報1400は、列に属する要素(上位業態及び下位業態)と行に属する要素(上位業態及び下位業態)とがそれぞれ対応している。
類似度1403は、列と行の交点に、列における上位業態及び下位業態と行における上位業態及び下位業態との類似度の情報を記憶している。
業界業態類似度設定情報1500は、業界類似度マトリクス情報1300の類似度1303及び業態類似度マトリクス情報1400の類似度1403を設定するための規則の情報を記憶している。詳細は後述する。
図16は、類似度算出モジュール211が実施する類似度算出フロー1600の例である。
類似度算出フロー1600は、第1の企業と第2の企業との類似度を算出し、算出した類似度を出力するフローである。
ここで、図26を用いて説明する。本実施形態における画面の例は利用者端末102の出力装置305に表示される。
図26で示す例では、第1の企業であるA株式会社におけるマッチング先企業の候補がある場合にはマッチング先企業の候補を表示する。しかし、図26で示す例では、A株式会社にはマッチング先企業が登録されていないため、マッチング先企業の候補を特定するために、第1の企業と類似する類似企業の抽出を開始するための画面となっている。
第1の企業と類似する類似企業を抽出することにより、利用者は、抽出した複数の類似企業を参照することで、いずれの企業をマッチング先企業の候補とすべきかの意思決定を行いやすくなる。
すなわち、類似度算出モジュール211は「以下のURLから自動抽出する」2602が選択された場合に、第1の情報を取得する。
また、類似度算出モジュール211は、本実施形態において、「以下のURLから自動抽出する」2602が選択された時点で対象企業基本情報800の企業情報803に記憶した全ての企業における企業情報(第1の企業と企業IDが同一であるものを除く。)を第2の情報として取得する。すなわち、本実施形態において、類似度算出モジュール211は、1つの第1の企業に対して対象企業基本情報800に記憶した全ての企業(第1の企業と同一の企業を除く)の類似度を算出することを意味する。
なお、他の実施形態として、類似度算出モジュール211は、特定の一部の対象企業基本情報800の企業情報803に記憶した企業情報、又は利用者端末102から受信した企業情報を第2の情報として取得してもよい。
類似度算出モジュール211は、第1の企業が行っている事業に関する単語と、第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出する(ステップ1603)。詳細は後述する。
類似度算出モジュール211は、第1の企業が属する業界と、第2の企業が属する業界と、の類似度に基づいて業界類似度を算出する(ステップ1605)。詳細は後述する。
類似度算出モジュール211は、第1の企業が属する業態と、第2の企業が属する業態と、の類似度に基づいて業態類似度を算出する(ステップ1607)。詳細は後述する。
類似度算出モジュール211は、企業類似度の序列に基づいて複数の第2の企業の類似度を出力する(ステップ1609)。詳細は後述する。
これにより、類似度算出モジュール211が実行する類似度算出フロー1600は終了する。
事業単語抽出フロー1700は、第1の情報及び第2の情報から事業に関する単語を抽出するフローであり、図16におけるステップ1602の詳細なフローである。
具体的には、類似度算出モジュール211は、第1の企業に関する文字列の情報である第1の情報(本実施形態においては企業URLのリンク先の文字列情報)を形態素解析により、意味を持つ最小限の単位である単語に分解する(以下、第1の情報を分解して得た複数の単語の群を第1の単語群とする場合がある。)。
同様に、類似度算出モジュール211は、第2の企業に関する文字列の情報である第2の情報(本実施形態においては企業URLのリンク先の文字列情報)を形態素解析により、意味を持つ最小限の単位である単語に分解する(以下、第2の情報を分解して得た複数の単語の群を第2の単語群とする場合がある。)。
辞書DB209の事業単語辞書情報1050には事業に関する単語(以下、事業単語とする場合がある。)の情報が記憶されている。
類似度算出モジュール211は、第1の情報において第1の事業単語が出現した回数及び第2の情報において第2の事業単語が出現した回数を出力する(ステップ1704)。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「住宅」及び「メンテナンス」の単語を含んでおり、かつ事業単語辞書情報1050に「住宅」及び「メンテナンス」の事業単語を含んでいる場合を想定する。当該場合には、類似度算出モジュール211は、第1の単語群と事業単語辞書情報1050とで共通する「住宅」及び「メンテナンス」が第1の情報における第1の事業単語であるとして当該単語を基準企業単語情報500の事業単語504に出力する(記憶する)(ステップ1703)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合であっても、第2の事業単語の情報及び出現した回数の情報を対象企業単語情報900における事業単語903に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の事業単語の情報及び出現した回数、並びに情報第2の事業単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する事業単語抽出フロー1700は終了する。
事業単語類似度算出フロー1800は、第1の企業が行っている事業に関する単語(第1の事業単語)と、第2の企業が行っている事業に関する単語(第2の事業単語)と、に基づいて事業類似度を算出するフローであり、図16におけるステップ1603の詳細なフローである。
類似度算出モジュール211は第1の事業単語群をベクトル化し、かつ第2の事業単語群をベクトル化する(ステップ1802)。
他の例として、類似度算出モジュール211は、Bag of Words、LSA(Latent Semantic Analysis)、word2vec、Doc2Vec等の文字列情報をベクトル化する技術を用いて、第1の企業に関する文字列情報(第1の情報)をベクトル化してもよく、また第2の企業に関する文字列情報(第2の情報)をベクトル化してもよい。
例えば、類似度算出モジュール211は、第1の事業単語群におけるベクトル情報と第2の事業単語群におけるベクトル情報との類似度は、コサイン類似度を計算することで算出できる。
類似度算出モジュール211は、第1の事業単語群におけるベクトル情報と第2の事業単語群におけるベクトル情報との算出した類似度を事業類似度として出力する(ステップ1804)。
なお、類似度算出モジュール211は、第1の企業のA株式会社と他の第2の企業との事業類似度も類似度704に出力するが、この時点において事業類似度の序列に従って記憶する必要はない。詳細は後述するが、Z株式会社(企業ID:C0001)の事業類似度は、類似度704のうちの類似度1に記憶されている。
これにより、類似度算出モジュール211が実行する事業単語類似度算出フロー1800は終了する。
業界単語抽出フロー1900は、第1の情報及び第2の情報から業界に関する単語を抽出するフローであり、図16におけるステップ1604の詳細なフローである。
辞書DB209の業界単語分類辞書情報1100には業界に関する単語(以下、業界単語とする場合がある。)の情報を記憶している。
類似度算出モジュール211は、第1の情報において第1の業界単語が出現した回数及び第2の情報において第2の業界単語が出現した回数を出力する(ステップ1904)。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「新築」及び「住宅」の単語を含んでいる場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群に含む「新築」及び「住宅」の単語が、業界単語分類辞書情報1100の業界単語1103に記憶されているかを検索する(ステップ1902)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合でっあっても、第2の業界単語の情報及び出現した回数の情報を対象企業単語情報900における業界単語904に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の業界単語の情報及び出現した回数、並びに情報第2の業界単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する業界単語抽出フロー1900は終了する。
業界類似度算出フロー2000は、第1の企業が属する業界と、第2の企業が属する業界と、の類似度に基づいて業界類似度を算出するフローであり、図16におけるステップ1605の詳細なフローである。
ステップ2003の具体的な例を、図13を用いて説明する。A株式会社の第1の業界(下位業界「建築」及び上位業界「建設」)と、Z株式会社の第2の業界(下位業界「建築」及び上位業界「建設」)と、の類似度を取得する例を説明する。
類似度算出モジュール211は、図13の業界類似度マトリクス情報1300の列に属するA株式会社の上位業態「建設」1312及び下位業態「建築」1311と、行に属するZ株式会社の上位業態「建設」1314及び下位業態「建築」1313との交点1315に対応付けられた類似度(10)を取得する。
第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例のように、第1の企業が1つの下位業界のみを有し、第2の企業が1つの下位業界のみを有している場合(業界類似度マトリクス情報1300の交点が1つの場合)には、業界類似度マトリクス情報1300の交点に対応付けられた類似度が、第1の企業と第2の企業との業界類似度となる。すなわち、上述のステップ2003で説明した、第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例の場合の業態類似度は10である。
類似度算出モジュール211は、V株式会社(企業ID:C0005)の第2の業界として下位業界「高分子」及び上位業界「化学・石油・素材」並びに下位業界「生活用品」及び上位業界「化学・石油・素材」を対象企業分類情報1000の業界1003から取得する。
すなわち、類似度算出モジュール211は、交点1320に対応付けられた類似度「8」と、交点1321に対応付けられた類似度「10」と、交点1322に対応付けられた類似度「6」と、交点1323に対応付けられた類似度「8」と、を其々取得する。
なお、他の例として、複数の交点に対応付けられた全ての類似度の平均値を業界類似度としてもよい。
ステップ2005の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例で説明する。類似度算出モジュール211は、上述したステップ2004により算出した業界類似度の10を、事業類似度の点数と調整するため、10で除した値である1.00を類似度情報700の類似度704にZ株式会社(対象企業の企業ID:C0001)と関連させて出力する(記憶する)。なお、他の実施形態として、当該出力後の類似度を業界類似度マトリクス情報1300の交点に対応付けておいてもよい。
これにより、類似度算出モジュール211が実行する業界類似度算出フロー2000は終了する。
業態単語抽出フロー2100は、第1の情報及び第2の情報から業態に関する単語を抽出するフローであり、図16におけるステップ1606の詳細なフローである。
辞書DB209の業態単語分類辞書情報1200には業態に関する単語(以下、業態単語とする場合がある。)の情報を記憶している。
類似度算出モジュール211は、第1の情報において第1の業態単語が出現した回数及び第2の情報において第2の業態単語が出現した回数を出力する(ステップ2104)。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「施工事例」及び「メンテナンス」の単語を含んでいる場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群に含む「施工事例」及び「メンテナンス」の単語が、業態単語分類辞書情報1200の業態単語1203に記憶されているかを検索する(ステップ2102)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合でっあっても、第2の業態単語の情報及び出現した回数の情報を対象企業単語情報900における業態単語905に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の業態単語の情報及び出現した回数、並びに情報第2の業態単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する業態単語抽出フロー2100は終了する。
業態類似度算出フロー2200は、第1の企業が属する業態と、第2の企業が属する業態と、の類似度に基づいて業態類似度を算出するするフローであり、図16におけるステップ1607の詳細なフローである。
なお、類似度算出モジュール211は、取得した第1の業態の情報を図6で示す基準企業分類情報600の業態605の業態1及び業態2に記憶する。
ステップ2203の具体的な例を、図14を用いて説明する。A株式会社の第1の業態(下位業態「施工」及び上位業態「製造・加工」並びに下位業態「整備・維持」及び上位業態「管理」)と、Z株式会社の第2の業態(下位業態「施工」及び上位業態「製造・加工」)と、の類似度を取得する例を説明する。
第1の企業が1つの下位業態のみを有し、第2の企業が1つの下位業態のみを有している場合(業態類似度マトリクス情報1400の交点が1つの場合)には、類似度算出モジュール211は、業態類似度マトリクス情報1400の交点に対応付けられた類似度を第1の企業と第2の企業との業態類似度とできる。
類似度算出モジュール211は、例えば、複数のうちの1つの第1の下位業態ごとに類似度を算出し、算出した全ての第1の下位業態ごとの類似度の平均値を算出することで、業態類似度を算出する。類似度算出モジュール211は、上述する業界類似度算出フロー2000における処理と同様に、例えば、列に属する第1の企業の1つの第1の下位業態に対応付けられた複数の類似度のうちの、最大の類似度と平均の類似度と、の平均値を算出することで、第1の下位業態ごとの類似度を算出する。なお、列の業態と、行の業態が完全に同一の場合の業態類似度は最大値となる。
そして、類似度算出モジュール211は、A株式会社の下位業態「施工」1411における類似度「10」1417と、A株式会社の「整備・維持」1413における類似度「7」1418と、の平均値である「8.5」を業態類似度として算出する。
ステップ2205の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例で説明する。類似度算出モジュール211は、上述したステップ2204により算出した業態類似度の8.5を、事業類似度の点数と調整するため、10で除した値である0.85を類似度情報700の類似度704にZ株式会社(対象企業の企業ID:C0001)と関連させて出力する(記憶する)。なお、他の実施形態として、当該出力後の類似度を業態類似度マトリクス情報1400の交点に対応付けておいてもよい。
これにより、類似度算出モジュール211が実行する業態類似度算出フロー2200は終了する。
図15の業界業態類似度設定情報1500には、業界類似度マトリクスにおける列の上位分類(上位業界)と行の上位分類(上位業界)とが、同じ、高類似度、中類似度、又は低類似度の場合で場合分けされており、かつ業界類似度マトリクスにおける列の下位分類(下位業界)と行の下位分類(下位業界)とが、同じ、高類似度、又は中類似度及び低類似度場合で場合分けされており、其々の場合に応じた類似度が記憶されている。
なお、「同じ」は業界同士が完全に同一であり、「高類似度」は業界同士が類似する可能性が高く、「中類似度」は業界同士が「高類似度」に次いで類似する可能性が高く、「低類似度」は業界同士が「中類似度」に次いで類似する可能性が高いことを意味する。
類似度設定規則1501は、業界業態類似度設定情報1500の最下行に上述した其々の場合に応じた類似度を記憶している。
類似度算出モジュール211は、業界業態類似度設定情報1500で示す規則に基づいて、業界類似度マトリクスの列(第1の企業)における下位業界及び上位業界と、行(第2の企業)における下位業界及び上位業界と、の交点に類似度を対応付ける。
列の下位業界と行の下位業界とが同じである場合(交点に記憶される類似度が10)。
列の下位業界と行の下位業界とが高類似度であり、かつ列の上位業界と行の上位業界とが同じである場合(交点に記憶される類似度が9)。
列の下位業界と行の下位業界とが中類似度であり、かつ列の上位業界と行の上位業界とが同じである場合(交点に記憶される類似度が8)。
列の下位業界と行の下位業界との類似度が中類似度であり、かつ列の上位業界と行の上位業界との類似度が高類似度である場合(交点に記憶される類似度が6)。
列の下位業界と行の下位業界との類似度が高類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が5)。
列の下位業界と行の下位業界との類似度が中類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が4)。
列の下位業界と行の下位業界との類似度が低類似度であり、かつ列の上位業界と行の上位業界との類似度が高類似度である場合(交点に記憶される類似度が2)。
列の下位業界と行の下位業界との類似度が低類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が1)。
企業類似度算出フロー2300は、事業類似度、業界類似度、及び業態類似度に基づいて企業類似度を算出するフローであり、図16におけるステップ1608の詳細なフローである。
類似度算出モジュール211は、事業類似度、業界類似度及び業態類似度を所定割合で足し合わせた企業類似度を算出する(ステップ2302)。
類似度算出モジュール211は、算出した企業類似度を出力する(ステップ2303)。
類似度算出モジュール211は、類似度情報700の類似度704から、第1の企業であるA株式会社と第2の企業(対象企業の企業ID:C0001)との事業類似度(0.960)、業界類似度(1.00)及び業態類似度(0.850)を其々取得する(ステップ2301)。
事業類似度:業界類似度:業態類似度=3:5:2
業態類似度の割合が最も高く、事業類似度の割合が最も低い。
すなわち、類似度算出モジュール211は、企業類似度として0.958の値を算出する(ステップ2302)。
当該所定割合はいかなる割合でもよく、当該割合を調整することで各類似度の重要度を設定できる。
これにより、類似度算出モジュール211が実行する企業類似度算出フロー2300は終了する。
類似度出力フロー2400は、企業類似度の序列に基づいて複数の第2の企業の類似度を出力するフローであり、図16におけるステップ1609の詳細なフローである。
類似度算出モジュール211は、取得した複数の第2の企業における企業類似度に基づき複数の第2の企業の序列を決定する(ステップ2402)。
類似度算出モジュール211は、決定した複数の第2の企業の序列の情報を出力する(記憶する)(ステップ2403)。
類似度算出モジュール211は、図7の類似度情報700の類似度704から、第1の企業であるA株式会社と複数の第2の企業との企業類似度を取得する(ステップ2401)。本実施形態においては、対象企業基本情報800に記憶されたすべての第2の企業とA株式会社との企業類似度を類似度情報700の類似度704から取得する。なお、図7には、3つの企業の類似度のみしか表示されていない。
これにより、類似度算出モジュール211が実行する類似度出力フロー2400は終了する。
類似企業表示フロー2500は、第1の企業に類似する第2の企業を表示するフローである。
類似企業表示モジュール212は、企業類似度の序列に基づいて、第2の企業に関する情報及び事業類似度、業界類似度及び業態類似度の軸を含むチャートを利用者端末102に表示する(ステップ2502)。
なお、類似企業表示モジュール212が生成及び表示するチャートは、レーダーチャートに限られず、例えば、会社毎に各類似度のコラムチャート(棒グラフ)をグルーピングしたチャートであってもよい。
類似企業表示モジュール212は、図7の類似度情報700の類似度704における、第1の企業であるA株式会社の行の類似度1、類似度2及び類似度3に記憶した、第2の企業(企業IDがC0001のZ株式会社、企業IDがC0080の企業及び企業IDがC0087の企業)における事業類似度、業界類似度、業態類似度及び企業類似度を取得する。また、取得した第2の企業における図8の対象企業基本情報800に記憶した情報も併せて取得する(ステップ2501)。
類似企業表示モジュール212は、企業IDがC0001のZ株式会社、企業IDがC0080の企業及び企業IDがC0087の企業の企業類似度の序列に基づいて、各企業の情報を表示する。すなわち、類似企業表示モジュール212は、企業類似度が最も高い企業であるZ株式会社(企業ID:C0001)の情報を上段部に表示し、次いで企業類似度が高い企業である企業IDがC0080の企業(R株式会社)の情報を中段部に表示し、次いで企業類似度が高い企業である企業IDがC0087の企業(G株式会社)の情報を下段部に表示する。
また、類似企業表示モジュール212は、図27で示すように、類似度情報700から取得した事業類似度を事業類似度の軸に表示し、類似度情報700から取得した業界類似度を業界類似度の軸に表示し、類似度情報700から取得した業態類似度を業態類似度の軸に表示したレーダーチャートを表示する。
これにより、類似企業表示モジュール212が実行する類似企業表示フロー2500は終了する。
類似度算出モジュール211は、業種に関する類似度、営業形態に関する類似度、又は事業構造に関する類似度を、業界類似度又は業態類似度を算出する方法と同様の方法で、算出できる。
次いで、類似度算出モジュール211は、業種類似度マトリクス、営業形態類似度マトリクス、又は事業構造類似度マトリクスを用いて、業種に関する類似度、営業形態に関する類似度、又は事業構造に関する類似度を算出する。
なお、上述の実施例は少なくとも特許請求の範囲に記載の構成を開示している。
Claims (25)
- 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
前記第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を前記第1の業界とし、
前記第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を前記第2の業界として、
前記業界類似度を算出する、企業類似度算出サーバ。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
前記第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を第1の下位業界とし、前記第1の下位業界より広い概念であり、前記第1の下位業界に対応付けられた業界を第1の上位業界とし、前記第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を第2の下位業界とし、前記第2の下位業界より広い概念であり、前記第2の下位業界に対応付けられた業界を第2の上位業界とし、
前記第1の下位業界及び前記第1の上位業界と、前記第2の下位業界及び前記第2の上位業界と、の類似度を算出することで、前記業界類似度を算出する、企業類似度算出サーバ。 - 前記業界類似度を算出するために用いる業界類似度マトリクスを取得する情報取得手段を有し、
前記業界類似度マトリクスは、
列に属する要素と行に属する要素とがそれぞれ対応しており、前記要素は、業界に関する情報である下位業界と前記下位業界より広い概念である上位業界とを含み、
前記列と前記行との交点には、前記列における前記下位業界及び前記上位業界と、前記行における前記下位業界及び前記上位業界と、の類似度が対応付けられており、
前記類似度算出手段は、
前記業界類似度マトリクスを用いて、
前記第1の下位業界及び前記第1の上位業界と関連する少なくとも1つの前記列と、
前記第2の下位業界及び前記第2の上位業界と関連する少なくとも1つの前記行と、に対応付けられた類似度を取得することで、前記業界類似度を算出する、請求項2に記載の企業類似度算出サーバ。 - 前記第1の下位業界及び前記第1の上位業界と関連する少なくとも1つの前記下位業界及び前記上位業界に対応する前記列と、
前記第2の下位業界及び前記第2の上位業界と関連する少なくとも1つの前記下位業界及び前記上位業界に対応する前記行と、に対応付けられた複数の類似度を取得し、
取得した前記複数の類似度に基づき、前記業界類似度を算出する、請求項3に記載の企業類似度算出サーバ。 - 前記業界類似度マトリクスの前記列と前記行とに対応付けられた類似度は、
前記列の前記下位業界と前記行の前記下位業界とが同一である場合、
前記列の前記下位業界と前記行の前記下位業界との類似度が類似する可能性が高い高類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界とが同一である場合、
前記列の前記下位業界と前記行の前記下位業界との類似度が前記高類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界との類似度が前記高類似度である場合、
前記列の前記下位業界と前記行の前記下位業界との類似度が前記高類似度より低い低類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界とが同一である場合、
前記列の前記下位業界と前記行の前記下位業界との類似度が前記低類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界との類似度が前記低類似度である場合、
の順で高い、請求項3または4に記載の企業類似度算出サーバ。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
前記第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を前記第1の業態とし、
前記第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を前記第2の業態として、
前記業態類似度を算出する、企業類似度算出サーバ。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
前記第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を第1の下位業態とし、前記第1の下位業態より広い概念であり、前記第1の下位業態に対応付けられた業態を第1の上位業態とし、
前記第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を第2の下位業態とし、前記第2の下位業態より広い概念であり、前記第2の下位業態に対応付けられた業態を第2の上位業態とし、
前記第1の下位業態及び前記第1の上位業態と、前記第2の下位業態及び前記第2の上位業態と、の類似度を算出することで、前記業態類似度を算出する、企業類似度算出サーバ。 - 前記業態類似度を算出するために用いる業態類似度マトリクスを取得する情報取得手段を有し、
前記業態類似度マトリクスは、
列に属する要素と行に属する要素とがそれぞれ対応しており、前記要素は、業態に関する情報である下位業態と前記下位業態より広い概念である上位業態とを含み、
前記列と前記行との交点には、前記列における前記下位業態及び前記上位業態と、前記行における前記下位業態及び前記上位業態と、の類似度が対応付けられており、
前記類似度算出手段は、
前記業態類似度マトリクスを用いて、
前記第1の下位業態及び前記第1の上位業態と関連する少なくとも1つの前記列と、
前記第2の下位業態及び前記第2の上位業態と関連する少なくとも1つの前記行と、に対応付けられた類似度を取得することで、前記業態類似度を算出する、請求項7に記載の企業類似度算出サーバ。 - 前記第1の下位業態及び前記第1の上位業態と関連する少なくとも1つの前記下位業態及び前記上位業態に対応する前記列と、
前記第2の下位業態及び前記第2の上位業態と関連する少なくとも1つの前記下位業態及び前記上位業態に対応する前記行と、に対応付けられた複数の類似度を取得し、
取得した前記複数の類似度に基づき、前記業態類似度を算出する、請求項8に記載の企業類似度算出サーバ。 - 前記業態類似度マトリクスの前記列と前記行とに対応付けられた類似度は、
前記列の前記下位業態と前記行の前記下位業態とが同一である場合、
前記列の前記下位業態と前記行の前記下位業態との類似度が類似する可能性が高い高類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態とが同一である場合、
前記列の前記下位業態と前記行の前記下位業態との類似度が前記高類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態との類似度が前記高類似度である場合、
前記列の前記下位業態と前記行の前記下位業態との類似度が前記高類似度より低い低類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態とが同一である場合、
前記列の前記下位業態と前記行の前記下位業態との類似度が前記低類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態との類似度が前記低類似度である場合、
の順で高い、請求項8または9に記載の企業類似度算出サーバ。 - 前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語である第1の事業単語を、前記第1の情報から少なくとも1つ抽出し、前記第2の企業が行っている事業に関する単語である第2の事業単語を、前記第2の情報から少なくとも1つ抽出し、前記第1の事業単語と前記第2の事業単語とを入力として、前記第1の企業と前記第2の企業との事業類似度を算出する言語処理モジュールを備える、請求項1から10のいずれか1項に記載の企業類似度算出サーバ。 - 前記言語処理モジュールは、tf‐idf、Bag of Words、LSA、word2vec、またはDoc2Vecのうちの少なくとも1つである、請求項11に記載の企業類似度算出サーバ。
- 前記類似度算出手段は、
前記事業類似度と、前記業態類似度と、前記業界類似度と、の其々を所定の割合で足し合わせた値を算出することで、
前記企業類似度を算出する、請求項1から12のいずれか1項に記載の企業類似度算出サーバ。 - 前記所定の割合は、
前記業態類似度の割合が最も高く、前記事業類似度の割合が最も低い、請求項13に記載の企業類似度算出サーバ。 - 前記出力手段は、
前記事業類似度と、
前記業態類似度と、
前記業界類似度と、
前記企業類似度と、を出力する、請求項1から14のいずれか1項に記載の企業類似度算出サーバ。 - 前記出力手段は、
前記事業類似度の軸と、
前記業態類似度の軸と、
前記業界類似度の軸と、を含むチャートを出力する、請求項1から15のいずれか1項に記載の企業類似度算出サーバ。 - 前記出力手段は、
前記類似度算出手段により算出した前記事業類似度を前記事業類似度の軸に表示し、
前記類似度算出手段により算出した前記業界類似度を前記業界類似度の軸に表示し、
前記類似度算出手段により算出した前記業態類似度を前記業態類似度の軸に表示する、請求項16に記載の企業類似度算出サーバ。 - 前記第2の企業が複数ある場合、
前記出力手段は、
前記類似度算出手段により算出した前記企業類似度の序列に基づいて複数の前記第2の企業の類似度を出力する、請求項1から17のいずれか1項に記載の企業類似度算出サーバ。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
算出された前記企業類似度を出力する、
ここで、前記業界類似度の算出においては、
前記第1の企業に関する第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を前記第1の業界とし、
前記第2の企業に関する第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を前記第2の業界として、
前記業界類似度を算出する、
企業類似度算出方法。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
算出された前記企業類似度を出力する、
ここで、前記業界類似度の算出においては、
前記第1の企業に関する第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を第1の下位業界とし、前記第1の下位業界より広い概念であり、前記第1の下位業界に対応付けられた業界を第1の上位業界とし、
前記第2の企業に関する第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を第2の下位業界とし、前記第2の下位業界より広い概念であり、前記第2の下位業界に対応付けられた業界を第2の上位業界とし、
前記第1の下位業界及び前記第1の上位業界と、前記第2の下位業界及び前記第2の上位業界と、の類似度を算出する、
企業類似度算出方法。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
算出された前記企業類似度を出力する、
ここで、前記業態類似度の算出においては、
前記第1の企業に関する第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を前記第1の業態とし、
前記第2の企業に関する第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を前記第2の業態として、
前記業態類似度を算出する、
企業類似度算出方法。 - 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
算出された前記企業類似度を出力する、
ここで、前記業態類似度の算出においては、
前記第1の企業に関する第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を第1の下位業態とし、前記第1の下位業態より広い概念であり、前記第1の下位業態に対応付けられた業態を第1の上位業態とし、
前記第2の企業に関する第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を第2の下位業態とし、前記第2の下位業態より広い概念であり、前記第2の下位業態に対応付けられた業態を第2の上位業態とし、
前記第1の下位業態及び前記第1の上位業態と、前記第2の下位業態及び前記第2の上位業態と、の類似度を算出することで、前記業態類似度を算出する、
企業類似度算出方法。 - 前記事業類似度の算出においては、
前記第1の企業が行っている事業に関する単語である第1の事業単語を前記第1の情報から少なくとも1つ抽出し、前記第2の企業が行っている事業に関する単語である第2の事業単語を、前記第2の情報から少なくとも1つ抽出し、前記第1の事業単語と前記第2の事業単語とを入力として、前記第1の企業と前記第2の企業との事業類似度を算出する言語処理モジュールを備える、請求項19から22のいずれか1項に記載の企業類似度算出方法。 - 前記言語処理モジュールは、tf‐idf、Bag of Words、LSA、word2vec、またはDoc2Vecのうちの少なくとも1つである、請求項23に記載の企業類似度算出方法。
- 企業類似度算出サーバに請求項19から24のいずれか1項に記載の企業類似度算出方法の各ステップを実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019146489A JP7418781B2 (ja) | 2019-08-08 | 2019-08-08 | 企業類似度算出サーバ及び企業類似度算出方法 |
PCT/JP2020/029577 WO2021024966A1 (ja) | 2019-08-08 | 2020-07-31 | 企業類似度算出サーバ及び企業類似度算出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019146489A JP7418781B2 (ja) | 2019-08-08 | 2019-08-08 | 企業類似度算出サーバ及び企業類似度算出方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021026689A JP2021026689A (ja) | 2021-02-22 |
JP2021026689A5 JP2021026689A5 (ja) | 2022-08-18 |
JP7418781B2 true JP7418781B2 (ja) | 2024-01-22 |
Family
ID=74503847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019146489A Active JP7418781B2 (ja) | 2019-08-08 | 2019-08-08 | 企業類似度算出サーバ及び企業類似度算出方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7418781B2 (ja) |
WO (1) | WO2021024966A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117880283A (zh) * | 2023-12-14 | 2024-04-12 | 天翼云科技有限公司 | 云监控方法及装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008287328A (ja) | 2007-05-15 | 2008-11-27 | Ntt Data Corp | 評価装置及び方法ならびにコンピュータプログラム |
JP2016071798A (ja) | 2014-10-01 | 2016-05-09 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP6489340B1 (ja) | 2018-06-28 | 2019-03-27 | 嘉久 塩川 | 比較対象企業選定システム |
-
2019
- 2019-08-08 JP JP2019146489A patent/JP7418781B2/ja active Active
-
2020
- 2020-07-31 WO PCT/JP2020/029577 patent/WO2021024966A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008287328A (ja) | 2007-05-15 | 2008-11-27 | Ntt Data Corp | 評価装置及び方法ならびにコンピュータプログラム |
JP2016071798A (ja) | 2014-10-01 | 2016-05-09 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP6489340B1 (ja) | 2018-06-28 | 2019-03-27 | 嘉久 塩川 | 比較対象企業選定システム |
Also Published As
Publication number | Publication date |
---|---|
JP2021026689A (ja) | 2021-02-22 |
WO2021024966A1 (ja) | 2021-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868411B1 (en) | Techniques for compiling and presenting query results | |
EP3143523B1 (en) | Visual interactive search | |
US10606883B2 (en) | Selection of initial document collection for visual interactive search | |
US20160314126A1 (en) | Entity fingerprints | |
CA2919878C (en) | Refining search query results | |
US20110264651A1 (en) | Large scale entity-specific resource classification | |
US20160232464A1 (en) | Statistically and ontologically correlated analytics for business intelligence | |
US10956469B2 (en) | System and method for metadata correlation using natural language processing | |
US20160004757A1 (en) | Data management method, data management device and storage medium | |
CN113449187A (zh) | 基于双画像的产品推荐方法、装置、设备及存储介质 | |
CN113761334B (zh) | 一种可视化推荐方法、装置、设备和存储介质 | |
US20150302036A1 (en) | Method, system and computer program for information retrieval using content algebra | |
US9552415B2 (en) | Category classification processing device and method | |
JP2016018286A (ja) | 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム | |
KR20230014035A (ko) | 사용자 검색 의도 분석을 통한 연관 문서 추천 방법 및 장치 | |
JP7418781B2 (ja) | 企業類似度算出サーバ及び企業類似度算出方法 | |
US20180357227A1 (en) | System and method for analyzing popularity of one or more user defined topics among the big data | |
US12197463B2 (en) | Creating descriptors for business analytics applications | |
JP2020013413A (ja) | 判断支援装置および判断支援方法 | |
CN111753199A (zh) | 用户画像构建方法及设备、电子设备和介质 | |
CA2485814A1 (en) | Method and apparatus for range processing in an n-dimensional space | |
KR102062139B1 (ko) | 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치 | |
US20170255691A1 (en) | Information processing system, information processing method, and program | |
WO2012061983A1 (en) | Seed set expansion | |
JP6716919B2 (ja) | 情報抽出装置、抽出方法、および、抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220808 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220808 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7418781 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |