JP7418781B2 - 企業類似度算出サーバ及び企業類似度算出方法 - Google Patents

企業類似度算出サーバ及び企業類似度算出方法 Download PDF

Info

Publication number
JP7418781B2
JP7418781B2 JP2019146489A JP2019146489A JP7418781B2 JP 7418781 B2 JP7418781 B2 JP 7418781B2 JP 2019146489 A JP2019146489 A JP 2019146489A JP 2019146489 A JP2019146489 A JP 2019146489A JP 7418781 B2 JP7418781 B2 JP 7418781B2
Authority
JP
Japan
Prior art keywords
similarity
company
business
industry
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019146489A
Other languages
English (en)
Other versions
JP2021026689A (ja
JP2021026689A5 (ja
Inventor
諒馬 阿部
隆史 老沼
博洋 岩下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vanddd
Original Assignee
Vanddd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vanddd filed Critical Vanddd
Priority to JP2019146489A priority Critical patent/JP7418781B2/ja
Priority to PCT/JP2020/029577 priority patent/WO2021024966A1/ja
Publication of JP2021026689A publication Critical patent/JP2021026689A/ja
Publication of JP2021026689A5 publication Critical patent/JP2021026689A5/ja
Application granted granted Critical
Publication of JP7418781B2 publication Critical patent/JP7418781B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、企業類似度算出サーバ及び企業類似度算出方法に関する。
本技術分野の背景技術として、特開2012-118612号公報(特許文献1)がある。この公報には、「ネットワークを介して、顧客である企業の財務情報を格納したデータサーバとユーザ端末とに接続された管理サーバにおけるマーケティング提案支援方法は、前記ユーザ端末から顧客リストを取得し、前記顧客リストから少なくとも1つの特徴的な評価指標を抽出し、前記特徴的な評価指標に基づいて、前記データサーバから、少なくとも1つの類似企業を検索し、前記検索された少なくとも1つの企業を、類似の程度に基づいて絞り込む」ことが記載されている。
特開2012-118612号公報
しかし、企業間の類似度を算出するにあたり、企業の情報を事業に関する情報、業界に関する情報又は業態に関する情報に分類しておらず、企業間の類似度を精度良く算出できないおそれがあった。
そこで、本発明は、其々の企業における、事業に関する情報の類似度、業界に関する情報の類似度、及び業態に関する情報の類似度に基づいて、企業間の類似度を精度良く算出できる仕組みを提供する。
上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、
基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
算出された前記企業類似度を出力する出力手段と、を備え、
前記類似度算出手段は、
前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出する、
ことを特徴とする。
本発明によれば、其々の企業における、事業に関する情報の類似度、業界に関する情報の類似度、及び業態に関する情報の類似度に基づいて、企業間の類似度を精度良く算出できる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
全体の企業類似度算出システム1の構成図の例である。 企業類似度算出サーバ101のハードウェア構成の例である。 利用者端末102のハードウェア構成の例である。 管理者端末103のハードウェア構成の例である。 基準企業単語情報500の例である。 基準企業分類情報600の例である。 類似度情報700の例である。 対象企業基本情報800の例である。 対象企業単語情報900の例である 対象企業分類情報1000の例である。 業界単語分類辞書情報1100の例である。 業態単語分類辞書情報1200の例である。 業界類似度マトリクス情報1300の例である。 業態類似度マトリクス情報1400の例である。 業界業態類似度設定情報1500の例である。 類似度算出モジュール211が実施する類似度算出フロー1600の例である。 類似度算出モジュール211が実施する事業単語抽出フロー1700の例である。 類似度算出モジュール211が実施する事業単語類似度算出フロー1800の例である。 類似度算出モジュール211が実施する業界単語抽出フロー1900の例である。 類似度算出モジュール211が実施する業界類似度算出フロー2000の例である。 類似度算出モジュール211が実施する業態単語抽出フロー2100の例である。 類似度算出モジュール211が実施する業態類似度算出フロー2200の例である。 類似度算出モジュール211が実施する企業類似度算出フロー2300の例である。 類似度算出モジュール211が実施する類似度出力フロー2400の例である。 類似企業表示モジュール212が実施する類似企業表示フロー2500の例である。 第1の企業と類似する類似企業の抽出を開始するための画面2600の例である。 第1の企業と類似する類似企業を表示するための画面2700の例である。
企業間の類似度(以下、企業類似度とする場合がある。)の情報は様々な場面で活用されており、例えば、企業同士のM&A(Merger and Acquisition:企業買収)を計画するに際して相手方の企業(以下、マッチング先企業とする場合がある。)の候補を抽出する場合に、企業類似度が活用される。この場合において、企業類似度を精度良く算出することで、より効率的なM&Aを実現できる。
しかしながら、従来においては、企業間の類似度を、其々の企業における、事業に関する情報の類似度、業界に関する情報の類似度、及び業態に関する情報の類似度に基づいて、算出することについては何ら考慮されておらず、企業類似度を精度良く算出できないおそれがあった。
そこで、当該課題を解決するために、本実施形態は以下で説明するシステム又は方法を採用した。これにより、企業間の類似度を精度良く算出できる。
以下、実施形態を説明する。
本実施形態では、企業同士のM&Aを計画するに際してマッチング先企業の候補を抽出するために企業間の類似度を算出する企業類似度算出システム1の例を説明する。
図1は、全体の企業類似度算出システム1の構成図の例である。
企業類似度算出システム1は、複数の利用者端末102、複数の管理者端末103、を備え、それぞれがネットワークを介して企業類似度算出サーバ101に接続されている。なお、ネットワークは有線、無線を問わず、それぞれの端末はネットワークを介して情報を送受信することができる。
企業類似度算出システム1のそれぞれの端末や企業類似度算出サーバ101は、例えば、スマートフォン、タブレット、携帯電話機、携帯情報端末(PDA)などの携帯端末(モバイル端末)でもよいし、メガネ型や腕時計型、着衣型などのウェアラブル端末でもよい。また、据置型または携帯型のコンピュータや、クラウドやネットワーク上に配置されるサーバでもよい。また、機能としてはVR(仮想現実:Virtual Reality)端末、AR端末、MR(複合現実:Mixed Reality)端末でもよい。あるいは、これらの複数の端末の組合せであってもよい。例えば、1台のスマートフォンと1台のウェアラブル端末との組合せが論理的に一つの端末として機能し得る。またこれら以外の情報処理端末であってもよい。
企業類似度算出システム1のそれぞれの端末や企業類似度算出サーバ101は、それぞれオペレーティングシステムやアプリケーション、プログラムなどを実行するプロセッサと、RAM(Random Access Memory)等の主記憶装置と、ICカードやハードディスクドライブ、SSD(Solid State Drive)、フラッシュメモリ等の補助記憶装置と、ネットワークカードや無線通信モジュール、モバイル通信モジュール等の通信制御部と、タッチパネルやキーボード、マウス、音声入力、カメラ部の撮像による動き検知による入力などの入力装置と、モニタやディスプレイ等の出力装置とを備える。なお、出力装置は、外部のモニタやディスプレイ、プリンタ、機器などに、出力するための情報を送信する装置や端子であってもよい。
主記憶装置には、各種プログラムやアプリケーションなど(モジュール)が記憶されており、これらのプログラムやアプリケーションをプロセッサが実行することで全体システムの各機能要素が実現される。なお、これらの各モジュールは集積化する等によりハードウェアで実装してもよい。また、各モジュールはそれぞれ独立したプログラムやアプリケーションでもよいが、1つの統合プログラムやアプリケーションの中の一部のサブプログラムや関数などの形で実装されていてもよい。
本明細書では、各モジュールが、処理を行う主体(主語)として記載をしているが、実際には各種プログラムやアプリケーションなど(モジュール)を処理するプロセッサが処理を実行する。
補助記憶装置には、各種データベース(DB)が記憶されている。「データベース」とは、プロセッサまたは外部のコンピュータからの任意のデータ操作(例えば、抽出、追加、削除、上書きなど)に対応できるようにデータ集合を記憶する機能要素(記憶部)である。データベースの実装方法は限定されず、例えばデータベース管理システムでもよいし、表計算ソフトウェアでもよいし、XML、JSONなどのテキストファイルでもよい。データベース管理システムで実装する場合には、リレーショナルデータベース(RDBMS)であってもよいし、非リレーショナルデータベース(非RDBMS)であってもよい。
利用者端末102は、企業類似度情報を利用する者が使用する端末である。利用する者とは自ら企業類似度情報を利用する者だけでなく、当該情報を他社に提供する者も含む。
管理者端末103は、企業類似度算出システム1の管理者などが使用する端末である。
企業類似度算出サーバ101は、上記それぞれの端末などから、判定を行うにあたって必要となる様々な情報の入力を受け付け、これらを補助記憶装置202の中に記憶する。
図2は、企業類似度算出サーバ101のハードウェア構成の例である。
企業類似度算出サーバ101は、例えばクラウド上に配置されたサーバで構成される。
主記憶装置201には、類似度算出モジュール211、類似企業表示モジュール212、管理モジュール213のプログラムやアプリケーションが記憶されており、これらのプログラムやアプリケーションをプロセッサ203が実行することで企業類似度算出サーバ101の各機能要素が実現される。
類似度算出モジュール211は、企業に関連する情報に基づき、企業間の類似度を算出する。詳細は後述するが、例えば、基準となる企業(以下、第1の企業とする場合がある)と、第1の企業との類似度を算出される対象となる企業(以下、第2の企業とする場合がある)と、の類似度を算出する。
類似企業表示モジュール212は、類似する企業同士の情報を利用者端末102や管理者端末103に表示する。詳細は後述するが、例えば、第1の企業と類似する複数の第2の企業の情報、及び当該第1の企業と其々の第2の企業との類似度を表示する。
管理モジュール213は、企業類似度算出システム1の管理を行う。具体的には、管理モジュール213は企業類似度算出サーバの稼働情報や、企業類似度算出システム1を利用する利用者情報などを管理することなどを行う。
補助記憶装置202は、調査履歴データベース207(以下、調査履歴DBとする場合がある)、対象企業データベース208(以下、対象企業DBとする場合がある)、辞書データベース209(以下、辞書DBとする場合がある)、を備える。本実施形態においては少なくとも1つの情報を格納する少なくとも1つの情報をデータベースに備える。
調査履歴DB207は、基準企業単語情報500、基準企業分類情報600及び類似度情報700を備える。
対象企業DB208は、対象企業基本情報800、対象企業単語情報900及び対象企業分類情報1000を備える。
辞書DB209は、事業単語辞書情報1050、業界単語分類辞書情報1100、業態単語分類辞書情報1200、業界類似度マトリクス情報1300、業態類似度マトリクス情報1400及び業界業態類似度設定情報1500を備える。
図3は、利用者端末102のハードウェア構成の例である。
利用者端末102は、例えば据置型コンピュータで構成される。
主記憶装置301には、類似度企業表示モジュール311が記憶されており、これらのプログラムやアプリケーションをプロセッサ303が実行することで利用者端末102の各機能要素が実現される。
補助記憶装置302の利用者端末データ321は、利用者に関連する情報を記憶する。
図4は、管理者端末103のハードウェア構成の例である。
管理者端末103は、例えば据置型コンピュータで構成される。
主記憶装置401には、管理モジュール411が記憶されており、これらのプログラムやアプリケーションをプロセッサが実行することで管理者端末103の各機能要素が実現される。
管理モジュール411は、企業類似度算出システム1の管理を行う。
補助記憶装置402の管理者端末データ421は、企業類似度算出システム1を管理するための情報を記憶する。
図5、図6及び図7は企業類似度算出サーバ101の補助記憶装置202の調査履歴DB207に記憶される各テーブルの例である。
図5は、基準企業単語情報500の例である。
基準企業単語情報500は第1の企業に関する情報から抽出した単語の情報を記憶している。
基準企業単語情報500は、案件ID501、企業ID502、基準企業名503、事業単語504、業界単語505及び業態単語506などの情報を有する。
案件ID501は、基準企業としての第1の企業と、少なくとも1つの第2の企業と、の類似度を算出する旨の要求を利用者端末から企業類似度算出サーバが受信した場合に生成されるユニークなIDである。案件IDは時系列において過去の案件より後の案件の方が大きい数値が付与される。
企業ID502は、企業ごとに生成されるユニークなIDである。言い換えれば、1つの企業は1つの企業IDを有する。
基準企業名503は、基準企業(第1の企業)の名称である。
事業単語504は、第1の企業に関する情報から抽出した、第1の企業の事業に関する単語の情報である。
業界単語505は、第1の企業に関する情報から抽出した、第1の企業の業界に関する単語の情報である。
業態単語506は、第1の企業に関する情報から抽出した、第1の企業の業態に関する単語の情報である。
図6は、基準企業分類情報600の例である。
基準企業分類情報600は基準企業(第1の企業)が属する業界及び業態の情報を記憶している。
基準企業分類情報600は案件ID601、企業ID602、基準企業名603、業界604及び業態605などの情報を有する。
業界604は、基準企業(第1の企業)が属する業界の情報である。
業態605は、基準企業(第1の企業)が属する業態の情報である。
図7は、類似度情報700の例である。
類似度情報700は基準企業(第1の企業)と対象企業(第2の企業)との類似度の情報を記憶している。
類似度情報700は案件ID701、企業ID702、基準企業名703、及び類似度704などの情報を有する。
類似度704は基準企業(第1の企業)と複数の対象企業(第2の企業)との類似度の情報である。
図8、図9及び図10は企業類似度算出サーバ101の補助記憶装置202の対象企業DB208に記憶される各テーブルの例である。
図8は、対象企業基本情報800の例である。
対象企業基本情報800は対象企業(第2の企業)に関する企業情報を記憶している。
対象企業基本情報800は企業ID801、対象企業名802、企業情報803、株式時価総額804、当期純利益805及び株価収益率806などの情報を有する。
対象企業名802は、対象企業(第2の企業)の名称である。
企業情報803は、対象企業(第2の企業)に関する文字列の情報であり、実質的に対象企業(第2の企業)に関する文字列の情報に紐づいた情報であればよく、例えば企業URL(Uniform Resource Locator)であってもよい。
図9は、対象企業単語情報900の例である
対象企業単語情報900は対象企業(第2の企業)に関する情報から抽出した単語の情報を記憶している。
対象企業単語情報900は、企業ID901、対象企業名902、事業単語903、業界単語904及び業態単語905などの情報を有する。
事業単語903は、第2の企業に関する情報から抽出した、第1の企業の事業に関する単語の情報である。
業界単語904は、第2の企業に関する情報から抽出した、第1の企業の業界に関する単語の情報である。
業態単語905は、第2の企業に関する情報から抽出した、第1の企業の業態に関する単語の情報である。
図10は、対象企業分類情報1000の例である。
対象企業分類情報1000は対象企業(第2の企業)が属する業界及び業態の情報を記憶している。
対象企業分類情報1000は企業ID1001、対象企業名1002、業界1003及び業態1004などの情報を有する。
業界1003は、対象企業(第2の企業)が属する業界の情報である。
業態1004は、対象企業(第2の企業)が属する業態の情報である。
図11、図12、図13、図14及び図15は企業類似度算出サーバ101の補助記憶装置202の辞書DB209に記憶される各テーブルの例である。
なお、辞書DB209には、事業単語辞書情報1050も記憶されている。事業単語辞書情報1050は事業に関する単語の情報を記憶している。
図11は、業界単語分類辞書情報1100の例である。
業界単語分類辞書情報1100は業界に関する単語及び分類の情報を記憶している。
業界単語分類辞書情報1100は上位業界1101、下位業界1102及び業界単語1103などの情報を有する。
業界単語1103は、業界に関する単語の情報である。
下位業界1102は、業界単語1103に対応付けられた下位の業界の分類の情報である。
上位業界1101は、下位業界1102に対応付けられた上位の業界の分類の情報である。上位業界1101は下位業界1102より広い概念である。
図12は、業態単語分類辞書情報1200の例である。
業態単語分類辞書情報1200は業態に関する単語及び分類の情報を記憶している。
業態単語分類辞書情報1200は上位業態1201、下位業態1202及び業態単語1203などの情報を有する。
業態単語1203は、業態に関する単語の情報である。
下位業態1202は、業態単語1203に対応付けられた下位の業態の分類の情報である。
上位業態1201は、下位業態1202に対応付けられた上位の業態の分類の情報である。上位業態1201は下位業態1202より広い概念である。
なお、事業単語辞書情報1050に記憶する事業に関連する全ての単語と、業界単語分類辞書情報1100に記憶する業界に関連する全ての単語と、業態単語分類辞書情報1200に記憶する業態に関連する全ての単語と、は完全に一致しないようにする(異なる)。しかし、事業単語辞書情報1050に記憶する事業に関連する特定の一部の単語と、業界単語分類辞書情報1100に記憶する業界に関連する特定の一部の単語と、業態単語分類辞書情報1200に記憶する業態に関連する特定の一部の単語と、が同一であってもよい。
図13は、業界類似度マトリクス情報1300の例である。
業界類似度マトリクス情報1300は一方の上位業界及び下位業界と他方の上位業界及び下位業界との類似度を記憶している。
業界類似度マトリクス情報1300は上位業界1301、下位業界1302及び類似度1303などの情報を有する。
業界類似度マトリクス情報1300は、列に属する要素(上位業界及び下位業界)と行に属する要素(上位業界及び下位業界)とがそれぞれ対応している。
類似度1303には、列と行の交点に、列における上位業界及び下位業界と行における上位業界及び下位業界との類似度の情報を記憶している。
図14は、業態類似度マトリクス情報1400の例である。
業態類似度マトリクス情報1400は一方の上位業態及び下位業態と他方の上位業態及び下位業態との類似度を記憶している。
業態類似度マトリクス情報1400は上位業態1401、下位業態1402及び類似度1403などの情報を有する。
業態類似度マトリクス情報1400は、列に属する要素(上位業態及び下位業態)と行に属する要素(上位業態及び下位業態)とがそれぞれ対応している。
類似度1403は、列と行の交点に、列における上位業態及び下位業態と行における上位業態及び下位業態との類似度の情報を記憶している。
図15は、業界業態類似度設定情報1500の例である。
業界業態類似度設定情報1500は、業界類似度マトリクス情報1300の類似度1303及び業態類似度マトリクス情報1400の類似度1403を設定するための規則の情報を記憶している。詳細は後述する。
図16~図25は企業類似度算出システム1で実施される各種処理のフローを示す。
図16は、類似度算出モジュール211が実施する類似度算出フロー1600の例である。
類似度算出フロー1600は、第1の企業と第2の企業との類似度を算出し、算出した類似度を出力するフローである。
類似度算出モジュール211は第1の企業に関する情報(以下、第1の情報とする場合がある)及び第2の企業に関する情報(以下、第2の情報とする場合がある)を取得する(ステップ1601)。
ここで、図26を用いて説明する。本実施形態における画面の例は利用者端末102の出力装置305に表示される。
図26は、第1の企業と類似する類似企業の抽出を開始するための画面2600の例である。
図26で示す例では、第1の企業であるA株式会社におけるマッチング先企業の候補がある場合にはマッチング先企業の候補を表示する。しかし、図26で示す例では、A株式会社にはマッチング先企業が登録されていないため、マッチング先企業の候補を特定するために、第1の企業と類似する類似企業の抽出を開始するための画面となっている。
第1の企業と類似する類似企業を抽出することにより、利用者は、抽出した複数の類似企業を参照することで、いずれの企業をマッチング先企業の候補とすべきかの意思決定を行いやすくなる。
図26で示す例では、第1の企業であるA株式会社に関する情報(第1の情報)であるURL2601(https://www.a‥)を表示している。ここで、当該A株式会社に関する情報(第1の情報)は、A株式会社に関する情報であるとして予め記憶した情報である。すなわち、A株式会社に関する情報(A株式会社のURLの情報も含む。)は既に対象企業基本情報800に記憶した情報である。従って、図26で示す例では、第1の情報であるURL2601は対象企業基本情報800の企業情報803に記憶したA株式会社の企業情報(図示せず)である。他の例として、第1の情報を利用者端末102から受信してもよい。
図26で示す例において、「以下のURLから自動抽出する」2602が選択されると、類似度算出モジュール211は、第1の情報及び第2の情報を取得(ステップ1601)したこととなる。
すなわち、類似度算出モジュール211は「以下のURLから自動抽出する」2602が選択された場合に、第1の情報を取得する。
また、類似度算出モジュール211は、本実施形態において、「以下のURLから自動抽出する」2602が選択された時点で対象企業基本情報800の企業情報803に記憶した全ての企業における企業情報(第1の企業と企業IDが同一であるものを除く。)を第2の情報として取得する。すなわち、本実施形態において、類似度算出モジュール211は、1つの第1の企業に対して対象企業基本情報800に記憶した全ての企業(第1の企業と同一の企業を除く)の類似度を算出することを意味する。
なお、他の実施形態として、類似度算出モジュール211は、特定の一部の対象企業基本情報800の企業情報803に記憶した企業情報、又は利用者端末102から受信した企業情報を第2の情報として取得してもよい。
類似度算出モジュール211は、第1の情報及び第2の情報から事業に関する単語を抽出する(ステップ1602)。詳細は後述する。
類似度算出モジュール211は、第1の企業が行っている事業に関する単語と、第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出する(ステップ1603)。詳細は後述する。
類似度算出モジュール211は、第1の情報及び第2の情報から業界に関する単語を抽出する(ステップ1604)。詳細は後述する。
類似度算出モジュール211は、第1の企業が属する業界と、第2の企業が属する業界と、の類似度に基づいて業界類似度を算出する(ステップ1605)。詳細は後述する。
類似度算出モジュール211は、第1の情報及び第2の情報から業態に関する単語を抽出する(ステップ1606)。詳細は後述する。
類似度算出モジュール211は、第1の企業が属する業態と、第2の企業が属する業態と、の類似度に基づいて業態類似度を算出する(ステップ1607)。詳細は後述する。
類似度算出モジュール211は、事業類似度、業界類似度、及び業態類似度に基づいて企業類似度を算出する(ステップ1608)。詳細は後述する。
類似度算出モジュール211は、企業類似度の序列に基づいて複数の第2の企業の類似度を出力する(ステップ1609)。詳細は後述する。
これにより、類似度算出モジュール211が実行する類似度算出フロー1600は終了する。
図17は、類似度算出モジュール211が実施する事業単語抽出フロー1700の例である。
事業単語抽出フロー1700は、第1の情報及び第2の情報から事業に関する単語を抽出するフローであり、図16におけるステップ1602の詳細なフローである。
類似度算出モジュール211は第1の企業に関する情報である第1の情報及び第2の企業に関する情報である第2の情報から単語群を抽出する(ステップ1701)。
具体的には、類似度算出モジュール211は、第1の企業に関する文字列の情報である第1の情報(本実施形態においては企業URLのリンク先の文字列情報)を形態素解析により、意味を持つ最小限の単位である単語に分解する(以下、第1の情報を分解して得た複数の単語の群を第1の単語群とする場合がある。)。
同様に、類似度算出モジュール211は、第2の企業に関する文字列の情報である第2の情報(本実施形態においては企業URLのリンク先の文字列情報)を形態素解析により、意味を持つ最小限の単位である単語に分解する(以下、第2の情報を分解して得た複数の単語の群を第2の単語群とする場合がある。)。
類似度算出モジュール211は第1の単語群と事業単語辞書情報1050とを突合し、かつ第2の単語群と事業単語辞書情報1050とを突合する(ステップ1702)。
辞書DB209の事業単語辞書情報1050には事業に関する単語(以下、事業単語とする場合がある。)の情報が記憶されている。
類似度算出モジュール211は第1の単語群に含まれる事業単語(以下、第1の事業単語とする場合がある。)又は第2の単語群に含まれる事業単語(以下、第2の事業単語とする場合がある。)を出力する(ステップ1703)。
類似度算出モジュール211は、第1の情報において第1の事業単語が出現した回数及び第2の情報において第2の事業単語が出現した回数を出力する(ステップ1704)。
ステップ1703及びステップ1704の具体的な例を、図5を用いて説明する。図5で示す案件IDがM1(基準企業名がA株式会社)の例を説明する。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「住宅」及び「メンテナンス」の単語を含んでおり、かつ事業単語辞書情報1050に「住宅」及び「メンテナンス」の事業単語を含んでいる場合を想定する。当該場合には、類似度算出モジュール211は、第1の単語群と事業単語辞書情報1050とで共通する「住宅」及び「メンテナンス」が第1の情報における第1の事業単語であるとして当該単語を基準企業単語情報500の事業単語504に出力する(記憶する)(ステップ1703)。
さらに、類似度算出モジュール211は、「住宅」及び「メンテナンス」がA株式会社に関する文字列情報に出現した回数も基準企業単語情報500の事業単語504に出力する(記憶する)(ステップ1704)。すなわち、類似度算出モジュール211はA株式会社に関する文字列情報(第1の情報)のうち、最も多く出現した「住宅」(出現回数が7回)を事業単語504の単語1に出力し、次いで出現回数が多かった「メンテナンス」(出現回数が6回)を事業単語504の単語2に出力する。なお、類似度算出モジュール211は、「メンテナンス」に次いで出現回数が多かった他の単語も事業単語504の単語3(図示せず)以降に出力する。
なお、A株式会社に関する文字列情報から抽出した第1の単語群に「新築」の単語を含んでおり、かつ事業単語辞書情報1050に「新築」の事業単語を含んでいない場合を想定する。当該場合には、類似度算出モジュール211は、第1の単語群と事業単語辞書情報1050とでは「新築」の単語は共通しないため「新築」は基準企業単語情報500の事業単語504に出力しない(記憶しない)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合であっても、第2の事業単語の情報及び出現した回数の情報を対象企業単語情報900における事業単語903に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の事業単語の情報及び出現した回数、並びに情報第2の事業単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する事業単語抽出フロー1700は終了する。
図18は、類似度算出モジュール211が実施する事業単語類似度算出フロー1800の例である。
事業単語類似度算出フロー1800は、第1の企業が行っている事業に関する単語(第1の事業単語)と、第2の企業が行っている事業に関する単語(第2の事業単語)と、に基づいて事業類似度を算出するフローであり、図16におけるステップ1603の詳細なフローである。
類似度算出モジュール211は図5における事業単語504に記憶した全ての第1の事業単語(以下、第1の事業単語群とする場合がある)及び事業単語903に記憶した全ての第2の事業単語(以下、第2の事業単語群とする場合がある。)取得する(ステップ1801)。
類似度算出モジュール211は第1の事業単語群をベクトル化し、かつ第2の事業単語群をベクトル化する(ステップ1802)。
具体的には、例えば、類似度算出モジュール211は、tf‐idf(Term Frequency-Inverse Document Frequency)を用いて、第1の事業単語群及び第2の事業単語群を其々ベクトル化することができる。この場合においては、類似度算出モジュール211は、第1の事業単語群に含まれる各事業単語の出現回数の情報も取得する。
他の例として、類似度算出モジュール211は、Bag of Words、LSA(Latent Semantic Analysis)、word2vec、Doc2Vec等の文字列情報をベクトル化する技術を用いて、第1の企業に関する文字列情報(第1の情報)をベクトル化してもよく、また第2の企業に関する文字列情報(第2の情報)をベクトル化してもよい。
類似度算出モジュール211は、第1の事業単語群におけるベクトル情報と第2の事業単語群におけるベクトル情報との類似度を算出する(ステップ1803)。
例えば、類似度算出モジュール211は、第1の事業単語群におけるベクトル情報と第2の事業単語群におけるベクトル情報との類似度は、コサイン類似度を計算することで算出できる。
類似度算出モジュール211は、第1の事業単語群におけるベクトル情報と第2の事業単語群におけるベクトル情報との算出した類似度を事業類似度として出力する(ステップ1804)。
ステップ1803及びステップ1804の具体的な例を、図5、図7及び図9を用いて説明する。図5で示す第1の企業であるA株式会社(基準企業名503)と、図9で示す第2の企業のうちの1つであるZ株式会社(対象企業名902)と、の事業類似度を算出し、図7における類似度704に出力する例である。
ステップ1803として、類似度算出モジュール211は、図5のA株式会社における事業単語504に記憶した情報をベクトル化したベクトル情報と、図9のZ株式会社における事業単語903に記憶した情報をベクトル化したベクトル情報と、のコサイン類似度を算出する。この場合、類似度算出モジュール211は、例えば、コサイン類似度を0.960と算出する。
ステップ1804として、類似度算出モジュール211は、Z株式会社の企業ID及び当該企業IDに関連させて事業類似度(コサイン類似度)を類似度情報700の類似度704に出力する(記憶する)。
なお、類似度算出モジュール211は、第1の企業のA株式会社と他の第2の企業との事業類似度も類似度704に出力するが、この時点において事業類似度の序列に従って記憶する必要はない。詳細は後述するが、Z株式会社(企業ID:C0001)の事業類似度は、類似度704のうちの類似度1に記憶されている。
これにより、類似度算出モジュール211が実行する事業単語類似度算出フロー1800は終了する。
図19は、類似度算出モジュール211が実施する業界単語抽出フロー1900の例である。
業界単語抽出フロー1900は、第1の情報及び第2の情報から業界に関する単語を抽出するフローであり、図16におけるステップ1604の詳細なフローである。
類似度算出モジュール211は第1の企業に関する情報である第1の情報及び第2の企業に関する情報である第2の情報から単語群を抽出する(ステップ1901)。なお、当該ステップはステップ1701と同様であり、ステップ1701において、類似度算出モジュール211が抽出した単語群を利用することができる。
類似度算出モジュール211は第1の単語群と業界単語分類辞書情報1100とを突合し、かつ第2の単語群と業界単語分類辞書情報1100とを突合する(ステップ1902)。
辞書DB209の業界単語分類辞書情報1100には業界に関する単語(以下、業界単語とする場合がある。)の情報を記憶している。
類似度算出モジュール211は第1の単語群に含まれる業界単語(以下、第1の業界単語とする場合がある。)又は第2の単語群に含まれる業界単語(以下、第2の業界単語とする場合がある。)を出力する(ステップ1903)。
類似度算出モジュール211は、第1の情報において第1の業界単語が出現した回数及び第2の情報において第2の業界単語が出現した回数を出力する(ステップ1904)。
ステップ1902~ステップ1904の具体的な例を、図5及び図11を用いて説明する。図5で示す案件IDがM1(基準企業名がA株式会社)の例を説明する。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「新築」及び「住宅」の単語を含んでいる場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群に含む「新築」及び「住宅」の単語が、業界単語分類辞書情報1100の業界単語1103に記憶されているかを検索する(ステップ1902)。
本実施形態において、業界単語分類辞書情報1100の業界単語1103には「新築」1111及び「住宅」1112の単語が記憶されている。従って、類似度算出モジュール211は、第1の単語群に含む「新築」及び「住宅」の単語は、業界単語分類辞書情報1100の業界単語1103に含まれる「新築」1111及び「住宅」1112の単語であるとして、「新築」及び「住宅」の単語を第1の業界単語として基準企業単語情報500の業界単語505に出力する(記憶する)(ステップ1903)。
さらに、類似度算出モジュール211は、「新築」及び「住宅」がA株式会社に関する文字列情報に出現した回数も基準企業単語情報500の業界単語505に出力する(記憶する)(ステップ1904)。すなわち、類似度算出モジュール211はA株式会社に関する文字列情報(第1の情報)のうち、最も多く出現した「新築」(出現回数が10回)を業界単語505の単語1に出力し、次いで出現回数が多かった「住宅」(出現回数が7回)を業界単語505の単語2に出力する。なお、類似度算出モジュール211は、「住宅」に次いで出現回数が多かった他の単語も業界単語505の単語3(図示せず)以降に出力する。
なお、A株式会社に関する文字列情報から抽出した第1の単語群に「施工事例」の単語を含んでおり、かつ業界単語分類辞書情報1100の業界単語1103に「施工事例」の業界単語を含んでいない場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群と業界単語分類辞書情報1100の業界単語1103とでは「施工事例」の単語は共通しないため「施工事例」の単語は基準企業単語情報500の業界単語505に出力しない(記憶しない)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合でっあっても、第2の業界単語の情報及び出現した回数の情報を対象企業単語情報900における業界単語904に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の業界単語の情報及び出現した回数、並びに情報第2の業界単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する業界単語抽出フロー1900は終了する。
図20は、類似度算出モジュール211が実施する業界類似度算出フロー2000の例である。
業界類似度算出フロー2000は、第1の企業が属する業界と、第2の企業が属する業界と、の類似度に基づいて業界類似度を算出するフローであり、図16におけるステップ1605の詳細なフローである。
類似度算出モジュール211は、所定回数以上で出現する第1の業界単語を基準企業単語情報500の業界単語505から取得し、かつ所定回数以上で出現する第2の業界単語の情報を対象企業単語情報900の業界単語904から取得する(ステップ2001)。
ステップ2001の具体的な例を、図5及び図9を用いて説明する。図5で示す基準企業名がA株式会社の例を説明する。A株式会社における業界単語は「新築」(出現回数10回)、「住宅」(出現回数7回)と続く。本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する「新築」の出現回数(10回)の80%以上の回数(8回以上)で出現する第1の業界単語を取得する。すなわち、類似度算出モジュール211は、「新築」の業界単語の情報のみを取得する。なお、本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する単語の出現回数の所定割合(80%)以上としたが、当該所定割合は任意に設定できる。
図9で示す対象企業名がZ株式会社の例を説明する。Z株式会社における業界単語は「空間設計」(出現回数5回)、「住宅」(出現回数4回)と続く。本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する「空間設計」の出現回数(5回)の80%以上の回数(4回以上)で出現する第1の業界単語を取得する。すなわち、類似度算出モジュール211は、「空間設計」及び「住宅」の業界単語の情報を取得する。
類似度算出モジュール211は、ステップ2001で取得した第1の業界単語に対応付けられた業界分類(以下、第1の業界とする場合がある。)、及びステップ2001で取得した第2の業界単語に対応付けられた業界分類(以下、第2の業界とする場合がある。)を業界単語分類辞書情報1100から取得する(ステップ2002)。
ステップ2002の具体的な例を、図5及び図11を用いて説明する。図5で示す基準企業名がA株式会社の例を説明する。類似度算出モジュール211は、ステップ2001で取得した「新築」の第1の業界単語に対応する第1の業界を取得する。具体的には、類似度算出モジュール211は、図11の業界単語分類辞書情報1100の「新築」1111に対応する、下位業界1102に記憶された「建築」1113及び上位業界1101に記憶された「建設」1114を取得する。なお、類似度算出モジュール211は、取得した第1の業界の情報を図6で示す基準企業分類情報600の業界604の業界1に記憶し、第1の業界が複数ある場合には、業界2以降に記憶する。
同様に、ステップ2002の具体的な例を、図9及び図11を用いて説明する。図9で示す対象企業名がZ株式会社の例を説明する。類似度算出モジュール211は、ステップ2001で取得した「空間設計」及び「住宅」の第2の業界単語に対応する第2の業界を取得する。具体的には、類似度算出モジュール211は、図11の業界単語分類辞書情報1100の「空間設計」1115及び「住宅」1112に対応する、下位業界1102に記憶された「建築」1113及び上位業界1101に記憶された「建設」1114を取得する。なお、類似度算出モジュール211は、取得した第2の業界の情報を図10で示す対象企業分類情報1000の業界1003の業界1に記憶し、第1の業界が複数ある場合には、業界2以降に記憶する。
類似度算出モジュール211は、業界類似度マトリクス情報1300に基づき、ステップ2002で取得した、第1の業界と第2の業界との類似度を取得する(ステップ2003)。
ステップ2003の具体的な例を、図13を用いて説明する。A株式会社の第1の業界(下位業界「建築」及び上位業界「建設」)と、Z株式会社の第2の業界(下位業界「建築」及び上位業界「建設」)と、の類似度を取得する例を説明する。
類似度算出モジュール211は、図13の業界類似度マトリクス情報1300の列に属するA株式会社の上位業態「建設」1312及び下位業態「建築」1311と、行に属するZ株式会社の上位業態「建設」1314及び下位業態「建築」1313との交点1315に対応付けられた類似度(10)を取得する。
類似度算出モジュール211は、業界類似度マトリクス情報1300の交点に対応付けられた類似度に基づき、第1の企業と第2の企業との業界類似度を算出する(ステップ2004)。
第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例のように、第1の企業が1つの下位業界のみを有し、第2の企業が1つの下位業界のみを有している場合(業界類似度マトリクス情報1300の交点が1つの場合)には、業界類似度マトリクス情報1300の交点に対応付けられた類似度が、第1の企業と第2の企業との業界類似度となる。すなわち、上述のステップ2003で説明した、第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例の場合の業態類似度は10である。
第1の企業の第1の業界及び第2の企業の第2の業界のうちの少なくとも1つが複数の下位業界を含んでいる場合であって、業界類似度マトリクス情報1300の交点が複数ある(類似度が複数ある)場合には、複数の交点に対応付けられた類似度を用いて所定の計算をすること業界類似度を算出できる。具体的な例を、図6、図10及び図13を用いて説明する。図6における基準企業分類情報600に記憶するH株式会社の第1の業界と、図10における対象企業分類情報1000に記憶するV株式会社(企業ID:C0005)の第2の業界と、の業界類似度を取得する例を説明する。
類似度算出モジュール211は、H株式会社の第1の業界として下位業界「高分子」及び上位業界「化学・石油・素材」並びに下位業界「無機材料」及び上位業界「化学・石油・素材」を基準企業分類情報600の業界604から取得する。
類似度算出モジュール211は、V株式会社(企業ID:C0005)の第2の業界として下位業界「高分子」及び上位業界「化学・石油・素材」並びに下位業界「生活用品」及び上位業界「化学・石油・素材」を対象企業分類情報1000の業界1003から取得する。
類似度算出モジュール211は、図13の業界類似度マトリクス情報1300における、列に属するH株式会社の下位業界「高分子」1316及び下位業界「無機材料」1317と、行に属するV株式会社の下位業界「高分子」1318及び下位業界「生活用品」1319と、の4つの交点1320、1321、1322、1323に対応付けられた類似度を其々取得する。
すなわち、類似度算出モジュール211は、交点1320に対応付けられた類似度「8」と、交点1321に対応付けられた類似度「10」と、交点1322に対応付けられた類似度「6」と、交点1323に対応付けられた類似度「8」と、を其々取得する。
類似度算出モジュール211は、例えば、複数のうちの1つの第1の下位業界ごとに類似度を算出し、算出した全ての第1の下位業界ごとの類似度の平均値を算出することで、業界類似度を算出できる。類似度算出モジュール211は、例えば、列に属する第1の企業の1つの第1の下位業界に対応付けられた複数の類似度のうちの、最大の類似度と平均の類似度と、の平均値を算出することで、第1の下位業界ごとの類似度を算出する。なお、列の業界と、行の業界が完全に同一の場合の業界類似度は最大値となる。
第1の下位業界ごとの類似度は、具体的に次のように算出できる。類似度算出モジュール211は、列に属するH株式会社の下位業界「高分子」1316における交点に対応付けられた類似度のうち、交点1320に対応付けられた類似度「8」と交点1321に対応付けられた類似度「10」との平均である「9」と、最大の類似度である交点1321に対応付けられた類似度「10」と、を取得する。更に、類似度算出モジュール211は、取得した「9」と「10」との平均値である「9.5」を、H株式会社の下位業界「高分子」1316における類似度とする。
類似度算出モジュール211は、列に属するH株式会社の下位業界「無機材料」1317における交点に対応付けられた類似度のうち、交点1322に対応付けられた類似度「6」と交点1323に対応付けられた類似度「8」との平均である「7」と、最大の類似度である交点1323に対応付けられた類似度「8」と、を取得する。更に、類似度算出モジュール211は、取得した「7」と「8」との平均値である「7.5」を、H株式会社の下位業界「無機材料」1317における類似度とする。なお、当該例のように、第1の下位業界ごとに類似度を算出することで、複数の交点に対応付けられた類似度のうちの最大の類似度に重きをおいた評価をすることができる。
そして、類似度算出モジュール211は、H株式会社の下位業界「高分子」1316における類似度「9.5」と、H株式会社の「無機材料」1317における類似度「7.5」と、の平均値である「8.5」を業界類似度として算出する。なお、類似度算出モジュール211は、算出した業界類似度は次のステップ2005に従い図7の類似度情報700の類似度704に記憶する
なお、他の例として、複数の交点に対応付けられた全ての類似度の平均値を業界類似度としてもよい。
類似度算出モジュール211は、算出した業界類似度を出力する(ステップ2005)。
ステップ2005の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例で説明する。類似度算出モジュール211は、上述したステップ2004により算出した業界類似度の10を、事業類似度の点数と調整するため、10で除した値である1.00を類似度情報700の類似度704にZ株式会社(対象企業の企業ID:C0001)と関連させて出力する(記憶する)。なお、他の実施形態として、当該出力後の類似度を業界類似度マトリクス情報1300の交点に対応付けておいてもよい。
これにより、類似度算出モジュール211が実行する業界類似度算出フロー2000は終了する。
図21は、類似度算出モジュール211が実施する業態単語抽出フロー2100の例である。
業態単語抽出フロー2100は、第1の情報及び第2の情報から業態に関する単語を抽出するフローであり、図16におけるステップ1606の詳細なフローである。
類似度算出モジュール211は第1の企業に関する情報である第1の情報及び第2の企業に関する情報である第2の情報から単語群を抽出する(ステップ2101)。なお、当該ステップはステップ1701及び1901と同様であり、ステップ1701又は1901において、類似度算出モジュール211が抽出した単語群を利用することができる。
類似度算出モジュール211は第1の単語群と業態単語分類辞書情報1200とを突合し、かつ第2の単語群と業態単語分類辞書情報1200とを突合する(ステップ2102)。
辞書DB209の業態単語分類辞書情報1200には業態に関する単語(以下、業態単語とする場合がある。)の情報を記憶している。
類似度算出モジュール211は第1の単語群に含まれる業態単語(以下、第1の業態単語とする場合がある。)又は第2の単語群に含まれる業態単語(以下、第2の業態単語とする場合がある。)を出力する(ステップ2103)。
類似度算出モジュール211は、第1の情報において第1の業態単語が出現した回数及び第2の情報において第2の業態単語が出現した回数を出力する(ステップ2104)。
ステップ2102~ステップ2104の具体的な例を、図5及び図12を用いて説明する。図5で示す案件IDがM1(基準企業名がA株式会社)の例を説明する。
A株式会社に関する文字列情報(第1の情報)から抽出した第1の単語群に「施工事例」及び「メンテナンス」の単語を含んでいる場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群に含む「施工事例」及び「メンテナンス」の単語が、業態単語分類辞書情報1200の業態単語1203に記憶されているかを検索する(ステップ2102)。
本実施形態において、業態単語分類辞書情報1200の業態単語1203には「施工事例」1211及び「メンテナンス」1212の単語が記憶されている。従って、類似度算出モジュール211は、第1の単語群に含む「施工事例」及び「メンテナンス」の単語は、業態単語分類辞書情報1200の業態単語1203に含まれる「施工事例」1211及び「メンテナンス」1212の単語であるとして、「施工事例」及び「メンテナンス」の単語を第1の業態単語として基準企業単語情報500の業態単語506に出力する(記憶する)(ステップ2103)。
さらに、類似度算出モジュール211は、「施工事例」及び「メンテナンス」がA株式会社に関する文字列情報に出現した回数も基準企業単語情報500の業態単語506に出力する(記憶する)(ステップ2104)。すなわち、類似度算出モジュール211はA株式会社に関する文字列情報(第1の情報)のうち、最も多く出現した「施工事例」(出現回数が7回)を業態単語506の単語1に出力し、次いで出現回数が多かった「メンテナンス」(出現回数が6回)を業態単語506の単語2に出力する。なお、類似度算出モジュール211は、「住宅」に次いで出現回数が多かった他の単語も業態単語506の単語3(図示せず)以降に出力する。
なお、A株式会社に関する文字列情報から抽出した第1の単語群に「住宅」の単語を含んでおり、かつ業態単語分類辞書情報1200の業態単語1203に「住宅」の業態単語を含んでいない場合を想定する。当該場合に、類似度算出モジュール211は、第1の単語群と業態単語分類辞書情報1200の業態単語1203とでは「住宅」の単語は共通しないため「住宅」の単語は基準企業単語情報500の業態単語506に出力しない(記憶しない)。
また、図5を用いて説明した当該例は第1の企業についての例であるが、第2の企業の場合でっあっても、第2の業態単語の情報及び出現した回数の情報を対象企業単語情報900における業態単語905に出力する(記憶する)こと以外は、図5を用いて説明した例と同様である。他の実施形態として、類似度算出モジュール211は、第1の業態単語の情報及び出現した回数、並びに情報第2の業態単語の情報及び出現した回数の情報が同一のデータベースに記憶してもよい。
これにより、類似度算出モジュール211が実行する業態単語抽出フロー2100は終了する。
図22は、類似度算出モジュール211が実施する業態類似度算出フロー2200の例である。
業態類似度算出フロー2200は、第1の企業が属する業態と、第2の企業が属する業態と、の類似度に基づいて業態類似度を算出するするフローであり、図16におけるステップ1607の詳細なフローである。
類似度算出モジュール211は、所定回数以上で出現する第1の業態単語を基準企業単語情報500の業態単語506から取得し、かつ所定回数以上で出現する第2の業態単語の情報を対象企業単語情報900の業態単語905から取得する(ステップ2201)。
ステップ2201の具体的な例を、図5及び図9を用いて説明する。図5で示す基準企業名がA株式会社の例を説明する。A株式会社における業態単語は「施工事例」(出現回数7回)、「メンテナンス」(出現回数6回)と続く。本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する「施工事例」の出現回数(7回)の80%以上の回数(5.6回以上)で出現する第1の業態単語を取得する。すなわち、類似度算出モジュール211は、「施工事例」及び「メンテナンス」の業態単語の情報を取得する。なお、本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する単語の出現回数の所定割合(80%)以上としたが、当該所定割合は任意に設定できる。
図9で示す対象企業名がZ株式会社の例を説明する。Z株式会社における業態単語は「施工実績」(出現回数8回)、「メンテナンス」(出現回数4回)と続く。本実施形態において、類似度算出モジュール211は、最大の出現回数で出現する「施工実績」の出現回数(8回)の80%以上の回数(6.4回以上)で出現する第1の業態単語を取得する。すなわち、類似度算出モジュール211は、「施工実績」の業態単語の情報のみを取得する。
類似度算出モジュール211は、ステップ2201で取得した第1の業態単語に対応付けられた業態分類(以下、第1の業態とする場合がある。)、及びステップ2201で取得した第2の業態単語に対応付けられた業態分類(以下、第2の業態とする場合がある。)を業態単語分類辞書情報1200から取得する(ステップ2202)。
ステップ2202の具体的な例を、図5及び図12を用いて説明する。図5で示す基準企業名がA株式会社の例を説明する。類似度算出モジュール211は、ステップ2201で取得した「施工事例」及び「メンテナンス」の第1の業態単語に対応する第1の業態を取得する。具体的には、類似度算出モジュール211は、図12の業態単語分類辞書情報1200の「施工事例」1211に対応する、下位業態1202に記憶された「施工」1213及び上位業態1201に記憶された「製造・加工」1214を取得する。さらに、類似度算出モジュール211は、図12の業態単語分類辞書情報1200の「メンテナンス」1212に対応する、下位業態1202に記憶された「整備・維持」1215及び上位業態1201に記憶された「管理」1216を取得する。
なお、類似度算出モジュール211は、取得した第1の業態の情報を図6で示す基準企業分類情報600の業態605の業態1及び業態2に記憶する。
同様に、ステップ2202の具体的な例を、図9及び図12を用いて説明する。図9で示す対象企業名がZ株式会社の例を説明する。類似度算出モジュール211は、ステップ2201で取得した「施工実績」の第2の業態単語に対応する第2の業態を取得する。具体的には、類似度算出モジュール211は、図12の業態単語分類辞書情報1200の「施工実績」1217に対応する、下位業態1202に記憶された「施工」1213及び上位業態1201に記憶された「製造・加工」1214を取得する。なお、類似度算出モジュール211は、取得した第2の業態の情報を図10で示す対象企業分類情報1000の業態1004の業態1に記憶し、第1の業態が複数ある場合には、業態2以降に記憶する。
類似度算出モジュール211は、業態類似度マトリクス情報1400に基づき、ステップ2202で取得した、第1の業態と第2の業態との類似度を取得する(ステップ2203)。
ステップ2203の具体的な例を、図14を用いて説明する。A株式会社の第1の業態(下位業態「施工」及び上位業態「製造・加工」並びに下位業態「整備・維持」及び上位業態「管理」)と、Z株式会社の第2の業態(下位業態「施工」及び上位業態「製造・加工」)と、の類似度を取得する例を説明する。
類似度算出モジュール211は、図14の業態類似度マトリクス情報1400における、列に属するA株式会社の上位業態「製造・加工」1412及び下位業態「施工」1411並びに列に属するA株式会社の上位業態「管理」1414及び下位業態「整備・維持」1413と、行に属するZ株式会社の上位業態「製造・加工」1416及び下位業態「施工」1415と、の2つの交点1417、1418に対応付けられた類似度を其々取得する。すなわち、類似度算出モジュール211は、交点1417に対応付けられた類似度「10」と、交点1418に対応付けられた類似度「7」と、を其々取得する。
類似度算出モジュール211は、業態類似度マトリクス情報1400の交点に対応付けられた類似度に基づき、第1の企業と第2の企業との業態類似度を算出する(ステップ2204)。
第1の企業が1つの下位業態のみを有し、第2の企業が1つの下位業態のみを有している場合(業態類似度マトリクス情報1400の交点が1つの場合)には、類似度算出モジュール211は、業態類似度マトリクス情報1400の交点に対応付けられた類似度を第1の企業と第2の企業との業態類似度とできる。
第1の企業の第1の業態及び第2の企業の第2の業態のうちの少なくとも1つが複数の下位業態を含んでいる場合であって、業態類似度マトリクス情報1400の交点が複数ある(類似度が複数ある)場合を想定する。当該場合に、類似度算出モジュール211は、複数の交点に対応付けられた類似度を用いて業態類似度を算出する。
類似度算出モジュール211は、例えば、複数のうちの1つの第1の下位業態ごとに類似度を算出し、算出した全ての第1の下位業態ごとの類似度の平均値を算出することで、業態類似度を算出する。類似度算出モジュール211は、上述する業界類似度算出フロー2000における処理と同様に、例えば、列に属する第1の企業の1つの第1の下位業態に対応付けられた複数の類似度のうちの、最大の類似度と平均の類似度と、の平均値を算出することで、第1の下位業態ごとの類似度を算出する。なお、列の業態と、行の業態が完全に同一の場合の業態類似度は最大値となる。
第1の企業としてのA株式会社と第2の企業としてのZ株式会社との業態類似度を算出する例を説明する。当該例においては、列に属する第1の企業の1つの第1の下位業態に対応付けられた類似度は1つであるため、当該1つの類似度が、第1の下位業態ごとの類似度となる。すなわち、類似度算出モジュール211は、A株式会社の下位業態「施工」1411における類似度「10」1417と、A株式会社の「整備・維持」1413における類似度「7」1418と、を取得する。
そして、類似度算出モジュール211は、A株式会社の下位業態「施工」1411における類似度「10」1417と、A株式会社の「整備・維持」1413における類似度「7」1418と、の平均値である「8.5」を業態類似度として算出する。
類似度算出モジュール211は、算出した業態類似度を出力する(ステップ2205)。
ステップ2205の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社と第2の企業としてのZ株式会社との例で説明する。類似度算出モジュール211は、上述したステップ2204により算出した業態類似度の8.5を、事業類似度の点数と調整するため、10で除した値である0.85を類似度情報700の類似度704にZ株式会社(対象企業の企業ID:C0001)と関連させて出力する(記憶する)。なお、他の実施形態として、当該出力後の類似度を業態類似度マトリクス情報1400の交点に対応付けておいてもよい。
これにより、類似度算出モジュール211が実行する業態類似度算出フロー2200は終了する。
ここで、業界類似度マトリクスの列における下位業界及び上位業界と、行における下位業界及び上位業界と、の交点に記憶された類似度は、所定の規則に基づいて設定される。当該所定の規則について、図15を用いて説明する。
図15の業界業態類似度設定情報1500には、業界類似度マトリクスにおける列の上位分類(上位業界)と行の上位分類(上位業界)とが、同じ、高類似度、中類似度、又は低類似度の場合で場合分けされており、かつ業界類似度マトリクスにおける列の下位分類(下位業界)と行の下位分類(下位業界)とが、同じ、高類似度、又は中類似度及び低類似度場合で場合分けされており、其々の場合に応じた類似度が記憶されている。
なお、「同じ」は業界同士が完全に同一であり、「高類似度」は業界同士が類似する可能性が高く、「中類似度」は業界同士が「高類似度」に次いで類似する可能性が高く、「低類似度」は業界同士が「中類似度」に次いで類似する可能性が高いことを意味する。
業界業態類似度設定情報1500は類似度設定規則1501などの情報を有する。
類似度設定規則1501は、業界業態類似度設定情報1500の最下行に上述した其々の場合に応じた類似度を記憶している。
類似度算出モジュール211は、業界業態類似度設定情報1500で示す規則に基づいて、業界類似度マトリクスの列(第1の企業)における下位業界及び上位業界と、行(第2の企業)における下位業界及び上位業界と、の交点に類似度を対応付ける。
具体的には、例えば、類似度算出モジュール211は、以下の順で類似度を高く設定することができる。
列の下位業界と行の下位業界とが同じである場合(交点に記憶される類似度が10)。
列の下位業界と行の下位業界とが高類似度であり、かつ列の上位業界と行の上位業界とが同じである場合(交点に記憶される類似度が9)。
列の下位業界と行の下位業界とが中類似度であり、かつ列の上位業界と行の上位業界とが同じである場合(交点に記憶される類似度が8)。
列の下位業界と行の下位業界との類似度が高類似度であり、かつ列の上位業界と行の上位業界との類似度が高類似度である場合(交点に記憶される類似度が7)。
列の下位業界と行の下位業界との類似度が中類似度であり、かつ列の上位業界と行の上位業界との類似度が高類似度である場合(交点に記憶される類似度が6)。
列の下位業界と行の下位業界との類似度が高類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が5)。
列の下位業界と行の下位業界との類似度が中類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が4)。
列の下位業界と行の下位業界との類似度が低類似度であり、かつ列の上位業界と行の上位業界とが同じである場合(交点に記憶される類似度が3)。
列の下位業界と行の下位業界との類似度が低類似度であり、かつ列の上位業界と行の上位業界との類似度が高類似度である場合(交点に記憶される類似度が2)。
列の下位業界と行の下位業界との類似度が低類似度であり、かつ列の上位業界と行の上位業界との類似度が低及び中類似度である場合(交点に記憶される類似度が1)。
なお、下位業界同士が「同じ」、「高類似度」、「中類似度」又は「低類似度」かは、予め決定されている必要がある。また同様に、上位業界同士が「同じ」、「高類似度」、「中類似度」又は「低類似度」かは、予め決定されている必要がある。
また業態類似度マトリクスの列における下位業態及び上位業態と、行における下位業態及び上位業態と、の交点に対応付ける類似度についても上述するとおりの所定の規則に基づいて設定される。
図23は、類似度算出モジュール211が実施する企業類似度算出フロー2300の例である。
企業類似度算出フロー2300は、事業類似度、業界類似度、及び業態類似度に基づいて企業類似度を算出するフローであり、図16におけるステップ1608の詳細なフローである。
類似度算出モジュール211は、類似度情報700から事業類似度、業界類似度及び業態類似度の情報を取得する(ステップ2301)。
類似度算出モジュール211は、事業類似度、業界類似度及び業態類似度を所定割合で足し合わせた企業類似度を算出する(ステップ2302)。
類似度算出モジュール211は、算出した企業類似度を出力する(ステップ2303)。
ステップ2301~ステップ2303の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社と第2の企業としてのZ株式会社(対象企業の企業ID:C0001)との例で説明する。
類似度算出モジュール211は、類似度情報700の類似度704から、第1の企業であるA株式会社と第2の企業(対象企業の企業ID:C0001)との事業類似度(0.960)、業界類似度(1.00)及び業態類似度(0.850)を其々取得する(ステップ2301)。
類似度算出モジュール211は、以下の割合で其々の類似度を足し合わせる。
事業類似度:業界類似度:業態類似度=3:5:2
業態類似度の割合が最も高く、事業類似度の割合が最も低い。
すなわち、類似度算出モジュール211は、企業類似度として0.958の値を算出する(ステップ2302)。
当該所定割合はいかなる割合でもよく、当該割合を調整することで各類似度の重要度を設定できる。
類似度算出モジュール211は、算出した企業類似度(0.958)を類似度情報700の類似度704にZ株式会社(対象企業の企業ID:C0001)と関連させて出力する(記憶する)(ステップ2303)。
これにより、類似度算出モジュール211が実行する企業類似度算出フロー2300は終了する。
図24は、類似度算出モジュール211が実施する類似度出力フロー2400の例である。
類似度出力フロー2400は、企業類似度の序列に基づいて複数の第2の企業の類似度を出力するフローであり、図16におけるステップ1609の詳細なフローである。
類似度算出モジュール211は、複数の第2の企業における企業類似度を取得する(ステップ2401)。
類似度算出モジュール211は、取得した複数の第2の企業における企業類似度に基づき複数の第2の企業の序列を決定する(ステップ2402)。
類似度算出モジュール211は、決定した複数の第2の企業の序列の情報を出力する(記憶する)(ステップ2403)。
ステップ2401~ステップ2403の具体的な例を、図7を用いて説明する。第1の企業としてのA株式会社の例で説明する。
類似度算出モジュール211は、図7の類似度情報700の類似度704から、第1の企業であるA株式会社と複数の第2の企業との企業類似度を取得する(ステップ2401)。本実施形態においては、対象企業基本情報800に記憶されたすべての第2の企業とA株式会社との企業類似度を類似度情報700の類似度704から取得する。なお、図7には、3つの企業の類似度のみしか表示されていない。
類似度算出モジュール211は、すべての第2の企業とA株式会社との企業類似度に基づき第2の企業を序列付けしたところ、例えば、上位3位は次のとおり決定できる(ステップ2402)。第1位は企業IDがC0001(Z株式会社)で企業類似度が0.958であり、第2位は企業IDがC0080の企業で企業類似度が0.927であり、第3位は企業IDがC0087で企業類似度が0.810である。
類似度算出モジュール211は、第1位の企業IDがC0001のZ株式会社の各類似度に関する情報を類似度情報700の類似度704の類似度1に出力(記憶)し、第2位の企業IDがC0080の企業の各類似度に関する情報を類似度情報700の類似度704の類似度2に出力(記憶)し、第3位の企業IDがC0087の企業の各類似度に関する情報を類似度情報700の類似度704の類似度3に出力(記憶)する(ステップ2403)。なお、類似度算出モジュール211は、第4位以降を類似度情報700の類似度704の類似度4以降に出力(記憶)する。
これにより、類似度算出モジュール211が実行する類似度出力フロー2400は終了する。
図25は、類似企業表示モジュール212が実施する類似企業表示フロー2500の例である。
類似企業表示フロー2500は、第1の企業に類似する第2の企業を表示するフローである。
類似企業表示モジュール212は、企業類似度が上位の第2の企業における事業類似度、業界類似度、業態類似度及び企業類似度を取得する(ステップ2501)。
類似企業表示モジュール212は、企業類似度の序列に基づいて、第2の企業に関する情報及び事業類似度、業界類似度及び業態類似度の軸を含むチャートを利用者端末102に表示する(ステップ2502)。
なお、類似企業表示モジュール212が生成及び表示するチャートは、レーダーチャートに限られず、例えば、会社毎に各類似度のコラムチャート(棒グラフ)をグルーピングしたチャートであってもよい。
ステップ2501及びステップ2502の具体的な例を、図7、図8及び図27を用いて説明する。第1の企業としてのA株式会社の例で説明する。
類似企業表示モジュール212は、図7の類似度情報700の類似度704における、第1の企業であるA株式会社の行の類似度1、類似度2及び類似度3に記憶した、第2の企業(企業IDがC0001のZ株式会社、企業IDがC0080の企業及び企業IDがC0087の企業)における事業類似度、業界類似度、業態類似度及び企業類似度を取得する。また、取得した第2の企業における図8の対象企業基本情報800に記憶した情報も併せて取得する(ステップ2501)。
図27は、第1の企業と類似する類似企業を表示するための画面2700の例である。より具体的には、図27は第1の企業としてのA株式会社に類似する3つの企業が表示されている。なお、図27は図26の「以下のURLから自動抽出する」2602が選択された後に表示される画面である。
類似企業表示モジュール212は、企業IDがC0001のZ株式会社、企業IDがC0080の企業及び企業IDがC0087の企業の企業類似度の序列に基づいて、各企業の情報を表示する。すなわち、類似企業表示モジュール212は、企業類似度が最も高い企業であるZ株式会社(企業ID:C0001)の情報を上段部に表示し、次いで企業類似度が高い企業である企業IDがC0080の企業(R株式会社)の情報を中段部に表示し、次いで企業類似度が高い企業である企業IDがC0087の企業(G株式会社)の情報を下段部に表示する。
類似企業表示モジュール212は、図27で示すように、図8の対象企業基本情報800から取得した、各第2の企業における、名称、株式時価総額、当期純利益、及び株価収益率を表示する。
また、類似企業表示モジュール212は、図27で示すように、類似度情報700から取得した事業類似度を事業類似度の軸に表示し、類似度情報700から取得した業界類似度を業界類似度の軸に表示し、類似度情報700から取得した業態類似度を業態類似度の軸に表示したレーダーチャートを表示する。
これにより、類似企業表示モジュール212が実行する類似企業表示フロー2500は終了する。
なお、類似企業表示モジュール212は、事業類似度の軸、業界類似度の軸及び業態類似度の軸に加えて、又は置き換えて、業種に関する類似度の軸、営業形態に関する類似度の軸、又は事業構造に関する類似度の軸、を含むチャートを生成及び表示してもよい。
類似度算出モジュール211は、業種に関する類似度、営業形態に関する類似度、又は事業構造に関する類似度を、業界類似度又は業態類似度を算出する方法と同様の方法で、算出できる。
すなわち、類似度算出モジュール211は、第1の情報又は第2の情報から、業種に関する単語及び分類の情報を記憶する業種単語分類辞書情報、営業形態に関する単語及び分類の情報を記憶する営業形態単語分類辞書情報、又は事業構造に関する単語及び分類の情報を記憶する事業構造単語分類辞書情報を用いて、業種に関する単語、営業形態に関する単語、又は事業構造に関する単語を抽出する。
次いで、当該抽出した単語に対応する第1の企業又は第2の企業が属する業種、営業形態、又は事業構造を、業種単語分類辞書情報、営業形態単語分類辞書情報、又は事業構造単語分類辞書情報を用いて、特定する。
次いで、類似度算出モジュール211は、業種類似度マトリクス、営業形態類似度マトリクス、又は事業構造類似度マトリクスを用いて、業種に関する類似度、営業形態に関する類似度、又は事業構造に関する類似度を算出する。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
なお、上述の実施例は少なくとも特許請求の範囲に記載の構成を開示している。
1・・・企業類似度算出システム、101・・・企業類似度算出サーバ、102・・・利用者端末、103・・・管理者端末、201・・・主記憶装置、202・・・補助記憶装置、203・・・プロセッサ、211・・・類似度算出モジュール、212・・・類似企業表示モジュール、213・・・管理モジュール

Claims (25)

  1. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
    前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
    算出された前記企業類似度を出力する出力手段と、を備え、
    前記類似度算出手段は、
    前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
    前記第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を前記第1の業界とし、
    前記第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を前記第2の業界として、
    前記業界類似度を算出する、企業類似度算出サーバ。
  2. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
    前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
    算出された前記企業類似度を出力する出力手段と、を備え、
    前記類似度算出手段は、
    前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
    前記第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を第1の下位業界とし、前記第1の下位業界より広い概念であり、前記第1の下位業界に対応付けられた業界を第1の上位業界とし、前記第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を第2の下位業界とし、前記第2の下位業界より広い概念であり、前記第2の下位業界に対応付けられた業界を第2の上位業界とし、
    前記第1の下位業界及び前記第1の上位業界と、前記第2の下位業界及び前記第2の上位業界と、の類似度を算出することで、前記業界類似度を算出する、企業類似度算出サーバ。
  3. 前記業界類似度を算出するために用いる業界類似度マトリクスを取得する情報取得手段を有し、
    前記業界類似度マトリクスは、
    列に属する要素と行に属する要素とがそれぞれ対応しており、前記要素は、業界に関する情報である下位業界と前記下位業界より広い概念である上位業界とを含み、
    前記列と前記行との交点には、前記列における前記下位業界及び前記上位業界と、前記行における前記下位業界及び前記上位業界と、の類似度が対応付けられており、
    前記類似度算出手段は、
    前記業界類似度マトリクスを用いて、
    前記第1の下位業界及び前記第1の上位業界と関連する少なくとも1つの前記列と、
    前記第2の下位業界及び前記第2の上位業界と関連する少なくとも1つの前記行と、に対応付けられた類似度を取得することで、前記業界類似度を算出する、請求項2に記載の企業類似度算出サーバ。
  4. 前記第1の下位業界及び前記第1の上位業界と関連する少なくとも1つの前記下位業界及び前記上位業界に対応する前記列と、
    前記第2の下位業界及び前記第2の上位業界と関連する少なくとも1つの前記下位業界及び前記上位業界に対応する前記行と、に対応付けられた複数の類似度を取得し、
    取得した前記複数の類似度に基づき、前記業界類似度を算出する、請求項3に記載の企業類似度算出サーバ。
  5. 前記業界類似度マトリクスの前記列と前記行とに対応付けられた類似度は、
    前記列の前記下位業界と前記行の前記下位業界とが同一である場合、
    前記列の前記下位業界と前記行の前記下位業界との類似度が類似する可能性が高い高類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界とが同一である場合、
    前記列の前記下位業界と前記行の前記下位業界との類似度が前記高類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界との類似度が前記高類似度である場合、
    前記列の前記下位業界と前記行の前記下位業界との類似度が前記高類似度より低い低類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界とが同一である場合、
    前記列の前記下位業界と前記行の前記下位業界との類似度が前記低類似度であり、かつ前記列の前記上位業界と前記行の前記上位業界との類似度が前記低類似度である場合、
    の順で高い、請求項3または4に記載の企業類似度算出サーバ。
  6. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
    前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
    算出された前記企業類似度を出力する出力手段と、を備え、
    前記類似度算出手段は、
    前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
    前記第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を前記第1の業態とし、
    前記第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を前記第2の業態として、
    前記業態類似度を算出する、企業類似度算出サーバ。
  7. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバであって、
    前記第1の企業に関する第1の情報及び前記第2の企業に関する第2の情報に基づき、前記第1の企業と前記第2の企業との企業類似度を算出する類似度算出手段と、
    算出された前記企業類似度を出力する出力手段と、を備え、
    前記類似度算出手段は、
    前記第1の企業が行っている事業に関する単語と、前記第2の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出するものであり、
    前記第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を第1の下位業態とし、前記第1の下位業態より広い概念であり、前記第1の下位業態に対応付けられた業態を第1の上位業態とし、
    前記第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を第2の下位業態とし、前記第2の下位業態より広い概念であり、前記第2の下位業態に対応付けられた業態を第2の上位業態とし、
    前記第1の下位業態及び前記第1の上位業態と、前記第2の下位業態及び前記第2の上位業態と、の類似度を算出することで、前記業態類似度を算出する、企業類似度算出サーバ。
  8. 前記業態類似度を算出するために用いる業態類似度マトリクスを取得する情報取得手段を有し、
    前記業態類似度マトリクスは、
    列に属する要素と行に属する要素とがそれぞれ対応しており、前記要素は、業態に関する情報である下位業態と前記下位業態より広い概念である上位業態とを含み、
    前記列と前記行との交点には、前記列における前記下位業態及び前記上位業態と、前記行における前記下位業態及び前記上位業態と、の類似度が対応付けられており、
    前記類似度算出手段は、
    前記業態類似度マトリクスを用いて、
    前記第1の下位業態及び前記第1の上位業態と関連する少なくとも1つの前記列と、
    前記第2の下位業態及び前記第2の上位業態と関連する少なくとも1つの前記行と、に対応付けられた類似度を取得することで、前記業態類似度を算出する、請求項7に記載の企業類似度算出サーバ。
  9. 前記第1の下位業態及び前記第1の上位業態と関連する少なくとも1つの前記下位業態及び前記上位業態に対応する前記列と、
    前記第2の下位業態及び前記第2の上位業態と関連する少なくとも1つの前記下位業態及び前記上位業態に対応する前記行と、に対応付けられた複数の類似度を取得し、
    取得した前記複数の類似度に基づき、前記業態類似度を算出する、請求項8に記載の企業類似度算出サーバ。
  10. 前記業態類似度マトリクスの前記列と前記行とに対応付けられた類似度は、
    前記列の前記下位業態と前記行の前記下位業態とが同一である場合、
    前記列の前記下位業態と前記行の前記下位業態との類似度が類似する可能性が高い高類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態とが同一である場合、
    前記列の前記下位業態と前記行の前記下位業態との類似度が前記高類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態との類似度が前記高類似度である場合、
    前記列の前記下位業態と前記行の前記下位業態との類似度が前記高類似度より低い低類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態とが同一である場合、
    前記列の前記下位業態と前記行の前記下位業態との類似度が前記低類似度であり、かつ前記列の前記上位業態と前記行の前記上位業態との類似度が前記低類似度である場合、
    の順で高い、請求項8または9に記載の企業類似度算出サーバ。
  11. 前記類似度算出手段は、
    前記第1の企業が行っている事業に関する単語である第1の事業単語を、前記第1の情報から少なくとも1つ抽出し、前記第2の企業が行っている事業に関する単語である第2の事業単語を、前記第2の情報から少なくとも1つ抽出し、前記第1の事業単語と前記第2の事業単語とを入力として、前記第1の企業と前記第2の企業との事業類似度を算出する言語処理モジュールを備える、請求項1から10のいずれか1項に記載の企業類似度算出サーバ。
  12. 前記言語処理モジュールは、tf‐idf、Bag of Words、LSA、word2vec、またはDoc2Vecのうちの少なくとも1つである、請求項11に記載の企業類似度算出サーバ。
  13. 前記類似度算出手段は、
    前記事業類似度と、前記業態類似度と、前記業界類似度と、の其々を所定の割合で足し合わせた値を算出することで、
    前記企業類似度を算出する、請求項1から12のいずれか1項に記載の企業類似度算出サーバ。
  14. 前記所定の割合は、
    前記業態類似度の割合が最も高く、前記事業類似度の割合が最も低い、請求項13に記載の企業類似度算出サーバ。
  15. 前記出力手段は、
    前記事業類似度と、
    前記業態類似度と、
    前記業界類似度と、
    前記企業類似度と、を出力する、請求項1から14のいずれか1項に記載の企業類似度算出サーバ。
  16. 前記出力手段は、
    前記事業類似度の軸と、
    前記業態類似度の軸と、
    前記業界類似度の軸と、を含むチャートを出力する、請求項1から15のいずれか1項に記載の企業類似度算出サーバ。
  17. 前記出力手段は、
    前記類似度算出手段により算出した前記事業類似度を前記事業類似度の軸に表示し、
    前記類似度算出手段により算出した前記業界類似度を前記業界類似度の軸に表示し、
    前記類似度算出手段により算出した前記業態類似度を前記業態類似度の軸に表示する、請求項16に記載の企業類似度算出サーバ。
  18. 前記第2の企業が複数ある場合、
    前記出力手段は、
    前記類似度算出手段により算出した前記企業類似度の序列に基づいて複数の前記第2の企業の類似度を出力する、請求項1から17のいずれか1項に記載の企業類似度算出サーバ。
  19. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
    前記第1の企業が行っている事業に関する単語と、前記第の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
    算出された前記企業類似度を出力する、
    ここで、前記業界類似度の算出においては、
    前記第1の企業に関する第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を前記第1の業界とし、
    前記第2の企業に関する第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を前記第2の業界として、
    前記業界類似度を算出する、
    企業類似度算出方法。
  20. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
    前記第1の企業が行っている事業に関する単語と、前記第の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
    算出された前記企業類似度を出力する、
    ここで、前記業界類似度の算出においては、
    前記第1の企業に関する第1の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業界単語と対応付けられた少なくとも1つの業界を第1の下位業界とし、前記第1の下位業界より広い概念であり、前記第1の下位業界に対応付けられた業界を第1の上位業界とし、
    前記第2の企業に関する第2の情報から業界に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業界単語と対応付けられた少なくとも1つの業界を第2の下位業界とし、前記第2の下位業界より広い概念であり、前記第2の下位業界に対応付けられた業界を第2の上位業界とし、
    前記第1の下位業界及び前記第1の上位業界と、前記第2の下位業界及び前記第2の上位業界と、の類似度を算出する、
    企業類似度算出方法。
  21. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
    前記第1の企業が行っている事業に関する単語と、前記第の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
    算出された前記企業類似度を出力する、
    ここで、前記業態類似度の算出においては、
    前記第1の企業に関する第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を前記第1の業態とし、
    前記第2の企業に関する第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を前記第2の業態として、
    前記業態類似度を算出する、
    企業類似度算出方法。
  22. 基準となる第1の企業と、前記第1の企業以外の第2の企業と、の企業類似度を算出する企業類似度算出サーバにおける企業類似度算出方法であって、
    前記第1の企業が行っている事業に関する単語と、前記第の企業が行っている事業に関する単語と、に基づいて事業類似度を算出し、
    前記第1の企業が属する業界に関する第1の業界と、前記第2の企業が属する業界に関する第2の業界と、に基づいて業界類似度を算出し、
    前記第1の企業が属する業態に関する第1の業態と、前記第2の企業が属する業態に関する第2の業態と、に基づいて業態類似度を算出し、
    前記事業類似度と、前記業界類似度と、前記業態類似度と、に基づいて前記企業類似度を算出し、
    算出された前記企業類似度を出力する、
    ここで、前記業態類似度の算出においては、
    前記第1の企業に関する第1の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第1の業態単語と対応付けられた少なくとも1つの業態を第1の下位業態とし、前記第1の下位業態より広い概念であり、前記第1の下位業態に対応付けられた業態を第1の上位業態とし、
    前記第2の企業に関する第2の情報から業態に関する単語を抽出し、抽出した単語のうち所定の出現回数以上で出現する少なくとも1つの第2の業態単語と対応付けられた少なくとも1つの業態を第2の下位業態とし、前記第2の下位業態より広い概念であり、前記第2の下位業態に対応付けられた業態を第2の上位業態とし、
    前記第1の下位業態及び前記第1の上位業態と、前記第2の下位業態及び前記第2の上位業態と、の類似度を算出することで、前記業態類似度を算出する、
    企業類似度算出方法。
  23. 前記事業類似度の算出においては、
    前記第1の企業が行っている事業に関する単語である第1の事業単語を前記第1の情報から少なくとも1つ抽出し、前記第2の企業が行っている事業に関する単語である第2の事業単語を、前記第2の情報から少なくとも1つ抽出し、前記第1の事業単語と前記第2の事業単語とを入力として、前記第1の企業と前記第2の企業との事業類似度を算出する言語処理モジュールを備える、請求項19から22のいずれか1項に記載の企業類似度算出方法。
  24. 前記言語処理モジュールは、tf‐idf、Bag of Words、LSA、word2vec、またはDoc2Vecのうちの少なくとも1つである、請求項23に記載の企業類似度算出方法。
  25. 企業類似度算出サーバに請求項19から24のいずれか1項に記載の企業類似度算出方法の各ステップを実行させるためのプログラム。
JP2019146489A 2019-08-08 2019-08-08 企業類似度算出サーバ及び企業類似度算出方法 Active JP7418781B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019146489A JP7418781B2 (ja) 2019-08-08 2019-08-08 企業類似度算出サーバ及び企業類似度算出方法
PCT/JP2020/029577 WO2021024966A1 (ja) 2019-08-08 2020-07-31 企業類似度算出サーバ及び企業類似度算出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019146489A JP7418781B2 (ja) 2019-08-08 2019-08-08 企業類似度算出サーバ及び企業類似度算出方法

Publications (3)

Publication Number Publication Date
JP2021026689A JP2021026689A (ja) 2021-02-22
JP2021026689A5 JP2021026689A5 (ja) 2022-08-18
JP7418781B2 true JP7418781B2 (ja) 2024-01-22

Family

ID=74503847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019146489A Active JP7418781B2 (ja) 2019-08-08 2019-08-08 企業類似度算出サーバ及び企業類似度算出方法

Country Status (2)

Country Link
JP (1) JP7418781B2 (ja)
WO (1) WO2021024966A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117880283A (zh) * 2023-12-14 2024-04-12 天翼云科技有限公司 云监控方法及装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287328A (ja) 2007-05-15 2008-11-27 Ntt Data Corp 評価装置及び方法ならびにコンピュータプログラム
JP2016071798A (ja) 2014-10-01 2016-05-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6489340B1 (ja) 2018-06-28 2019-03-27 嘉久 塩川 比較対象企業選定システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287328A (ja) 2007-05-15 2008-11-27 Ntt Data Corp 評価装置及び方法ならびにコンピュータプログラム
JP2016071798A (ja) 2014-10-01 2016-05-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6489340B1 (ja) 2018-06-28 2019-03-27 嘉久 塩川 比較対象企業選定システム

Also Published As

Publication number Publication date
JP2021026689A (ja) 2021-02-22
WO2021024966A1 (ja) 2021-02-11

Similar Documents

Publication Publication Date Title
US11868411B1 (en) Techniques for compiling and presenting query results
EP3143523B1 (en) Visual interactive search
US10606883B2 (en) Selection of initial document collection for visual interactive search
US20160314126A1 (en) Entity fingerprints
CA2919878C (en) Refining search query results
US20110264651A1 (en) Large scale entity-specific resource classification
US20160232464A1 (en) Statistically and ontologically correlated analytics for business intelligence
US10956469B2 (en) System and method for metadata correlation using natural language processing
US20160004757A1 (en) Data management method, data management device and storage medium
CN113449187A (zh) 基于双画像的产品推荐方法、装置、设备及存储介质
CN113761334B (zh) 一种可视化推荐方法、装置、设备和存储介质
US20150302036A1 (en) Method, system and computer program for information retrieval using content algebra
US9552415B2 (en) Category classification processing device and method
JP2016018286A (ja) 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム
KR20230014035A (ko) 사용자 검색 의도 분석을 통한 연관 문서 추천 방법 및 장치
JP7418781B2 (ja) 企業類似度算出サーバ及び企業類似度算出方法
US20180357227A1 (en) System and method for analyzing popularity of one or more user defined topics among the big data
US12197463B2 (en) Creating descriptors for business analytics applications
JP2020013413A (ja) 判断支援装置および判断支援方法
CN111753199A (zh) 用户画像构建方法及设备、电子设备和介质
CA2485814A1 (en) Method and apparatus for range processing in an n-dimensional space
KR102062139B1 (ko) 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치
US20170255691A1 (en) Information processing system, information processing method, and program
WO2012061983A1 (en) Seed set expansion
JP6716919B2 (ja) 情報抽出装置、抽出方法、および、抽出プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220808

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220808

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20220808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231227

R150 Certificate of patent or registration of utility model

Ref document number: 7418781

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150