JP2019211974A - 企業分析装置 - Google Patents

企業分析装置 Download PDF

Info

Publication number
JP2019211974A
JP2019211974A JP2018107104A JP2018107104A JP2019211974A JP 2019211974 A JP2019211974 A JP 2019211974A JP 2018107104 A JP2018107104 A JP 2018107104A JP 2018107104 A JP2018107104 A JP 2018107104A JP 2019211974 A JP2019211974 A JP 2019211974A
Authority
JP
Japan
Prior art keywords
company
word
vector
companies
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018107104A
Other languages
English (en)
Inventor
淳一朗 猪野
Junichiro Ino
淳一朗 猪野
修 米川
Osamu Yonekawa
修 米川
浩介 近藤
Kosuke Kondo
浩介 近藤
堀崇之
Takayuki Hori
崇之 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2018107104A priority Critical patent/JP2019211974A/ja
Publication of JP2019211974A publication Critical patent/JP2019211974A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】企業を、その企業の特徴を表す数値ベクトルで表すことができる企業分析装置を提供する。【解決手段】企業分析装置10は、複数の企業に関する複数の説明文に含まれる複数の単語を抽出する抽出部11と、複数の単語それぞれを、数値により分散表現された単語ベクトルに変換する変換部12と、複数の説明文それぞれに含まれる単語に対応する単語ベクトルに基づいて、複数の企業それぞれに対応する企業ベクトルを算出する算出部13と、を備える。【選択図】図1

Description

本発明は、企業分析装置に関する。
従来、証券取引所に上場する株式は、企業の事業内容を代表的に示した業種の概念により分類されている。例えば、日本の証券取引所に上場される株式については、33種類の業種に分類する東証33業種コードが設定されている。
一方、近年の自然言語処理の研究において、単語の分散表現と呼ばれる技術が注目されている。例えば下記特許文献1には、単語を高次元の実数ベクトルで表現し、意味が近い単語を、コサイン距離が近いベクトルに対応させる技術が記載されている。特許文献1に記載の技術によれば、ベクトルの加算や減算によって、単語の意味の加算や減算を行うことができる。
米国特許第9037464号明細書
業種は、企業の分析に長年用いられてきた実績があり、銘柄を分類する際に有用である。しかしながら、企業の業態は徐々に移り変わるものであるし、企業が複数の事業を行っている場合には、代表的な業種を選ぶことが難しい場合がある。
本発明者らは、近年の自然言語処理の研究に着目し、企業を数値ベクトルとして表現することで、企業の業態が徐々に移り変わったり、企業が複数の事業を行ったりしている場合であっても、企業を適切に特徴付けることができることを見出した。
そこで、本発明は、企業を、その企業の特徴を表す数値ベクトルで表すことができる企業分析装置を提供することを目的とする。
本発明の一態様に係る企業分析装置は、複数の企業に関する複数の説明文に含まれる複数の単語を抽出する抽出部と、複数の単語それぞれを、数値により分散表現された単語ベクトルに変換する変換部と、複数の説明文それぞれに含まれる単語に対応する単語ベクトルに基づいて、複数の企業それぞれに対応する企業ベクトルを算出する算出部と、を備える。
この態様によれば、企業を企業ベクトルとして表現することで、企業の業態が徐々に移り変わる場合であっても、企業の説明文も徐々に移り変わるため、企業を適切に特徴付けることができる。また、企業を企業ベクトルとして表現することで、企業が複数の事業を行っている場合であっても、企業の説明文に複数の事業に関する記述が含まれるため、企業を適切に特徴付けることができる。
また、上記態様において、検索ワードの入力を受け付ける入力部と、検索ワードに応じた1又は複数の企業の名称を出力する出力部と、をさらに備え、算出部は、検索ワードに含まれる単語に対応する単語ベクトル又は検索ワードに含まれる企業の名称に対応する企業ベクトルに基づいて、数値により分散表現された検索ベクトルを算出し、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出し、出力部は、類似度に基づいて、検索ワードに応じた1又は複数の企業の名称を出力してもよい。
この態様によれば、検索ワードとして任意の単語を受け付けて、その単語と意味的に近似する企業の名称を出力することができる。
また、上記態様において、算出部は、検索ワードに含まれる単語に対応する単語ベクトル又は検索ワードに含まれる企業の名称に対応する企業ベクトルを、検索ワードに含まれる演算子に基づいて加算及び減算して検索ベクトルを算出し、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出し、出力部は、類似度に基づいて、検索ワードに応じた1又は複数の企業の名称を出力してもよい。
この態様によれば、検索ワードとして単語に関する加算及び減算を含む任意の検索式を受け付けて、単語ベクトル又は企業ベクトルについて加算及び減算を行うことで、意味的な加算及び減算を行い、検索ワードと意味的に類似する企業の名称を出力することができる。
また、上記態様において、出力部により出力された1又は複数の企業の名称に基づいて、検索ワードに対応する株価指数を生成する指数生成部をさらに備えてもよい。
この態様によれば、任意の検索ワードに対応するテーマインデックスを生成することができる。これにより、ある企業と類似する企業に投資するテーマインデックスを生成したり、流行語から連想される企業に投資するテーマインデックスを生成したりすることができる。
また、上記態様において、複数の企業に対応する複数の企業ベクトルのクラスタリングにより、複数の企業を分類する分類部と、分類部により1つのクラスタに分類された1又は複数の企業に対応する1又は複数の企業ベクトルに基づいて、クラスタを特徴付ける単語を生成する単語生成部と、をさらに備えてもよい。
この態様によれば、企業ベクトルのクラスタリングによって複数の企業を分類し、クラスタを特徴付ける単語を生成することで、企業の業態が徐々に移り変わったり、企業が複数の事業を行ったりしている場合であっても、企業を適切に分類し、各分類に簡単な名称を与えることができる。
本発明によれば、企業を、その企業の特徴を表す数値ベクトルで表すことができる企業分析を提供することができる。
本発明の実施形態に係る企業分析装置の機能ブロックを示す図である。 本実施形態に係る企業分析装置の物理的構成を示す図である。 本実施形態に係る企業分析装置により実行される企業ベクトル算出処理のフローチャートである。 本実施形態に係る企業分析装置により表示される検索アプリケーションの画面例である。 本実施形態に係る企業分析装置により実行される検索処理のフローチャートである。 本実施形態に係る企業分析装置により表示される株価指数生成アプリケーションの画面例である。 本実施形態に係る企業分析装置により実行される株価指数生成処理のフローチャートである。 本実施形態に係る企業分析装置により表示される企業分類アプリケーションの画面例である。 本実施形態に係る企業分析装置により実行される企業分類処理のフローチャートである。
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
図1は、本実施形態に係る企業分析装置10の機能ブロックを示す図である。企業分析装置10は、抽出部11、変換部12、算出部13、出力部14、指数生成部15、分類部16、単語生成部17、入力部10e及び表示部10fを備える。
抽出部11は、複数の企業に関する複数の説明文に含まれる複数の複数の単語を抽出する。ここで、企業に関する説明文は、法律により記載事項が定められた文章であってよい。例えば、日本の証券取引所に上場されている企業の場合、企業の説明文は、有価証券報告書の全部又は一部であってよく、特に「事業の概況」の記載を含んでよい。また、米国の証券取引所に上場されている企業の場合、企業の説明文は、Form 10−KやForm 10−Qの全部又は一部であってよい。
抽出部11は、企業に関する説明文について形態素解析を行い、品詞フィルタによって動詞と名詞を抽出することとしてよい。また、抽出部11は、活用を統一して動詞を抽出してよい。さらに、抽出部11は、頻出語フィルタによって、多数の企業の説明文に現れる単語を除去してもよい。ここで、多数の企業とは、例えば500社以上であってよいが、上場企業数に応じて定めてもよい。
変換部12は、抽出部11により抽出された複数の単語それぞれを、数値により分散表現された単語ベクトルに変換する。単語ベクトルは、例えば100次元から500次元程度の数値ベクトルであってよく、単語から数値ベクトルの分散表現を算出するアルゴリズムは、公知のものであってよい。
算出部13は、複数の説明文それぞれに含まれる単語に対応する単語ベクトルに基づいて、複数の企業それぞれに対応する企業ベクトルを算出する。算出部13は、複数の企業のうち1の企業に関する説明文に含まれる複数の単語に対応する複数の単語ベクトルに基づいて、1の企業に対応する企業ベクトルを算出する。算出部13は、1の企業に関する説明文に含まれる複数の単語を変換部12により変換した複数の単語ベクトルの総和によって、1の企業に対応する企業ベクトルを算出してよい。また、算出部13は、事業の売上割合を表す企業のセグメント情報を用いて単語ベクトルに重み付けを行い、単語ベクトルの重み付き和によって企業ベクトルを算出してもよい。この場合、セグメント情報に表れる単語を変換部12により単語ベクトルに変換し、企業に関する説明文に含まれる単語を変換部12により変換した単語ベクトルとの類似度を算出し、類似度が高いほど重みが大きくなるように、セグメントの重みを決定してよい。ここで、類似度は、ベクトルのコサイン類似度であってよいが、ユークリッド距離や他の距離を用いて類似度を算出してもよい。
このように、本実施形態に係る企業分析装置10によれば、企業を企業ベクトルとして表現することで、企業の業態が徐々に移り変わる場合であっても、企業の説明文も徐々に移り変わるため、企業を適切に特徴付けることができる。また、企業を企業ベクトルとして表現することで、企業が複数の事業を行っている場合であっても、企業の説明文に複数の事業に関する記述が含まれるため、企業を適切に特徴付けることができる。
入力部10eは、検索ワードの入力を受け付ける。ここで、検索ワードは、任意の単語を含んでよく、例えば、企業の名称、流行語、技術テーマ、投資テーマ等を含んでよい。また、検索ワードは、単語又は企業の名称と、他の単語又は他の企業の名称との加算及び減算を表す演算子を含んでよい。例えば、検索ワードは、「A社−コンサルティング」であってよい。ここで、「A社」は企業の名称であり、「コンサルティング」は、事業名(単語)であり、「−」は減算を表す演算子である。
出力部14は、検索ワードに応じた1又は複数の企業の名称を出力する。出力部14により出力された1又は複数の企業の名称は、表示部10fにより表示されたり、外部装置に送信されたりしてよい。なお、出力部14は、検索ワードに含まれている企業の名称を除外して、検索ワードに応じた1又は複数の企業の名称を出力してよい。
算出部13は、検索ワードに含まれる単語に対応する単語ベクトル又は検索ワードに含まれる企業の名称に対応する企業ベクトルに基づいて、数値により分散表現された検索ベクトルを算出してよい。そして、算出部13は、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出してよい。ここで、類似度は、ベクトルのコサイン類似度であってよい。さらに、出力部14は、算出された類似度に基づいて、検索ワードに応じた1又は複数の企業の名称を出力してよい。出力部14は、類似度が高い順に、1又は複数の企業の名称を出力してよい。
このように、検索ワードとして任意の単語を受け付けて、その単語と意味的に近似する企業の名称を出力することができる。例えば、検索ワードとして企業名を入力し、その企業と類似する企業を検索したり、検索ワードとして流行語を入力し、その単語から連想される企業を検索したりすることができる。
算出部13は、検索ワードに含まれる単語に対応する単語ベクトル又は検索ワードに含まれる企業の名称に対応する企業ベクトルを、検索ワードに含まれる演算子に基づいて加算及び減算して前記検索ベクトルを算出し、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出してもよい。例えば、検索ワードが「A社−コンサルティング」である場合、算出部13は、「A社」に対応する企業ベクトルから、「コンサルティング」に対応する単語ベクトルを減算して検索ベクトルを算出し、検索ベクトルと企業ベクトルとのコサイン類似度を算出してよい。そして、出力部14は、算出された類似度に基づいて、検索ワードに応じた1又は複数の企業の名称を出力してよい。出力部14は、類似度が高い順に、1又は複数の企業の名称を出力してよい。
検索ワードとして単語に関する加算及び減算を含む任意の検索式を受け付けて、単語ベクトル又は企業ベクトルについて加算及び減算を行うことで、意味的な加算及び減算を行い、検索ワードと意味的に類似する企業の名称を出力することができる。例えば、検索ワードとして業種と企業名の加算又は減算を入力し、その企業にその業種を足した場合に類似する企業を検索したり、ある企業からある業種を分離した場合に類似する企業を検索したりすることができる。また、検索ワードとして企業名の加算又は減算を入力し、2以上の企業が合併した場合に類似する企業を検索したり、ある企業と他の企業との差に類似する企業を検索したりすることができる。このようにして、M&Aや事業売却によって企業の特徴がどのように変化するか分析することができる。
また、企業分析装置10は、企業に関する説明文が定期的に更新される場合、最新の説明文に基づいて企業ベクトルを算出し、過去に算出された企業ベクトルと最新の企業ベクトルとの差に基づいて、事業の変化を分析してもよい。例えば、最新の企業ベクトルと、同じ企業について過去に算出された企業ベクトルとの差を算出し、差ベクトルと複数の単語ベクトル又は複数の企業ベクトルとの類似度を算出して、類似度が高い単語や企業名を出力してもよい。このようにして、企業の事業推移を分析することができる。
指数生成部15は、出力部14により出力された1又は複数の企業の名称に基づいて、検索ワードに対応する株価指数を生成する。指数生成部15は、例えば、検索ベクトルとの間で類似度が上位となる複数の企業を抽出し、時価総額加重平均によって株価指数を生成してよい。このようにして、任意の検索ワードに対応するテーマインデックスを生成することができる。これにより、ある企業と類似する企業に投資するテーマインデックスを生成したり、流行語から連想される企業に投資するテーマインデックスを生成したりすることができる。
分類部16は、複数の企業に対応する複数の企業ベクトルのクラスタリングにより、複数の企業を分類する。分類部16は、分類数の指定を受け付けて、例えばk−means法によって企業ベクトルのクラスタリングを行ってよいが、クラスタリングのアルゴリズムは任意である。
単語生成部17は、分類部16により1つのクラスタに分類された1又は複数の企業に対応する1又は複数の企業ベクトルに基づいて、クラスタを特徴付ける単語を生成する。単語生成部17は、1つのクラスタに分類された1又は複数の企業ベクトルの総和を求め、和ベクトルと類似度が高い単語ベクトルを検索することで、クラスタを特徴付ける単語を生成してよい。このように、企業ベクトルのクラスタリングによって複数の企業を分類し、クラスタを特徴付ける単語を生成することで、企業の業態が徐々に移り変わったり、企業が複数の事業を行ったりしている場合であっても、企業を適切に分類し、各分類に簡単な名称を与えることができる。
図2は、本実施形態に係る企業分析装置10の物理的な構成を示す図である。企業分析装置10は、ハードウェアプロセッサに相当するCPU(Central Processing Unit)10aと、メモリに相当するRAM(Random Access Memory)10bと、メモリに相当するROM(Read Only Memory)10cと、通信部10dと、入力部10eと、表示部10fとを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では企業分析装置10が一台のコンピュータで構成される場合について説明するが、企業分析装置10は、複数のコンピュータを用いて実現されてもよい。
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、企業分析を行うプログラム(企業分析プログラム)を実行する演算装置である。CPU10aは、入力部10eや通信部10dから種々の入力データを受け取り、入力データの演算結果を表示部10fに表示したり、RAM10bやROM10cに格納したりする。
RAM10bは、データの書き換えが可能な記憶部であり、例えば半導体記憶素子で構成される。RAM10bは、CPU10aが実行するアプリケーション等のプログラムやデータを記憶する。
ROM10cは、データの読み出しが可能な記憶部であり、例えば半導体記憶素子で構成される。ROM10cは、例えばファームウェア等のプログラムやデータを記憶する。
通信部10dは、企業分析装置10を通信ネットワークに接続するインターフェースであり、例えば、有線又は無線回線のデータ伝送路により構成されたLAN(Local Area Network)、WAN(Wide Area Network)、インターネット等の通信ネットワークに接続される。
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード、マウス及びタッチパネルを含む。
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成される。
企業分析プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。企業分析装置10では、CPU10aが企業分析プログラムを実行することにより、図1を用いて説明した様々な機能が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、企業分析装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。
図3は、本実施形態に係る企業分析装置10により実行される企業ベクトル算出処理のフローチャートである。企業分析装置10は、はじめに、複数の企業に関する説明文について形態素解析を実行し(S10)、品詞フィルタによって、動詞と名詞を抽出し(S11)、頻出語フィルタによって、多数の企業の説明文に現れる単語を除去する(S12)。
その後、企業分析装置10は、所定のアルゴリズムによって、複数の単語それぞれを、分散表現された単語ベクトルに変換する(S13)。
単語ベクトルが得られた後、企業分析装置10は、1の企業に関する説明文に含まれる複数の単語を変換した複数の単語ベクトルの総和又は重み付き和によって、企業ベクトルを算出する(S14)。以上により、企業ベクトル算出処理が終了する。なお、企業ベクトル算出処理は、企業に関する説明文が更新される度に実行してもよい。
図4は、本実施形態に係る企業分析装置10により表示される検索アプリケーションの画面例である。検索アプリケーションは、検索ワードW1、検索ボタンI1、検索結果を表す企業名I2及び類似度I3を含む。ユーザは、ポインティングデバイスやタッチパネルによってポインタPを操作して、検索ワードW1を入力したり、検索ボタンI1を押下して検索を実行したり、企業名I2に一覧表示された個別の企業名を押下して、企業の詳細を確認したりすることができる。
企業分析装置10の表示部10fは、出力部14により出力された1又は複数の企業の名称を、類似度が高い順に並べて表示してよい。本例の場合、検索ワードW1は「A社−コンサルティング」であり、算出部13は、「A社」の企業ベクトルから「コンサルティング」の単語ベクトルを減算して検索ベクトルを算出し、検索ベクトルとの類似度が高い企業ベクトルを検索する。その結果、図4の企業名I2に示すように、「B社」、「C社」、「D社」といった企業の名称が表示される。ここで、検索ワードとの類似度I3は、B社について「0.85」であり、C社について「0.77」であり、D社について「0.71」である。なお、本例で示す類似度は、コサイン類似度であり、最大値が1であり、最小値が0である。なお、コサイン類似度を−1〜1の値を取るものとして定義してもよい。本例の検索結果より、A社からコンサルティングの要素を引いた概念は、B社、C社、D社等に類似するという分析を行うことができる。
同様に、例えば「A社+B社」という検索ワードを用いることで、A社とB社が合併した場合に、どのような企業に類似することとなるか分析することができる。また、例えば「A社−B社」という検索ワードを用いることで、A社が行っていてB社が行っていない事業を表す企業を分析することができる。
また、単に「コンサルティング」という検索ワードを用いる場合であっても、企業に関する説明文に「コンサルティング」という単語が一度も現れていない企業であっても、検索ワードから連想される企業として挙げられる場合がある。これは、変換部12によって、単語から数値ベクトルへの変換が単語の意味に応じて行われ、コンサルティングに類似する意味の文章が説明文に含まれる場合にも、検索ワードとの類似度が高く算出されるためである。このように、本実施形態に係る企業分析装置10によれば、より柔軟な企業分析を行うことができる。
図5は、本実施形態に係る企業分析装置10により実行される検索処理のフローチャートである。企業分析装置10は、はじめに、検索ワードの入力を受け付ける(S20)。そして、企業分析装置10は、検索ワードに含まれる1又は複数の単語に対応する1又は複数の単語ベクトルを検索する(S21)。また、企業分析装置10は、検索ワードに含まれる1又は複数の企業の名称に対応する1又は複数の企業ベクトルを検索する(S22)。なお、単語ベクトル及び企業ベクトルは、予め算出し、RAM10b等の記憶部に記憶していてよい。
次に、企業分析装置10は、検索された単語ベクトル及び企業ベクトルを、検索ワードに含まれる演算式に従って加算及び減算して、検索ベクトルを算出する(S23)。そして、企業分析装置10は、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出する(S24)。最後に、企業分析装置10は、類似度に基づいて、1又は複数の企業の名称を出力する(S25)。なお、出力された企業の名称は、表示部10fに表示されたり、外部装置に送信されたりしてよい。以上により、検索処理が終了する。
図6は、本実施形態に係る企業分析装置10により表示される株価指数生成アプリケーションの画面例である。株価指数生成アプリケーションは、ポジティブ検索ワードW2、ネガティブ検索ワードW3、スクリーニング設定ウィンドウI4、チャート表示ウィンドウI5及び構成銘柄リストI6を含む。ユーザは、ポインティングデバイスやタッチパネルによってポインタPを操作して、ポジティブ検索ワードW2やネガティブ検索ワードW3を入力したり、スクリーニング設定ウィンドウI4によってスクリーニング条件を設定したり、構成銘柄リストI6に一覧表示された個別の企業名を押下して、企業の詳細を確認したりすることができる。
本例では、ポジティブ検索ワードW2として「ディープラーニング」が入力され、ネガティブ検索ワードW3として「コンサルティング」が入力されているが、これらは一例であって、検索ワードは任意である。また、本例では、スクリーニング設定ウィンドウI4に「時価総額」が「A(百万円)以上」であるという条件と、「PER」(Price per Earnings Ratio)が「B以下」であるという条件と、「騰落率」が「C%〜D%」であるという条件と、「ROE」(Return On Equity)が「E以上」であるという条件とが示されているが、これらは一例であって、これら以外のスクリーニング条件が設定されてもよいし、これらの一部の条件が設定されなくてもよい。
指数生成部15は、ポジティブ検索ワードW2の単語ベクトルからネガティブ検索ワードW3の単語ベクトルを減算して検索ベクトルを算出し、検索ベクトルと複数の企業ベクトルとの類似度を算出する。そして、類似度が上位である複数の企業のうち、スクリーニング設定ウィンドウI4で設定されたスクリーニング条件を満たす企業を抽出し、抽出された企業の時価総額加重平均によって、株価指数を生成してよい。
チャート表示ウィンドウI5には、指数生成部15により生成された株価指数のチャートG1が表示される。チャート表示ウィンドウI5には、比較のため、ベンチマークのチャートG2が表示されてよい。また、構成銘柄リストI6には、指数生成部15により生成された株価指数の構成銘柄が表示される。本例の場合、構成銘柄は、「A社」、「B社」及び「C社」を含む。また、構成銘柄リストI6の「ウェイト」は、A社について「0.3」、B社について「0.25」、C社について「0.24」となっている。これらのウェイトは、各銘柄の時価総額に応じた値となっているが、指数生成部15は、ウェイトの修正を受け付けて、株価指数を再構成して、修正後の指数についてチャートを表示してもよい。
図7は、本実施形態に係る企業分析装置10により実行される株価指数生成処理のフローチャートである。企業分析装置10は、はじめに、検索ワードの入力を受け付け(S30)、検索ワードに含まれる1又は複数の単語に対応する1又は複数の単語ベクトルを検索する(S31)。そして、企業分析装置10は、ポジティブ検索ワードの単語ベクトルから、ネガティブ検索ワードの単語ベクトルを減算して、検索ベクトルを算出し(S32)、検索ベクトルと、複数の企業に対応する複数の企業ベクトルとの類似度を算出する(S33)。
次に、企業分析装置10は、類似度に基づいて、1又は複数の企業の名称を出力し(S34)、スクリーニング条件を満たす企業を抽出する(S35)。ここで、スクリーニング条件は、スクリーニング設定ウィンドウにより設定されたものであってよい。
その後、企業分析装置10は、抽出された企業により、株価指数を生成する(S36)。企業分析装置10は、例えば、抽出された企業の時価総額加重平均によって株価指数を生成したり、抽出された企業の単純な株価平均によって株価指数を生成したりしてよい。
企業分析装置10は、生成された株価指数と、ベンチマークの推移を描画する(S37)。生成された株価指数と、ベンチマークの推移は、チャートによって表されてよい。また、企業分析装置10は、生成された株価指数の構成銘柄を表示し、ウェイトの変更を受け付ける(S38)。以上により、株価指数生成処理が終了する。
図8は、本実施形態に係る企業分析装置10により表示される企業分類アプリケーションの画面例である。企業分類アプリケーションは、分類数W4、実行ボタンI7、第1クラスタI8及び第2クラスタI9を含む。ユーザは、ポインティングデバイスやタッチパネルによってポインタPを操作して、分類数W4を指定したり、第1クラスタI8及び第2クラスタI9に一覧表示された個別の企業名を押下して、企業の詳細を確認したりすることができる。
本例では、分類数W4として「30」が指定されている。この場合、分類部16は、複数の企業に対応する複数の企業ベクトルのクラスタリングにより、複数の企業を30のクラスタに分類する。そして、単語生成部17は、分類部16により1つのクラスタに分類された1又は複数の企業に対応する1又は複数の企業ベクトルに基づいて、クラスタを特徴付ける単語を生成する。
本例の場合、第1クラスタI8には、「A社」及び「C社」が含まれ、第1クラスタI8を特徴付ける単語は「ディープラーニング」である。また、第2クラスタI9には、「B社」及び「D社」が含まれ、第2クラスタI9を特徴付ける単語は「コンサルティング」である。このように、企業に関する最新の説明文に基づいて、事業の現状を反映した企業分類を行うことができる。また、単語生成部17によって、1つのクラスタに分類された1又は複数の企業ベクトルの総和を求め、和ベクトルと類似度が高い単語ベクトルを複数抽出して、クラスタを特徴付ける複数の単語を生成することもできる。
図9は、本実施形態に係る企業分析装置10により実行される企業分類処理のフローチャートである。企業分析装置10は、はじめに、分類数の入力を受け付ける(S40
)。
そして、企業分析装置10は、複数の企業に対応する複数の企業ベクトルを、指定された分類数にクラスタリングする(S41)。その後、企業分析装置10は、1つのクラスタに分類された1又は複数の企業に対応する企業ベクトルに基づいて、クラスタを特徴付ける単語を生成する(S42)。最後に、企業分析装置10は、生成された単語を関連付けて、クラスタ毎に企業の名称を出力する(S43)。出力された企業の名称は、表示部10fに表示されたり、外部装置に送信されたりしてよい。以上により、企業分類処理が終了する。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
10…企業分析装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…抽出部、12…変換部、13…算出部、14…出力部、15…指数生成部、16…分類部、17…単語生成部

Claims (5)

  1. 複数の企業に関する複数の説明文に含まれる複数の単語を抽出する抽出部と、
    前記複数の単語それぞれを、数値により分散表現された単語ベクトルに変換する変換部と、
    前記複数の説明文それぞれに含まれる単語に対応する前記単語ベクトルに基づいて、前記複数の企業それぞれに対応する企業ベクトルを算出する算出部と、
    を備える企業分析装置。
  2. 検索ワードの入力を受け付ける入力部と、
    前記検索ワードに応じた1又は複数の企業の名称を出力する出力部と、をさらに備え、
    前記算出部は、前記検索ワードに含まれる単語に対応する前記単語ベクトル又は前記検索ワードに含まれる企業の名称に対応する前記企業ベクトルに基づいて、数値により分散表現された検索ベクトルを算出し、前記検索ベクトルと、前記複数の企業に対応する複数の前記企業ベクトルとの類似度を算出し、
    前記出力部は、前記類似度に基づいて、前記検索ワードに応じた1又は複数の企業の名称を出力する、
    請求項1に記載の企業分析装置。
  3. 前記算出部は、前記検索ワードに含まれる単語に対応する前記単語ベクトル又は前記検索ワードに含まれる企業の名称に対応する前記企業ベクトルを、前記検索ワードに含まれる演算子に基づいて加算及び減算して前記検索ベクトルを算出し、前記検索ベクトルと、前記複数の企業に対応する複数の前記企業ベクトルとの前記類似度を算出し、
    前記出力部は、前記類似度に基づいて、前記検索ワードに応じた1又は複数の企業の名称を出力する、
    請求項2に記載の企業分析装置。
  4. 前記出力部により出力された1又は複数の企業の名称に基づいて、前記検索ワードに対応する株価指数を生成する指数生成部をさらに備える、
    請求項2又は3に記載の企業分析装置。
  5. 前記複数の企業に対応する複数の前記企業ベクトルのクラスタリングにより、前記複数の企業を分類する分類部と、
    前記分類部により1つのクラスタに分類された1又は複数の企業に対応する1又は複数の前記企業ベクトルに基づいて、前記クラスタを特徴付ける単語を生成する単語生成部と、をさらに備える、
    請求項1から4のいずれか1項に記載の企業分析装置。
JP2018107104A 2018-06-04 2018-06-04 企業分析装置 Pending JP2019211974A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018107104A JP2019211974A (ja) 2018-06-04 2018-06-04 企業分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018107104A JP2019211974A (ja) 2018-06-04 2018-06-04 企業分析装置

Publications (1)

Publication Number Publication Date
JP2019211974A true JP2019211974A (ja) 2019-12-12

Family

ID=68846770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018107104A Pending JP2019211974A (ja) 2018-06-04 2018-06-04 企業分析装置

Country Status (1)

Country Link
JP (1) JP2019211974A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023008284A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
JP2023008283A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
JP2023008285A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
JP7519795B2 (ja) 2020-03-25 2024-07-22 株式会社野村総合研究所 自然言語処理装置およびプログラム
KR102699113B1 (ko) * 2023-12-06 2024-08-27 주식회사 아이이에스지 예측 모델을 이용하여 대상기업의 esg 활동데이터를 예측하여 상기 대상기업의 esg 활동을 진단하는 장치 및 방법

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163275A (ja) * 2000-11-29 2002-06-07 Matsushita Electric Ind Co Ltd 技術文書検索装置
JP2002304400A (ja) * 2001-04-03 2002-10-18 Ricoh Co Ltd 文書分類装置
JP2006227823A (ja) * 2005-02-16 2006-08-31 Canon Inc 情報処理装置及びその制御方法
JP2007183796A (ja) * 2006-01-06 2007-07-19 Pma:Kk 企業評価値算出システム
JP2008287328A (ja) * 2007-05-15 2008-11-27 Ntt Data Corp 評価装置及び方法ならびにコンピュータプログラム
JP5005843B1 (ja) * 2012-03-30 2012-08-22 株式会社三菱ケミカルホールディングス 企業価値の評価装置、評価方法及び評価プログラム
JP2013168177A (ja) * 2013-05-07 2013-08-29 Fujitsu Ltd 情報提供プログラム、情報提供装置および検索サービスの提供方法
JP2015225357A (ja) * 2014-05-26 2015-12-14 一郎 工藤 株式上場企業特許力成長率評価装置、株式上場企業特許力成長率評価装置の動作方法及び株式上場企業特許力成長率評価プログラム
JP2017111479A (ja) * 2015-12-14 2017-06-22 日本放送協会 広告文選択装置及びプログラム
JP2018010451A (ja) * 2016-07-13 2018-01-18 ヤフー株式会社 データ分類装置、データ分類方法、およびプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163275A (ja) * 2000-11-29 2002-06-07 Matsushita Electric Ind Co Ltd 技術文書検索装置
JP2002304400A (ja) * 2001-04-03 2002-10-18 Ricoh Co Ltd 文書分類装置
JP2006227823A (ja) * 2005-02-16 2006-08-31 Canon Inc 情報処理装置及びその制御方法
JP2007183796A (ja) * 2006-01-06 2007-07-19 Pma:Kk 企業評価値算出システム
JP2008287328A (ja) * 2007-05-15 2008-11-27 Ntt Data Corp 評価装置及び方法ならびにコンピュータプログラム
JP5005843B1 (ja) * 2012-03-30 2012-08-22 株式会社三菱ケミカルホールディングス 企業価値の評価装置、評価方法及び評価プログラム
JP2013168177A (ja) * 2013-05-07 2013-08-29 Fujitsu Ltd 情報提供プログラム、情報提供装置および検索サービスの提供方法
JP2015225357A (ja) * 2014-05-26 2015-12-14 一郎 工藤 株式上場企業特許力成長率評価装置、株式上場企業特許力成長率評価装置の動作方法及び株式上場企業特許力成長率評価プログラム
JP2017111479A (ja) * 2015-12-14 2017-06-22 日本放送協会 広告文選択装置及びプログラム
JP2018010451A (ja) * 2016-07-13 2018-01-18 ヤフー株式会社 データ分類装置、データ分類方法、およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7519795B2 (ja) 2020-03-25 2024-07-22 株式会社野村総合研究所 自然言語処理装置およびプログラム
JP2023008284A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
JP2023008283A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
JP2023008285A (ja) * 2021-07-05 2023-01-19 リンカーズ株式会社 検索システム、検索方法及び検索プログラム
KR102699113B1 (ko) * 2023-12-06 2024-08-27 주식회사 아이이에스지 예측 모델을 이용하여 대상기업의 esg 활동데이터를 예측하여 상기 대상기업의 esg 활동을 진단하는 장치 및 방법

Similar Documents

Publication Publication Date Title
Zhou et al. A machine learning approach to customer needs analysis for product ecosystems
JP2019211974A (ja) 企業分析装置
Rai Identifying key product attributes and their importance levels from online customer reviews
US20190318407A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
Yan et al. A bilingual approach for conducting Chinese and English social media sentiment analysis
US10141006B1 (en) Artificial intelligence system for improving accessibility of digitized speech
US20210157977A1 (en) Display system, program, and storage medium
US20190370274A1 (en) Analysis Method Using Graph Theory, Analysis Program, and Analysis System
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
US11429786B2 (en) Document analysis device, learning device, document analysis method, and learning method
US20200356725A1 (en) System and method for automatically tagging customer messages using artificial intelligence models
KR20210022873A (ko) 인터넷을 통해 수집된 화장품 리뷰 정보를 분석하여 개선된 리뷰 정보를 사용자에게 제공하는 방법 및 시스템
CN111753082A (zh) 基于评论数据的文本分类方法及装置、设备和介质
JP2019121139A (ja) 要約装置、要約方法、及び要約プログラム
JP7403027B1 (ja) 採用支援システム、採用支援方法及びプログラム
Bondielli et al. On the use of summarization and transformer architectures for profiling résumés
Lee et al. Developing a supervised learning-based social media business sentiment index
Jebaseel et al. M-learning sentiment analysis with data mining techniques
US20240345707A1 (en) Content analytics as part of content creation
CN116882414B (zh) 基于大规模语言模型的评语自动生成方法及相关装置
Meghana et al. Sentiment Analysis on Amazon Product Reviews using LSTM and Naive Bayes
JP7387521B2 (ja) 論述構造推定方法、論述構造推定装置、および論述構造推定プログラム
JP3743204B2 (ja) データ分析支援方法および装置
Al Dakhil et al. Reviews Analysis of Apple Store Applications Using Supervised Machine Learning
CN107622129B (zh) 一种知识库的组织方法及装置、计算机存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230501