JP7398320B2 - Consulting support system, consulting support method - Google Patents

Consulting support system, consulting support method Download PDF

Info

Publication number
JP7398320B2
JP7398320B2 JP2020063201A JP2020063201A JP7398320B2 JP 7398320 B2 JP7398320 B2 JP 7398320B2 JP 2020063201 A JP2020063201 A JP 2020063201A JP 2020063201 A JP2020063201 A JP 2020063201A JP 7398320 B2 JP7398320 B2 JP 7398320B2
Authority
JP
Japan
Prior art keywords
topic
user
data
model
external
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020063201A
Other languages
Japanese (ja)
Other versions
JP2021163122A (en
Inventor
紀宏 津嶋
聡 笹原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2020063201A priority Critical patent/JP7398320B2/en
Publication of JP2021163122A publication Critical patent/JP2021163122A/en
Application granted granted Critical
Publication of JP7398320B2 publication Critical patent/JP7398320B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、コンサルティング支援システム、コンサルティング支援方法に関する。 The present invention relates to a consulting support system and a consulting support method.

従来から、トピックモデルを用いてユーザに対するコンサルティングを行う様々な技術が存在する。例えば、特許文献1では、あるWebサイト(ドメイン)におけるユーザの行動とそのサイトの情報をトピックモデルで分析して商品やサービスをリコメンドし、トピックモデルで分析した当該ドメインでの特徴を、他のドメインでも活用可能としている。 Conventionally, there have been various techniques for consulting users using topic models. For example, in Patent Document 1, a topic model is used to analyze user behavior on a certain website (domain) and information about that site to recommend products and services, and the characteristics of the domain analyzed using the topic model are used to recommend products and services. It can also be used for domains.

特開2016-76097号公報Japanese Patent Application Publication No. 2016-76097

特許文献1では、ドメイン群ごとに異なるユーザプロファイルを抽出することで行動予測精度を向上させ、トピックモデルで分析したドメインでの特徴を、他のドメインでも活用可能としている。しかし、ドメインにおける語句の定義の違いを克服するにあたり、ドメイン毎に語句の定義を合わせる必要がある。この方法では、他のドメインを訪問する際に、都度トピックモデルを作成しなければならない。即ち、語句の辞書はアドホックであり、その分析や知見を蓄積して活用する、つまりフィードバックすることで、トピックモデルを用いた分析を行う場合に、ドメインにおける語句の定義の違いを如何に解決するかという着想については開示されていない。更に、元ドメインの所有者が新しい他のドメインの所有者に対してリコメンドシステムの導入時に上流工程において、過去にリコメンドを導入したドメインで得た語句間の定義の違いを解決した辞書を活用したコンサルティングを行うことができない。 In Patent Document 1, behavior prediction accuracy is improved by extracting different user profiles for each domain group, and features in a domain analyzed using a topic model can be utilized in other domains. However, in order to overcome the differences in definitions of words in different domains, it is necessary to match the definitions of words in each domain. With this method, a topic model must be created each time another domain is visited. In other words, word dictionaries are ad-hoc, and by accumulating and utilizing their analysis and knowledge, that is, feeding them back, how can we resolve differences in word definitions in the domain when performing analysis using topic models? The idea was not disclosed. Furthermore, when the former domain owner introduced a recommendation system to the new owner of another domain, in the upstream process, he used a dictionary that resolved differences in definitions between words obtained in the domain where recommendations had been introduced in the past. Unable to provide consulting.

本発明の一側面としては、ドメインにおける語句の定義の違いを解決してトピックモデルを用いた分析を行うことが可能なコンサルティング支援システム、コンサルティング支援方法を提供することを目的とする。 One aspect of the present invention is to provide a consulting support system and a consulting support method that are capable of resolving differences in definitions of words in a domain and performing analysis using a topic model.

本発明にかかるコンサルティング支援システムは、ユーザ企業が有するユーザ公開データとユーザ非公開データとを含むユーザデータから得られたユーザトピックモデルと、前記ユーザ企業以外の他の外部において公開されている外部公開データから得られた外部トピックモデルと、前記外部トピックモデルと前記ユーザトピックモデルとの関連度を判定するための基準となる混合トピックモデルと、を生成するトピックモデル生成部と、前記混合トピックモデルが有するトピックと前記ユーザトピックモデルが有するトピックとの距離が閾値以下となるトピックであるフィードバックトピックを前記ユーザトピックモデルの中から特定し、前記混合トピックモデルが有するトピックと前記外部トピックモデルが有するトピックとの距離が閾値以下となるトピックである外部トピックを前記外部トピックモデルの中から特定するトピックモデル分析部と、特定された前記フィードバックトピックと前記外部トピックとを対応付けてフィードバックリポジトリに登録するフィードバック学習部と、を有することを特徴とするコンサルティング支援システムとして構成される。 The consulting support system according to the present invention uses a user topic model obtained from user data including user public data and user private data owned by a user company, and external public information published outside other than the user company. a topic model generation unit that generates an external topic model obtained from data and a mixed topic model that serves as a reference for determining the degree of association between the external topic model and the user topic model; A feedback topic is identified from the user topic model, which is a topic for which the distance between the topic owned by the user topic model and the topic owned by the user topic model is equal to or less than a threshold value, and the topic owned by the mixed topic model and the topic owned by the external topic model are identified. a topic model analysis unit that identifies an external topic from the external topic model, which is a topic for which a distance of It is configured as a consulting support system characterized by having a department and a.

本発明の一態様によれば、ドメインにおける語句の定義の違いを解決してトピックモデルを用いた分析を行うことができる。 According to one aspect of the present invention, it is possible to resolve differences in definitions of words in a domain and perform analysis using a topic model.

本実施の形態におけるコンサルティング支援システムの構成例を示す図である。1 is a diagram illustrating a configuration example of a consulting support system according to the present embodiment. 外部公開データに含まれる省庁オープンデータの例を示す図である。FIG. 3 is a diagram illustrating an example of government agency open data included in externally disclosed data. 建設機械輸出額データの例を示す図である。FIG. 2 is a diagram showing an example of construction machinery export amount data. 石炭生産量推移データの例を示す図である。FIG. 3 is a diagram showing an example of coal production amount transition data. ユーザ企業の売上データの例を示す図である。It is a figure showing an example of sales data of a user company. フィードバックリポジトリの例を示す図である(初期状態)。It is a diagram showing an example of a feedback repository (initial state). フィードバックリポジトリの例を示す図である(更新後)。FIG. 3 is a diagram showing an example of a feedback repository (after update). 分析処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of analysis processing. 図8に示したS812、S820の処理の詳細手順を示すフローチャートである。9 is a flowchart showing detailed steps of the processing of S812 and S820 shown in FIG. 8. 図8に示したS824の処理の詳細手順を示すフローチャートである。9 is a flowchart showing detailed steps of the process of S824 shown in FIG. 8. 図8に示したS815~S819の処理の詳細手順を示すフローチャートである。9 is a flowchart showing detailed steps of the processing from S815 to S819 shown in FIG. 8. 分析設定部が、分析結果を表示部に表示した画面の例を示す図である。FIG. 6 is a diagram showing an example of a screen on which the analysis setting section displays the analysis results on the display section. S815~S819の処理を説明するための概念図である。FIG. 7 is a conceptual diagram for explaining the processing of S815 to S819. 関連データ収集部が収集したトピックモデルやデータ、これらの関連性を説明するための概念図である。FIG. 2 is a conceptual diagram for explaining topic models and data collected by a related data collection unit, and their relationships; FIG.

以下に添付図面を参照して、本発明にかかるコンサルティング支援システム、コンサルティング支援方法の実施の形態を詳細に説明する。 DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of a consulting support system and a consulting support method according to the present invention will be described in detail below with reference to the accompanying drawings.

図1は、本実施の形態におけるコンサルティング支援システムの構成例を示す図である。図1に示すように、コンサルティング支援システム1000は、コンサルティングを受けるユーザ企業が管理するコンピュータであるユーザサーバ200と、ユーザ企業以外の他の外部において公開されている外部公開データ300とを用いて、上記ユーザ企業にコンサルティングを行うためのコンサルティングサーバ100を有している。コンサルティングサーバ100は、ユーザサーバ200との間でネットワークN1を介して接続され、外部公開データ300が記憶されているクラウドやサーバとの間でネットワークN2を介して接続されている。以下では、各処理をコンサルティングサーバ100が実行する前提で説明しているが、1または複数のサーバが各処理を実行してもよいし、コンサルティングサーバ100と同様の機能を有したクラウドが各処理を実行してもよい。 FIG. 1 is a diagram showing a configuration example of a consulting support system in this embodiment. As shown in FIG. 1, the consulting support system 1000 uses a user server 200, which is a computer managed by a user company undergoing consulting, and external public data 300, which is made public outside the user company. It has a consulting server 100 for providing consulting to the above user companies. The consulting server 100 is connected to a user server 200 via a network N1, and is connected to a cloud or a server in which external public data 300 is stored via a network N2. The following explanation assumes that each process is executed by the consulting server 100, but one or more servers may execute each process, or a cloud having the same functions as the consulting server 100 can execute each process. may be executed.

コンサルティングサーバ100における各処理は、プログラムの実行により実現される。コンサルティングサーバ100は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、NIC(Network Interface Card)といった、通信可能なコンピュータが備える一般的な構成を有し、CPUが、ROMからプログラムを読み出して実行することにより、各処理を実行する機能部の機能が実現される。上記プログラムは、USB(Universal Serial Bus)メモリ等の記憶媒体から読み出されたり、ネットワークを介した他のコンピュータからダウンロードする等して、コンサルティングサーバ100に提供されてもよい。 Each process in the consulting server 100 is realized by executing a program. The consulting server 100 uses general memory such as a CPU (Central Processing Unit), ROM (Read Only Memory), RAM (Random Access Memory), HDD (Hard Disk Drive), and NIC (Network Interface Card) that are included in a communicable computer. The CPU reads a program from the ROM and executes it, thereby realizing the functions of the functional unit that executes each process. The above program may be provided to the consulting server 100 by being read from a storage medium such as a USB (Universal Serial Bus) memory or by being downloaded from another computer via a network.

コンサルティングサーバ100は、ユーザ企業が有するユーザサーバ200からの要求(例えば、課題解決要求)を受けて、当該課題に対する解決策を提示するためのサーバであり、ハードウェアとしては一般的なコンピュータから構成される。ネットワークN1、N2は、有線、無線を問わず、インターネット等の一般的な公衆回線網から構成される。 The consulting server 100 is a server for receiving a request (for example, a problem solving request) from a user server 200 owned by a user company and presenting a solution to the problem, and is configured of a general computer as hardware. be done. The networks N1 and N2 are composed of general public line networks such as the Internet, regardless of whether they are wired or wireless.

コンサルティングサーバ100は、ユーザサーバ200から本システムで用いるユーザ企業が有する各種のユーザデータを取得するためのユーザデータ取得部101と、外部公開データ300を取得するための外部データ取得部102と、これらのデータおよび後述するフィードバックリポジトリ109とを用いて、所定の分析手法(例えば、SWOT分析、ファイブフォース分析等の事業戦略を立案するための分析手法)に基づくユーザ企業の分析処理を行い、その結果を表示部104に表示する分析設定部103と、分析設定部103による分析の結果が所定の閾値を超えた場合のアラート情報を出力するアラート処理部105と、アラート情報に関連するデータ(例えば、トピックモデルやその元となるデータ)をトピックモデル分析部111から収集する関連データ収集部106と、関連データ収集部106が収集したデータを可視化した可視化データやトピックモデルのトピック名を決定する際の主要な語句となるキーワードを表示するためのキーワード表示データ(以下、提供用データ)を生成して出力するための関連データ表示制御部107と、関連データ表示制御部107により生成された提供用データをユーザサーバ200に送信するデータ送信部108と、を有する。 The consulting server 100 includes a user data acquisition unit 101 for acquiring various user data owned by user companies used in this system from the user server 200, an external data acquisition unit 102 for acquiring external public data 300, and Using the data and the feedback repository 109 described later, an analysis process is performed on the user company based on a predetermined analysis method (for example, an analysis method for formulating a business strategy such as SWOT analysis or five force analysis), and the results are an analysis setting section 103 that displays on the display section 104; an alert processing section 105 that outputs alert information when the analysis result by the analysis setting section 103 exceeds a predetermined threshold; The related data collection unit 106 collects the topic model and its source data) from the topic model analysis unit 111, and the visualization data that visualizes the data collected by the related data collection unit 106 and the topic name of the topic model are determined. A related data display control unit 107 for generating and outputting keyword display data (hereinafter referred to as provision data) for displaying keywords serving as main words and phrases, and provision data generated by the related data display control unit 107. and a data transmitting unit 108 that transmits the data to the user server 200.

具体的には後述するが、ユーザデータには、ユーザ企業が一般に開示しているデータであるユーザ公開データと、ユーザ企業が一般に開示していないデータであるユーザ非公開データとを含む。以下では、ユーザ公開データの一例として、ユーザ企業が投資家に向けて発信する、経営状況や財務状況、業績動向(例えば、決算データの推移)に関するIR(Investor Relations)データ2011を用いて説明するが、これ以外にも、ユーザ企業のアニュアルレポート2012をはじめ、各ユーザ企業が一般に開示する様々なデータをユーザ公開データに含めてよい。IRデータ2011には、ユーザ企業の経営状況や財務状況、業績動向を示す経営指標のほか、ユーザ企業が属する業種や業界の名称、ユーザ企業の決算データ、ユーザ企業が展開する店舗や支店の数、ユーザ企業の経営目標等、ユーザ企業が定期または不定期で開示する各種データが含まれる。例えば、IRデータ2011には、ユーザ企業の国別売上(北米:1300億円、中国:1200億円・・・といった各国における製品の売上金額など)が含まれ、アニュアルレポート2012には、例えば、建設機械ごとの販売事業目標額、レンタル事業目標額・・・といったユーザ企業の経営目標が含まれる。 As will be specifically described later, user data includes user public data, which is data disclosed to the public by the user company, and user private data, which is data not disclosed to the public by the user company. Below, we will explain using IR (Investor Relations) data 2011 regarding business conditions, financial conditions, and performance trends (for example, trends in financial results data) that user companies transmit to investors as an example of user public data. However, in addition to this, the user public data may include various data disclosed to the public by each user company, including the user company's annual report 2012. IR Data 2011 includes management indicators showing the user company's business status, financial situation, and business performance trends, as well as the name of the industry and industry to which the user company belongs, financial results data of the user company, and the number of stores and branches operated by the user company. , management goals of the user company, and various other data that the user company discloses on a regular or irregular basis. For example, IR Data 2011 includes the user company's sales by country (such as the sales amount of products in each country, such as North America: 130 billion yen, China: 120 billion yen, etc.), and Annual Report 2012 includes, for example, Management goals of the user company are included, such as sales business target amount, rental business target amount, etc. for each construction machine.

また、以下では、ユーザ非公開データの一例として、IRデータ2011の根拠となるユーザ企業の売上データ2023を用いて説明するが、これ以外にも、例えば、ユーザ企業の財務状況に関する財務データ2021、ユーザ企業の経理に関する会計データ2022、ユーザ企業の製品販売顧客を示す顧客データ2024、ユーザ企業が製造する製品の在庫状況に関する在庫データ2025、ユーザ企業が製造する製品の製造状況を示す製品データ2026をはじめ、ユーザ公開データの元となるデータであって、各ユーザ企業が一般に開示しない様々なデータをユーザ非公開データに含めてよい。 Further, in the following description, sales data 2023 of the user company, which is the basis of the IR data 2011, will be used as an example of user-disclosed data. Accounting data 2022 related to the accounting of the user company, customer data 2024 showing the product sales customers of the user company, inventory data 2025 related to the inventory status of the products manufactured by the user company, and product data 2026 showing the manufacturing status of the products manufactured by the user company. First, the user private data may include various data that is the source of the user public data and that is not generally disclosed by each user company.

コンサルティングサーバ100は、さらに、ユーザデータ取得部101が取得した各種ユーザデータからユーザトピックモデル1111を生成し、外部データ取得部102が取得した外部公開データから外部トピックモデル1112を生成し、上記ユーザ各種データと上記外部公開データとから混合トピックモデル1113を生成するトピックモデル生成部112と、トピックモデル生成部112が生成した各トピックモデルが有する項目の関連性を判断し、所定の条件を満たした項目のトピック名を抽出するトピックモデル分析部111と、トピックモデル分析部111が抽出したトピック名を後述するフィードバックリポジトリ109に追加するフィードバック学習部110と、を有する。本システムが有する各サーバおよびこれらの各部が実行する具体的な処理については後述する。なお、矢印は主にデータの流れを示している。 The consulting server 100 further generates a user topic model 1111 from the various user data acquired by the user data acquisition unit 101, generates an external topic model 1112 from the external public data acquired by the external data acquisition unit 102, and generates an external topic model 1112 from the external public data acquired by the external data acquisition unit 102. A topic model generation unit 112 generates a mixed topic model 1113 from the data and the external public data, and a topic model generation unit 112 determines the relevance of items in each topic model generated, and determines the items that meet predetermined conditions. , and a feedback learning unit 110 that adds the topic names extracted by the topic model analysis unit 111 to a feedback repository 109, which will be described later. Each server included in this system and specific processing executed by each of these units will be described later. Note that the arrows mainly indicate the flow of data.

以下では、外部公開データの一例として、各省庁が一般に開示している省庁オープンデータ302を用いて説明するが、これ以外にも、例えば、政府CIOポータルに登録されている政府CIOデータ301、気象庁が公開している全国各地の気象データ303、企業の信用調査に関する信用調査データ304、政府統計等の調査レポート305、政府や各企業に関する様々なニュースが掲載されたニュース記事データ306をはじめ、ユーザ企業以外の政府や企業が一般に開示する様々なデータを外部公開データに含めてよい。続いて、本システムで用いられるデータについて説明する。まず、外部公開データ300について説明する。 In the following, explanation will be given using the government open data 302 that is disclosed to the public by each government agency as an example of externally disclosed data. Weather data from all over the country published by 303, credit investigation data 304 related to corporate credit investigations, research reports 305 such as government statistics, news article data 306 containing various news related to the government and each company, etc. Externally disclosed data may include various data disclosed to the public by governments and companies other than companies. Next, the data used in this system will be explained. First, the external public data 300 will be explained.

図2は、外部公開データ300に含まれる省庁オープンデータ302の例を示す図である。省庁オープンデータ302は、各省庁が一般に開放しているデータである。図2では、省庁オープンデータ302の一例として、建設機械の日本の輸出額に関するデータ(以下、建設機械輸出額データ)3021を示している。図2では、2007年、2012年、2017年のそれぞれの年度において、日本からアジアをはじめとする各地域への建設機械の輸出額が示されていることがわかる。 FIG. 2 is a diagram showing an example of government agency open data 302 included in external public data 300. The ministries and agencies open data 302 is data that each ministry and agency makes available to the public. FIG. 2 shows data 3021 regarding Japan's export amount of construction machinery (hereinafter referred to as construction machinery export amount data) as an example of the ministry open data 302. Figure 2 shows the amount of construction machinery exported from Japan to Asia and other regions in each of the years 2007, 2012, and 2017.

さらに、図3に示すように、建設機械輸出額データ3021は、建設機械別の出荷額の推移を示すデータ(以下、機械別出荷推移データ)30211を含んでいる。図3では、2007年、2012年、2017年のそれぞれの年度において、トラクタや油圧ショベルといった建設機械ごとに、各年度の国内出荷額と輸出額とこれらの小計が示されていることがわかる。 Further, as shown in FIG. 3, the construction machinery export value data 3021 includes data 30211 indicating changes in the shipment amount for each construction machine (hereinafter referred to as shipment trend data for each machine). In Figure 3, it can be seen that for each year of 2007, 2012, and 2017, the domestic shipment amount, export amount, and subtotal of these are shown for each construction machine such as tractors and hydraulic excavators.

このほか、省庁オープンデータ302には、図4に示すように、世界の石炭生産量の推移を示すデータ(以下、石炭生産量推移データ)3022が含まれる。図4では、2005年から2015年までの各年度において、中国や米国をはじめとする世界各国における石炭生産量と年度ごとの合計が示されていることがわかる。続いて、ユーザデータについて説明する。 In addition, as shown in FIG. 4, the ministry open data 302 includes data 3022 indicating changes in world coal production (hereinafter referred to as coal production change data). In Figure 4, it can be seen that for each year from 2005 to 2015, the amount of coal produced in countries around the world, including China and the United States, and the total for each year are shown. Next, user data will be explained.

図5は、ユーザデータに含まれるユーザ公開データの一例として、ユーザ企業の売上データ2023を示している。図5では、売上情報を示す番号(#)と、当該番号で示される売上情報に記録された売り上げた製品名と、製品のカテゴリを示す製品カテゴリと、当該製品カテゴリの製品を購入した顧客の顧客名と、当該顧客が行っている事業の業種や業界とが対応付けて記憶されていることがわかる。例えば、図5では、番号1(#1)の顧客は、業種が建築工事業に属する国内企業である「株式会社高層ビル建設」であり、製品カテゴリが「クレーン」である製品「クレーンA型」を購入し、その売り上げが計上されたことを示している。売上データ2023は、IRデータ2011として記憶されているユーザ企業の売り上げデータの根拠や内訳を示すものである。後述するように、ユーザトピックモデルが生成される際に、製品カテゴリ「クレーン」、「ブルドーザ」は、それぞれ、トピック名「ビル建設機械」、「掘削機械」としてトピックモデル処理が行われる。続いて、コンサルティングサーバ100が保持するフィードバックリポジトリ109について説明する。 FIG. 5 shows sales data 2023 of a user company as an example of user public data included in user data. In Figure 5, a number (#) indicating sales information, the name of the sold product recorded in the sales information indicated by the number, a product category indicating the product category, and the number of customers who purchased the product in the product category are shown. It can be seen that the customer name and the type of business or industry in which the customer is engaged are stored in association with each other. For example, in Figure 5, the customer with number 1 (#1) is "High-rise Building Construction Co., Ltd.", a domestic company whose industry is in the construction business, and whose product category is "crane", which is the product "Crane Type A". ” was purchased and the sales were recorded. Sales data 2023 indicates the basis and breakdown of the user company's sales data stored as IR data 2011. As will be described later, when a user topic model is generated, the product categories "crane" and "bulldozer" are subjected to topic model processing as topic names "building construction machinery" and "excavation machinery," respectively. Next, the feedback repository 109 held by the consulting server 100 will be explained.

図6、7は、フィードバックリポジトリ109の例を示す図である。フィードバックリポジトリ109は、外部公開データとして公開されている各ドメインで用いられている語句の定義の違いを吸収して解決し、外部トピックモデル1112のトピックとユーザトピックモデル1111のトピックとを関連付けるためのデータベースである。図6は、後述する処理において更新される前のフィードバックリポジトリ109aの例であり、図7は、後述する処理において更新された後のフィードバックリポジトリ109bの例である。 6 and 7 are diagrams showing examples of the feedback repository 109. The feedback repository 109 absorbs and resolves differences in the definitions of words used in each domain published as external public data, and is used to associate topics in the external topic model 1112 with topics in the user topic model 1111. It is a database. FIG. 6 is an example of the feedback repository 109a before being updated in the process described below, and FIG. 7 is an example of the feedback repository 109b after being updated in the process described later.

図6、7に示すように、フィードバックリポジトリ109は、レコードの連番(#)と、外部トピックモデル1112で定義されたトピック名である外部トピック名と、本リポジトリで定義されるトピック名であるフィードバックトピック名と、フィードバックトピック名の元となるユーザデータやユーザ企業が属する業種や業界を示すデータドメインとが対応付けて記憶されている。図6は、初期状態のフィードバックリポジトリ109aであるため、これらの各項目には、外部トピックモデル1112と同様の内容が記憶されている。図7に示すフィードバックリポジトリ109bでは、以下に示す処理を実行することで、フィードバックトピック名として、外部トピック名に対応付けて、ユーザトピックモデル1111のトピック名が新たに追加されている。図7では、例えば、ユーザトピックモデル1111のトピック名である「ビル建設機械」が、外部トピック名「建設機械」に対応付けて、連番「n.1」として記憶されていることがわかる。また、追加されたフィードバックトピック名は、ユーザトピックモデル1111の中の建設業界に関するトピックモデルに属したトピックのデータドメイン名が記憶されている。具体的な処理については後述するが、フィードバックリポジトリ109にこのような関連性を対応付けて記憶し、蓄積していくことにより、ユーザデータで用いられている語句の定義と、同じ意味の語句であっても業種や業界ごとに異なる語句が用いられている外部公開データでの語句の定義の違いを吸収して解決するとともに、ユーザトピックモデルのトピックに含まれる項目が、ユーザがこれまで気づくことのなかった外部トピックモデルのトピックに含まれる項目に関連性がある、との気づきを得ることができる。 As shown in FIGS. 6 and 7, the feedback repository 109 contains the serial number (#) of the record, the external topic name that is the topic name defined in the external topic model 1112, and the topic name defined in this repository. A feedback topic name and a data domain indicating the user data that is the source of the feedback topic name and the type of business or industry to which the user company belongs are stored in association with each other. Since FIG. 6 shows the feedback repository 109a in its initial state, the same content as the external topic model 1112 is stored in each of these items. In the feedback repository 109b shown in FIG. 7, the topic name of the user topic model 1111 is newly added as a feedback topic name in association with the external topic name by executing the process described below. In FIG. 7, for example, it can be seen that the topic name "Building Construction Machinery" of the user topic model 1111 is stored as a serial number "n.1" in association with the external topic name "Construction Machinery". Further, as the added feedback topic name, the data domain name of the topic belonging to the topic model related to the construction industry in the user topic model 1111 is stored. The specific process will be described later, but by storing and storing such relationships in the feedback repository 109, the definition of the words used in the user data and the words with the same meaning. In addition to absorbing and resolving differences in word definitions in externally published data, where different words and phrases are used depending on the type of business or industry, the items included in the topics of the user topic model are changed from what users have previously noticed. It is possible to realize that items included in the topics of the external topic model, which were not previously available, are related.

図8は、本システムで行われるユーザ企業に対してコンサルティングの際に行われる分析処理の処理手順を示すフローチャートである。図8に示すように、まず、外部データ取得部102は、図1に示したような外部公開データ300を取得して内部メモリ(不図示)にコピーし、当該外部公開データ300を記憶する(S801)。これにより、政府や省庁、また調査機関が公開している情報を外部データとして蓄積することができる。例えば、外部公開データ300は、政府CIOデータ301a、省庁オープンデータ302a、気象データ303a、信用調査データ304a、調査レポート305a、ニュース記事データ306aとして記憶される。 FIG. 8 is a flowchart showing the processing procedure of analysis processing performed in this system when consulting a user company. As shown in FIG. 8, the external data acquisition unit 102 first acquires external public data 300 as shown in FIG. 1, copies it to an internal memory (not shown), and stores the external public data 300 ( S801). This allows information published by governments, ministries, and research institutions to be accumulated as external data. For example, the external public data 300 is stored as government CIO data 301a, ministry open data 302a, weather data 303a, credit investigation data 304a, investigation report 305a, and news article data 306a.

続いて、ユーザデータ取得部101は、ユーザサーバ200から図1に示したようなユーザデータを取得し、ユーザデータに含まれるユーザ公開データを内部メモリ(不図示)にコピーし、記憶する(S802)。このとき、ユーザデータ取得部101は、IRデータ2011やアニュアルレポート2012から、当該ユーザ企業の経営指標のほか、ユーザ企業が属する業種や業界の名称、ユーザ企業の売上データや決算データ、ユーザ企業が展開する店舗や支店の数等の各種データを読み取る。例えば、ユーザ公開データは、IRデータ2011aアニュアルレポート2012aとして記憶される。 Next, the user data acquisition unit 101 acquires user data as shown in FIG. 1 from the user server 200, copies user public data included in the user data to an internal memory (not shown), and stores it (S802). ). At this time, the user data acquisition unit 101 obtains from the IR data 2011 and the annual report 2012, in addition to the management indicators of the user company, the name of the industry and industry to which the user company belongs, the sales data and financial results data of the user company, and the user company's information. Read various data such as the number of stores and branches. For example, user public data is stored as IR data 2011a and annual report 2012a.

また、ユーザデータ取得部101は、ユーザデータとして、ユーザ企業の内部データであるユーザ非公開データが含まれているか否かを判定し(S803)、ユーザデータにユーザ非公開データが含まれていると判定した場合(S803;Yes)、当該ユーザ非公開データを内部メモリ(不図示)にコピーし、記憶する(S804)。例えば、ユーザデータ取得部101は、当該ユーザ非公開データとして、IRデータ2011やアニュアルレポート2012の根拠となった当該ユーザ企業の売上データを記憶する。一方、ユーザデータ取得部101は、ユーザデータにユーザ非公開データが含まれていないと判定した場合(S803;No)、何もせずにS805に進む。 Further, the user data acquisition unit 101 determines whether the user data includes user private data that is internal data of the user company (S803), and determines whether the user data includes user private data. If it is determined (S803; Yes), the user private data is copied to an internal memory (not shown) and stored (S804). For example, the user data acquisition unit 101 stores sales data of the user company, which is the basis of the IR data 2011 and the annual report 2012, as the user private data. On the other hand, if the user data acquisition unit 101 determines that the user data does not include user private data (S803; No), the process proceeds to S805 without doing anything.

トピックモデル生成部112は、S803またはS804が終了すると、ユーザデータ(ユーザ非公開データが含まれる場合は当該ユーザ非公開データを含むユーザデータ)からユーザトピックモデル1111を生成し(S805)、トピックモデル分析部111に登録する(S806)。ユーザトピックモデルを生成する手法については、LDA(Latent Dirichlet Allocation)、PLSI(Probabilistic Latent Semantic Indexing)、LSI(Latent Semantic Index)等、従来から知られている手法を用いることができる。 Upon completion of S803 or S804, the topic model generation unit 112 generates a user topic model 1111 from the user data (if user private data is included, the user data including the user private data) (S805), and generates a topic model It is registered in the analysis unit 111 (S806). As a method for generating a user topic model, conventionally known methods such as LDA (Latent Dirichlet Allocation), PLSI (Probabilistic Latent Semantic Indexing), and LSI (Latent Semantic Index) can be used.

また、トピックモデル生成部112は、S804を実行した場合には、ユーザデータと外部公開データから混合トピックモデル1113を生成し(S807)、トピックモデル分析部111に登録する(S808)。混合トピックモデルを生成する手法については、ユーザトピックモデルを生成する場合と同様、従来から知られている手法を用いることができる。混合トピックモデルは、ユーザトピックモデル1111のトピック名と外部トピックモデル1112のトピック名との意味的な類似度をトピックモデルの項目間の距離に基づいて判定するための基準となる、ユーザトピックモデル1111と外部トピックモデル1112との間で共通して用いられるトピックモデルであり、ユーザトピックモデル1111と外部トピックモデル1112との関連性の有無を判断するために本システム内で用いられるトピックモデルである。 Furthermore, when executing S804, the topic model generation unit 112 generates a mixed topic model 1113 from the user data and externally published data (S807), and registers it in the topic model analysis unit 111 (S808). As for the method of generating the mixed topic model, a conventionally known method can be used as in the case of generating the user topic model. The mixed topic model is a user topic model 1111 that serves as a standard for determining the semantic similarity between the topic name of the user topic model 1111 and the topic name of the external topic model 1112 based on the distance between items of the topic model. This is a topic model that is commonly used between the user topic model 1111 and the external topic model 1112, and is a topic model that is used within this system to determine whether there is a relationship between the user topic model 1111 and the external topic model 1112.

S801において、外部データ取得部102が外部公開データ300を取得して内部メモリ(不図示)に記憶すると、トピックモデル生成部112は、外部公開データから外部トピックモデル1112を生成し(S809)、トピックモデル分析部111に登録する(S810)。外部トピックモデルを生成する手法については、ユーザトピックモデルや混合トピックモデルを生成する場合と同様、従来から知られている手法を用いることができる。 In S801, when the external data acquisition unit 102 acquires external public data 300 and stores it in an internal memory (not shown), the topic model generation unit 112 generates an external topic model 1112 from the external public data (S809), and It is registered in the model analysis unit 111 (S810). As for the method of generating the external topic model, conventionally known methods can be used, as in the case of generating the user topic model and the mixed topic model.

各トピックモデルが登録されると、分析設定部103は、ユーザデータに対する分析指標となる項目を内部要因として定義し(S811)、外部公開データに対する分析指標となる項目を外部要因として定義する(S812)。これらの定義は、例えば、分析設定部103が、分析者により、コンサルティングサーバ100が備える入力装置(例えば、キーボード)からユーザデータや外部公開データで保持する項目が指定されることにより定義される。 When each topic model is registered, the analysis setting unit 103 defines items that serve as analysis indicators for user data as internal factors (S811), and defines items that serve as analysis indicators for externally published data as external factors (S812). ). These definitions are, for example, defined by the analysis setting unit 103 when an analyst specifies items to be held as user data or externally disclosed data from an input device (for example, a keyboard) provided in the consulting server 100.

これらの項目が定義されると、分析設定部103は、フィードバックリポジトリ109が生成されているか否かを判定し(S813)、フィードバックリポジトリ109が生成されていないと判定した場合(S813;No)、ユーザ企業にコンサルティングするために、例えば、SWOT分析、ファイブフォース分析等の事業戦略を立案するための分析手法を選択し、当該分析手法で用いる閾値を定義する(S814)。当該分析手法や閾値の設定は、例えば、分析設定部103が、分析者により、コンサルティングサーバ100が備える上記入力装置からユーザデータや外部公開データで保持する項目が指定されることにより定義される。その後、S821に進み、分析設定部103は、S811で定義した内部要因とS812で定義した外部要因とを軸として、S814で設定した所定の分析手法と当該分析手法で用いる閾値とを用いて分析を行う。 Once these items are defined, the analysis setting unit 103 determines whether the feedback repository 109 has been created (S813), and if it is determined that the feedback repository 109 has not been created (S813; No), In order to provide consulting to the user company, an analysis method for formulating a business strategy, such as SWOT analysis or five force analysis, is selected, and a threshold value to be used in the analysis method is defined (S814). The analysis method and threshold settings are defined, for example, by the analysis setting unit 103 having an analyst designate items to be held as user data or external public data from the input device included in the consulting server 100. Thereafter, the process proceeds to S821, and the analysis setting unit 103 performs analysis using the predetermined analysis method set in S814 and the threshold value used in the analysis method, with the internal factors defined in S811 and the external factors defined in S812 as axes. I do.

一方、分析設定部103は、フィードバックリポジトリ109が生成されていると判定した場合(S813;Yes)、フィードバックリポジトリ109を読み出し、S812で定義された外部公開データに対する分析指標となる項目を再定義し(S820)、S814に進む。この場合は、分析設定部103は、上述した場合と同様、ユーザ企業にコンサルティングするための分析手法を選択し、当該分析手法で用いる閾値を定義した後(S814)、S811で定義した内部要因とS820で再定義した外部要因とを軸として、S814で設定した所定の分析手法と当該分析手法で用いる閾値とを用いて分析を行う。以下、フィードバックリポジトリ109の生成に関する処理について説明する。 On the other hand, if the analysis setting unit 103 determines that the feedback repository 109 has been generated (S813; Yes), it reads the feedback repository 109 and redefines the items that serve as analysis indicators for the externally published data defined in S812. (S820), proceed to S814. In this case, as in the case described above, the analysis setting unit 103 selects an analysis method for consulting the user company, defines the threshold value used in the analysis method (S814), and then uses the internal factors defined in S811. Analysis is performed using the predetermined analysis method set in S814 and the threshold used in the analysis method, with the external factors redefined in S820 as the axis. Processing related to generating the feedback repository 109 will be described below.

S806、S808、S810において、トピックモデル生成部112が、ユーザトピックモデル1111、外部トピックモデル1112、混合トピックモデル1113をそれぞれ生成すると、トピックモデル分析部111は、各トピックモデルの間で項目間の距離が所定の閾値以下である項目を有するトピック名を特定する(S815)。当該項目間の距離については、例えば、従来から知られている各種のクラスタ分析を用いて算出することができる。 In S806, S808, and S810, when the topic model generation unit 112 generates the user topic model 1111, external topic model 1112, and mixed topic model 1113, the topic model analysis unit 111 calculates the distance between items between each topic model. A topic name having an item whose value is less than or equal to a predetermined threshold is identified (S815). The distance between the items can be calculated using, for example, various conventionally known cluster analyses.

トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデルのトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名(例えば、トピックの特徴を示す語句がトピック名に含まれるようなトピック名)を特定し、特定した当該トピック名に対応するユーザトピックモデル1111のトピック名を抽出する(S816)。上記対応するトピック名とは、例えば、ユーザトピックモデル1111のなかで、上記特定した混合トピックモデル1113のトピック名あるいはキーワードと同義のトピック名である。 The topic model analysis unit 111 determines whether the distance between the topic name of the mixed topic model and the keyword that is the origin of the topic name is less than or equal to the threshold, among the topics that include items for which the distance between the items is less than or equal to a predetermined threshold. A topic name (for example, a topic name that includes a phrase indicating the characteristics of the topic) is specified, and a topic name of the user topic model 1111 corresponding to the specified topic name is extracted (S816). The corresponding topic name is, for example, a topic name synonymous with the topic name or keyword of the identified mixed topic model 1113 in the user topic model 1111.

また、トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデルのトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名(例えば、トピックの特徴を示す語句がトピック名に含まれるようなトピック名)を特定し、特定した当該トピック名に対応する外部トピックモデル1112のトピック名および当該トピック名とは異なる外部トピックモデル1112のトピック名を抽出する(S817)。上記対応するトピック名とは、例えば、外部トピックモデル1112のなかで、上記特定した混合トピックモデル1113のトピック名あるいはキーワードと同義のトピック名である。また、上記異なるトピック名とは、例えば、外部トピックモデル1112のなかで、上記同義のトピック名以外の、上記特定した混合トピックモデル1113のトピック名と意味的に一定以上近いトピック名である。上記意味的に一定以上近いか否かの判定については、PLSA(Probabilistic Latent Semantic Analysis)等、従来から知られている様々な意味解析の手法を用いてよい。ここで、S815~S819の処理について具体的に説明する。 In addition, the topic model analysis unit 111 determines that, among topics that include items for which the distance between the items is equal to or less than a predetermined threshold, the distance between the topic name of the mixed topic model and the keyword that is the source of the topic name is A topic name that is equal to or less than a threshold value (for example, a topic name that includes a word or phrase indicating the characteristics of the topic) is identified, and the topic name of the external topic model 1112 corresponding to the identified topic name and the topic name are extracts topic names of different external topic models 1112 (S817). The corresponding topic name is, for example, a topic name synonymous with the topic name or keyword of the identified mixed topic model 1113 in the external topic model 1112. Further, the different topic name is, for example, a topic name in the external topic model 1112 that is semantically similar to a topic name of the identified mixed topic model 1113 by a certain level or more, other than the synonymous topic name. For determining whether or not the two words are semantically close to each other by more than a certain level, various conventionally known semantic analysis methods such as PLSA (Probabilistic Latent Semantic Analysis) may be used. Here, the processing of S815 to S819 will be specifically explained.

図13は、S815~S819の処理を説明するための概念図である。S815において、トピックモデル分析部111は、図示しない混合トピックモデル1113を基準として、混合トピックモデル1113に含まれるトピックが有する項目と、ユーザトピックモデル1111に含まれるトピックが有する項目との距離、および混合トピックモデル1113に含まれるトピックが有する項目と、外部トピックモデル1112に含まれるトピックが有する項目との距離をそれぞれ算出し、算出した距離が所定の閾値以下となる項目を含むトピックのトピック名を、混合トピックモデル1113の中から特定する。これにより、混合トピックモデル1113が有する項目の内容を基準として、混合トピックモデル1113のトピックと意味的に近い項目を含むユーザトピックモデル1111のトピックおよび外部トピックモデル1112のトピックを特定することができる。 FIG. 13 is a conceptual diagram for explaining the processing of S815 to S819. In S815, the topic model analysis unit 111 calculates the distance between the items included in the topics included in the mixed topic model 1113 and the items included in the topics included in the user topic model 1111, and the distance between the items included in the topics included in the mixed topic model 1113, based on the mixed topic model 1113 (not shown). The distances between the items included in the topic model 1113 and the items included in the external topic model 1112 are calculated, and the topic name of the topic containing the item for which the calculated distance is less than or equal to a predetermined threshold is calculated. Specify from among the mixed topic models 1113. As a result, topics of the user topic model 1111 and topics of the external topic model 1112 that include items semantically similar to the topics of the mixed topic model 1113 can be specified based on the content of the items included in the mixed topic model 1113.

そして、S816において、トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデル1113のトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名(例えば、トピックの特徴を示す語句がトピック名に含まれるようなトピック名)を特定し、特定した当該トピック名に対応するユーザトピックモデル1111のトピック名を抽出する。図13では、一例として、国別売上トピック1111a、掘削機械トピック1111b、ビル建設機械トピック1111c、鉱業トピック1111dのトピック名が、上記距離が閾値以下となるトピック名に対応するユーザトピックモデル1111のトピック名として抽出されている。 Then, in S816, the topic model analysis unit 111 selects the topic name of the mixed topic model 1113 and the keyword that is the origin of the topic name, among the topics that include items for which the distance between the items is equal to or less than a predetermined threshold. A topic name whose distance from Extract. In FIG. 13, as an example, the topic names of the country sales topic 1111a, the excavation machinery topic 1111b, the building construction machinery topic 1111c, and the mining topic 1111d are topics of the user topic model 1111 that correspond to the topic names for which the distance is equal to or less than the threshold value. Extracted as a name.

さらに、S817において、トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデルのトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名(例えば、トピックの特徴を示す語句がトピック名に含まれるようなトピック名)を特定し、特定した当該トピック名に対応する外部トピックモデル1112のトピック名および当該トピック名とは異なる外部トピックモデル1112のトピック名を抽出する。図13では、一例として、エネルギー(採掘量)トピック1112b、輸出機器トピック1112c、輸出国トピック1112dのトピック名が、上記距離が閾値以下となるトピック名に対応する外部トピックモデル1112のトピック名として抽出されている。さらに、当該ステップにおいて、トピックモデル分析部111は、抽出したトピック名とは上記異なる外部トピックモデル1112のトピック名を抽出する。図13では、一例として、エネルギー(発電量)トピック1112aのトピック名が、エネルギー(採掘量)トピック1112bのトピック名と意味的に一定以上近いトピック名であると判断され、上記異なる外部トピックモデル1112のトピック名として抽出されている。 Furthermore, in S817, the topic model analysis unit 111 selects the topic name of the mixed topic model and the keyword that is the source of the topic name, among the topics that include items for which the distance between the items is equal to or less than a predetermined threshold. The topic name of the external topic model 1112 that corresponds to the identified topic name and the corresponding A topic name of external topic model 1112 that is different from the topic name is extracted. In FIG. 13, as an example, the topic names of energy (mined amount) topic 1112b, export equipment topic 1112c, and export country topic 1112d are extracted as the topic names of the external topic model 1112 corresponding to the topic names for which the distance is less than or equal to the threshold value. has been done. Furthermore, in this step, the topic model analysis unit 111 extracts a topic name of the external topic model 1112 that is different from the extracted topic name. In FIG. 13, as an example, it is determined that the topic name of the energy (power generation amount) topic 1112a is semantically similar to the topic name of the energy (mined amount) topic 1112b by more than a certain level, and the different external topic model 1112 is extracted as the topic name.

フィードバック学習部110は、S816で抽出されたユーザトピックモデル1111のトピック名と、S817で抽出された外部トピックモデル1112のトピック名および上記異なる外部トピックモデル1112のトピック名とを、互いに関連のあるトピックとして対応付けてフィードバックリポジトリ109に追加する(S818)。例えば、図7に示すように、フィードバック学習部110は、S816で抽出された鉱業トピック1111dのトピック名と、S817で抽出されたエネルギー(採掘量)トピック1112bとが、上記特定した混合トピックモデル1113のトピック名あるいはキーワードと同義のトピック名であるため互いに関連のあるトピックであると判断する。そして、フィードバック学習部110は、鉱業トピック1111dのトピック名「鉱業」についてはフィードバックトピック名に記憶し、当該フィードバックトピック名に対応する外部トピック名に、エネルギー(採掘量)トピック1112bのトピック名「エネルギー(採掘量)」を記憶する。図7では、初期状態の外部トピック名およびフィードバックトピック名「エネルギー」のレコード(連番「p」)の次のレコード(連番「p.1」)として、外部トピック名に「エネルギー(採掘量)」、フィードバックトピック名に「鉱業」が設定されたレコードが、上記レコード(連番「p」)の外部トピック名の別名レコードとして記憶されている。同様に、図7では、初期状態の外部トピック名およびフィードバックトピック名「建設機械」のレコード(連番「n」)の次のレコード(連番「n.1」)として、外部トピック名に「建設機械」、フィードバックトピック名に「ビル建設機械」が設定されたレコードが、上記レコード(連番「n」)の外部トピック名の別名レコードとして記憶されている。 The feedback learning unit 110 converts the topic name of the user topic model 1111 extracted in S816, the topic name of the external topic model 1112 extracted in S817, and the topic name of the different external topic model 1112 into mutually related topics. and is added to the feedback repository 109 in association with the above (S818). For example, as shown in FIG. 7, the feedback learning unit 110 determines that the topic name of the mining topic 1111d extracted in S816 and the energy (mining amount) topic 1112b extracted in S817 are the same as in the mixed topic model 1113 identified above. Since the topic name is synonymous with the topic name or keyword, it is determined that the topics are related to each other. Then, the feedback learning unit 110 stores the topic name "Mining" of the mining topic 1111d in the feedback topic name, and adds the topic name "Energy" of the energy (mined amount) topic 1112b to the external topic name corresponding to the feedback topic name. (Mined amount)” is memorized. In Figure 7, the external topic name and the feedback topic name “Energy” (sequential number “p”) are set as the next record (sequential number “p.1”) after the record with the feedback topic name “Energy”. )", and a record in which "mining" is set as the feedback topic name is stored as an alias record of the external topic name of the above record (serial number "p"). Similarly, in FIG. 7, as the next record (serial number "n.1") of the record (serial number "n") with the initial external topic name and feedback topic name "Construction Machinery", the external topic name is " A record in which "Construction Machinery" and "Building Construction Machinery" are set as the feedback topic name is stored as an alias record of the external topic name of the above record (serial number "n").

さらに、フィードバック学習部110は、トピック名「エネルギー(発電量)」が外部トピック名に設定した「エネルギー(採掘量)」と意味的に一定以上近いトピック名であると判断し、エネルギー(発電量)のトピック名を、上記異なる外部トピックモデル1112のトピック名として抽出し、上記レコード(連番「p」)の外部トピック名の別名レコード(連番「p.2」)として記憶されている。当該レコードのフィードバックトピック名「燃料」については、上記同様、エネルギー(発電量)トピック1112aと関連のあるユーザトピックモデル1111のトピックのトピック名(図13では図示しないトピック名「燃料」)が記憶されている。 Furthermore, the feedback learning unit 110 determines that the topic name "Energy (amount of power generation)" is semantically similar to "Energy (amount of mining)" set as an external topic name, and ) is extracted as the topic name of the different external topic model 1112, and is stored as an alias record (serial number "p.2") of the external topic name of the record (serial number "p"). Regarding the feedback topic name "Fuel" of the record, as described above, the topic name of the topic of the user topic model 1111 that is related to the energy (power generation amount) topic 1112a (topic name "Fuel" not shown in FIG. 13) is stored. ing.

その後、フィードバック学習部110は、上記追加したレコードのデータドメインに、IRデータ2011に含まれるユーザ企業やユーザデータが属する業種や業界の名称を設定する(S819)。データドメインは、例えば、フィードバック学習部110が、IRデータ2011やユーザデータの内容(例えば、タイトル名、項目名)から業種や業界を分析し、上記名称として設定すればよい。 After that, the feedback learning unit 110 sets the name of the business type or industry to which the user company and user data included in the IR data 2011 belong to the data domain of the added record (S819). The data domain may be set as the above name by, for example, the feedback learning unit 110 analyzing the type of business or industry from the contents of the IR data 2011 and user data (for example, title name, item name).

このように、S815~S819の処理が終了すると、図6に示した初期状態のフィードバックリポジトリ109aから図7に示す学習後のフィードバックリポジトリ109bに更新される。S819が終了すると、S820に進み、当該更新後のフィードバックリポジトリ109に含まれる外部データトピック名のトピックおよびフィードバックトピック名のトピックモデルを用いて、S812で定義された外部公開データに対する分析指標となる項目が再定義される。 In this manner, when the processes of S815 to S819 are completed, the feedback repository 109a in the initial state shown in FIG. 6 is updated to the feedback repository 109b after learning shown in FIG. 7. When S819 ends, the process advances to S820, and uses the topic of the external data topic name and the topic model of the feedback topic name included in the updated feedback repository 109 to determine items that serve as analysis indicators for the external public data defined in S812. is redefined.

そして、分析設定部103は、S814で設定した所定の分析手法と当該分析手法で用いる閾値とを用いて分析を行い(S821)、その分析結果をディスプレイ等の表示部104に表示する(S822)。 Then, the analysis setting unit 103 performs analysis using the predetermined analysis method set in S814 and the threshold value used in the analysis method (S821), and displays the analysis result on the display unit 104 such as a display (S822). .

図12は、分析設定部103が、上記分析結果を表示部104に表示した画面の例を示す図である。図12に示すように、分析設定部103は、表示部104に、分析結果1201として、ユーザ企業の会社目標1202と、内部要因と外部要因とを軸としたSWOT等の分析手法の結果を示す分析表1203とを表示する。会社目標1202は、例えば、ユーザデータ取得部101が取得したユーザデータのユーザ公開データから読み取ればよい。 FIG. 12 is a diagram showing an example of a screen on which the analysis setting section 103 displays the above analysis results on the display section 104. As shown in FIG. 12, the analysis setting unit 103 displays, on the display unit 104, the company goals 1202 of the user company and the results of an analysis method such as SWOT based on internal and external factors as analysis results 1201. An analysis table 1203 is displayed. The company goal 1202 may be read, for example, from the user public data of the user data acquired by the user data acquisition unit 101.

さらに、分析設定部103は、上記分析の結果、S814で設定した閾値を満たさない項目があるか否かを判定する。分析設定部103は、S814で設定した閾値を満たさない項目があると判定した場合、当該項目はユーザ企業にとって改善の余地がある項目であると判断し、アラート処理部105が、アラートを通知するとともに、S822で表示した分析結果の中で該当する項目を、表示部104において選択可能な状態とする(S823)。上記アラートは、例えば、上記分析結果が表示された画面上に、上記閾値を満たさない項目に対して警告を促すためにアラート処理部105が出力するメッセージである。 Further, the analysis setting unit 103 determines whether or not there are any items that do not satisfy the threshold set in S814 as a result of the above analysis. If the analysis setting unit 103 determines that there is an item that does not satisfy the threshold set in S814, the analysis setting unit 103 determines that the item has room for improvement for the user company, and the alert processing unit 105 notifies the user of an alert. At the same time, the corresponding item among the analysis results displayed in S822 is made selectable on the display unit 104 (S823). The above-mentioned alert is, for example, a message outputted by the alert processing unit 105 on the screen on which the above-mentioned analysis result is displayed in order to prompt a warning for an item that does not satisfy the above-mentioned threshold value.

図12では、分析結果が、ユーザ企業の強みとして分析された海外売上において、ユーザ企業の脅威として分析された中国に対する建設機器輸出額が、閾値(例えば、前年比±ゼロ)に満たない-1.4%となっている。このため、アラート処理部105は、上記選択可能な状態にするために、例えば、当該項目(上記中国に対する建設機器輸出額)から当該項目を分析結果として表示するために用いたトピックモデルや元データへのリンクを張る等、当該項目1204から元となるデータへのアクセスが可能な状態に設定し、設定後の画面を表示部104に表示する。 In Figure 12, the analysis results show that in overseas sales, which was analyzed as a strength of the user company, the amount of construction equipment exports to China, which was analyzed as a threat to the user company, was less than a threshold (for example, ±0 compared to the previous year) -1 .4%. Therefore, in order to make the selection possible, the alert processing unit 105 uses, for example, the topic model and original data used to display the item as an analysis result from the item (the amount of construction equipment exported to China). The item 1204 is set to be accessible to the source data, such as by creating a link to the item 1204, and the screen after setting is displayed on the display unit 104.

ここで、分析者からコンサルティングを受けるユーザ企業の担当者が、上記表示部104に表示された項目1204を選択し、アラート処理部105が当該選択を受け付けると、アラート処理部105は関連データ収集部106を起動し、関連データ収集部106は、選択された上記項目1204の根拠となる関連データを収集する(S824)。例えば、関連データ収集部106は、上記アラートが出力された上記項目1204を分析結果として出力するために用いたトピックモデルおよび当該トピックモデルの元となるデータをトピックモデル分析部111から収集する。収集されるトピックモデルや上記元となるデータは、例えば、上記項目1204の出力に用いた外部トピックモデル1112(例えば、輸出機器トピック1112c、エネルギー(採掘量)トピック1112b、エネルギー(発電量)トピック1112a)やこれらの元となったデータ(例えば、機械別出荷推移データ30211、石炭生産量推移データ3022、国別エネルギー別発電量データ3033)、およびユーザトピックモデル1111(例えば、鉱業トピック1111d、ビル建設機械トピック1111c、掘削機械トピック1111b)やこれらの元となったデータ(例えば、売上データ2023、顧客データ2024、製品データ2026)である。収集されるトピックモデルには、S820において、分析設定部103が、S812で定義された外部公開データに対する分析指標となる項目を再定義した場合には、再定義後の項目を含むトピックモデルや当該トピックモデルの元となるデータを含む。 Here, when the person in charge of the user company receiving consulting from the analyst selects the item 1204 displayed on the display section 104 and the alert processing section 105 accepts the selection, the alert processing section 105 selects the item 1204 displayed on the display section 104. 106, and the related data collection unit 106 collects related data that is the basis for the selected item 1204 (S824). For example, the related data collection unit 106 collects from the topic model analysis unit 111 the topic model used to output the item 1204 for which the alert was output as an analysis result and the data that is the source of the topic model. The collected topic model and the above source data are, for example, the external topic model 1112 used to output the above item 1204 (for example, export equipment topic 1112c, energy (mined amount) topic 1112b, energy (power generation amount) topic 1112a) ), their source data (for example, shipment trend data by machine 30211, coal production trend data 3022, power generation data by energy by country 3033), and user topic models 1111 (for example, mining topic 1111d, building construction machine topic 1111c, excavating machine topic 1111b) and the data that became the source of these (for example, sales data 2023, customer data 2024, product data 2026). In S820, if the analysis setting unit 103 redefines the items that serve as analysis indicators for the externally published data defined in S812, the collected topic models include topic models that include the redefined items and the relevant topic models. Contains the data that is the basis of the topic model.

関連データ表示制御部107は、関連データ収集部106が収集した上記関連するトピックモデルや上記元となるデータ、およびトピックモデルや上記元となるデータの関連性を、画面を切り替える等して表示部104に表示するとともに、関連性の根拠としたトピック名の元となるキーワードを出力して表示する(S825)。関連データ表示制御部107は、当該キーワードとして、例えば、混合トピックモデルのトピック名の元となる語句を読み取ったり、当該語句と同義の語句であって外部トピックモデル1112やユーザトピックモデル1111のトピック名の元となる語句を読み取ればよい。 The related data display control unit 107 displays the related topic models and the source data collected by the related data collection unit 106 and the relationships between the topic models and the source data on the display unit by, for example, switching screens. 104, and also outputs and displays the keyword that is the source of the topic name that is the basis for the relevance (S825). The related data display control unit 107 reads, as the keyword, a phrase that is the source of the topic name of the mixed topic model, or reads a phrase that is synonymous with the word and phrase that is the topic name of the external topic model 1112 or user topic model 1111. All you have to do is read the original phrase.

図14は、関連データ収集部106が収集したトピックモデルやデータ、これらの関連性を説明するための概念図である。図14では、図13に示した概念図に示されたトピックモデルやデータのうち、関連データ収集部106が収集したトピックモデルやデータ、およびこれらの関連性を抽出して表示した画面1401を示している。関連データ表示制御部107は、このような情報を表示部104の画面上に表示する。 FIG. 14 is a conceptual diagram for explaining topic models and data collected by the related data collection unit 106, and their relationships. FIG. 14 shows a screen 1401 in which topic models and data collected by the related data collection unit 106 and their relationships are extracted and displayed from among the topic models and data shown in the conceptual diagram shown in FIG. ing. The related data display control unit 107 displays such information on the screen of the display unit 104.

図14では、関連データ収集部106が、機械別出荷推移データ30211、石炭生産量推移データ3022、国別エネルギー別発電量データ3033を外部トピックモデル1112の上記元データとして収集し、売上データ2023、顧客データ2024、製品データ2026をユーザトピックモデル1111の上記元となるデータとして収集し、関連データ表示制御部107が、収集されたこれらのデータやそのデータを含むトピックモデルを可視化した可視化データやキーワード表示データ(提供用データ)を生成し、表示部104の画面上に表示している。また、石炭生産量推移データ3022と顧客データ2024との間には関連性1301があり、機械別出荷推移データ30211と製品データ2026との間には関連性1302があったことを示している。関連性1301および関連性1302は、図7に示したフィードバックリポジトリ109を参照し、新たに追加されたレコードの外部データトピック名とフィードバックトピック名とを参照し、上記元となるデータを含むトピックモデル同士に関連性があると判断すればよい。図14では、上記元データ同士に関連性がある場合を例示しているが、トピックモデル間でも同様に考えることができる。また、図14では、関連データ表示制御部107が、「石炭」や「ブルドーザ」といったキーワードを表示している。 In FIG. 14, the related data collection unit 106 collects shipment trend data 30211 by machine, coal production trend data 3022, power generation data 3033 by country and energy as the above-mentioned source data of the external topic model 1112, and sales data 2023, Customer data 2024 and product data 2026 are collected as the source data of the user topic model 1111, and the related data display control unit 107 generates visualization data and keywords that visualize the collected data and the topic model containing the data. Display data (provided data) is generated and displayed on the screen of the display unit 104. Further, there is a relationship 1301 between the coal production amount transition data 3022 and the customer data 2024, and a relationship 1302 exists between the machine-by-machine shipment transition data 30211 and the product data 2026. Relevance 1301 and Relevance 1302 refer to the feedback repository 109 shown in FIG. 7, refer to the external data topic name and feedback topic name of the newly added record, and create a topic model containing the above source data. It may be determined that there is a relationship between them. Although FIG. 14 illustrates a case where the original data are related to each other, the same can be considered between topic models. Further, in FIG. 14, the related data display control unit 107 displays keywords such as "coal" and "bulldozer."

その後、データ送信部108は、関連データ表示制御部107により生成された上記提供用データを、課題分析解決データ2031としてユーザサーバ200に送信する。コンサルティングを受けるユーザ企業の担当者は、サーバ200が備えた入力装置(例えば、キーボード)を操作する等して、サーバ200が受け取った上記提供用データを、サーバ200が備えるディスプレイ等の表示装置である入力表示部203に表示し、その内容を確認する。 Thereafter, the data transmitting unit 108 transmits the provision data generated by the related data display control unit 107 to the user server 200 as problem analysis solution data 2031. A person in charge of the user company receiving consulting operates an input device (for example, a keyboard) included in the server 200 to transmit the provision data received by the server 200 on a display device such as a display included in the server 200. It is displayed on a certain input display section 203 and its contents are confirmed.

このように、図7に示したフィードバックリポジトリ109に、互いに関連性のある外部トピックモデルのトピック名とユーザトピックモデルのトピック名であるフィードバックトピック名とを対応付けて保持しておき、これらの関連性を画面上に表示する。したがって、外部公開データ300に基づく外部トピックモデル1112を用いた分析だけでは得られない、ユーザ非公開データを含むユーザデータに基づくユーザトピックモデル1111との関連性を、ユーザデータと外部公開データとの間で用いられる語句の違いを意識することなく、ユーザ企業の新たな気づきとして提示することができる。 In this way, the feedback repository 109 shown in FIG. 7 stores topic names of external topic models that are related to each other and feedback topic names that are topic names of user topic models in association with each other. Display gender on screen. Therefore, the relationship between the user data and the externally published data, which cannot be obtained only by analysis using the externally published data 300 and the user topic model 1111 based on the user data including user private data, is User companies can present new insights without having to be aware of the differences in terms used between them.

図9は、図8に示したS812、S820の処理の詳細手順を示すフローチャートである。図9に示すように、分析設定部103は、コンサルティングサーバ100にコピーされた外部公開データ300のなかで、分析に用いるために分析者から指定されたデータを選択する(S901)。分析設定部103は、分析の軸となる外部要因をフィードバックリポジトリ109から選択するか否かを判定し(S902)、分析の軸となる外部要因をフィードバックリポジトリ109から選択すると判定した場合(S902;Yes)、その時点で生成、更新されているフィードバックリポジトリ109の外部トピック名およびドメインを読み出し、読み出した当該外部トピック名およびドメインに対応するトピックモデルおよび当該トピックモデルの元となるデータを外部要因として選択する(S903)。S903で外部要因とするトピックモデルおよび当該トピックモデルの元となるデータが選択されると、S814に進む。S814では、外部要因として選択された外部トピック名のトピックモデルおよび当該トピックモデルの元となるデータを用いて、所定の分析手法と当該分析手法で用いる閾値とを用いて分析が行われることとなる。 FIG. 9 is a flowchart showing detailed steps of the processing in S812 and S820 shown in FIG. As shown in FIG. 9, the analysis setting unit 103 selects data designated by the analyst for use in analysis from the external public data 300 copied to the consulting server 100 (S901). The analysis setting unit 103 determines whether or not to select an external factor as an axis of analysis from the feedback repository 109 (S902), and if it is determined that an external factor as an axis of analysis is to be selected from the feedback repository 109 (S902; Yes), reads the external topic name and domain of the feedback repository 109 that is being generated and updated at that time, and uses the topic model corresponding to the read external topic name and domain and the data that is the source of the topic model as an external factor. Select (S903). When the topic model to be used as an external factor and the source data of the topic model are selected in S903, the process advances to S814. In S814, an analysis is performed using a topic model of the external topic name selected as an external factor and the data that is the source of the topic model, using a predetermined analysis method and a threshold used in the analysis method. .

図10は、図8に示したS824の処理の詳細手順を示すフローチャートである。図10に示すように、関連データ収集部106は、上記アラートが出力された上記項目1204を分析結果として出力するために用いたトピックモデルおよび当該トピックモデルの元となるデータをトピックモデル分析部111から収集する(S1001)。関連データ収集部106は、S813の判定結果から、フィードバックリポジトリ109を活用するか否かを判定し(S1002)、フィードバックリポジトリ109を活用すると判定した場合(S1002;Yes)、フィードバックリポジトリ109の外部トピック名およびドメインを読み出し、読み出した当該外部トピック名およびドメインに対応するトピックモデルおよび当該トピックモデルの元となるデータを、関連データとして収集する(S1003)。S1003で関連データとする項目が収集されると、S825に進む。 FIG. 10 is a flowchart showing the detailed procedure of the process of S824 shown in FIG. As shown in FIG. 10, the related data collection unit 106 collects the topic model used to output the item 1204 for which the alert was output as an analysis result and the data that is the source of the topic model to the topic model analysis unit 111. (S1001). The related data collection unit 106 determines whether or not to utilize the feedback repository 109 based on the determination result in S813 (S1002), and if it is determined to utilize the feedback repository 109 (S1002; Yes), the external topic of the feedback repository 109 is The external topic name and domain are read out, and the topic model corresponding to the read external topic name and domain and the source data of the topic model are collected as related data (S1003). When items to be related data are collected in S1003, the process advances to S825.

図11は、図8に示したS815~S819の処理の詳細手順を示すフローチャートである。図11に示すように、まず、トピックモデル分析部111は、従来から知られている各種のクラスタ分析を用いて、各トピックモデルの間で項目間の距離が所定の閾値以下である項目を有するトピック名を特定する(S1101)。 FIG. 11 is a flowchart showing detailed steps of the processing from S815 to S819 shown in FIG. As shown in FIG. 11, first, the topic model analysis unit 111 uses various conventionally known cluster analyzes to identify items whose distance between items is equal to or less than a predetermined threshold in each topic model. A topic name is specified (S1101).

トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデルのトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名に対応するユーザトピックモデル1111のトピック名を抽出する(S1102)。例えば、上記距離がゼロであるユーザトピックモデル1111のトピック名を、上記キーワードと同義のトピック名として抽出する。 The topic model analysis unit 111 determines whether the distance between the topic name of the mixed topic model and the keyword that is the origin of the topic name is less than or equal to the threshold, among the topics that include items for which the distance between the items is less than or equal to a predetermined threshold. The topic name of the user topic model 1111 corresponding to the topic name is extracted (S1102). For example, the topic name of the user topic model 1111 whose distance is zero is extracted as a topic name synonymous with the keyword.

また、トピックモデル分析部111は、上記項目間の距離が所定の閾値以下となる項目を含むトピックのうち、混合トピックモデルのトピック名と当該トピック名の元となる語句であるキーワードとの距離が閾値以下となるトピック名に対応する外部トピックモデル1112のトピック名および当該トピック名とは異なる外部トピックモデル1112のトピック名を抽出する(S1103)。例えば、上記距離がゼロである外部トピックモデル1112のトピック名を、上記キーワードと同義のトピック名として抽出するとともに、当該トピック名と意味的に一定以上近いトピック名を上記異なるトピック名として抽出する。 In addition, the topic model analysis unit 111 determines that, among topics that include items for which the distance between the items is equal to or less than a predetermined threshold, the distance between the topic name of the mixed topic model and the keyword that is the source of the topic name is The topic name of the external topic model 1112 corresponding to the topic name that is equal to or less than the threshold value and the topic name of the external topic model 1112 that is different from the topic name are extracted (S1103). For example, the topic name of the external topic model 1112 whose distance is zero is extracted as a topic name synonymous with the keyword, and a topic name that is semantically closer than a certain level to the topic name is extracted as the different topic name.

フィードバック学習部110は、S1102で抽出されたユーザトピックモデル1111のトピック名と、S1103で抽出された外部トピックモデル1112のトピック名および上記異なるトピック名とを、互いに関連のあるトピックとして対応付けてフィードバックリポジトリ109に別名レコードとして追加する(S1104)。 The feedback learning unit 110 associates the topic name of the user topic model 1111 extracted in S1102 with the topic name of the external topic model 1112 extracted in S1103 and the above-mentioned different topic names as mutually related topics, and provides feedback. It is added to the repository 109 as an alias record (S1104).

その後、フィードバック学習部110は、上記追加したレコードのドメインに、IRデータ2011に含まれるユーザ企業が属する業種や業界の名称を設定する(S1105)。 After that, the feedback learning unit 110 sets the name of the business type or industry to which the user company included in the IR data 2011 belongs to the domain of the added record (S1105).

以上説明したように、本実施例におけるコンサルティング支援システム1000によれば、トピックモデルを用いた分析を行う場合に、ドメインにおける語句の定義の違いを解決することが可能となる。例えば、図7に示したようなフィードバックリポジトリをシステム上に保持し、外部トピックモデルとユーザトピックモデルとを対応付けておくことで、外部トピックモデルや外部公開データにおける語句の違いを考慮した分析を行い、その結果を提示することができる。 As described above, according to the consulting support system 1000 of this embodiment, when performing analysis using a topic model, it is possible to resolve differences in definitions of words in domains. For example, by maintaining a feedback repository as shown in Figure 7 on the system and associating external topic models with user topic models, it is possible to perform analysis that takes into account differences in terms in external topic models and externally published data. and present the results.

さらに、図12に示したように、分析結果が芳しくない場合には、その項目を選択可能な状態とし、当該項目が選択された場合には、その項目の根拠となったトピックモデルやそのトピックモデルの元となったデータにアクセス可能とすることで、芳しくないと分析された項目における課題を解決するために必要なデータをリコメンドすることができる。 Furthermore, as shown in Figure 12, if the analysis result is not good, that item is made selectable, and when the item is selected, the topic model that was the basis for that item and the topic By making the data that is the basis of the model accessible, it is possible to recommend the data necessary to solve problems in items analyzed as unfavorable.

なお、上記実施例では、図8において、フィードバックリポジトリ109を生成、更新するS815~S819までの処理を含めて1つの分析処理として説明した。しかし、S815~S819までの処理を1つのフィードバックリポジトリ生成処理として他の処理とは独立して実行してもよい。 Note that in the above embodiment, in FIG. 8, the processes from S815 to S819 for generating and updating the feedback repository 109 were described as one analysis process. However, the processes from S815 to S819 may be executed as one feedback repository generation process independently from other processes.

1000 コンサルティング支援システム
100 コンサルティングサーバ
200 ユーザサーバ
N1、N2 ネットワーク
101 ユーザデータ取得部
102 外部データ取得部
103 分析設定部
104 表示部
105 アラート処理部
106 関連データ収集部
107 関連データ表示制御部
108 データ送信部
109 フィードバックリポジトリ
110 フィードバック学習部
111 トピックモデル分析部
112 トピックモデル生成部
201 公開データ記憶部
202 内部データ記憶部
203 入力表示部
204 表示部
1000 Consulting support system 100 Consulting server 200 User servers N1, N2 Network 101 User data acquisition section 102 External data acquisition section 103 Analysis setting section 104 Display section 105 Alert processing section 106 Related data collection section 107 Related data display control section 108 Data transmission section 109 Feedback repository 110 Feedback learning section 111 Topic model analysis section 112 Topic model generation section 201 Public data storage section 202 Internal data storage section 203 Input display section 204 Display section

Claims (6)

ユーザ企業が有するユーザ公開データとユーザ非公開データとを含むユーザデータから得られたユーザトピックモデルと、前記ユーザ企業以外の他の外部において公開されている外部公開データから得られた外部トピックモデルと、前記ユーザデータと前記外部公開データとから、所定の手法を用いて得られた、前記ユーザトピックモデルのトピック名と前記外部トピックモデルのトピック名との意味的な類似度をトピックモデルの項目間の距離に基づいて判定するための、前記外部トピックモデルと前記ユーザトピックモデルとに共通のトピックモデルである混合トピックモデルと、を生成するトピックモデル生成部と、
前記混合トピックモデルが有するトピックと前記ユーザトピックモデルが有するトピックとの距離が閾値以下となるトピックであるフィードバックトピックを前記ユーザトピックモデルの中から特定し、前記混合トピックモデルが有するトピックと前記外部トピックモデルが有するトピックとの距離が閾値以下となるトピックである外部トピックを前記外部トピックモデルの中から特定するトピックモデル分析部と、
特定された前記フィードバックトピックと前記外部トピックとを対応付けてフィードバックリポジトリに登録するフィードバック学習部と、
を有することを特徴とするコンサルティング支援システム。
A user topic model obtained from user data including user public data and user private data owned by the user company, and an external topic model obtained from external public data published outside of the user company. , the semantic similarity between the topic name of the user topic model and the topic name of the external topic model, which is obtained using a predetermined method from the user data and the externally published data, is calculated between the items of the topic model. a topic model generation unit that generates a mixed topic model that is a topic model common to the external topic model and the user topic model, for making a determination based on the distance of ;
A feedback topic that is a topic in which the distance between a topic included in the mixed topic model and a topic included in the user topic model is equal to or less than a threshold is identified from the user topic model, and a feedback topic is identified from the user topic model, and a topic included in the mixed topic model and the external topic are identified. a topic model analysis unit that identifies an external topic from the external topic model, which is a topic whose distance from the topic of the model is equal to or less than a threshold;
a feedback learning unit that associates the identified feedback topic with the external topic and registers it in a feedback repository;
A consulting support system characterized by having.
前記ユーザデータに対する分析指標となる項目を内部要因として定義し、前記外部公開データに対する分析指標となる項目を外部要因として定義する分析設定部を有し、
前記分析設定部は、前記登録されたフィードバックリポジトリを読み出して、前記定義された外部公開データに対する分析指標となる項目を再定義し、所定の分析手法により前記ユーザ企業を分析する処理を行う、
ことを特徴とする請求項1に記載のコンサルティング支援システム。
an analysis setting unit that defines items that serve as analysis indicators for the user data as internal factors, and defines items that serve as analysis indicators for the externally disclosed data as external factors;
The analysis setting unit reads the registered feedback repository, redefines items that serve as analysis indicators for the defined externally published data, and performs a process of analyzing the user company using a predetermined analysis method.
The consulting support system according to claim 1, characterized in that:
前記トピックモデル分析部は、前記混合トピックモデルのトピック名あるいは当該トピック名の元となる語句であるキーワードと、前記ユーザトピックモデルのトピック名に対応するトピックとの距離が閾値以下となるトピック名に対応する前記ユーザトピックモデルのトピック名を前記フィードバックトピックとして抽出するとともに、前記ピック名あるいは前記キーワードと、前記外部トピックモデルのトピック名に対応するトピックとの距離が閾値以下となるトピック名に対応する前記外部トピックモデルのトピック名および当該トピック名とは異なる外部トピックモデルのトピック名を抽出し、
フィードバック学習部は、前記ユーザトピックモデルのトピック名と、前記外部トピックモデルのトピック名および前記異なる外部トピックモデルのトピック名とを、互いに関連のあるトピックとして対応付けて前記フィードバックリポジトリに追加する、
ことを特徴とする請求項1に記載のコンサルティング支援システム。
The topic model analysis unit selects a topic name for which a distance between a topic name of the mixed topic model or a keyword that is a source word of the topic name and a topic corresponding to the topic name of the user topic model is less than or equal to a threshold value. The topic name of the corresponding user topic model is extracted as the feedback topic , and the distance between the topic name or the keyword and the topic corresponding to the topic name of the external topic model is equal to or less than a threshold value. Extract the topic name of the external topic model and the topic name of the external topic model different from the topic name,
The feedback learning unit associates the topic name of the user topic model, the topic name of the external topic model, and the topic name of the different external topic model as mutually related topics, and adds them to the feedback repository.
The consulting support system according to claim 1, characterized in that:
前記分析設定部は、前記所定の分析手法により分析した結果を表示部に表示し、
前記分析した結果が閾値を満たさない場合、アラートを通知するとともに、前記分析した結果の中で該当する項目を、前記表示部において選択可能な状態とするアラート処理部、
を有することを特徴とする請求項2に記載のコンサルティング支援システム。
The analysis setting section displays the results analyzed by the predetermined analysis method on a display section,
an alert processing unit that notifies an alert when the analyzed result does not satisfy a threshold value and makes the corresponding item in the analyzed result selectable on the display unit;
3. The consulting support system according to claim 2, further comprising:
前記選択可能な状態とされた前記項目が選択された場合に、選択された前記項目の根拠となる関連データとして、前記アラートが出力された項目を前記分析した結果として出力するために用いたトピックモデルおよび当該トピックモデルの元となるデータを収集する関連データ収集部、
を有することを特徴とする請求項4に記載のコンサルティング支援システム。
When the item in the selectable state is selected, the topic used to output the item for which the alert was output as the result of the analysis as related data that is the basis for the selected item. A related data collection unit that collects the data that is the basis of the model and the topic model;
5. The consulting support system according to claim 4, further comprising:
コンピュータによりユーザ企業に対するコンサルティングを支援するコンサルティング支援方法であって、
ユーザ企業が有するユーザ公開データとユーザ非公開データとを含むユーザデータから得られたユーザトピックモデルと、前記ユーザ企業以外の他の外部において公開されている外部公開データから得られた外部トピックモデルと、前記ユーザデータと前記外部公開データとから、所定の手法を用いて得られた、前記ユーザトピックモデルのトピック名と前記外部トピックモデルのトピック名との意味的な類似度をトピックモデルの項目間の距離に基づいて判定するための、前記外部トピックモデルと前記ユーザトピックモデルとに共通のトピックモデルである混合トピックモデルと、を生成し、
前記混合トピックモデルが有するトピックと前記ユーザトピックモデルが有するトピックとの距離が閾値以下となるトピックであるフィードバックトピックを前記ユーザトピックモデルの中から特定し、
前記混合トピックモデルが有するトピックと前記外部トピックモデルが有するトピックとの距離が閾値以下となるトピックである外部トピックを前記外部トピックモデルの中から特定し、
特定された前記フィードバックトピックと前記外部トピックとを対応付けてフィードバックリポジトリに登録する、
ことを特徴とするコンサルティング支援方法。
A consulting support method for supporting consulting for a user company using a computer,
A user topic model obtained from user data including user public data and user private data owned by the user company, and an external topic model obtained from external public data published outside of the user company. , the semantic similarity between the topic name of the user topic model and the topic name of the external topic model, which is obtained using a predetermined method from the user data and the externally published data, is calculated between the items of the topic model. generating a mixed topic model that is a topic model common to the external topic model and the user topic model, for making a determination based on the distance of ;
Identifying a feedback topic from the user topic model that is a topic in which a distance between a topic included in the mixed topic model and a topic included in the user topic model is equal to or less than a threshold;
Identifying an external topic from the external topic model that is a topic in which a distance between a topic included in the mixed topic model and a topic included in the external topic model is equal to or less than a threshold;
associating the identified feedback topic with the external topic and registering it in a feedback repository;
A consulting support method characterized by:
JP2020063201A 2020-03-31 2020-03-31 Consulting support system, consulting support method Active JP7398320B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020063201A JP7398320B2 (en) 2020-03-31 2020-03-31 Consulting support system, consulting support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020063201A JP7398320B2 (en) 2020-03-31 2020-03-31 Consulting support system, consulting support method

Publications (2)

Publication Number Publication Date
JP2021163122A JP2021163122A (en) 2021-10-11
JP7398320B2 true JP7398320B2 (en) 2023-12-14

Family

ID=78004893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020063201A Active JP7398320B2 (en) 2020-03-31 2020-03-31 Consulting support system, consulting support method

Country Status (1)

Country Link
JP (1) JP7398320B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7248858B1 (en) 2022-11-08 2023-03-29 株式会社博報堂 Information processing system, computer program, and information processing method
KR102583159B1 (en) * 2022-12-20 2023-09-26 오케스트로 주식회사 A creation module for automatic swat analysis tool using artificial intelligence and a swot analysis system comprising the same

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187395A (en) 2008-02-07 2009-08-20 Nec Corp Topic analyzing device, method and program
US20190236206A1 (en) 2018-01-26 2019-08-01 International Business Machines Corporation Automatic Extraction of Domain Specific Terminology from a Large Corpus
JP2020013413A (en) 2018-07-19 2020-01-23 株式会社日立製作所 Judgment support device and judgment support method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187395A (en) 2008-02-07 2009-08-20 Nec Corp Topic analyzing device, method and program
US20190236206A1 (en) 2018-01-26 2019-08-01 International Business Machines Corporation Automatic Extraction of Domain Specific Terminology from a Large Corpus
JP2020013413A (en) 2018-07-19 2020-01-23 株式会社日立製作所 Judgment support device and judgment support method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
松村 憲和,分散・ヘテロなデータからのトピック全体構造の学習,FIT2005 第4回情報科学技術フォーラム 情報科学技術レターズ 第4巻,社団法人情報処理学会,2005年08月22日,pp.93~94,LF-003

Also Published As

Publication number Publication date
JP2021163122A (en) 2021-10-11

Similar Documents

Publication Publication Date Title
Oltramari et al. PrivOnto: A semantic framework for the analysis of privacy policies
US11580680B2 (en) Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
US11681694B2 (en) Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
Wilson et al. The creation and analysis of a website privacy policy corpus
US11503065B2 (en) Determining digital vulnerability based on an online presence
Kagdi et al. Assigning change requests to software developers
US20180232450A1 (en) Dynamic faceted search
Zhang et al. KSAP: An approach to bug report assignment using KNN search and heterogeneous proximity
US20150310068A1 (en) Reinforcement Learning Based Document Coding
JP7398320B2 (en) Consulting support system, consulting support method
Eddy et al. Impact of structural weighting on a latent dirichlet allocation–based feature location technique
Sadashiva Reddy Exploring the Existing and Unknown Side Effects of Privacy Preserving Data Mining Algorithms
Howard et al. The impact of information quality on information research
Dash et al. Factors affecting user experience of contact tracing app during COVID-19: an aspect-based sentiment analysis of user-generated review
JP6285284B2 (en) Opinion utilization support device and opinion utilization support method
US11776078B2 (en) Systems and methods for generating strategic competitive intelligence data relevant for an entity
US11443004B1 (en) Data extraction and optimization using artificial intelligence models
Dhotre et al. “Take It or Leave It”: Effective Visualization of Privacy Policies
Lee et al. Exploring trends in blockchain publications with topic modeling: Implications for forecasting the emergence of industry applications
US8019755B2 (en) Internet-user accessible system database computer method and system for analyzing government legsilationand legislative documents, statutes, bills, by-laws, proposals and amendments
CN111222918B (en) Keyword mining method and device, electronic equipment and storage medium
Hamid et al. GenAIPABench: A benchmark for generative AI-based privacy assistants
KR102113680B1 (en) Big data de-identification system and method
WO2016145231A1 (en) Method and system for converting disparate financial, regulatory, and disclosure documents to a linked table
Jawale et al. Implementation of automated sentiment discovery system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231204

R150 Certificate of patent or registration of utility model

Ref document number: 7398320

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150