JP7621608B2

JP7621608B2 - 財務諸表不正推定装置、財務諸表不正推定方法及びプログラム

Info

Publication number: JP7621608B2
Application number: JP2024055350A
Authority: JP
Inventors: 真澄中島; 邦彦藤田; 啓佑吉田
Original assignee: Individual
Current assignee: Individual
Priority date: 2023-04-29
Filing date: 2024-03-29
Publication date: 2025-01-27
Anticipated expiration: 2044-03-29
Also published as: JP2024160043A

Description

本発明は財務諸表不正推定装置、財務諸表不正推定方法及びプログラムに関し、特に企業又はその経営者が開示するテキスト情報に基づいて財務諸表不正の有無を推定する技術に関する。

財務諸表に関する不正な情報が開示されると、投資者が正しい投資判断ができず、市場が機能しなくなり、公共財が棄損してしまう。投資者が不正企業を検出できない、非不正企業を選択できないことによって市場による適正な分配ができなくなるのである。かかる問題に対処するため、従来より様々な不正検出手法が提案されている。

海外では、財務諸表データに対してロジスティック回帰を適用した手法（非特許文献１乃至４）、アニュアルレポートのテキスト情報に対して計量的分析を適用した手法（非特許文献５及び６）がある。

こうした計量統計的手法だけではなく、財務諸表データに対して機械学習を適用した手法として非特許文献７乃至１５がある。また、テキスト情報に対して機械学習を適用した手法として非特許文献１６乃至１９がある。

また、テキストと財務諸表データ両方を用いたハイブリッド型の機械学習手法として非特許文献２０乃至２４がある。

日本では、財務諸表不正に対してロジスティック回帰分析を適用した手法として非特許文献２５乃至２７がある。また、テキスト情報に対して統計的分析を適用した手法として非特許文献２８乃至非特許文献３０がある。

また、財務諸表データに対して機械学習を適用した手法として非特許文献３１がある。

特許文献１には、機械学習により、企業の財務諸表に含まれる複数の勘定科目に基づいて、異常な勘定科目を検出する装置が記載されている。

特許文献２には、機械学習により、個々の企業の財務諸表に含まれる各勘定科目や取引情報などに基づいて、複数の企業間で行われる異常な取引を検知する装置が記載されている。

Beasley, M.1996. An empirical analysis of the relation between the board of director composition and financial statement fraud. The Accounting Review, 71 (4): 443-465. Beneath, M.D. 1999. Incentives and penalties related to earnings overstatements that violate GAAP, and post-Sarbanes Oxley period. The Accounting Review, 83 (3): 757-787. Dechow, P. M., R. G. Sloan, and A. P. Sweeney. 1996. Causes and Consequences of Earnings Manipulation: An Analysis of Firms Subject to Enforcement Actions by the SEC. Contemporary Accounting Research 13 (l): 1-36. Skousen, C. J, K. R. Smith, and C. J. Wright. 2009. Detecting and predicting financial statement fraud: The effectiveness of the fraud triangle and SAS No. 99, in M. Hirschey, K., John, A. K. Makhija (ed.) Corporate Governance and Firm Performance (Advances in Financial Economics, 13), Emerald Group Publishing Limited, 53-A81. Churyk, N. T., C. C. Lee, and B. D. Clinton. 2009. Early detection of fraud: Evidence from restatements. Advances in Accounting Behavioral Research 12: 25-40. Lee, C.C., N. T. Churyk, and B. D. Clinton. 2013. Validating early fraud prediction using narrative disclosure. Journal of Forensic & Investigative Accounting, 5 (1): January-June.35-57. Fanning, K.M, and K. O. Cogger.1998. Neural network detection of management fraud using published financial data, Intelligent Systems in Accounting, Finance and Management 7(1): 21-41. Green, B.P., and J.H. Choi. 1997. Assessing the risk of management fraud through neural-network technology. Auding: A Journal of Practice & Theory 16:14-28. Hoogs, B., T. Keihl. C. Lacomb, and D. Senturk. 2007. A genetic algorithm approach to detection temporal patterns indicative of financial statemen fraud. International Journal of Intelligent Systems in Accounting, Finance and Management 15: 41-56. Kirks, E., C. Spanthis, and Y. Manoloppoulos, 2007. Data mining techniques for the detection of fraudulent financial statements. Expert Systems with Applications 32: 995-1003. Ravisankar, P., V. Ravi., G.R. Rao, I. Bose. 2011.Detection of financial statement fraud and feature selection using data mining techniques, Decision Support System 50: 491-500. Huang, S.Y. 2013. Fraud detection model by using support vector machine techniques. International Journal of Digital Content Technology and its Applications 7:32-42. Omar, N. Z. A. Johari, M. Smith. 2017. Predicting fraudulent financial reporting using artificial neural network. Journal of Financial Crime 24(2):362-387. Bao, Y., B. Ke, B. Li, Y. J. Yu, and J. Zhang. 2020. Detecting accounting fraud in publicly traded U.S. firms using a machine learning approach. Journal of Accounting Research 58 (1): 199-235. https://doi.org/10.1111/1475-679X.12292 EL-Bannany, M. A.H. Dehghan, and A,M. Khedr 2021. Prediction of financial statement fraud using machine learning techniques in UAE. 2021 18th International Multi-Conference on Systems, Signals & Devices. Humpherys, S.L. K.C. Moffitt, M.B. Burns, J.K. Burgoon, W. F. Felix. 2011. Identification of fraudulent financial statements using linguistic credibility analysis, Decision Support Systems 50: 585-594. Goel, S., J. Gongolly., S.R.Faerman. and O. Uzner. 2010. Can linguistic predictors detect fraudulent financial filings? Journal of Emerging Technologies in Accounting 7: 25-46． Glancy, F.H. and S.B. Yadav. 2011. A computational model for financial reporting fraud detection, Decision Support Systems 50: 595-601. Goel,S., and O.Uzuner. 2016. Do Sentiments Matter in Fraud Detection? Estimating Semantic Orientation of Annual Reports. Special Issue in Accounting, Auditing and Finance 23 (3）：215-239 Brown, N. C., R. M. Crowley, and W. B. Elliott. 2020. What are you saying? Using topic to detect financial misreporting. Journal of Accounting Research 58 (1): 237-291. Cecchini, M., H. Aytug, G.J. Koehler, P. Pathak. 2010. Making words work: Using financial text as a predictor of financial events, Decision Support Systems 50:164-175. Chen, Y-J., C-H. Wu., Y-M, Chen, H-K Chen. 2017. Enhancement of fraud detection for narratives in annual reports. International Journal of Accounting Information Systems 26: 32-45. Hajek, P. and R. Henriques. 2017. Mining corporate annual reports for intelligent detection of financial statement fraud -A comparative study of machine learning methods. Knowledge-Based Systems 128: 139-152. Gleichman, T.C. 2022. The Detection of Fraudulent Financial Statements Using Textual and Financial data, Techinish Univesitat Ilmenau, Dissertation. Song. M., N. Oshiro, and A. Shuto. 2016. Predicting accounting fraud: Evidence from Japan, The Japanese Accounting Review 6: 17-63. Nakashima, M. 2021. Can the Fraud Triangle Explain Fraudulent Financial Statements? Evidence from Japan, Journal of Forensic and Investigative Accounting 13 (1): 198-232. 佐藤夏輝・小村亜唯子・平井裕久．「事前不正確率の違いによるロジスティック回帰を用いた不正会計の見地モデルの検知精度」『高崎経済大学論集』64 (4):107-128． Nakashima, M., H. Hirose, and H. Hirai. 2022. Fraud detection by focusing on readability Evidence from Japan. Journal of Forensic and Investigative Accounting 13 (1): 276-298. Nakashima, M. 2022. Fraud Detection Method by Textual Analysis of CEO Letters in the Perspective of Obfuscation Hypothesis: Evidence from Japanese Firms Listed on the U.S. Stock Exchange . 『経営論集』 32 (1): 83-99. 中島真澄．2022．「CEOレターのトーンと財務ファンダメンタルズからの不正検出―米国上場日本企業における実証」『会計監査ジャーナル』19：104‐114．宇宿哲平・近藤聡・白木研吾・菅美希・宮川大介．2019. 「機械学習手法を用いた不正会計の検知と予測」『RIETI Discussion Paper Series 』19-J-039 白田由香利，「機械学習回帰におけるShapley値の理論説明と事例紹介」，DEIM Forum 2022，2022年3月，[online]，インターネット<URL: https://event.dbsj.org/deim2022/post/tutorial/deim2022_tutorial_T2.pdf>，（検索日：2024年1月4日）吉田秀穂ほか，「決定木ベースモデルの解釈におけるSHAP値の有用性の検証」，The 34th Annual Conference of the Japanese Society for Artificial Intelligence 2020，2020年6月，[online]，インターネット<URL: https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_3E5GS204/_pdf/-char/ja>，（検索日：2024年1月4日）

特許第６６６７８６５号特許第７１４６２１８号

しかしながら、財務諸表データを用いる手法（ハイブリッド型を含む）は、財務諸表不正の検出という目的を必ずしも十分に達成することができない。財務諸表不正の性質上、不正検出の際において財務諸表上の不正の兆候を識別することは困難であり、不正の兆候の一部は、不正が存在していなくとも、示されることもある。財務諸表が一般に認められた会計原則（ＧｅｎｅｒａｌｌｙＡｃｃｅｐｔｅｄＡｃｃｏｕｎｔｉｎｇＰｒｉｎｃｉｐｌｅｓ：ＧＡＡＰ）から逸脱していても逸脱が適切に開示されている場合は不正の存在と言われるものでないし、一方、財務諸表がＧＡＡＰに準拠していても、その原則が完全でないことから不正という誤解を招くこともある。財務諸表データからの財務比率だけで不正検出するのは不十分である。

また、過年度に財務諸表の虚偽記載などの不正が検出された場合、企業は訂正報告書が義務付けられている（金融商品取引法第２４条２）。その訂正報告書が提出されると、有価証券報告書データベースのうち、財務諸表データは訂正報告書の数字で上書きされる。

一方、企業またはその経営者が開示するテキスト情報は、定量的な情報に対して優位性があり、定量的な情報を補完する情報が含まれている。テキストの部分は、財務諸表に記載された情報以外の有用な情報あるいは監査済財務諸表には含まれない（非財務的な）説明や解釈を含んでいるため、融資や投資を決定する際に重要な役割を果たす可能性がある。

また、不正のトライアングル理論の合理化ファクターとして、経営者のテキスト情報には経営者の価値観や信条が直接的反映されているので、テキスト情報から不正企業経営者に共通する特性を発見できる可能性が高い。また、テキスト分析は、テキスト情報が経営者によってどのように作られたかを考察することを容易にし、企業開示の属性とその背後にある経営者や企業の特性との相互作用の分析を可能にする。不正を予測するためには、このような経営者の意思決定プロセスに対する視点が重要である。

また、財務諸表データとは異なり、記述（テキスト）情報に関しては訂正報告書が提出されたとしても変更されずそのままデータベース上に開示されている。したがって、記述情報の場合は、財務諸表不正が反映されたままの状態が維持されるため、記述（テキスト）情報による不正検出は性能分析が安定的である。

そこで、テキスト情報に焦点を合わせた不正検出手法の開発が望まれる。特に、財務諸表不正を検出することを目的とした場合、どのようなテキスト情報を対象として、どのような説明変数を生成し、どのようなモデルで推定を行うのが好適であるかは未だ明らかにされていない。

本発明はこれらの問題を解決するためになされたものであり、企業又はその経営者が開示するテキスト情報に基づいて財務諸表不正の有無を推定する財務諸表不正推定装置、財務諸表不正推定方法及びプログラムを提供することを目的とする。

本発明の一実施形態において、財務諸表不正推定装置は、企業又はその経営者が開示するテキスト情報を分析して１以上の説明変数を生成するテキスト情報分析部と、前記説明変数と、前記企業にかかる財務諸表不正の有無と、の相関関係を示す学習済みモデル又は統計モデルを格納したモデル格納部と、前記テキスト情報分析部が生成した前記説明変数を、前記学習済みモデル又は前記統計モデルに入力し、前記企業にかかる財務諸表不正の有無を推定する不正推定部と、を有し、前記説明変数として前記テキスト情報の数字率を含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数として前記テキスト情報の表現力をさらに含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数として前記テキスト情報の漢字含有率又は学年をさらに含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数として前記テキスト情報の単語数をさらに含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数として前記テキスト情報の表現力、漢字含有率又は学年、単語数をさらに含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数として前記テキスト情報の単語の多様性及びトーンをさらに含む。
本発明の一実施形態において、財務諸表不正推定装置は、前記説明変数と、前記企業にかかる財務諸表不正の有無と、を入力して両者の相関関係を学習し、前記学習済みモデルを生成する機械学習部をさらに有し、前記機械学習部はアンサンブル学習により前記学習を行う。
本発明の一実施形態において、前記機械学習部は勾配ブースティング決定木（ＧｒａｄｉｅｎｔＢｏｏｓｔｉｎｇＤｅｃｉｓｉｏｎＴｒｅｅ）により前記学習を行う。
本発明の一実施形態において、前記機械学習部はランダムフォレストにより前記学習を行う。
本発明の一実施形態において、財務諸表不正推定装置は、前記テキスト情報としてＭＤ＆Ａ（Ｍａｎａｇｅｍｅｎｔ’ｓＤｉｓｃｕｓｓｉｏｎａｎｄＡｎａｌｙｓｉｓｏｆＦｉｎａｎｃｉａｌＣｏｎｄｉｔｉｏｎａｎｄＲｅｓｕｌｔｓｏｆＯｐｅｒａｔｉｏｎｓ）を使用する。
本発明の一実施形態において、財務諸表不正推定方法は、コンピュータにおいて実行される財務諸表不正推定方法であって、企業又はその経営者が開示するテキスト情報を分析して１以上の説明変数を生成するテキスト情報分析ステップと、前記テキスト情報分析ステップにおいて生成された前記説明変数を、前記説明変数と前記企業にかかる財務諸表不正の有無との相関関係を示す学習済みモデル又は統計モデルに入力し、前記企業にかかる財務諸表不正の有無を推定する不正推定ステップと、を有し、前記説明変数として数字率を含む。
本発明の一実施形態において、プログラムは、方法をコンピュータに実行させる。

本発明により、企業又はその経営者が開示するテキスト情報に基づいて財務諸表不正の有無を推定する財務諸表不正推定装置、財務諸表不正推定方法及びプログラムを提供することができる。

不適切な会計・経理の開示企業数を示すグラフである。財務諸表不正推定装置１の概略的なハードウェア構成を示すブロック図である。財務諸表不正推定装置１の概略的な機能構成を示すブロック図である。不正企業および非不正企業が開示するテキストの複雑さ（学年）を示す表である。不正企業群および非不正企業群２５社のｔ検定結果を示す表である。財務諸表不正推定装置１の動作例を示すフローチャートである。実験に使用した６つの説明変数を示す表である。ＲＯＣ曲線を示す図である。ＡＵＲＯＣを示す図である。実験に使用した６個の説明変数について、不正企業群と非不正企業群との間の有意差の有無を示す表である。６つの説明変数（漢字含有率、単語の多様性、数字率、単語数、トーン、表現力）を用いた場合における、学習済みモデルの評価指標を示す図である。決定木を用いた場合のＳＨＡＰ値の絶対値の平均を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。決定木を用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の絶対値の平均を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ランダムフォレストを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の絶対値の平均を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＸＧＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の絶対値の平均を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＬｉｇｈｔＧＢＭを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の絶対値の平均を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。ＣａｔＢｏｏｓｔを用いた場合のＳＨＡＰ値の分布を示すグラフである。４つの説明変数（漢字含有率、数字率、単語数、表現力）を用いた場合における、学習済みモデルの評価指標を示す図である。２つの説明変数（数字率、単語数）を用いた場合における、学習済みモデルの評価指標を示す図である。２つの説明変数（数字率、漢字含有率）を用いた場合における、学習済みモデルの評価指標を示す図である。２つの説明変数（数字率、表現力）を用いた場合における、学習済みモデルの評価指標を示す図である。１つの説明変数（数字率）のみを用いた場合における、学習済みモデルの評価指標を示す図である。数字率の有効性を検証するためのサンプルデータのヒストグラムを示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。数字率の有効性を検証するための対比実験の結果を示す図である。

本発明の実施の形態にかかる財務諸表不正推定装置１は、企業の財務諸表に関する不正の有無を推定する情報処理装置である。ここでいう財務諸表には、連結企業の場合の連結財務諸表、連結子会社をもたない単体の企業の場合の個別財務諸表を含む。財務諸表不正は、「財務諸表をミスリードすることを通して投資者や債権者の信頼を損なう、経営者によって関与された恣意的な不正」（ＥｌｌｉｏｔｔａｎｄＷｉｌｌｉｎｇｈａｍ１９８０）や、「企業の財務上の結果を意図的に不正表示することであり、投資者や債権者のような財務諸表利用者をだます目的で財務諸表の開示や金額を省略したり、意図的に不正表示したりすることによって達成されること」（Ｒａｖｉｓａｎｋａｒｅｔａｌ．２０１１；ＥＬＢａｎｎａｙｅｔａｌ．２０２１，６５０）と定義されている。本実施の形態では、企業または経営者が関与したり、指示したりすることによって投資者や債権者のような財務諸表利用者をミスリードする目的で財務諸表上の開示や金額を意図的に省略したり、不正表示したりすることと定義する。そこには循環取引などによって結果的に財務諸表上の実際の金額と異なる数値になる、売上や利益の架空計上など、財務諸表上に反映された不正も、財務諸表不正に含める。なお、財務諸表不正には、経営者や社員個人による不正、子会社（連結子会社）・関連会社による不正等の、財務諸表に反映されない不正は含まれない。

図１は、自社開示、金融庁・東京証券取引所などの公表資料に基づいて、東京商工リサーチが、上場企業、有価証券報告書の提出企業を対象に、「不適切な会計・経理」で過年度決算に影響が出た企業、今後影響が出る可能性を開示した企業数を集計したデータである（東京商工リサーチ．２０２１．２０２１年全上場企業「不適切な会計・経理の開示企業データ」調査に依拠して出願人が作成）。

図１では、当事者を、会社、子会社・関連会社、従業員、役員の４つに分類している。このうち、会社が当事者であるものは、「会社ぐるみの会計不正」を意味し、上の定義でいう財務諸表不正を示している（図１において最も濃色で示されている成分に相当）。なぜなら、会社ぐるみの会計不正だけが、財務諸表不正に反映され、その意図的な財務諸表不正を隠ぺいするために、経営者はテキスト情報を作成、開示するからである。

図２は、財務諸表不正推定装置１の概略的なハードウェア構成を示すブロック図である。財務諸表不正推定装置１は、ＣＰＵ１１、揮発性メモリ１３、不揮発性メモリ１４、インタフェース１５、バス２０、入出力装置７０を有する情報処理装置である。

ＣＰＵ１１（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）は、不揮発性メモリ１４に格納されたプログラムをバス２０を介して読み出し、プログラムに従った情報処理を実行することにより特有の機能を実現する。

不揮発性メモリ１４は、財務諸表不正推定装置１の電源の状態にかかわらず記憶状態が保持される記憶装置であり、例えばハードディスクやＳＳＤ等である。一般に、不揮発性メモリ１４に記憶されているプログラムやデータは、プログラム実行時に揮発性メモリ１３に展開される。

揮発性メモリ１３には、不揮発性メモリ１４から展開されたプログラムやデータをはじめ、一時的な計算データや入出力装置７０を介して入力又は出力されるデータ等が格納される記憶装置である。

入出力装置７０はディスプレイ等のデータ出力装置、キーボードやポインティングデバイス等のデータ入力装置、外部との通信を制御する通信インタフェース等を含む。ＣＰＵ１１から出力された表示データは、インタフェース１５を介してディスプレイに表示される。キーボードから入力された指令やデータは、インタフェース１５を介してＣＰＵ１１に渡される。通信インタフェースはＣＰＵ１１が出力する送信データをインタフェース１５により取得し、外部に対して出力する。また通信インタフェースは外部より受信データを取得し、インタフェース１５を介してＣＰＵ１１に引き渡す。

図３は、本発明の実施の形態にかかる財務諸表不正推定装置１の概略的な機能構成を示すブロック図である。財務諸表不正推定装置１は、テキスト情報入力部１０１、テキスト情報分析部１０２、不正推定部１０３を有する。また、必要に応じ機械学習部１０４を有する。

テキスト情報入力部１０１は、企業またはその経営者が開示するテキスト情報を取得する。以下にテキスト情報の一例を示すが、本発明はこれらの例に限定されるものでない。

テキスト情報として特に好適なのはＭＤ＆Ａ（ｍａｎａｇｅｍｅｎｔ’ｓｄｉｓｃｕｓｓｉｏｎａｎｄａｎａｌｙｓｉｓｏｆｆｉｎａｎｃｉａｌｃｏｎｄｉｔｉｏｎａｎｄｒｅｓｕｌｔｓｏｆｏｐｅｒａｔｉｏｎｓ）である。有価証券報告書内「経営者による財政状態及び経営成績の検討と分析」において、経営者により開示されるこのテキスト情報には、経営成績に重要な影響を与える要因についての分析や、資本の財務および資金の流動性にかかわる財源などの説明が含まれる。

なぜＭＤ＆Ａ開示に焦点を合わせるのかというと、第１に、金融庁が内容に関する指針を出しており、上場企業にとって開示が義務付けられた情報であり、多くの人が財務諸表とともに読んでいるからである。第２に、現在、ＭＤ＆Ａ開示は外部監査の対象となっていないが、ＭＤ＆Ａ開示は上場企業の財務実績に関する「インサイダーの視点」を提供するもので、ＭＤ＆Ａ開示は、経営者の正直性や財務情報との整合性だけでなく、「経営陣の倫理的価値観（ｔｏｎｅａｔｔｈｅｔｏｐ）」を評価する上で非常に重要な情報となっているからである。第３に、ＭＤ＆Ａ作成者（経営者）が、ＭＤ＆Ａに財務報告不正が反映されていることを知っていた可能性があり、何らかのストレスにさらされ、テキスト（文章）に影響が反映されている。そのため、ＭＤ＆Ａ開示に焦点を合わせることは有意義である。

加えて、ＭＤ＆Ａは形式が予め決まっているので情報の収集及び処理がしやすいこと、裁量が含まれる余地が小さいため定型的な処理に適していることが特徴である。

あるいは、テキスト情報はＣＥＯレターであっても良い。ＣＥＯレターは、アニュアルレポート、企業ウェブサイト等の電子媒体、又は株主通信等の紙媒体等において開示される投資家向けのメッセージであり、ＭＤ＆Ａに準ずる情報が含まれることが多い。ＣＥＯレターは、ＭＤ＆Ａに比べて裁量の余地が大きいため、経営者の考え、態度や価値観がより反映されやすいという特徴がある。

あるいは、テキスト情報は有価証券報告書に記載されたリスク情報であっても良い。

テキスト情報分析部１０２は、テキスト情報入力部１０１に入力されたテキスト情報を分析し、１以上の説明変数を生成する。以下に説明変数の一例を示すが、本発明はこれらに限定されるものではない。

財務諸表不正を実施した経営者は、テキスト情報において、財務諸表不正を投資者から隠したいという意図をもって戦略的に財務諸表不正を隠ぺいしようとする。そのような、経営者による財務諸表不正の隠蔽という戦略をあばくための理論として、難解化仮説（ＯｂｆｕｓｃａｔｉｏｎＨｙｐｏｔｈｅｓｉｓ）、情報操作理論（ＩｎｆｏｒｍａｔｉｏｎＭａｎｉｐｕｌａｔｉｏｎＴｈｅｏｒｙ）、対人欺瞞理論（ＩｎｔｅｒｐｅｒｓｏｎａｌＤｅｃｅｐｔｉｏｎＴｈｅｏｒｙ）の３つの理論がある。本実施の形態では、これらの理論に基づいていくつかの説明変数を定義する。

（１）難解化仮説
言語上の複雑性は情報量と難解化の２つの構成要素に分解できる。このうち情報量は情報の非対称性と負の相関があり、難解化は情報の非対称性と正の相関がある。ある研究によれば、赤字企業は、文章を難解にして業績不振を隠蔽する一方で、情報量を増やす開示を行う傾向がある。難解化仮説（ＯｂｆｕｓｃａｔｉｏｎＨｙｐｏｔｈｅｓｉｓ）とは、経営者が悪いニュースについては隠蔽したり、より前向きな情報を示したりすることによって投資者をミスリードするという仮説である。情報量については、企業または経営者が関与する財務諸表不正の検出が目的であること、Ｂａｄｎｅｗｓ自体が読みにくいということが別の研究で実証されていることから、本実施の形態では考慮しない。本実施の形態では、経営者の裁量がより働きやすいと考えられる難解化にのみ焦点を合わせる。

不正企業は非不正企業よりもテキストの複雑性（学年）が高く、投資者をミスリードさせる目的で難解化させる。例えば、不正なアニュアルレポートには、難解な単語、複雑な構文がより多く使用されていることがわかっている。不正企業は、発言の複雑性を高め、発言内容を難解にする。不正なアニュアルレポートには語彙の多様性が非不正のアニュアルレポートよりも高く、読みにくいという特徴がある。そこで、仮説Ｈ１ａ「不正企業経営者は、投資者をミスリードする目的で文章を難解化させるので、漢字含有率が高く、単語の多様性が高い。」を設定する。

仮説Ｈ１ａに基づき、テキスト情報分析部１０２は以下の説明変数を生成できる。
・漢字含有率：テキスト情報に出現する漢字の数を、カタカナの数、ひらがなの数、漢字の数の和で割った値。
・単語の多様性：テキスト情報に出現する単語の種類の数を単語数で割った値。ここで単語の種類の数とは、重複を除いた単語数のことである。
・学年：テキストの複雑さを示す「学年（Ｇｒａｄｅ）」は、“世の中に存在する日本語文章の難易度分布の中で、ある文章がどのような位置にあるのか”を示す指標である（Ｓａｔｏ２００８）。佐藤（２０１１）に依拠して、ＯＢＩソフトウェアで、バランスコーパスに基づく相対的な難易度を、日本の学校の学年に対応する１３段階に分けて、複雑度を測定する方法を用いている。すなわち、小学校１年次生（複雑さレベル１）から学年高等学校３年次生（複雑さレベル１２）、さらに大学（複雑さレベル１３）までの１３段階のうちどれかの学年で表示される（Ｓａｔｏ２００８）。

図４は、不正企業および非不正企業それぞれのテキストについて、複雑さを示す指標である学年を測定した結果である。Ｎａｋａｓｈｉｍａ（２０２３）の研究では、不正企業のテキストの複雑性は、非不正企業のテキストの複雑性よりも高いことがうかがえる。学年（Ｇｒａｄｅ）は、漢字含有率と相関が高いと思われ、難解化仮説に含まれることとなる。すなわち、漢字含有率の代替として、学年を説明変数として使用することが可能である。

（２）情報操作理論
情報操作理論によれば、受容者をミスリードする目的で提示する情報の量（情報量のコントロール）、質（情報の歪曲）、方法（曖昧なスタイルでの提示）、関連性（無関係な情報）を操作することによって、情報開示の一部または全部を利用することが可能である。不正検出研究として可読性を考察した研究Ｎａｋａｓｈｉｍａｅｔａｌ．（２０２２）によれば、不正企業と非不正企業間で長さ（文字数）に有意差は観察されていない。不正企業は、財務諸表数値に虚偽があり、その虚偽、特に数字や単語数を隠ぺいすることが予想できる。そこで、仮説Ｈ１ｂ「不正企業経営者は、虚偽の数字を示すことができず、隠蔽するので、非不正企業よりも数字率および単語数が低くなる。」を設定する。

仮説Ｈ１ｂに基づき、テキスト情報分析部１０２は以下の説明変数を生成できる。
・数字率：テキスト情報に出現する全ての文字に占める数字の割合。
・単語数：テキスト情報を単語に分割した際の単語の数。

（３）対人欺瞞理論
ある研究によれば、不正なＭＤ＆Ａは、真実のＭＤ＆Ａに比べ、平均して３倍以上のポジティブなセンチメントと４倍以上のネガティブなセンチメントを含んでおり、このことは、不正なＭＤ＆Ａでは、ポジティブとネガティブの両方のセンチメントがより顕著に使用されていることを示唆している。不正企業はより印象管理に従事し、だましてよりポジティブに企業を描写する。実際に、不正企業経営者はポジティブニュースを大げさにしたり、ネガティブなニュースを最小化したり隠蔽したりして誤った印象を伝えていることが発見されている。

対人欺瞞理論によれば、不正実行者は、特定性（Ｓｐｅｃｉｆｉｃｉｔｙ）を低下させ、包括的な用語を用いることによって、文書に曖昧さを加え、責任を拡散しようとする。したがって、不正企業経営者は、ＭＤ＆Ａを曖昧にし、責任追及から逃れようと、表現力を低くすることが予想できる。そこで、仮説Ｈ１ｃ「不正企業経営者は、ポジティブな用語が少なく、ネガティブな用語が多く、また、表現力が低い。」を設定する。

仮説Ｈ１ｃに基づき、テキスト情報分析部１０２は以下の説明変数を生成できる。
・トーン：テキスト情報に出現するポジティブ用語の数からネガティブ用語の数を引いたものを、ポジティブ用語の数とネガティブ用語の数の和で割った値。ここで、ポジティブ用語及びネガティブ用語の数は以下の手順で測定できる。まず、テキスト情報としての日本語の文章を単語ごとに切断してから、品詞を判断する。そして、辞書を参照し、ポジティブ用語、ネガティブ用語に相当する単語が文章中にいくつあるのかを算定する。辞書は、公知の単語感情極性対応表を使用できる。
・表現力：形容詞の数と副詞の数の和を名詞の数と動詞の数の和で割った値。

不正推定部１０３は、テキスト情報分析部１０２が生成した１以上の説明変数を取得し、これをモデル格納部１０３１に格納された推定モデルに入力する。推定モデルは、説明変数と財務諸表不正の有無との相関関係を示す学習済みモデル１０３１１又は統計モデル１０３１２である。推定モデルは、説明変数を入力すると、予め定義された相関関係に照らし、財務諸表不正の有無を示す目的変数を出力する。本実施の形態では、目的変数は２値（不正あり又はなし）とした。なお、本発明はこれに限定されるものではなく、例えば財務諸表に不正がある可能性を示す数値等を目的変数としても良い。

不正推定部１０３は、統計モデル１０３１２を用いて推定を行う場合は、ロジスティック回帰分析をはじめとする公知の統計分析手法を採用することができる。

一方、学習済みモデル１０３１１を用いて推定を行う場合、典型的には機械学習部１０４が予め学習済みモデルを生成する必要がある。

機械学習部１０４は、任意の機械学習アルゴリズムに従って、テキスト情報分析部１０２が生成した１以上の説明変数と、財務諸表不正の有無を示す目的変数との相関関係を学習する。機械学習部１０４は、大量の学習用データ（テキスト情報分析部１０２が生成した１以上の説明変数と、財務諸表不正の有無を示す目的変数とのセット）を繰り返し入力し、学習過程を繰り返し実行する。このように学習過程を繰り返し実行することにより、１以上の説明変数と、財務諸表不正の有無を示す目的変数との相関性を示す学習済みモデルが構築される。学習済みモデルが示す相関性は、学習過程が進むにつれて徐々に信頼性を増してゆく。十分に信頼できる水準の学習済みモデルが構築されると、その学習モデルは、１以上の説明変数に対応する目的変数の値を推定するために使用できるものとなる。

不正推定部１０３は、機械学習部１０４が構築した学習済みモデルに基づき、１以上の説明変数に対応する目的変数すなわち財務諸表不正の有無を自動的かつ正確に求めることができる。すなわち不正推定部１０３は、テキスト情報分析部１０２が生成した１以上の説明変数を学習済みモデルに入力として与えることにより、学習済みモデルが財務諸表不正の有無を示す目的変数を自動的かつ正確に出力する。

本実施の形態では、機械学習手法として、コンペティション等で多く用いられるアンサンブル型学習手法を採用した。具体的には、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔが挙げられる。また、これらの手法に対する対比のため、決定木分析も行った。以降、目的変数は０又は１の２値であることを前提に説明する。

（１）決定木分析（分類）
単一の木構造を用いた教師あり機械学習による分析の総称である。本実施の形態で用いた他の手法（ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔ）と比較して、得られるモデルの精度では劣る傾向がある。しかしながら、モデルの木構造の可視化の点において他手法に勝る。

本実施の形態では、ｓｃｉｋｉｔ－ｌｅａｒｎに標準的に実装されている決定木分析手法の一種であるＣＡＲＴ（ＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＲｅｇｒｅｓｓｉｏｎＴｒｅｅｓ）を用いた。ＣＡＲＴは、各分岐点でデータを二分割する木（二分木）により分析を行う手法である。

（２）ランダムフォレスト
アンサンブル型学習手法の一種である。元の訓練データから重複を許しつつランダムにいくつかのデータを抽出し、新しい訓練データを構築する。その後、構築された新しい訓練データを元に決定木分析をおこなう。上記の操作を並列に行うことで複数のモデル（弱学習器）を得る。目的変数の推定の際には、複数の弱学習器から得られる出力値に基づいた多数決を行う。より多くの弱学習器が出力した推定結果を最終的な出力とする。この方法により、単一のモデルに比べ、過学習の危険性の軽減が期待される。

（３）ＸＧＢｏｏｓｔ
以降の手法もランダムフォレストと同様にアンサンブル型学習手法である。各弱学習器が木の構造を持っている点においてもランダムフォレストと類似する。しかし、弱学習器の構成（決定）法・集約法は大きく異なる。ランダムフォレストにおいては、過学習の抑制が目的であったが、以降の手法の主な目的は予測精度の向上である。一方で、以降説明する手法は決定木分析やランダムフォレストよりも、過学習が生じやすい手法である。

ＸＧＢｏｏｓｔは目的変数が１である確率を各弱学習器の推定値の総和を用いて推定する（厳密には、学習率と呼ばれるハイパーパラメータと各学習器の推定値の積の総和を用いるが、本説明では、学習率は常に１であると仮定する）。各学習器は逐次的に構築する。１番目の弱学習器は目的変数が１である確率を推定するが、ｎ番目（ｎは２以上の整数）の弱学習器は（ｎ－１）番目までの弱学習器の推定値の総和と真の値の間の誤差を推定する。木の構造を持つ各弱学習器における葉の分割については、情報利得を基準とする。ただし情報利得として、決定木分析においてよく用いられるエントロピーやジニ係数とは異なるものを用いる。詳細は割愛するが、真の値との誤差の最小化を達成するような情報利得を用いている。なお、葉の分割を検討する順番はｌｅｖｅｌ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈに則る。すなわち、同じ深さの全ての葉について分割を検討しきった後に、１つ深い枝の分割の検討に移るといった手順をとる。

（４）ＬｉｇｈｔＧＢＭ
ＬｉｇｈｔＧＢＭは、学習アルゴリズムにおいて、ＸＧＢｏｏｓｔと類似する手法である。目的変数が１である確率を、木の構造を持つ弱学習器たちの推定値の総和で推定する点において、ＸＧＢｏｏｓｔと変わらない。ＸＧＢｏｏｓｔとの主な違いは各回帰木の構成方法にある。

一点目の違いは各特徴量をヒストグラム化している点である。ヒストグラム化により厳密な枝分かれを探さずに済み、計算コストを抑えることが可能である。二点目の違いは「ｌｅｖｅｌ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈ」ではなく「ｌｅａｆ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈ」により、木の構造を決定している点である。両者の違いは葉の分割を検討する順番にある。なお、木を完全に成長させた場合には同じ木が構成される。Ｌｅａｆ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈは、情報利得の最も大きくなる枝から順に伸ばす構成方法である。ｌｅａｆ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈを用いる場合は、「ｐｒｅ－ｐｒｕｎｉｎｇ」と呼ばれる剪定アルゴリズムを適用することができる。ｐｒｅ－ｐｒｕｎｉｎｇとはさらなる分岐を行うことで予測誤差が下がるなら分岐を行い、そうではないのならそこで木の成長を止めるアルゴリズムである。Ｐｒｅ－ｐｒｕｎｉｎｇはｐｏｓｔ－ｐｒｕｎｉｎｇに比較して精度が落ちる可能性があるものの、計算コストが抑えることができる。なお、ｐｏｓｔ－ｐｒｕｎｉｎｇとは決定木を完全に成長させてから、最も予測誤差の小さい状態を選択する剪定方法である。

ヒストグラム化、ｌｅａｆ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈ及びｐｒｅ－ｐｒｕｎｉｎｇにより、ｌｉｇｈｔＧＢＭの計算コストはＸＧＢｏｏｓｔよりも「軽く」なる傾向がある。ただし、ｌｅａｆ－ｗｉｓｅｔｒｅｅｇｒｏｗｔｈによる決定木は複雑になりやすく、過学習には注意が必要である。

（５）ＣａｔＢｏｏｓｔ
ＸＧＢｏｏｓｔやＬｉｇｈｔＧＢＭと同様に、ＣａｔＢｏｏｓｔも木の構造を持つ弱学習器たちの推定値の総和によって目的変数が１である確率を推定する手法である。勾配ブースティング決定木（ＧｒａｄｉｅｎｔＢｏｏｓｔｉｎｇＤｅｃｉｓｉｏｎＴｒｅｅ）の一種である。各弱学習器を構築する際に、訓練データからランダムにサンプリングしたデータを用いるため、ＸＧＢｏｏｓｔやＬｉｇｈｔＧＢＭよりも過学習を起こしにくい手法とされる。

＜実験＞
本実施の形態にかかる財務諸表不正推定装置１を使用し、実在する企業が開示したテキスト情報を対象として、財務諸表不正の有無を推定する実験を行なった。その手法と結果を以下に示す。

（１）サンプル選択とデータ
分析対象企業は、企業はすべて日本取引所に上場している企業３４８３社のうち、銀行業・保険業（１６５社）、米国基準およびＩＦＲＳ基準その他基準（３２０社）を除外した、日本基準を適用している企業２９９８社である。不正企業群は、東京商工リサーチ（株）による『２０２０年不適切な会計・経理」（以下、不適切会計）を開示した上場企業』の２０１９年に不不適切会計とされた会社７３社のうち、会社ぐるみの不正３１社、従業員関連の不正が１２社、上級経営者個人の不正が３社、子会社関連不正が２７社である。会社ぐるみの不正３１社のうち、６社が上場廃止企業であり、最終サンプルは２５社である。業種と総資産および売上高の類似した企業群をペアの非不正企業としている。図５は、不正企業群２５社、非不正企業群２５社のｔ検定結果を示している。図５から、不正企業、非不正企業の総資産、売上高に有意差がなく、ペアサンプルとして妥当であることがわかる。

当該不正企業群、非不正企業群のＭＤ＆Ａ開示データは、２０１３年から２０１９年の７年分のＭＤ＆Ａを含めている。過去７年分のＭＤ＆Ａ開示で分析するのは、東芝やオリンパスの不正事例から発覚した年度から遡って最短７年間は不正に関与しているからである。

（２）分析手法
（２－１）機械学習による財務諸表不正推定の試行
図６に示すフローチャートに従って、財務諸表推定装置１を使用し、機械学習による不正検知モデルの生成及び当該モデルによる財務諸表不正推定を試行した。機械学習手法としては決定木、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔを用いた。

（２－１－１）学習フェーズ
Ｓ１０１：テキスト情報の取得
テキスト情報入力部１０１が、企業またはその経営者が開示するテキスト情報を取得する。本実験では、（１）サンプル選択とデータにおいて示した企業５０社の２０１３年度から２０１８年度までの６年分のＭＤ＆Ａを学習用のテキスト情報として収集、入力した。

Ｓ１０２：説明変数の生成
テキスト情報分析部１０２は、テキスト情報入力部１０１に入力されたテキスト情報を分析し、説明変数を生成する。本実験では、図７に示す６つの説明変数を生成した。

Ｓ１０３：学習済みモデルの生成
機械学習部１０４は、Ｓ１０２で生成された６つの説明変数と、財務諸表不正の有無を示す目的変数（２値）と、のセットを学習用データとして繰り返し入力し、学習済みモデルを生成する。本実験では、機械学習手法として決定木、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔの５種類を採用し、それぞれ学習済みモデルを生成した。

（２－１－２）推定フェーズ
Ｓ１０４：テキスト情報の取得
テキスト情報入力部１０１が、企業またはその経営者が開示するテキスト情報を取得する。本実験では、（１）サンプル選択とデータにおいて示した企業５０社の２０１９年度のＭＤ＆Ａを推定用のテキスト情報として収集、入力した。

Ｓ１０５：説明変数の生成
テキスト情報分析部１０２は、テキスト情報入力部１０１に入力されたテキスト情報を分析し、説明変数を生成する。本実験では、図７に示す６つの説明変数を生成した。

Ｓ１０６：財務諸表不正の有無の推定
不正推定部１０３は、Ｓ１０５で生成された６つの説明変数をＳ１０３で生成された学習済みモデルに入力し、財務諸表不正の有無を示す目的変数（２値）を推定結果として出力する。

（２－２）評価
複数の機械学習手法（決定木、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔ）により生成された分類器の有効性を評価するため、Ａｃｃｕｒａｃｙ、Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、Ｆｍｅａｓｕｒｅ、ＡＵＲＯＣを算出する。Ａｃｃｕｒａｃｙは、正しく分類されたＭＤ＆Ａ開示の総数を分析されたＭＤ＆Ａ開示の総数で除したものである。Ｐｒｅｃｉｓｉｏｎは、不正と分類されたＭＤ＆Ａ開示の総数に対する、不正と正しく分類されたＭＤ＆Ａ開示数の比率である。Ｒｅｃａｌｌは、実際の不正のＭＤ＆Ａ開示の総数に対する、不正と正しく分類されたＭＤ＆Ａ開示の数の比率である。ＲｅｃａｌｌはＴｒｕｅＰｏｓｉｔｉｖｅＲａｔｅ（真陽性率）とも呼ばれる。以下では、ＴｒｕｅＰｏｓｉｔｉｖｅＲａｔｅをＴＰＲと略記する。対して、実際の非不正のＭＤ＆Ａ開示の総数に対する、不正と誤って分類されたＭＤ＆Ａ開示の数の比率をＦａｌｓｅＰｏｓｉｔｉｖｅＲａｔｅ（偽陽性率）と呼ぶ。以下では、ＦａｌｓｅＰｏｓｉｔｉｖｅＲａｔｅをＦＰＲと略記する。

Ｆｍｅａｓｕｒｅは、それぞれの加重調和平均を用いてＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌを１つのメトリックスに統合したものである。数値が高いほど推定性能が高いことを意味する（Ｈｕｍｐｈｅｒｙｅｔａｌ．２０１１，５９１）。

ＡＵＲＯＣの説明のために、本実験で用いる機械学習モデルたちの推定方法について述べる。本実験において、機械学習モデルたちは不正を行っている確率をまず算出する。予め閾値（通常は０．５）を設定しておき、確率が閾値以上の場合に不正と分類している。閾値を低くすればするほど、機械学習モデルたちによって不正と分類される傾向が強まる。その結果ＴＰＲは高まるものの、ＦＰＲも高まる。反対に、閾値を低くすればするほど、ＦＰＲは下がるがＴＰＲも下がってしまう。閾値を０から１の間で変化させた際のＴＰＲとＦＰＲの関係をグラフで表したものをＲＯＣ曲線と呼ぶ（図８、曲線ａ）。ランダムな分類（例えば、０以上１以下の間の値を取る乱数を不正の確率にした分類）を行った際には、図８の直線ｂのようなＲＯＣ曲線になる。ＴＰＲ＝１かつＦＰＲ＝０が成り立つような閾値が存在する場合はその閾値で分類を行うことで、ＡｃｃｕｒａｃｙもＰｒｅｃｉｓｉｏｎもＲｅｃａｌｌも１になるような理想的な分類を行うことができる。このような閾値が存在するような、理想的な場合は図８の線ｃのようなＲＯＣ曲線が得られる。

ＡＵＲＯＣ（ＡｒｅａＵｎｄｅｒｔｈｅＲＯＣｃｕｒｖｅ）とはＲＯＣ曲線がどれほど理想的なＲＯＣ曲線（図８の線ｃ）に近いかを測る尺度である。ＡＵＲＯＣは図９において示す領域ｄ（曲線ｂとＴＰＲ＝０に挟まれた領域）の面積で与えられる。ＲＯＣ曲線が図８、図９の線ｃに近づくほど、ＡＵＲＯＣ曲線の値は大きくなり、理想的な分類が行われた際のＡＵＲＯＣは１である。すなわち、ＡＵＲＯＣ曲線の値が１に近いほど、機械学習モデルの推定性能が高いと示唆される。また、ランダムな分類が行われた場合、ＡＵＲＯＣは０．５になる。すなわち、ＡＵＲＯＣが０．５を超えていれば、機械学習モデルがランダムな分類より高い推定能力を持つことが示唆される。

（３）分析結果
（３－１）統計学的検定の結果
本実験で用いる６個の説明変数に対して、不正企業の群と非不正企業の群の間に有意差があるかをマンホイットニーのＵ検定（有意水準５％）によって調べた。結果を図１０に示す。不正企業は、非不正企業と比べて、漢字含有率が高く、単語の多様性が高く、数字率が低く、単語数が低く、トーンが低く、表現力が低いことがわかった。ただし、数字率については有意差が認められなかった。しかしながら、後述の（３－２）モデルの評価により、数字率は本実験の機械学習モデルの推定に強く寄与していることがわかった。

（３－２）モデルの評価
本実験では、２０１３年度から２０１８年度までのデータを訓練データ、２０１９年度のデータをテストデータとした。また、説明変数として図７に示す６つの説明変数を使用した。

決定木、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔを用いた不正検知モデルの評価指標（Ａｃｃｕｒａｃｙ、Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、Ｆｍｅａｓｕｒｅ、ＡＵＲＯＣ）はそれぞれ図１１のとおりであった。なお、各評価指標の値はテストデータに対して算出したものである。

また、これらのモデルのＳＨＡＰ値はそれぞれ図１２乃至図１６の通りであった。

図１２Ａ乃至図１２Ｇは決定木を使って生成したモデルのＳＨＡＰ値を示す図である。図１２Ａは、６つの説明変数「数字率」「単語数」「漢字含有率」「表現力」「単語の多様性」「トーン」のＳＨＡＰ値の絶対値の平均を比較したグラフである。図１２Ｂ乃至図１２Ｆは、上記６つの説明変数をそれぞれ使用した場合のＳＨＡＰ値の分布を示したグラフである。図１２Ｂは標準化された「数字率」に対するＳＨＡＰ値の分布、図１２Ｃは標準化された「単語数」に対するＳＨＡＰ値の分布、図１２Ｄは標準化された「漢字含有率」に対するＳＨＡＰ値の分布、図１２Ｅは標準化された「表現力」に対するＳＨＡＰ値の分布、図１２Ｆは標準化された「単語の多様性」に対するＳＨＡＰ値の分布、図１２Ｇは標準化された「トーン」に対するＳＨＡＰ値の分布を示している。

図１３Ａはランダムフォレストを使って生成したモデルのＳＨＡＰ値を示す図である。図１３Ａは、６つの説明変数「数字率」「単語数」「漢字含有率」「表現力」「単語の多様性」「トーン」のＳＨＡＰ値の絶対値の平均を比較したグラフである。図１３Ｂ乃至図１３Ｆは、上記６つの説明変数をそれぞれ使用した場合のＳＨＡＰ値の分布を示したグラフである。図１３Ｂは標準化された「数字率」に対するＳＨＡＰ値の分布、図１３Ｃは標準化された「単語数」に対するＳＨＡＰ値の分布、図１３Ｄは標準化された「漢字含有率」に対するＳＨＡＰ値の分布、図１３Ｅは標準化された「表現力」に対するＳＨＡＰ値の分布、図１３Ｆは標準化された「単語の多様性」に対するＳＨＡＰ値の分布、図１３Ｇは標準化された「トーン」に対するＳＨＡＰ値の分布を示している。

図１４ＡはＸＧＢｏｏｓｔを使って生成したモデルのＳＨＡＰ値を示す図である。図１４Ａは、６つの説明変数「数字率」「単語数」「漢字含有率」「表現力」「単語の多様性」「トーン」のＳＨＡＰ値の絶対値の平均を比較したグラフである。図１４Ｂ乃至図１４Ｆは、上記６つの説明変数をそれぞれ使用した場合のＳＨＡＰ値の分布を示したグラフである。図１４Ｂは標準化された「数字率」に対するＳＨＡＰ値の分布、図１４Ｃは標準化された「単語数」に対するＳＨＡＰ値の分布、図１４Ｄは標準化された「漢字含有率」に対するＳＨＡＰ値の分布、図１４Ｅは標準化された「表現力」に対するＳＨＡＰ値の分布、図１４Ｆは標準化された「単語の多様性」に対するＳＨＡＰ値の分布、図１４Ｇは標準化された「トーン」に対するＳＨＡＰ値の分布を示している。

図１５ＡはＬｉｇｈｔＧＢＭを使って生成したモデルのＳＨＡＰ値を示す図である。図１５Ａは、６つの説明変数「数字率」「単語数」「漢字含有率」「表現力」「単語の多様性」「トーン」のＳＨＡＰ値の絶対値の平均を比較したグラフである。図１５Ｂ乃至図１５Ｆは、上記６つの説明変数をそれぞれ使用した場合のＳＨＡＰ値の分布を示したグラフである。図１５Ｂは標準化された「数字率」に対するＳＨＡＰ値の分布、図１５Ｃは標準化された「単語数」に対するＳＨＡＰ値の分布、図１５Ｄは標準化された「漢字含有率」に対するＳＨＡＰ値の分布、図１５Ｅは標準化された「表現力」に対するＳＨＡＰ値の分布、図１５Ｆは標準化された「単語の多様性」に対するＳＨＡＰ値の分布、図１５Ｇは標準化された「トーン」に対するＳＨＡＰ値の分布を示している。

図１６ＡはＣａｔＢｏｏｓｔを使って生成したモデルのＳＨＡＰ値を示す図である。図１６Ａは、６つの説明変数「数字率」「単語数」「漢字含有率」「表現力」「単語の多様性」「トーン」のＳＨＡＰ値の絶対値の平均を比較したグラフである。図１６Ｂ乃至図１６Ｆは、上記６つの説明変数をそれぞれ使用した場合のＳＨＡＰ値の分布を示したグラフである。図１６Ｂは標準化された「数字率」に対するＳＨＡＰ値の分布、図１６Ｃは標準化された「単語数」に対するＳＨＡＰ値の分布、図１６Ｄは標準化された「漢字含有率」に対するＳＨＡＰ値の分布、図１６Ｅは標準化された「表現力」に対するＳＨＡＰ値の分布、図１６Ｆは標準化された「単語の多様性」に対するＳＨＡＰ値の分布、図１６Ｇは標準化された「トーン」に対するＳＨＡＰ値の分布を示している。

ＳＨＡＰ値は、各機械学習モデルが目的変数を出力するに際し、各説明変数の影響をどれだけ受けたか（寄与度）を示している。ＳＨＡＰ値の絶対値の平均について説明変数間の順位をつけると、「数字率」は５つのモデルのいずれにおいても１位であった。一方、「トーン」と「単語の多様性」は、５つのモデルのいずれについても、４位以下にしかならなかった。図１７は、推定にあまり寄与していないと思われるこれらの説明変数（「トーン」及び「単語の多様性」）を除いた場合のモデルの評価指標を示す表である。図１７に示すように、決定木を除いた手法については６変数の場合と遜色ない推定精度を示した。

なお、説明変数の機械学習モデルへの貢献を示す指標としてＳＨＡＰ値が有用であることは、例えば非特許文献３１及び３２に示すように当業者にとっての技術常識である。仮に、ＳＨＡＰ値が高くてもその説明変数の寄与度が低くなる例外的なケースが存在しうるとしても、本実験がその例外にあたると推察できるような合理的な理由は見出せない。

「トーン」と「単語の多様性」を除いた４つの説明変数のうち、「数字率」とその他の１つの説明変数を用いて、２つの説明変数のみから推定を行った。比較的少ない説明変数であっても多少の推定精度を示した。
図１８は「数字率」及び「単語数」のみを用いた際のモデルの評価指標である。
図１９は「数字率」及び「漢字含有率」のみを用いた際のモデルの評価指標である。
図２０は「数字率」及び「表現力」のみを用いた際のモデルの評価指標である。
説明変数として、「数字率」のみを用いた際の評価は図２１の通りであった。

第１に、機械学習を用いた推定においては、説明変数のうち数字率の寄与度が最も高く、数字率のみを用いた場合でも一定の推定精度が得られることがわかった。従来の財務諸表不正推定手法では、数多くの説明変数を生成して推定に使用するものが主流であった。一方、本発明において新たに導入された説明変数である数字率を使用すれば、１つの説明変数で一定の精度を有する財務諸表不正の推定が可能である。すなわち、数字率という新たな概念を推定処理に使用することによって、従来よりも計算リソースを大幅に抑制しつつも、推定精度を確保することができるようになった。

また、数字率に、寄与度が比較的高い表現力、漢字含有率、単語数の少なくともいずれか１つを組み合わせることで、数字率のみを用いた場合に比べ推定精度をさらに上げられることがわかった。一方、トーン、単語の多様性の寄与度は比較的低いことがわかった。

第２に、不正検知モデル（決定木、ランダムフォレスト、ＸＧＢｏｏｓｔ、ＬｉｇｈｔＧＢＭ、ＣａｔＢｏｏｓｔ）の性能を比較したところ、６変数の場合はランダムフォレストが最も性能が高いことがわかった。なお、ハイパーパラメータをチューニングすればＣａｔＢｏｏｓｔの性能が最も高くなる可能性がある。

このように、（３－１）に示した統計学的検定と、（３－２）に示した機械学習モデルの評価とでは、数字率に対する評価が異なる結果となった。しかしながら、この結果は説明変数としての数字率の有用性を否定するものではない。

図２２は、サンプルデータにおける非不正企業と不正企業の分布を示すヒストグラムである。淡色は非不正企業の件数、濃色は不正企業の件数を示す。このサンプルデータでは、数字率は０から０．１７５以下の範囲に分布している。数字率の範囲を細分化した各レンジにおける非不正企業、不正企業の件数は０から３５件の範囲に分布している。

このヒストグラムでは、数字率の増加に対する非不正企業の増減傾向と、不正企業の増減傾向とが異なる。非不正企業では、０．０７５をピークとして増加から減少に転じる比較的きれいな分布が見られる。一方、不正企業では０．０６３をピークとして増加から減少に転じた後、０．１００では再度増加に転じ、０．１２５では再度減少に転じるという特徴的な動きが見られる。

統計的検定は、比較したい２群の増減傾向を全体的に捉えて比較する。そのため、局所的な増減傾向の相違は捨象されうる。このサンプルデータのように、一方の群が特徴的かつ局所的な増減傾向を有していたとしても、その相違は有意差としては顕現しにくい。

一方、機械学習は、より局所的に数字率を捉えて推定を行う。例えば数字率０．１００の場合と数字率０．１１３の場合とで異なる推定を行うことが可能である。したがって、このようなサンプルデータを用いた場合であっても比較的正確に判定を行うことができる。

本実験において、統計学的検定においては有意差が認められなかったものの、機械学習による数字率を用いた場合に一定の推定精度が得られたのは、このような要因によるものと考えられる。

図１２Ｂ、図１３Ｂ、図１４Ｂ、図１５Ｂ及び図１６Ｂによれば、本実験にかかるサンプルデータは、数字率が高いほど不正である可能性は低く、数字率が低いほど不正である可能性が高いものであることがわかる。そして、数字率が中間レンジにある場合は不正、非不正のいずれかである可能性が入り乱れていることがわかる。これは、サンプルデータが上述のヒストグラムのような分布をしている場合にみられる特徴である。このような特徴を有するデータは、統計的検定では有意差が出なくても、機械学習による推定では一定の精度を示しうるケースにあたる。

このように、ある説明変数について統計的検定では有意差が出ない場合であっても、機械学習では一定の推定精度が得られる場合がある。上述のように、本実験では、数字率を用いた場合の機械学習モデルのＡＵＲＯＣの値は０．５を超え、ランダムな分類より高い推定能力を持つことを示唆している。また、機械学習モデルが目的変数を出力するに際し、各説明変数の影響をどれだけ受けたか（寄与度）を示すＳＨＡＰ値は、数字率が最も高い。したがって、本実験において使用したような数字率を説明変数とする機械学習モデルは、財務諸表不正の有無を実用的な精度で推定できると結論づけることができる。

＜対比実験１＞
財務諸表不正推定における数字率の有用性をさらに検証するため、数字率を用いずに他の１以上の説明変数を用いた場合の機械学習モデルのＡＵＲＯＣ値と、数字率を併用した場合のＡＵＲＯＣ値との対比実験を行った（対比実験１）。対比実験１の結果を図２３に示す。なお、検証に用いた機械学習アルゴリズムに内在するランダム性により、図１７乃至図２２において示されている値とは多少の差異がある。

図２３Ａ乃至図２３Ｄにおいて、「変数リスト」は機械学習モデルが用いる説明変数を示している。ここには数字率が含まれていない。

図２３Ａにおいて、「ＲａｎｄｏｍＦ＿ＡＵＲＯＣ」は、ランダムフォレストを用い、「変数リスト」に示す説明変数（数字率は含まれていない）のみを用いて生成したモデルのＡＵＲＯＣ値を示している。「ＲａｎｄｏｍＦ＿ＡＵＲＯＣｗｉｔｈ数字率」は、同じくランダムフォレストを用い、「変数リスト」に示す説明変数と数字率とを用いて生成したモデルのＡＵＲＯＣ値を示している。

図２３Ｂにおいて、「ＸＧＢＣｌａｓ＿ＡＵＲＯＣ」は、ＸＧＢｏｏｓｔを用い、「変数リスト」に示す説明変数（数字率は含まれていない）のみを用いて生成したモデルのＡＵＲＯＣ値を示している。「ＸＧＢＣｌａｓ＿ＡＵＲＯＣｗｉｔｈ数字率」は、同じくＸＧＢｏｏｓｔを用い、「変数リスト」に示す説明変数と数字率とを用いて生成したモデルのＡＵＲＯＣ値を示している。

図２３Ｃにおいて、「ＬＧＢＭＣｌａ＿ＡＵＲＯＣ」は、ＬｉｇｈｔＧＢＭを用い、「変数リスト」に示す説明変数（数字率は含まれていない）のみを用いて生成したモデルのＡＵＲＯＣ値を示している。「ＬＧＢＭＣｌａ＿ＡＵＲＯＣｗｉｔｈ数字率」は、同じくＬｉｇｈｔＧＢＭを用い、「変数リスト」に示す説明変数と数字率とを用いて生成したモデルのＡＵＲＯＣ値を示している。

図２３Ｄにおいて、「＜ｃａｔｂｏｏ＿ＡＵＲＯＣ」は、ＣａｔＢｏｏｓｔを用い、「変数リスト」に示す説明変数（数字率は含まれていない）のみを用いて生成したモデルのＡＵＲＯＣ値を示している。「＜ｃａｔｂｏｏ＿ＡＵＲＯＣｗｉｔｈ数字率」は、同じくＣａｔＢｏｏｓｔを用い、「変数リスト」に示す説明変数と数字率とを用いて生成したモデルのＡＵＲＯＣ値を示している。

図２３Ａ乃至図２３Ｄのいずれにおいても、他の説明変数に数字率を加えるとＡＵＲＯＣ値が増加し、推定精度が向上することがわかる。

＜対比実験２＞
さらなる検証のため、説明変数として数字率を含むグループと、数字率を含まないグループとのＡＵＲＯＣ値を比較する対比実験を行った（対比実験２）。対比実験２では、２つのグループの説明変数の数は同じになるようにした。対比実験２の結果を図２４及び図２５に示す。なお、検証に用いた機械学習アルゴリズムに内在するランダム性により、図１７乃至図２２において示されている値とは多少の差異がある。

図２４Ａは、１つの説明変数を使用した場合において観測されたＡＵＲＯＣ値の一覧である。「変数リスト」は、機械学習モデルの生成に使用された説明変数（６パターン）を示している。本実験では、６つの説明変数「トーン」「単語数」「漢字含有率」「表現力」「数字率」「多様性」のうち、いずれか１つの説明変数のみを使用した。モデル生成にあたって使用した機械学習手法は、ランダムフォレスト（ＲａｎｄｏｍＦ＿ＡＵＲＯＣ）、ＸＧＢｏｏｓｔ（ＸＧＢＣｌａｓ＿ＡＵＲＯＣ）、ＬｉｇｈｔＧＢＭ（ＬＧＢＭＣｌａ＿ＡＵＲＯＣ）、ＣａｔＢｏｏｓｔ（＜ｃａｔｂｏｏ＿ＡＵＲＯＣ）の４種類である。これらの組み合わせ（２４パターン）についてそれぞれＡＵＲＯＣ値を測定した。

図２５Ａは、図２４Ａの「変数リスト」に挙げられた６パターンを、数字率を含むグループと含まないグループとに分別し、それぞれのグループにおけるＡＵＲＯＣ値の統計量を算出、比較した表である。数字率を含むグループは、数字率を含まないグループと比較して少なくともＡＵＲＯＣ値の平均値及び中央値が高い。このことから、全体的な傾向として数字率を含むグループの方が推定精度が高いと評価できる。

図２４Ｂは、２つの説明変数を使用した場合において観測されたＡＵＲＯＣ値の一覧である。「変数リスト」は、機械学習モデルの生成に使用された説明変数の組合せ（１５パターン）を示している。本実験では、６つの説明変数「トーン」「単語数」「漢字含有率」「表現力」「数字率」「多様性」のうち、異なる２つの説明変数を組合せて使用した。モデル生成にあたって使用した機械学習手法は、ランダムフォレスト（ＲａｎｄｏｍＦ＿ＡＵＲＯＣ）、ＸＧＢｏｏｓｔ（ＸＧＢＣｌａｓ＿ＡＵＲＯＣ）、ＬｉｇｈｔＧＢＭ（ＬＧＢＭＣｌａ＿ＡＵＲＯＣ）、ＣａｔＢｏｏｓｔ（＜ｃａｔｂｏｏ＿ＡＵＲＯＣ）の４種類である。これらの組み合わせ（６０パターン）についてそれぞれＡＵＲＯＣ値を測定した。

図２５Ｂは、図２４Ｂの「変数リスト」に挙げられた１５パターンを、数字率を含むグループと含まないグループとに分別し、それぞれのグループにおけるＡＵＲＯＣ値の統計量を算出、比較した表である。数字率を含むグループは、数字率を含まないグループと比較してＡＵＲＯＣ値の平均値、中央値、最大値のいずれもが大きい。このことから、全体的な傾向としてもピーク性能としても、数字率を含むグループの方が推定精度が高いと評価できる。

図２４Ｃは、３つの説明変数を使用した場合において観測されたＡＵＲＯＣ値の一覧である。「変数リスト」は、機械学習モデルの生成に使用された説明変数の組合せ（２０パターン）を示している。本実験では、６つの説明変数「トーン」「単語数」「漢字含有率」「表現力」「数字率」「多様性」のうち、異なる３つの説明変数を組合せて使用した。モデル生成にあたって使用した機械学習手法は、ランダムフォレスト（ＲａｎｄｏｍＦ＿ＡＵＲＯＣ）、ＸＧＢｏｏｓｔ（ＸＧＢＣｌａｓ＿ＡＵＲＯＣ）、ＬｉｇｈｔＧＢＭ（ＬＧＢＭＣｌａ＿ＡＵＲＯＣ）、ＣａｔＢｏｏｓｔ（＜ｃａｔｂｏｏ＿ＡＵＲＯＣ）の４種類である。これらの組み合わせ（１２０パターン）についてそれぞれＡＵＲＯＣ値を測定した。

図２５Ｃは、図２４Ｃの「変数リスト」に挙げられた２０パターンを、数字率を含むグループと含まないグループとに分別し、それぞれのグループにおけるＡＵＲＯＣ値の統計量を算出、比較した表である。数字率を含むグループは、数字率を含まないグループと比較して少なくともＡＵＲＯＣ値の平均値及び中央値が高い。このことから、全体的な傾向として数字率を含むグループの方が推定精度が高いと評価できる。

図２４Ｄは、４つの説明変数を使用した場合において観測されたＡＵＲＯＣ値の一覧である。「変数リスト」は、機械学習モデルの生成に使用された説明変数の組合せ（１５パターン）を示している。本実験では、６つの説明変数「トーン」「単語数」「漢字含有率」「表現力」「数字率」「多様性」のうち、異なる４つの説明変数を組合せて使用した。モデル生成にあたって使用した機械学習手法は、ランダムフォレスト（ＲａｎｄｏｍＦ＿ＡＵＲＯＣ）、ＸＧＢｏｏｓｔ（ＸＧＢＣｌａｓ＿ＡＵＲＯＣ）、ＬｉｇｈｔＧＢＭ（ＬＧＢＭＣｌａ＿ＡＵＲＯＣ）、ＣａｔＢｏｏｓｔ（＜ｃａｔｂｏｏ＿ＡＵＲＯＣ）の４種類である。これらの組み合わせ（６０パターン）についてそれぞれＡＵＲＯＣ値を測定した。

図２５Ｄは、図２４Ｄの「変数リスト」に挙げられた１５パターンを、数字率を含むグループと含まないグループとに分別し、それぞれのグループにおけるＡＵＲＯＣ値の統計量を算出、比較した表である。数字率を含むグループは、数字率を含まないグループと比較してＡＵＲＯＣ値の平均値、中央値、最大値のいずれもが大きい。このことから、全体的な傾向としてもピーク性能としても、数字率を含むグループの方が推定精度が高いと評価できる。

図２４Ｅは、５つの説明変数を使用した場合において観測されたＡＵＲＯＣ値の一覧である。「変数リスト」は、機械学習モデルの生成に使用された説明変数の組合せ（６パターン）を示している。本実験では、６つの説明変数「トーン」「単語数」「漢字含有率」「表現力」「数字率」「多様性」のうち、異なる５つの説明変数を組合せて使用した。モデル生成にあたって使用した機械学習手法は、ランダムフォレスト（ＲａｎｄｏｍＦ＿ＡＵＲＯＣ）、ＸＧＢｏｏｓｔ（ＸＧＢＣｌａｓ＿ＡＵＲＯＣ）、ＬｉｇｈｔＧＢＭ（ＬＧＢＭＣｌａ＿ＡＵＲＯＣ）、ＣａｔＢｏｏｓｔ（＜ｃａｔｂｏｏ＿ＡＵＲＯＣ）の４種類である。これらの組み合わせ（２４パターン）についてそれぞれＡＵＲＯＣ値を測定した。

図２５Ｅは、図２４Ｅの「変数リスト」に挙げられた６パターンを、数字率を含むグループと含まないグループとに分別し、それぞれのグループにおけるＡＵＲＯＣ値の統計量を算出、比較した表である。数字率を含むグループは、数字率を含まないグループと比較してＡＵＲＯＣ値の平均値、中央値、最大値のいずれもが大きい。このことから、全体的な傾向としてもピーク性能としても、数字率を含むグループの方が推定精度が高いと評価できる。

対比実験１及び２によれば、数字率を含む説明変数を使用した機械学習モデルにおいては、数字率を含まない場合と比較して、財務諸表不正の有無を高精度にかつ一定の反復可能性をもって推定することができる。

本実施の形態によれば、テキスト情報入力部１０１が企業またはその経営者が開示するＭＤ＆ＡやＣＥＯレターをはじめとするテキスト情報を取得し、テキスト情報分析部１０２がテキスト情報を分析して数字率を含む１以上の説明変数を生成し、不正推定部１０３がランダムフォレストやＣａｔＢｏｏｓｔをはじめとするメソッドにより推定モデルを構築する。これにより、精度の高い財務諸表不正推定を行うことが可能となるため、投資者の投資損失やリスクを回避するとともに、投資者が非不正企業に投資する場合の投資効果の向上を図ることができる。

以上、本発明の実施の形態について説明したが、本発明は上記実施形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。本発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。

例えば、上述の実施例ではテキスト情報として日本語のテキストを想定したが、本発明はこれに限定されるものではなく、英語をはじめとする外国語のテキストを対象としても良い。この場合、漢字含有率に代わる説明変数として、例えば単語の長さ（単語を構成する文字数）の平均値を用いることができる。単語の多様性、数字率、単語数、トーン、表現力等の説明変数は日本語の場合と同様に算出できる。なお、トーンを算出する際に参照する辞書については対象言語向けにあらかじめ準備されたものを使用する。

また、本発明の情報処理はハードウェアにより実現されても良く、ＣＰＵがコンピュータプログラムを実行することにより実現されても良い。コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉｕｍ）又は一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉｕｍ）によりコンピュータに供給され得る。

１財務諸表不正推定装置
１１ＣＰＵ
１３揮発性メモリ
１４不揮発性メモリ
１５インタフェース
１６インタフェース
２０バス
７０入出力装置
１０１テキスト情報入力部
１０２テキスト情報分析部
１０３不正推定部
１０３１モデル格納部
１０３１１学習済みモデル
１０３１２統計モデル
１０４機械学習部

Claims

企業又はその経営者が開示するテキスト情報を分析して１以上の説明変数を生成するテキスト情報分析部と、
前記説明変数と、前記企業にかかる財務諸表不正の有無と、の相関関係を示す学習済みモデルを格納したモデル格納部と、
前記テキスト情報分析部が生成した前記説明変数を、前記学習済みモデルに入力し、前記企業にかかる財務諸表不正の有無を推定する不正推定部と、を有し、
前記説明変数として前記テキスト情報の数字率を含む
財務諸表不正推定装置。
前記説明変数として前記テキスト情報の表現力をさらに含み、
前記表現力とは、形容詞の数と副詞の数の和を名詞の数と動詞の数の和で割った値である
請求項１記載の財務諸表不正推定装置。
前記説明変数として前記テキスト情報の漢字含有率又は学年をさらに含む
請求項１記載の財務諸表不正推定装置。
前記説明変数として前記テキスト情報の単語数をさらに含む
請求項１記載の財務諸表不正推定装置。
前記説明変数として前記テキスト情報の表現力、漢字含有率又は学年、単語数をさらに含み、
前記表現力とは、形容詞の数と副詞の数の和を名詞の数と動詞の数の和で割った値である
請求項１記載の財務諸表不正推定装置。
前記説明変数として前記テキスト情報の単語の多様性及びトーンをさらに含む
請求項５記載の財務諸表不正推定装置。
前記説明変数と、前記企業にかかる財務諸表不正の有無と、を入力して両者の相関関係を学習し、前記学習済みモデルを生成する機械学習部をさらに有し、
前記機械学習部はアンサンブル学習により前記学習を行う
請求項１乃至６いずれか１項記載の財務諸表不正推定装置。
前記機械学習部は勾配ブースティング決定木（ＧｒａｄｉｅｎｔＢｏｏｓｔｉｎｇＤｅｃｉｓｉｏｎＴｒｅｅ）により前記学習を行う
請求項７記載の財務諸表不正推定装置。
前記機械学習部はランダムフォレストにより前記学習を行う
請求項７記載の財務諸表不正推定装置。
前記テキスト情報としてＭＤ＆Ａ（Ｍａｎａｇｅｍｅｎｔ’ｓＤｉｓｃｕｓｓｉｏｎａｎｄＡｎａｌｙｓｉｓｏｆＦｉｎａｎｃｉａｌＣｏｎｄｉｔｉｏｎａｎｄＲｅｓｕｌｔｓｏｆＯｐｅｒａｔｉｏｎｓ）を使用する
請求項１乃至６いずれか１項記載の財務諸表不正推定装置。
コンピュータにおいて実行される財務諸表不正推定方法であって、
企業又はその経営者が開示するテキスト情報を分析して１以上の説明変数を生成するテキスト情報分析ステップと、
前記テキスト情報分析ステップにおいて生成された前記説明変数を、前記説明変数と前記企業にかかる財務諸表不正の有無との相関関係を示す学習済みモデルに入力し、前記企業にかかる財務諸表不正の有無を推定する不正推定ステップと、を有し、
前記説明変数として数字率を含む
財務諸表不正推定方法。
請求項１１記載の方法をコンピュータに実行させるためのプログラム。