JP2020135628A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2020135628A
JP2020135628A JP2019030577A JP2019030577A JP2020135628A JP 2020135628 A JP2020135628 A JP 2020135628A JP 2019030577 A JP2019030577 A JP 2019030577A JP 2019030577 A JP2019030577 A JP 2019030577A JP 2020135628 A JP2020135628 A JP 2020135628A
Authority
JP
Japan
Prior art keywords
target
usage
item
period
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019030577A
Other languages
English (en)
Other versions
JP6784788B2 (ja
Inventor
怜士 高橋
Reiji Takahashi
怜士 高橋
智志 中村
Tomoshi Nakamura
智志 中村
シャオジュン ワン
Xiaojun Wang
シャオジュン ワン
ホンユイ ザン
Hongyui Zhang
ホンユイ ザン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tiangong Ruifeng Tech Co Ltd
BEIJING TIANGONG RUIFENG TECHNOLOGY CO Ltd
Pkutech Co Ltd
Peking University
Mitsubishi Research Institute Inc
Original Assignee
Beijing Tiangong Ruifeng Tech Co Ltd
BEIJING TIANGONG RUIFENG TECHNOLOGY CO Ltd
Pkutech Co Ltd
Peking University
Mitsubishi Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tiangong Ruifeng Tech Co Ltd, BEIJING TIANGONG RUIFENG TECHNOLOGY CO Ltd, Pkutech Co Ltd, Peking University, Mitsubishi Research Institute Inc filed Critical Beijing Tiangong Ruifeng Tech Co Ltd
Priority to JP2019030577A priority Critical patent/JP6784788B2/ja
Priority to CN202010089052.6A priority patent/CN111291545B/zh
Publication of JP2020135628A publication Critical patent/JP2020135628A/ja
Application granted granted Critical
Publication of JP6784788B2 publication Critical patent/JP6784788B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】項目及び当該項目に対する数値を含む対象データから当該対象データを説明するための文章を作成する。
【解決手段】情報処理装置は、記憶部40に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部10と、前記決定部10によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部20と、前記作成部20によって作成された文章を出力する出力部30と、を有する。
【選択図】 図1

Description

本発明は、項目及び当該項目に対する数値を含む対象データから当該対象データを説明するための文章を作成する情報処理装置、情報処理方法及びプログラムに関する。
従来から情報処理装置によって自動で文章を作成することが試みられている。特許文献1では、人工知能アルゴリズムを用いて自然言語の解析をおこなう自然言語処理装置において、入力部が、ある自然言語に対する複数の手話画像を当該自然言語ごとに当該自然言語と関連付けして入力し、手話動作解析部が、入力された手話画像から、手話動作の複数の特徴点を抽出し、抽出された特徴点ごとに手話動作の、他の手話動作との共通点または相違点を解析し、推測部が、解析された共通点または相違点から、自然言語の意味内容について推測し、記憶部が、推測された意味内容に関する情報を、自然言語と関連付けして記憶することも提案されている。
特許第6301427号
本発明は、項目及び当該項目に対する数値を含む対象データから当該対象データを説明するための文章を作成する技術を提供する。
本発明による情報処理装置は、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備えてもよい。
本発明による情報処理装置において、
前記決定部は、第一期間に関する対象数値の評価及び第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、これらの評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択してもよい。
本発明による情報処理装置において、
前記対象データは複数のセクションを含む財務諸表であり、
前記決定部は、対象セクション毎に前記利用項目及び前記利用数値を選択し、
前記作成部は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成してもよい。
本発明による情報処理装置は、
外部装置にアップロードされた対象データを検出して読み出す抽出部を備えてもよい。
本発明による情報処理装置において、
前記決定部によって必ず選択される対象項目を指定可能となってもよい。
本発明による情報処理装置において、
前記決定部は人工知能機能を有し、
(1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
(2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択してもよい。
本発明による情報処理装置は、
前記作成部によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部を備え、
前記文章の分量又は前記利用項目の個数が閾値以上になっている場合には、前記作成部が要約文書を作成し、
前記出力部は前記要約文書を出力してもよい。
本発明による情報処理装置において、
前記作成部が文章を作成する際の評価レベルを調整可能となってもよい。
本発明による情報処理方法は、
情報処理装置を用いた情報処理方法であって、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み出す工程と、
第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行う工程と、
当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する工程と、
選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する工程と、
作成された文章を出力する工程と、
を備えてもよい。
本発明によるプログラムは、
情報処理装置にインストールするためのプログラムであって、
プログラムをインストールされた情報処理装置は、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備えてもよい。
本発明において、対象データに含まれる第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の評価結果(数値評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
図1は、本発明の実施の形態による情報処理装置の構成を示した概略ブロック図である。 図2(a)は、本発明の実施の形態で用いられ得るキャッシュ・フロー計算書を示し、図2(b)は図2(a)のキャッシュ・フロー計算書から文章を作成した結果の一例を示す図である。 図3は、本発明の実施の形態において人工知能機能を有する作成部が作成した文章と、人が作成した文章とを比較して示したものである。 図4は、本発明の実施の形態で用いられ得るキャッシュ・フロー計算書から文章を作成する工程を説明するための図である。 図5(a)は図4に続いて行われる処理内容を示す図であり、図5(b)は図5(a)に続いて行われる処理内容を示す図であり、図5(c)は図4に続いて行われる処理内容を示す図である。
実施の形態
《構成》
本実施の形態の情報処理装置は、一つの装置から構成されてもよいし複数の装置から構成されてもよい。また、複数の装置から情報処理装置が構成される場合には、各装置が同じ部屋等の同じ空間に設けられる必要はなく、異なる部屋、異なる建物、異なる地域等に設けられてもよい。本実施の形態では「及び/又は」を用いて説明することもあるが、「又は」という文言は「及び」の意味も含んでいる。つまり、A又はBという文言は、A単独、B単独、並びに、A及びBを含んだ概念である。
図1に示すように、情報処理装置は、記憶部40と、記憶部40に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価を行い、当該評価の結果(以下「数値評価結果」とも言う。)を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する決定部10と、決定部10によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部20と、作成部20によって作成された文章を出力する出力部30と、を有してもよい。対象データは典型的には項目と当該項目に対する数値を示す数表である。出力部30で出力された内容は表示画面等の表示部150で表示されてもよい。表示部150は本実施の形態の情報処理装置が提供するサービスを利用するユーザが管理するものであってもよい。
決定部10は、第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果(以下「変化評価結果」とも言う。)を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択してもよい。第二期間と第一期間とは同じ長さとなってもよく、例えば、第二期間及び第一期間の各々は1年となってもよいし、3月となってもよい。
決定部10は、数値評価結果において第一閾値を超える対象項目を利用項目として選択してもよい。決定部10は、変化評価結果において第二閾値を超える対象項目を利用項目として選択してもよい。数値評価結果及び変化評価結果はいずれか一方だけが利用されてもよいし、両方が利用されてもよい。第一閾値及び第二閾値は絶対値であってもよいし、相対的な比率であってもよい。なお、数値評価及び変化評価は後述するように人工知能機能を用いて行われてもよい。
第一閾値を超える対象項目が多数存在する場合には、決定部10は、第一個数を上限として評価値の高いものから順番に対象項目を利用項目として選択してもよい。同様に、第二閾値を超える対象項目が多数存在する場合には、決定部10は、第二個数を上限として評価値の高いものから順番に対象項目を利用項目として選択してもよい。これら評価値は変化値の絶対的な値だけではなく、当該項目の持つ意味も考慮して決定されてもよく、変化することに重要な意味のある項目では、変化値が小さい場合であっても高い評価値となってもよい。
対象データの大まかな構造部分はパソコン等の操作部80から入力されてもよい。一例として対象データがキャッシュ・フロー計算書である場合には、キャッシュ・フロー計算書から作成される文章が4つのセクションで構成されることや各セクションで用いられるキーワードが操作部80から入力されてもよいし、さらに情報を入力するのであれば、キャッシュ・フロー計算書から作成される文章が「サマリー」「営業CF」「財務CF」及び「投資CF」の4つのセクションで構成されることが操作部80から入力されてもよい。
対象データは一つの文章であってもよいが、これに限られることはなく、複数の文章が組み合わされてもよい。この場合、第1対象データの他に、第2対象データ、第3対象データ、・・・、第n対象データ(「n」は2以上の整数である。)に含まれる情報を用いて作成部20が文章を作成してもよい。第1対象データの情報を主として用い、その他の対象データの情報を副次的に用いてもよい。例えば、対象企業のキャッシュ・フロー計算書から文章を作成する際に、キャッシュ・フロー計算書の他に当該対象企業の貸借対照表及び損益計算書の情報も決定部10が読み出して利用項目及び利用数値を選択し、選択された利用項目及び利用数値を用いて作成部20が文章を作成してもよい。また、当該対象企業の個別財務諸表だけではなく連結財務諸表を決定部10が読み出して、決定部10によって選択された利用項目及び利用数値を用いて作成部20が文章を作成してもよい。
対象データが財務諸表である場合、対象データにおける金額又は金額変化が同じ値であっても対象企業の売上高、純利益、純資本等の金額によってインパクトは異なる。このため、対象となっている数表からなる第1対象データの他に、数表からなる第2対象データ、第3対象データ、・・・、第n対象データを利用することは有益である。
対象データは財務諸表であってもよく、より具体的には複数のセクションを含む財務諸表であってもよい。決定部10は、対象セクション毎に利用項目及び利用数値を選択してもよい。作成部20は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成してもよい。なお、対象データとしては項目と当該項目に対する数値を含む数表であればよく、例えば、地方自治体等における人口、平均年齢等を含む数表や、警察が発行している事故統計からなる数表等であってもよい。
財務諸表としては様々なものを挙げることができ、貸借対照表、損益計算書、キャッシュ・フロー計算書、株主資本等変動計算書等を挙げることができる。また、財務諸表としては、個別財務諸表であってもよいし連結財務諸表であってもよい。
対象となる文書が財務諸表である場合であれば、第一期間は、例えば会計年度であれば1年であり、四半期であれば3か月である。
一例としては図2(a)で示されているキャッシュ・フロー計算書の営業キャッシュ・フローに基づいて、「「営業活動によるキャッシュ・フロー」は、「3,215百万円の支出」(前年同四半期は「5,653百万円の支出」)となりました。これは、季節要因による「売上債権の増加6,393百万円」、「たな卸資産の増加5,643百万円」、「仕入債務の増加5,627百万円」等によるものです。」(図2(b))というような文章が作成部20によって作成されてもよい。営業キャッシュ・フローで示されている項目及び数値以外の内容は作成部20によって補充された補充用語である。この補充用語は記憶部40で記憶されており、作成部20が決定部10で選択された利用項目及び利用数値の意味を考慮して適宜選択することで、読み出されて文書内で利用されることになる。補充用語としては、様々なものを用いることができ、過去に作成された文章から抽出された用語が補充用語として記憶されてもよいし、ウェブサイトを介して取得された用語も補充用語として記憶されるようにしてもよい。
サーバやクラウド等の外部装置200にアップロードされた財務諸表等の対象データを検出して読み出す抽出部50が設けられてもよい(図1参照)。外部装置200は例えばEDINETであってもよい。抽出部50によって読み出された財務諸表に対して、決定部10が利用数値を選択するとともに数値評価結果及び/又は変化評価結果を決定し、作成部20が選択された利用数値と数値評価結果及び/又は変化評価結果とを用いて文章を作成してもよい。
決定部10によって必ず選択される対象項目(必須利用項目)が指定可能となってもよい。対象データが財務諸表からなる場合には、新株発行に関する項目は必ず選択される利用項目として指定されるようにしてもよい。また、純資本がマイナスとなっている場合には、「純資本」が利用項目として決定部10によって必ず選択されるようにしてもよい。また、結論部分は必須利用項目となってもよく、図2(a)に示す「営業活動によるキャッシュ・フロー」に関しては、結論である「営業活動によるキャッシュ・フロー」(図2(a)の末尾に示されている項目)が必須利用項目となってもよい。
決定部10及び作成部20は人工知能機能を有してもよい。決定部10が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合には、決定部10は、過去の実績データに基づいて対象数値を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択してもよい。決定部10が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合には、決定部10は、過去の実績データに基づいて対象数値の変化を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択してもよい。過去の実績データには、対象となっている企業の過去の実績データだけではなく、その他の多数の企業の過去の実績データが含まれてもよい。これらのデータは記憶部40に記憶されていてもよいし、外部装置200で記憶されているものを抽出部50が抽出するようにしてもよい。
財務諸表が対象データである場合には、第一期間は例えば当期(今年度の会計期間)であり、第二期間は例えば前期(前年度の会計期間)であり、両者は同じ長さ(1年)となっている。また四半期で比較する場合には、例えば、第一期間が当期の第1四半期である場合には第二期間は前期の第1四半期であり、第一期間が当期の第2四半期である場合には第二期間は前期の第2四半期であり、第一期間が当期の第3四半期である場合には第二期間は前期の第3四半期であり、第一期間が当期の第4四半期である場合には第二期間は前期の第4四半期であるというように、対応する四半期が比較対象となってもよい。また、第二期間よりも前の期間(例えば前々期等)における対象数値からの変化を考慮してもよい。また、図2に示すように同じ四半期までの累計期間を比較対象としてもよい(図2では第2四半期までの累計期間で比較されている。)。
人工知能機能を有する作成部20は、テンプレート(ひな型)を使用せず、数表と説明文のデータのみを用いて学習してもよい。このようにテンプレートを利用しない場合には、予めの準備が必要ない点で有益である。
作成部20は、決定部10によって選択された利用項目及び利用数値の内容から、対象企業の事業がどのような状況にあるか、つまり好調なのか不調なのかの結果を文章として示すようにしてもよい。変動項目が多く多数の利用項目が選択される場合には、事業が好調で多くの項目で数値が変動していることもあれば、事業が不調で多くの項目での数値が変動していることの両方があり得る。このような場合には、好調・不調の結果を作成部20が文章として示すようにしてもよい。この際、数値を用いた表現は行わず、好調であるのか又は不調であるのかだけを示すようにしてもよい。但し、これに限られることはなく、数値を用いつつ、好調・不調の結果を作成部20が文章として示すようにしてもよい。
作成部20によって作成された文章の分量が閾値(第三閾値)以上になっているか又は利用項目の個数が閾値(第四閾値)以上となっているかどうかを判断する判断部60が設けられてもよい。文章の分量又は利用項目の個数が閾値以上になっている場合には、作成部20が要約文書を作成してもよい。出力部30は要約文書を出力してもよい。この場合、作成部20は、要約文章として、対象企業の事業がどのような状況にあるのかだけを示す文章を作成するようにしてもよい。出力部30は対象データにおける財務諸表等の数表と作成部20が作成した文書とを並列で示すようにしてもよい。このような態様を採用する場合には、数表と文書とを並列で確認でき、数表の持つ意味を投資家等の利用者に提供できる。
作成部20はLSTM(Long Short Term Memory:長期短期記憶)によって文章を作成するようにしてもよい。LSTMはニューラルネットワークのうちRNN(リカレントニューラルネットワーク)に分類されるものである。RNNは時系列データを学習するためのニューラルネットワークで、LSTMはRNNの中でも繰り返し改善が施されたものである。LSTMを用いることで時系列データを考慮することができ、単語列の順序を考慮して学習することができる。学習方法としては、有価証券報告書であれば数万件(例えば2万〜5万件)の有価証券報告書を学習するようにしてもよい。機械学習に用いるためのソフトウェアライブラリであるTensorflowを用いてもよい。AIモデルとしては、Deep Learning(Seq2Seq系のモデル)を複数使用してもよい。機械学習を行う際にビームサーチを利用してもよいし、入力データと出力されたテキストで不整合がある場合にペナルティをかける強化学習を行ってもよい。
また、人工知能機能の一例として、機械学習の手法を用いた分類器を用いてもよい。この分類器は、例えば、過去の実績データから、高い精度のベクトルを生成するように、機械学習技術によって、利用する採用変数(要素)と、その係数(重み)を定めてもよい。上記人工知能機能は、回帰分析、決定木分析等を行ってもよい。機械学習技術に関しては、様々なモデルを採用することができ、例えば、ロジスティクス回帰モデル、ランダムフォレストモデル、ツリーモデル等を採用することができる。
発明者らが実際に実験を行った結果を図3に示す。図3の上側が人工知能機能を有する作成部20によって作成された文書であり、図3の下側が人間によって作成された文章である。人工知能機能を有する作成部20による大きな間違いは前年同期比の数字ではなく、前年同期の数字としてしまった部分のみであることを確認できた。「前年同期比」と「前年同期」は似た文脈で出てくることが多く、深層学習利用時に典型的な間違いであると評価できる。
前処理として、対象データ中の対象項目及び対象数値について一定の規則に基づいてラベルを付与してもよい。一例として対象データがキャッシュ・フロー計算書である場合には、キャッシュ・フロー計算書中の項目名・数値に対して前期数値、今期数値、増減分、増減率のラベルを一定の規則に基づき付与してもよい。また前処理として、形態素解析エンジンであるMeCab等を用いて分かち書きを行ってもよい。
また、対象データ中のセグメントのキーワードを設定してもよい。一例として対象データがキャッシュ・フロー計算書である場合には、サマリー、営業CF、財務CF、投資CFのキーワードを設定してもよい。
「CONJ」(conjunction)が、利用項目と利用項目に対する利用数値に基づいて作成部20で決定されてもよい。「CONJ」は複数の「利用項目」が作成する文章で利用される場合に用いられる。「CONJ」としては「この結果」「原因は、」等の予め複数の単語列が記憶部40で記憶されており、これらの単語列から適切な用語が作成部20で選択されてもよい。
「CONJ」としては、前述した「この結果」「原因は、」等のように、その後に理由を説明するための用語が用いられるようにしてもよい。この場合には、「CONJ」の前にある「利用項目」における「利用数値」の根拠を説明するための「利用項目」及び「利用数値」が「CONJ」の後に続くようにしてもよい。「CONJ」の配置場所は、選択された「利用項目」の関係から決定されてもよく、「A」「B」「C」という利用項目が選択され、「B」及び「C」が「A」の原因となる場合には、「A」「CONJ」「B」「C」という順番でこれらが配列されるようになってもよい。
本実施の形態の決定部10、作成部20、出力部30、記憶部40、抽出部50、判断部60等の各部材は、一つ又は複数のICチップ又は電子モジュール等で実現されてもよいし、回路構成によって実現されてもよい。また、一つの電子部材が制御部となり、これら決定部10、作成部20、出力部30、抽出部50、判断部60等の各部材の機能を果たしてもよい。
《方法》
主に図4及び図5を用いて、本実施の形態の情報処理装置を用いた情報処理方法の一例について説明する。この例では、対象データとしてキャッシュ・フロー計算書を用いて説明する。なお、ここでは一例を示しており、上記「構成」で述べた全ての態様及び下記「効果」で述べる全ての態様を「方法」において適用することができる。
決定部10は、対象データであるキャッシュ・フロー計算書から作成される文章が「サマリー」「営業CF」「財務CF」「投資CF」の順で構成されるのか、又は「営業CF」「投資CF」「財務CF」「サマリー」の順で構成されるのかを決定する。決定部10は、図4に示す数表を説明する場合、過去の文章から統計的に、「サマリー」「営業CF」「財務CF」「投資CF」の順で作成するものであると判断し、そのように決定してもよいし、当該順番が操作部80で予め入力されていてもよい。
次に、決定部10は、使用する数表項目(変数)、特殊記号(説明を表すCONJ)とその順番を決める。例えば、決定部10は、作成部20で作成される文書である「サマリー」の中で用いられるべき変数、特殊記号を選び、順番を決める。図4に示す数表から「サマリー」を書く場合、使用する項目とその順番は過去に作成された文章から統計的に「今年度の期末の現金」「CONJ」「今年度期首の現金」「純利益」であると判断してもよい(図5(a))。
次に、作成部20は、数表と抽出された要素列「今年度の期末の現金」「CONJ」「今年度期首の現金」「純利益」から文を構成する場合、過去の文章から統計的に「今年度の期末の現金」と、「CONJ」「今年度期首の現金」及び「純利益」とで分割することが自然であると判断する(図5(b))。
次に、分割された2つの文章の各々を作成する。
文1については、作成部20は、利用項目である「今年度の期末の現金」及び利用数値である「〇○○」を用いて、「今年度の期末の現金同等物の残高は「○○○」円となりました。」という文章を作成する(図5(c))。
同様に、文2については、「CONJ」である「その理由は」と、利用項目である「今年度期首の現金」及び利用数値である「△△△」と、利用項目である「純利益」及び利用数値である「□□□」とを用いて、「その理由は、期首の残高が「△△△」円であったところに、純利益が「□□□」であったためです。」という文章を作成する(図5(c))。なお、文1及び文2において、利用項目及び利用数値以外は補充用語である。
決定部10は、前述したのと同様の処理を「営業CF」「財務CF」及び「投資CF」の各々のセクションに対しても行い、キャッシュ・フロー計算書から文章を作成する。なお、本実施の形態では日本語を用いる態様を用いて説明しているが、これに限られることはなく、英語、中国語、韓国語、ドイツ語、フランス語等の様々な言語を用いることができる。
《効果》
次に、上述した構成からなる本実施の形態による効果であって、未だ説明していないものを中心に説明する。
対象データに含まれる第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の評価結果(数値評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
対象データに含まれる第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の変化結果(変化評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
また、数値評価結果及び変化評価結果の両方を用いる場合には、数値評価結果及び変化評価結果の両方に基づいて、自動的に報告文書等の文章を作成することができる。
数表から報告文書等の文書を自動で作成できれば、大量に数表を有している企業等が本実施の形態を採用することで、数表の内容を簡易な文書とすることができる。対象データが財務諸表である場合には、財務諸表に関する大量の情報を簡易な報告文書として作成でき、大量の財務諸表の分析作業の効率化を図れる。また、本実施の形態によれば、企業の財務担当、公認会計士、会計士事務所等が有価証券報告書を作成する際の下書きを予め準備することもできる。
公表された財務諸表を要約することは従前から行われているが、このような要約は対象企業が発表した財務諸表と当該財務諸表に関する文章に基づいて作成されることから、当該対象企業の評価が入ることとなる。他方、本実施の形態によれば、例えば財務諸表という数表だけを用いて要約された文章を作成することから、客観的な財務諸表の数値に基づいて文章を作成することができる。
なお、作成部20が文章を作成する際の評価レベルを調整可能となってもよい。評価レベルは操作部80からの入力によって調整可能となってもよい。同じ数値又は数値変化であったとしても、例えば、第一評価レベルでは厳しい評価を行って評価に関して厳しい内容からなる補充用語を用い(例えば「キャッシュが不足しており厳しい状況であります」とうような用語を用い)、第二評価レベルでは緩い評価を行って評価に関して緩やかな内容からなる補充用語を用い(例えば「現時点ではキャッシュがわずかに不足しておりますが、問題はございません」というような用語を用い)、第三評価レベルでは中立的な評価を行って評価に関して中立的な内容からなる補充用語を用いる(例えば「現時点ではキャッシュが不足しておりますが、中長期的に見れば問題はございません」という用語を用いる)ようにしてもよい。対象データが財務諸表に関するデータである場合であって企業の財務担当者が利用するときには、第二評価レベルを用いて緩やかな評価に基づいて文章を作成部20が作成することで、当該企業にとって財務上有利な評価されるように文章が作成されるようにしてもよい。他方、対象データが財務諸表に関するデータである場合であって投資家等の外部者が利用するときには、第一評価レベルを用いて厳しい評価に基づいて文章を作成部20が作成することで、当該企業にとって財務上不利な評価されるように文章が作成されるようにしてもよい。このような態様を採用することで、利用する対象者に応じて、目的に応じた文章の作成を期待できる。なお、企業の担当者が利用する場合であっても、第一評価レベルを用いて厳しい評価に基づいて作成部20が文章を作成するようにすることで、厳しい目で見た場合に、どのような評価を受けるかを予め確認するという利用も可能となる。
対象データが複数のセクション(例えば「サマリー」「営業CF」「財務CF」及び「投資CF」というセクション)を含む財務諸表等である場合に、決定部10が対象セクション毎に利用項目及び利用数値を選択する態様を採用した場合には、対象セクション毎に利用項目及び利用数値を選択できる。
また、作成部20が対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成する態様を採用した場合には、対象セクション毎に選択された利用項目及び利用数値を用いて、統合文書を作成できる。セクション文書を作成することで、当該セクション文書単位での利用も可能となる。
外部装置200にアップロードされた対象データを検出して読み出す抽出部50が設けられる態様では、最新の財務諸表を自動的に読み出して報告文書を作成できる。抽出部50による読み出しは1週間に1回、1日に一回であってもよい。1日に一回の頻度の場合には、休日の際には抽出に行かないようにしてもよい。このような態様を採用した場合には財務諸表の速報をいち早く作成して投資家等に提供できる。
決定部10によって必ず選択される対象項目を指定可能となる態様を採用する場合には、報告文書に当該内容を必ず組み入れることができる。対象データが財務諸表の場合には、投資家が特に注目する内容(例えば新株発行情報、純資本がマイナスになった情報等)を対象項目として指定することで、投資家にとって有益な情報を提供できる。
人工知能機能を有する決定部10が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合に、決定部10が過去の実績データに基づいて対象数値を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択する態様を採用した場合には、情報として意味の高い利用数値を精度よく選択でき、有益な情報提供を期待できる。
人工知能機能を有する決定部10が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合に、決定部10が過去の実績データに基づいて対象数値の変化を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択する態様を採用する場合にも、情報として意味の高い利用数値を精度よく選択でき、有益な情報提供を期待できる。
作成部20によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部60が設けられ、文章の分量又は利用項目の個数が閾値以上になっている場合に作成部20が要約文書を作成する態様を採用した場合には、文章の分量を一定の範囲として情報提供を行うことができる。対象データが財務諸表である場合には、財務諸表に関する簡易なレポートを作成でき、投資家としては、対象企業の財務諸表の内容を簡易に理解することができる。
上述した実施の形態の記載及び図面の開示は、特許請求の範囲に記載された発明を説明するための一例に過ぎず、上述した実施の形態の記載又は図面の開示によって特許請求の範囲に記載された発明が限定されることはない。
10 決定部
20 作成部
30 出力部
40 記憶部
50 抽出部
60 判断部

Claims (10)

  1. 記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
    前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
    前記作成部によって作成された文章を出力する出力部と、
    を備える、情報処理装置。
  2. 前記決定部は、第一期間に関する対象数値の評価及び第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、これらの評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する、請求項1に記載の情報処理装置。
  3. 前記対象データは複数のセクションを含む財務諸表であり、
    前記決定部は、対象セクション毎に前記利用項目及び前記利用数値を選択し、
    前記作成部は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成する、請求項1又は2のいずれか1項に記載の情報処理装置。
  4. 外部装置にアップロードされた対象データを検出して読み出す抽出部を備える、請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記決定部によって必ず選択される対象項目を指定可能となる、請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記決定部は人工知能機能を有し、
    (1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
    (2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択する、請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記作成部によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部を備え、
    前記文章の分量又は前記利用項目の個数が閾値以上になっている場合には、前記作成部が要約文書を作成し、
    前記出力部は前記要約文書を出力する、請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記作成部が文章を作成する際の評価レベルを調整可能となる、請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 情報処理装置を用いた情報処理方法であって、
    記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み出す工程と、
    第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行う工程と、
    当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する工程と、
    選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する工程と、
    作成された文章を出力する工程と、
    を備える、情報処理方法。
  10. 情報処理装置にインストールするためのプログラムであって、
    プログラムをインストールされた情報処理装置は、
    記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
    前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
    前記作成部によって作成された文章を出力する出力部と、
    を備える、プログラム。
JP2019030577A 2019-02-22 2019-02-22 情報処理装置、情報処理方法及びプログラム Active JP6784788B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019030577A JP6784788B2 (ja) 2019-02-22 2019-02-22 情報処理装置、情報処理方法及びプログラム
CN202010089052.6A CN111291545B (zh) 2019-02-22 2020-02-12 对象项目的文稿生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019030577A JP6784788B2 (ja) 2019-02-22 2019-02-22 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020135628A true JP2020135628A (ja) 2020-08-31
JP6784788B2 JP6784788B2 (ja) 2020-11-11

Family

ID=71024455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019030577A Active JP6784788B2 (ja) 2019-02-22 2019-02-22 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
JP (1) JP6784788B2 (ja)
CN (1) CN111291545B (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024507A (ja) * 2000-07-03 2002-01-25 Three C Consulting:Kk 商法計算書類作成システム及び商法計算書類作成処理プログラムを記憶した記録媒体
US20030074212A1 (en) * 2001-10-12 2003-04-17 Easy 221 Consulting Inc. Online enterprise diagnosis system and method
JP2011008527A (ja) * 2009-06-25 2011-01-13 Nomura Research Institute Ltd 決算書の分析結果に基づく記事を作成するシステム
US20140297565A1 (en) * 2011-09-29 2014-10-02 Skaffold Pty Limited Systems and methods for providing share assessment data with plain language interpretation
US20170147945A1 (en) * 2015-11-25 2017-05-25 NewsRx, LLC Systems and Methods for Financial Data Aggregation
JP6155409B1 (ja) * 2017-01-23 2017-06-28 株式会社xenodata lab. 決算分析システムおよび決算分析プログラム
JP2018049400A (ja) * 2016-09-20 2018-03-29 株式会社ココペリインキュベート 財務情報分析システム、及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808903A (zh) * 2014-12-29 2016-07-27 中兴通讯股份有限公司 一种生成健康报告的方法及装置
CN109146238A (zh) * 2018-07-10 2019-01-04 合肥深度财务管理咨询有限公司 基于大数据的企业财务共享评估方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024507A (ja) * 2000-07-03 2002-01-25 Three C Consulting:Kk 商法計算書類作成システム及び商法計算書類作成処理プログラムを記憶した記録媒体
US20030074212A1 (en) * 2001-10-12 2003-04-17 Easy 221 Consulting Inc. Online enterprise diagnosis system and method
JP2011008527A (ja) * 2009-06-25 2011-01-13 Nomura Research Institute Ltd 決算書の分析結果に基づく記事を作成するシステム
US20140297565A1 (en) * 2011-09-29 2014-10-02 Skaffold Pty Limited Systems and methods for providing share assessment data with plain language interpretation
US20170147945A1 (en) * 2015-11-25 2017-05-25 NewsRx, LLC Systems and Methods for Financial Data Aggregation
JP2018049400A (ja) * 2016-09-20 2018-03-29 株式会社ココペリインキュベート 財務情報分析システム、及びプログラム
JP6155409B1 (ja) * 2017-01-23 2017-06-28 株式会社xenodata lab. 決算分析システムおよび決算分析プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
村野 壮人: "決算短信から抽出した業績要因文の事業セグメントに基づく分類と業績文の抽出", 人工知能学 金融情報学研究会(SIG−FIN) 019 [ONLINE], JPN6020036015, 11 October 2017 (2017-10-11), ISSN: 0004353234 *
泉田 聡介: "記述言語XBRLで書かれた財務諸表を対象とした分析支援ツールの試作", 電子情報通信学会技術研究報告, vol. 第104巻,第723号, JPN6020011155, 8 March 2005 (2005-03-08), pages 7 - 11, ISSN: 0004238691 *

Also Published As

Publication number Publication date
CN111291545B (zh) 2023-06-30
CN111291545A (zh) 2020-06-16
JP6784788B2 (ja) 2020-11-11

Similar Documents

Publication Publication Date Title
Elshandidy et al. Risk reporting: A review of the literature and implications for future research✩
Kvaal et al. IFRS policy changes and the continuation of national patterns of IFRS practice
Sinclair Round up the usual suspects: Blame and the subprime crisis
Yesuf et al. Exploring synergies and performance evaluation between Islamic funds and socially responsible investment (SRIs) in light of the Sustainable Development Goals (SDGs)
Zinovyeva et al. Antisocial online behavior detection using deep learning
Chen et al. What Makes Cryptocurrencies Special? Investor Sentiment and Return Predictability
Rahimikia et al. Realised volatility forecasting: Machine learning via financial word embedding
El Badlaoui et al. Output indicators of audit quality: A framework based on literature review
Smailović Sentiment analysis in streams of microblogging posts
Basak et al. The British Stock Market, currencies, brexit, and media sentiments: A big data analysis
Meijer Risk disclosures in annual reports of Dutch listed companies during the years 2005-2008
Zhai et al. CS224N Final Project: Sentiment analysis of news articles for financial signal prediction
JP6784788B2 (ja) 情報処理装置、情報処理方法及びプログラム
Basak et al. British Stock Market, BREXIT and Media Sentiments-A Big Data Analysis
Yukselturk et al. The impact of analyst sentiment on UK stock recommendations and target prices
Juan et al. Analyzing microblogging activity and stock market behavior through artificial neural networks
CN114328536A (zh) 一种表格处理方法和系统
US20200265521A1 (en) Multimedia risk summarizer
Chakraborty et al. Automating the process of taxonomy creation and comparison of taxonomy structures
Janosek et al. Knowledge discovery in dynamic data using neural networks
Kubaščíková et al. Contextual non-financial information analysis of annual reports
AHMED et al. REVIEW OF OPPORTUNITIES AND CHALLENGES REPRESENTED BY BIG DATA FOR FINTECH IN MALAYSIA
Monaem et al. Measuring of international financial integration with a multicriteria decision aid approach
Islam et al. Stock market prediction of Bangladesh using multivariate long short-term memory with sentiment identification.
Hsu et al. Family firms' social responsibility: Exercise of family control versus family dynasty succession

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201023

R150 Certificate of patent or registration of utility model

Ref document number: 6784788

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250