JP2024090145A - Document data generation device, control method for document data generation device, and document data generation program - Google Patents
Document data generation device, control method for document data generation device, and document data generation program Download PDFInfo
- Publication number
- JP2024090145A JP2024090145A JP2022205839A JP2022205839A JP2024090145A JP 2024090145 A JP2024090145 A JP 2024090145A JP 2022205839 A JP2022205839 A JP 2022205839A JP 2022205839 A JP2022205839 A JP 2022205839A JP 2024090145 A JP2024090145 A JP 2024090145A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- data
- rewrite
- document
- generation device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 24
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 239000000284 extract Substances 0.000 claims abstract description 32
- 230000006870 function Effects 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 230000014616 translation Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Abstract
【課題】事業報告に関する文書データから形式が異なる文書データを生成可能な文書データ生成装置を実現することを目的とする。
【解決手段】文書データ生成装置(10)は、テンプレートデータに含まれる書き換え要素を抽出する抽出部(121)と、テンプレートデータの各書き換え要素の内容を、第1の文書データにおける複数の要素のうち、書き換え要素に対応する対応要素を用いて書き換えた第2の文書データを生成する生成部(122)と、を備える。
【選択図】図1
The present invention aims to realize a document data generation device capable of generating document data of a different format from document data relating to a business report.
[Solution] The document data generation device (10) comprises an extraction unit (121) that extracts rewrite elements contained in template data, and a generation unit (122) that generates second document data in which the content of each rewrite element of the template data is rewritten using a corresponding element among a plurality of elements in the first document data that corresponds to the rewrite element.
[Selected Figure] Figure 1
Description
本発明は、文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラムに関する。 The present invention relates to a document data generation device, a control method for a document data generation device, and a document data generation program.
文書データを再レイアウトすることによって、当該文書データから、言語、書式や表記などの形式が異なる新たな文書データを生成する技術が知られている。例えば、特開平7-105216号公報には、文書データに対してその論理構造に対応する変換や加工などの処理を行う文書論理構造処理方法が記載されている。 Technology is known that generates new document data in a different format, such as a different language, format, or notation, from document data by re-laying out the document data. For example, JP-A-7-105216 describes a document logical structure processing method that performs processes such as conversion and processing of document data that correspond to its logical structure.
ところで、文書データから形式が異なる文書データを生成する技術のうち、事業報告に関する文書データから形式が異なる文書データを生成する技術が求められている。 Among technologies for generating document data of different formats from document data, there is a demand for technology for generating document data of different formats from document data related to business reports.
しかしながら、上述のような従来技術は、単なる文書データから形式が異なる文書データを生成する技術にすぎず、事業報告に関する文書データから形式が異なる文書データを生成する技術ではない。また、事業報告に関するデータから数値情報を抽出して、売上収益および営業利益などのグラフや他社との利益を比較したグラフなどにグラフ化する技術は従来から存在するが事業報告に関する文書データから形式が異なる文書データを生成する技術は存在しない。 However, the above-mentioned conventional technologies are merely technologies for generating document data of a different format from simple document data, and are not technologies for generating document data of a different format from document data related to business reports. Furthermore, while there have been conventional technologies for extracting numerical information from data related to business reports and displaying it in graphs such as sales revenue and operating profits, or graphs comparing profits with other companies, there is no technology for generating document data of a different format from document data related to business reports.
本発明の一態様は、事業報告に関する文書データから形式が異なる文書データを生成可能な文書データ生成装置およびその関連技術を実現することを目的とする。 One aspect of the present invention aims to realize a document data generation device and related technology that can generate document data of different formats from document data related to business reports.
上記の課題を解決するために、本発明の一態様に係る文書データ生成装置は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置であって、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、を備える。 In order to solve the above problem, a document data generation device according to one aspect of the present invention is a document data generation device that generates second document data from first document data related to a business report, which includes a plurality of tagged elements, and includes an extraction unit that extracts rewrite elements to be rewritten that are included in template data of the second document data, and a generation unit that generates the second document data by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data that corresponds to the rewrite element.
本発明の一態様に係る文書データ生成装置は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置の制御方法であって、前記文書データ生成装置が、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出工程と、前記文書データ生成装置が、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成工程と、を含む。 A document data generation device according to one aspect of the present invention is a control method for generating second document data from first document data relating to a business report, the first document data including a plurality of tagged elements, the control method including an extraction step in which the document data generation device extracts rewrite elements to be rewritten, which are included in template data of the second document data, and a generation step in which the document data generation device generates the second document data by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data that corresponds to the rewrite element.
本発明の各態様に係る文書データ生成装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記文書データ生成装置が備える各部(ソフトウェア要素)として動作させることにより前記文書データ生成装置をコンピュータにて実現させる文書データ生成プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。 The document data generation device according to each aspect of the present invention may be realized by a computer. In this case, the document data generation program that causes a computer to operate as each unit (software element) of the document data generation device to realize the document data generation device on a computer, and the computer-readable recording medium on which the program is recorded, also fall within the scope of the present invention.
本発明の一態様によれば、事業報告に関する文書データから形式が異なる文書データを生成可能な文書データ生成装置およびその関連技術を実現することができる。 According to one aspect of the present invention, it is possible to realize a document data generation device and related technology capable of generating document data of different formats from document data related to business reports.
<実施形態1>
以下、本発明の実施形態1に係る文書データ生成装置10および文書データ生成装置の制御方法S1について説明する。
<
The document
〔文書データ生成装置10〕
図1を用いて、文書データ生成装置10について説明する。図1は、実施形態1に係る文書データ生成装置10の構成の一例を示すブロック図である。文書データ生成装置10は、第1の文書データから第2の文書データを生成する。第1の文書データおよび第2の文書データはともに事業報告に関する文書であり、第1の文書データは、タグ付けされた複数の要素を含む。図1に示すように、文書データ生成装置10は、取得部11と、制御部12と、表示部13とを備える。
[Document data generation device 10]
The document
一例として、第1の文書データは、提出済み事業報告書であり、XBRL(eXtensible Business Reporting Language)が用いられているものであってもよい。別の一例として、第1の文書データは、XBRLに準拠したタグ付けが、あらかじめ人手によってなされたPDF(Portable Document Format)ファイル、Wordファイル、PowerPointファイルおよびHTML(Hyper Text Markup Language)ファイルなどであってもよい。文書データ生成装置10は、事業報告に関する第1の文書データのうち、特にXBRLが用いられている第1の文書データから、形式が異なる第2の文書データを生成しやすい。第2の文書データとしては、第1の文書データの翻訳物などが挙げられる。すなわち、文書データ生成装置10は、第1の文書データから、形式が異なる第2の文書データとして、第1の文書データの翻訳物である第2の文書データを生成することができる。
As an example, the first document data may be a submitted business report using XBRL (eXtensible Business Reporting Language). As another example, the first document data may be a PDF (Portable Document Format) file, a Word file, a PowerPoint file, or an HTML (Hyper Text Markup Language) file, etc., in which XBRL-compliant tagging has been manually performed in advance. The document
[取得部11]
取得部11は、第1の文書データを取得する。
[Acquisition unit 11]
The acquiring
[制御部12]
制御部12は、文書データ生成装置10を制御する。図1に示すように、制御部12は、抽出部121と、生成部122とを備える。
[Control unit 12]
The
(抽出部121)
抽出部121は、第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。第2の文書データのテンプレートデータは、和文であってもよいし、英文など、和文を翻訳したものであってもよい。
(Extraction Unit 121)
The
(生成部122)
生成部122は、テンプレートデータの各書き換え要素の内容を、第1の文書データにおける複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた第2の文書データを生成する。
(Generation unit 122)
The generating
[表示部13]
表示部13は、第1の文書データや第2の文書データなどの文書データを表示する。
[Display unit 13]
The
〔文書データ生成装置の制御方法S1〕
以下、図2~5を用いて、文書データ生成装置の制御方法S1について説明する。図2は、実施形態1に係る文書データ生成装置の制御方法S1の一例を示すフロー図である。図3は、第1の文書データD1の一例を示す図である。図4は、第2の文書データのテンプレートデータTDの一例を示す図である。図5は、第2の文書データD2の一例を示す図である。文書データ生成装置の制御方法S1は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する。図2に示すように、文書データ生成装置の制御方法S1は、取得工程S11と、抽出工程S12と、生成工程S13と、表示工程S14とを含む。
[Control method S1 of document data generation device]
The control method S1 of the document data generation device will be described below with reference to Figs. 2 to 5. Fig. 2 is a flow diagram showing an example of the control method S1 of the document data generation device according to the first embodiment. Fig. 3 is a diagram showing an example of first document data D1. Fig. 4 is a diagram showing an example of template data TD of second document data. Fig. 5 is a diagram showing an example of second document data D2. The control method S1 of the document data generation device generates second document data from first document data related to a business report, which includes a plurality of tagged elements. As shown in Fig. 2, the control method S1 of the document data generation device includes an acquisition step S11, an extraction step S12, a generation step S13, and a display step S14.
[取得工程S11]
取得工程S11において、文書データ生成装置10の取得部11は、外部から文書データ生成装置10に入力された第1の文書データを取得する。例えば、取得部11は、図3に示す第1の文書データD1を取得してもよい。
[Obtaining step S11]
In the acquisition step S11, the
[抽出工程S12]
抽出工程S12において、文書データ生成装置10の抽出部121は、第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。例えば、抽出部121は、図4に示すテンプレートデータTDに含まれる要素C11~C19を書き換え要素として抽出する。抽出部121は、テンプレートデータTDに含まれる要素C11~C19の属性値に基づいて、書き換え要素を抽出してもよい。属性値としては、例えば、HTML(Hyper Text Markup Language)5 dataを用いたものが挙げられ、この場合、属性値は以下の(I)~(XI)の少なくとも1つを含んでいてもよい。属性値が、これらの少なくとも1つを含むことにより、抽出部121は、テンプレートデータTDから書き換え要素を高精度に抽出することができる。
[Extraction step S12]
In the extraction step S12, the
(I)XBRL内の要素を指し、当該要素の子要素の全てを表示するdata-abs
(II)日付として表示するXBRL内のコンテキスト情報を指定するdata-context
(III)表示の際の書式を指定するdata-format
(IV)XBRLに含まれるID属性を指すdata-id
(V)表示する値の期間情報を指定するdata-keyword
(VI)XBRLに含まれるMember属性を指定するdata-member
(VII)対応箇所の削除可否を指定するdata-nilable
(VIII)表示する日付の種類を指定するdata-period
(IX)表示する項目の識別子であるdata-type
(X)表示する単位の識別子であるdata-unit
(XI)XBRL内の区分を指すdata-role
(I) data-abs, which points to an element in XBRL and displays all of the child elements of that element
(II) data-context, which specifies the context information in the XBRL to be displayed as a date
(III) data-format to specify the format to be displayed
(IV) data-id, which refers to the ID attribute included in the XBRL
(V) A data keyword that specifies the period information of the value to be displayed.
(VI) data-member specifying the Member attribute included in XBRL
(VII) data-nilable that specifies whether the corresponding part can be deleted
(VIII) data-period that specifies the type of date to display
(IX) data-type, which is the identifier of the item to be displayed
(X) data-unit, which is the identifier of the unit to be displayed
(XI) Data-role that refers to a division in XBRL
上述の(I)data-absは、表自体を作成する場合に使用されるものである。XBRLでは勘定科目の記載順が木構造であるため、上述の(I)data-absにより、ユーザが表示したいXBRL内の要素を指定することにより、子要素の記載順およびXBRLにおいて定義した英語ラベルを取得することができる。 The above (I) data-abs is used when creating the table itself. In XBRL, the order of account items is a tree structure, so by specifying the elements in the XBRL that the user wishes to display using the above (I) data-abs, the order of child elements and the English labels defined in the XBRL can be obtained.
XBRLは、実値の有効期間を表す日付情報を持っているものの、XBRLでは情報を制御するに当たり、日付情報自体を表示することを目的としていない。これに対し、その日付情報を行見出しなどにおいて使用する際に、上述の(II)data-contextが属性値として指定される。 Although XBRL has date information that indicates the validity period of the actual value, the purpose of XBRL is not to display the date information itself when controlling information. Instead, when using that date information in row headings, etc., the above-mentioned (II) data-context is specified as the attribute value.
上述の(III)data-formatは、日付であれば「MMMM d、yyyy」のように英文において使用される日付の書式を指定可能としている。 The above (III) data-format allows you to specify the date format used in English, such as "MMMM d, yyyy" for dates.
上述の(IV)data-idは会社名などの独立した表示を行う場合に使用される。 The above (IV) data-id is used when displaying an independent item such as a company name.
上述の(V)data-keywordは、表自体を構成する際に、行ごとまたは列ごとに表示する実値の有効期間を表す情報を指定し、表自体を作成する場合に使用される。 The above-mentioned (V) data-keyword is used when creating the table itself by specifying information that indicates the validity period of the actual values to be displayed for each row or column.
上述の(VI)data-memberは、サマリー、変動計画書ではXBRLのDimension仕様を用いて2次元表によって構成されているため、上述の(IV)data-id(ID属性)と併せて使用される。 The above (VI) data-member is used in conjunction with the above (IV) data-id (ID attribute) since it is configured as a two-dimensional table using the XBRL Dimension specification in the summary and variation plan.
上述の(VII)data-nilableは、記載が任意の項目において、記載がない場合に該当期間箇所を削除するために用いられる。 The above (VII) data-nilable is used in items where entry is optional, to delete the relevant period if there is no entry.
上述の(VIII)data-periodは、data-content属性と併せて用いられるものであり、XBRLの実値の有効期間を表す日付情報に含まれる、開始日、終了日および時点のいずれを表示するのかを指定する。 The above-mentioned (VIII) data-period is used in conjunction with the data-content attribute to specify whether to display the start date, end date, or time included in the date information that represents the validity period of the actual XBRL value.
上述の(IX)data-typeは、日付、見出し、範囲、数値または自然文などのデータの種別を指定し、当該データがどの位置に表示されるのかを指定するものであり、他の属性と組み合わせて使用される。 The above (IX) data-type specifies the type of data, such as date, heading, range, numerical value, or natural language, and specifies where the data is to be displayed, and is used in combination with other attributes.
上述の(X)data-unitは、固定の単位、または、実値に関連付けられている単位を表示する際に使用される。 The (X) data-unit mentioned above is used to display a fixed unit or a unit associated with a real value.
上述の(XI)data-roleは、XBRLでの賃借対照表および損益計算書などの区分を指し示すものである。財務諸表では、表が異なると、同じ要素であっても異なる日本語ラベルを表示するように設定される。それを踏まえて、どの表において表示されているかを指定することによって、和文での表記に沿った英語ラベルの表示を可能とする。 The above (XI) data-role indicates the classification in XBRL, such as balance sheets and income statements. In financial statements, different tables are set to display different Japanese labels even for the same element. With this in mind, by specifying which table it is displayed in, it is possible to display an English label that matches the Japanese notation.
(抽出工程S12の一例)
以下、図4を用いて、抽出部121がテンプレートデータTDに含まれる要素C11~C19の属性値に基づき、書き換え要素を抽出する抽出工程S12の一例を説明する。
(An example of the extraction step S12)
An example of the extraction step S12 in which the
ここで、要素C11には、上述の(IV)data-idとしてCompany Name、上述の(II)data-contextとしてCurrent Yearが属性値として設定されている(紐づけられている)。この場合、抽出部121は、当該属性値に基づいて、Current YearにおけるCompany Nameを書き換え要素として抽出する。
Here, in element C11, Company Name is set as the above-mentioned (IV) data-id, and Current Year is set as the above-mentioned (II) data-context as attribute values (linked). In this case, the
要素C12には、上述の(IX)data-typeとして単位、上述の(XI)data-roleとして連結経営成績、上述の(III)data-formatとして表の単位が属性値して設定されている。この場合、抽出部121は、表における連結経営成績の単位を書き換え要素として抽出する。
Element C12 has the attribute values set as (IX) data-type above, the unit as (XI) data-role above, the consolidated operating results as (XI), and the unit of the table as (III) data-format above. In this case, the
要素C13には、上述の(IX)data-typeとして日付、上述の(II)data-contextとしてCurrent Yearが属性値として設定されている。この場合、抽出部121は、Current Yearの日付を書き換え要素として抽出する。
Element C13 has the attribute values set as the above-mentioned (IX) data-type, which is the date, and as the above-mentioned (II) data-context, which is the Current Year. In this case, the
要素C14には、上述の(IX)data-typeとして日付、上述の(II)data-contextとしてPrior1 Yearが属性値として設定されている。この場合、抽出部121はPrior1 Yearの日付を書き換え要素として抽出する。
Element C14 has the attribute values set as the above-mentioned (IX) data-type, which is the date, and as the above-mentioned (II) data-context, which is the Prior1 Year. In this case, the
要素C15には、上述の(IX)data-typeとして見出し、上述の(IV)data-idとしてNet Sales、上述の(XI)data-roleとして連結経営成績が属性値として設定されている。この場合、抽出部121は、連結経営成績のうちのNet Salesの見出しを書き換え要素として抽出する。
Element C15 has the attribute values set as the above (IX) data-type, Net Sales as the above (IV) data-id, and consolidated business results as the above (XI) data-role. In this case, the
要素C16には、上述の(IX)data-typeとして単位、上述の(IV)data-idとしてNet Sales、上述の(XI)data-roleとして連結経営成績が属性値として設定されている。この場合、抽出部121は、連結経営成績のうちのNet Salesの単位を書き換え要素として抽出する。
Element C16 has the attribute values set as the above (IX) data-type "unit," the above (IV) data-id "Net Sales," and the above (XI) data-role "consolidated business results." In this case, the
要素C17には、上述の(IV)data-idとしてNet Sales、上述の(XI)data-roleとして連結経営成績、上述の(V)data-keywordとしてCurrent Yearが属性値として設定されている。この場合、抽出部121は、連結経営成績のうち、Current YearのNet Salesを書き換え要素として抽出する。
Element C17 has the attribute values set as the above (IV) data-id, Net Sales, the above (XI) data-role, consolidated business results, and the above (V) data-keyword, Current Year. In this case, the
要素C18には、上述の(IV)data-idとしてNet Sales、上述の(XI)data-roleとして連結経営成績、上述の(II)data-contextとしてPrior1 Yearが属性値として設定されている。この場合、抽出部121は、連結営業成績のうち、Prior1 YearのNet Salesを書き換え要素として抽出する。
Element C18 has the attribute values set as the above (IV) data-id, Net Sales, the above (XI) data-role, consolidated business results, and the above (II) data-context, Prior1 Year. In this case, the
要素C19には、上述の(IV)data-idとしてChanges In Accounting Estimates、上述の(II)data-contextとしてCurrent Year、上述の(VII)data-nilableとしてtrueが属性値として設定されている。この場合、抽出部121は、Current YearのChanges In Accounting Estimatesがtrueを書き換え要素として抽出する。
In element C19, attribute values are set as the above-mentioned (IV) data-id, as the above-mentioned (II) data-context, as Current Year, and as the above-mentioned (VII) data-nilable, as true. In this case, the
[生成工程S13]
生成工程S13において、文書データ生成装置10の生成部122は、テンプレートデータの各書き換え要素の内容を、第1の文書データにおける複数の要素のうち、書き換え要素に対応する対応要素を用いて書き換えた第2の文書データを生成する。これにより、事業報告に関する第1の文書データから形式が異なる第2の文書データを生成できる。
[Generation step S13]
In the generating step S13, the generating
(生成工程S13の一例)
以下、図3~5を用いて、生成工程S13の一例について説明する。生成部122は、図4に示すテンプレートデータTDの各書き換え要素の内容を、図3に示す第1の文書データD1における複数の要素のうち、書き換え要素に対応する対応要素C1~C9を用いて書き換えた、図5に示す第2の文書データD2を生成する。
(An example of the generating step S13)
An example of the generating step S13 will be described below with reference to Figures 3 to 5. The generating
生成部122は、テンプレートデータTDにおける各書き換え要素が有する属性値に基づき、当該書き換え要素に対応する第1の文書データD1の対応要素を特定してもよい。これにより、生成部122は、第1の文書データD1のうち、第1の文書データD1から第2の文書データD2を生成するために必要な情報を特定し、取得することができる。
The generating
例えば、生成部122は、テンプレートデータTDにおける要素C11から抽出された書き換え要素であるCurrent YearにおけるCompany Nameが有する属性値に基づいて、当該書き換え要素に対応する対応要素C1を特定する。この場合、生成部122は、属性値である上述の(IV)data-idおよび上述の(II)data-contextに対応するタグが付された要素を対応要素C1として特定する。
For example, the
生成部122は、テンプレートデータTDにおける要素C12から抽出された書き換え要素である表における連結経営成績の単位が有する属性値に基づいて、当該書き換え要素に対応する対応要素C2を特定する。この場合、生成部122は、属性値である上述の(IX)data-typeおよび上述の(XI)data-roleに対応するタグが付された要素を対応要素C2として特定する。
The
生成部122は、テンプレートデータTDにおける要素C13から抽出された書き換え要素であるCurrent Yearの日付が有する属性値に基づいて、当該書き換え要素に対応する対応要素C3を特定する。この場合、生成部122は、属性値である上述の(IX)data-typeおよび上述の(II)data-contextに対応するタグが付された要素を対応要素C3として特定する。
The
生成部122は、テンプレートデータTDにおける要素C14から抽出された書き換え要素であるPrior1 Yearの日付に基づいて、当該書き換え要素に対応する対応要素C4を特定する。この場合、生成部122は、属性値である(IX)data-typeおよび上述の(II)data-contextに対応するタグが付された要素を対応要素C4として特定する。
The generating
生成部122は、テンプレートデータTDにおける要素C15から抽出された書き換え要素である、連結経営成績のうちのNet Salesの見出しに基づいて、当該書き換え要素に対応する対応要素C5を特定する。この場合、生成部122は、属性値である上述の(IX)data-type、上述の(IV)data-idおよび上述の(XI)data-roleに対応するタグが付された要素を対応要素C5として特定する。
The generating
生成部122は、テンプレートデータTDにおける要素C16から抽出された書き換え要素である、連結経営成績のうちのNet Salesの単位に基づいて、当該書き換え要素に対応する対応要素C6を特定する。この場合、生成部122は、属性値である上述の(IX)data-type、上述の(IV)data-idおよび上述の(XI)data-roleに対応するタグが付された要素を対応要素C6として特定する。
The generating
生成部122は、テンプレートデータTDにおける要素C17から抽出された書き換え要素である、連結経営成績のうちのNet Salesの単位に基づいて、当該書き換え要素に対応する対応要素C7を特定する。この場合、生成部122は、属性値である上述の(IV)data-id、上述の(XI)data-roleおよび上述の(V)data-keywordに対応するタグが付された要素を対応要素C7として特定する。
The generating
生成部122は、テンプレートデータTDにおける要素C18から抽出された書き換え要素である、連結営業成績のうちのPrior1 YearのNet Salesに基づいて、当該書き換え要素に対応する対応要素C8を特定する。この場合、生成部122は、属性値である上述の(IV)data-id、上述の(XI)data-roleおよび上述の(II)data-contextに対応するタグが付された要素を対応要素C8として特定する。
The generating
生成部122は、テンプレートデータTDにおける要素C19から抽出された書き換え要素である、Current YearのChanges In Accounting Estimatesがtrueに基づいて、当該書き換え要素に対応する対応要素C9を特定する。この場合、生成部122は、属性値である上述の(IV)data-id、上述の(II)data-contextおよび上述の(VII)data-nilableに対応するタグが付された要素を対応要素C9として特定する。
The
生成部122は、書き換え要素の内容を、対応要素に書き換えてもよいし、少なくとも一部の書き換え要素の内容を、当該書き換え要素の属性値に応じて対応要素の内容を変換した変換後内容に書き換えてもよい。これにより、生成部122は、書き換え要素の内容を、第2の文書データD2の形式に沿った変換後内容に書き換えることができる。
The generating
また、生成部122は、少なくとも一部の書き換え要素の内容を、書き換え要素の属性値をパラメータとして用いて対応要素の内容を機械翻訳した翻訳後内容に書き換えてもよい。これにより、生成部122は、少なくとも一部の書き換え要素の内容をそのまま機械翻訳する場合に比べて、書き換え要素に応じた翻訳語内容に対応要素を書き換えることができる。その結果、表記揺れおよび機械翻訳のコストが低減する。
The generating
例えば、生成部122は、テンプレートデータTDにおける要素C11から抽出された書き換え要素であるCurrent YearにおけるCompany Nameの内容を、対応要素C1に書き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IV)data-idおよび上述の(II)data-contextである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C1の株式会社の名称をテンプレートデータTDにおける要素C11にそのまま反映してもよい。その上で、図5の第2の文書データD2に示すように、生成部122は、当該名称を英語に機械翻訳した翻訳後内容C21に書き換えてもよい。
For example, the
生成部122は、テンプレートデータTDにおける要素C12から抽出された書き換え要素である、連結経営成績の単位の内容を、対応要素C2に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IX)data-typeおよび上述の(XI)data-roleである。そのため、生成部122は、要素C12から抽出された書き換え要素の内容である「対前期増減率」を、当該属性値に応じて対応要素の内容を変化した変換後内容である「対前年比の変化」に書き換えてもよい。その上で、生成部122は、変換後内容を”year-on-year chages”という英語に機械翻訳した、図5の第2の文書データD2に示すように、翻訳後内容C22に置き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C13から抽出された書き換え要素であるCurrent Yearの日付の内容を、対応要素C3に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IX)data-typeおよび上述の(II)data-contextである。そのため、生成部122は、要素C13から抽出された書き換え要素の内容である「2022年3月期」を、当該属性値に応じて対応要素の内容を変換した変換後内容である「2022年3月31日」に書き換えてもよい。その上で、生成部122は、変換後内容を”March 31, 2022”という英語に機械翻訳した、図5の第2の文書データD2に示すように、翻訳後内容C23に置き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C14から抽出された書き換え要素であるPrior1 Yearの日付の内容を、対応要素C4に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IX)data-typeおよび上述の(II)data-contextである。そのため、生成部122は、要素C14から抽出された書き換え要素の内容である「2021年3月期」を、当該属性値に応じて対応要素の内容を変換した変換後内容である「2021年3月31日」に書き換えてもよい。その上で、図5の第2の文書データD2に示すように、生成部122は、変換後内容を”March 31, 2021”という英語に機械翻訳した翻訳後内容C24に置き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C15から抽出された書き換え要素である、連結経営成績のうちのNet Salesの見出しの内容を、対応要素C5に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IX)data-type、上述の(IV)data-idおよび上述の(XI)data-roleである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C5の「売上高」をテンプレートデータTDにおける要素C15にそのまま反映してもよい。その上で、図5の第2の文書データD2に示すように、生成部122は、「売上高」を”Net Sales”という英語に機械翻訳した翻訳後内容C25に書き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C16から抽出された書き換え要素である、連結経営成績のうちのNet Salesの単位の内容を、対応要素C6に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IX)data-type、上述の(IV)data-idおよび上述の(XI)data-roleである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C6の「百万円」をテンプレートデータTDにおける要素C16にそのまま反映してもよい。その上で、図5の第2の文書データD2に示すように、生成部122は、「百万円」を”Millions of yen”という英語に機械翻訳した翻訳後内容C26に書き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C17から抽出された書き換え要素である、連結経営成績のうちのNet Salesの単位の内容を、対応要素C7に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IV)data-id、上述の(XI)data-roleおよび上述の(V)data-keywordである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C7をテンプレートデータTDにおける要素C17にそのまま反映してもよい。対応要素C7は、数値であるため、生成部122は、対応要素C7の数値を英語に機械翻訳した翻訳後内容に書き換えなくてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C18から抽出された書き換え素である、連結営業成績のうちのPrior1 YearのNet Salesの内容を、対応要素C8に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IV)data-id、上述の(XI)data-roleおよび上述の(II)data-contextである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C8をテンプレートデータTDにおける要素C18にそのまま反映してもよい。対応要素C8は、数値であるため、生成部122は、対応要素C8の数値を英語に機械翻訳した翻訳後内容に書き換えなくてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C19から抽出された書き換え要素である、Current YearのChanges In Accounting Estimatesがtrueの内容を、対応要素C9に置き換えてもよい。ここで、当該書き換え要素の属性値は、上述の(IV)data-id、上述の(II)data-contextおよび上述の(VII)data-nilableである。そのため、図3~5に示す例のように、生成部122は、第1の文書データD1における対応要素C9の「無」をテンプレートデータTDにおける要素C19にそのまま反映してもよい。その上で、図5の第2の文書データD2に示すように、生成部122は、「無」を”None”という英語に機械翻訳した翻訳後内容C29に書き換えてもよい。
The generating
生成部122は、テンプレートデータTDにおける要素C19から抽出された書き換え要素の”true”ではなく”false”であり、対応要素C9が実値として存在しない場合、任意の記載T1を先頭文字から削除してもよい。これにより、生成部122は、テンプレートデータTDにおける不要な記載(個所)を削除できる。上述の例では、要素C19を含むものが任意の記載T11である場合について説明しているが、要素C19を含むものは任意の記載に限定されず、例えば、任意の表であってもよい。この場合、要素C19から抽出された書き換え要素の”true”ではなく”false”であり、対応要素C9が実値として存在しない場合、任意の表ごと削除してもよい。これにより、生成部122は、テンプレートデータTDにおける不要な記載を削除できる。
If the rewrite element extracted from element C19 in template data TD is "false" instead of "true" and the corresponding element C9 does not exist as an actual value, the
[表示工程S14]
表示工程S14において、文書データ生成装置10の表示部13は、第2の文書データを表示する。例えば、表示部13は、図5に示す第2の文書データD2を表示する。
[Display step S14]
In a display step S14, the
<実施形態2>
以下、実施形態2に係る文書データ生成装置10Xについて説明する。説明の便宜上、上述の実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
<
Hereinafter, a document
〔文書データ生成装置10X〕
図6は、実施形態2に係る文書データ生成装置10Xの構成の一例を示すブロック図である。文書データ生成装置10Xは、実施形態1における制御部12の代わりに、制御部12Xを備えている。
[Document
6 is a block diagram showing an example of a configuration of a document
[制御部12X]
制御部12Xは、実施形態1における抽出部121と、表示部13との代わりに、抽出部121Xと、表示部13Xとを備え、第2の生成部123をさらに備えている。この点以外は、制御部12Xは、実施形態1における制御部12と同様である。
[
The
(抽出部121X)
抽出部121Xは、グラフおよび文書を含む第3の文書データ(要約抜粋版資料)のテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。
(
The
グラフの形式は特に限定されないが、例えば、棒グラフなどが挙げられる。第3の文書データのテンプレートデータは、グラフ用テンプレートと、文書用テンプレートとの2つのテンプレートから構成されていてもよいし、グラフおよび文書を含む1つのテンプレートから構成されていてもよい。第3の文書データのテンプレートが2つのテンプレートから構成されていても、第2の生成部123は、最終的にこれらのテンプレートを統合することによって、1つの第3の文書データを生成することができる。第3の文書のテンプレートデータに含まれる文書または文書用テンプレートデータは、和文であってもよいし、英文など、和文を翻訳したものであってもよい。
The format of the graph is not particularly limited, but examples include bar graphs. The template data of the third document data may be composed of two templates, a graph template and a document template, or may be composed of one template including a graph and a document. Even if the template of the third document data is composed of two templates, the
(第2の生成部123)
第2の生成部123は、第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する。具体的には、第2の生成部123は、第3の文書データのテンプレートデータの各書き換え要素の内容を、第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた第3の文書データを生成する。これにより、事業報告に関する第1の文書データから、第1の文書データを要約した第3の文書データを生成することができる。
(Second Generation Unit 123)
The
[表示部13X]
表示部13Xは、第3の文書データをさらに表示する。
[
The
〔文書データ生成装置の制御方法S1X〕
以下、図7を用いて、文書データ生成装置の制御方法S1Xについて説明する。図7は、実施形態2に係る文書データ生成装置の制御方法S1Xの一例を示すフロー図である。文書データ生成装置の制御方法S1Xは、取得工程S21と、抽出工程S22と、生成工程S23と、第2の生成工程S24と、表示工程S25とを含む。取得工程S21および生成工程S23は、実施形態1における取得工程S11およびS13と同様である。
[Control method S1X of document data generation device]
The control method S1X of the document data generation device will be described below with reference to Fig. 7. Fig. 7 is a flow diagram showing an example of the control method S1X of the document data generation device according to the second embodiment. The control method S1X of the document data generation device includes an acquisition step S21, an extraction step S22, a generation step S23, a second generation step S24, and a display step S25. The acquisition step S21 and the generation step S23 are similar to the acquisition steps S11 and S13 in the first embodiment.
[抽出工程S22]
抽出工程S22において、文書データ生成装置10Xの抽出部121Xは、グラフおよび文書を含む第3の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。例えば、第3の文書データのテンプレートがグラフ用テンプレートと文書用テンプレートとの2つのテンプレートから構成されている場合、抽出部121Xは、グラフ用テンプレートおよび文書用テンプレートの各々に含まれる書き換え要素を抽出してもよい。第3の文書データのテンプレートがグラフおよび文書を含む1つのテンプレートから構成されている場合、抽出部121Xは、当該1つのテンプレートに含まれる書き換え要素を抽出してもよい。
[Extraction step S22]
In the extraction step S22, the
抽出部121Xは、第3の文書データのテンプレートデータに含まれる要素の属性値に基づいて、書き換え要素を抽出してもよい。例えば、第3の文書データのテンプレートがグラフ用テンプレートと文書用テンプレートとの2つのテンプレートから構成されている場合、抽出部121Xは、これらのテンプレートの各々に含まれる要素の属性値に基づいて、書き換え要素を抽出してもよい。第3の文書データのテンプレートがグラフおよび文書を含む1つのテンプレートから構成されている場合、抽出部121Xは、当該1つのテンプレートに含まれる要素の属性値に基づいて、書き換え要素を抽出してもよい。
The
[第2の生成工程S24]
第2の生成工程S24において、文書データ生成装置10Xの第2の生成部123は、第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する。具体的には、第2の生成部123は、第3の文書データのテンプレートデータの各書き換え要素の内容を、第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた第3の文書データを生成する。
[Second generation step S24]
In a second generating step S24, the
以下、一例として、第3の文書データのテンプレートがグラフ用テンプレートと文書用テンプレートとの2つのテンプレートから構成されている場合について説明する。この場合、第2の生成部123は、グラフ用テンプレートおよび文書用テンプレートの各々に含まれる各書き換え要素の内容を、図3に示す第1の文書データD1において当該書き換え要素に対応する対応要素を用いて置き換える。
Below, as an example, a case will be described in which the templates of the third document data are composed of two templates, a graph template and a document template. In this case, the
グラフ用テンプレートに含まれる書き換え要素としては、例えば、棒グラフなどが挙げられる。当該書き換え要素に対応する対応要素としては、例えば、第1の文書データD1における表に含まれる対応要素C3~C8などが挙げられる。文書用テンプレートに含まれる書き換え要素としては、例えば、上場会社名などが挙げられる。当該書き換え要素に対応する対応要素としては、例えば、第1の文書データD1における上場会社名を示す対応要素C1などが挙げられる。次に、第2の生成部123は、当該各書き換え要素の内容を、当該対応要素を用いて置き換えた上述の2つのテンプレートを統合することによって、第3の文書データを生成する。
An example of a rewrite element included in the graph template is a bar graph. An example of a corresponding element for the rewrite element is the corresponding elements C3 to C8 included in the table in the first document data D1. An example of a rewrite element included in the document template is the name of a listed company. An example of a corresponding element for the rewrite element is the corresponding element C1 indicating the name of a listed company in the first document data D1. Next, the
別の一例として、第3の文書データのテンプレートがグラフおよび文書を含む1つのテンプレートから構成されている場合について説明する。この場合、第2の生成部123は、当該1つのテンプレートに含まれる書き換え要素の内容を、図3に示す第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えることによって、第3の文書データを生成する。当該1つのテンプレートに含まれる書き換え要素のうち、グラフに対応する書き換え要素としては、例えば、棒グラフなどが挙げられ、文書に対応する書き換え要素としては、例えば、上場会社などが挙げられる。
As another example, a case will be described where the template of the third document data is composed of one template including a graph and a document. In this case, the
上述の例では、グラフ用テンプレートまたは1つのテンプレートにおけるグラフに対応する対応要素が、第1の文書データD1における表に含まれる対応要素C3~C8である場合について説明している。ただし、第1の文書データD1に表の代わりにグラフが含まれる場合、グラフ用テンプレートまたは1つのテンプレートにおけるグラフに対応する対応要素は、第1の文書データD1におけるグラフに含まれる対応要素であってもよい。この場合、第2の生成部123は、第1の文書データD1におけるグラフの配置や形状などの形式が異なる第3の文書データを生成してもよい。
In the above example, a case is described in which the corresponding elements corresponding to the graph in the graph template or one template are corresponding elements C3 to C8 included in the table in the first document data D1. However, if the first document data D1 includes a graph instead of a table, the corresponding elements corresponding to the graph in the graph template or one template may be corresponding elements included in the graph in the first document data D1. In this case, the
[表示工程S25]
表示工程S25において、文書データ生成装置10Xの表示部13Xは、第3の文書データを表示する。例えば、表示部13Xは、第1の文書データD1における対応要素C9を含む任意の記載T1を削除し、対応要素C3~C8を含む表を棒グラフに書き換えた第3の文書データを表示する。
[Display step S25]
In a display step S25,
〔ソフトウェアによる実現例〕
文書データ生成装置10および10X(以下、「装置」と呼ぶ)の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック(特に制御部12および12Xに含まれる各部)としてコンピュータを機能させるためのプログラムにより実現することができる。
[Software implementation example]
The functions of document
この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも1つの制御装置(例えばプロセッサ)と少なくとも1つの記憶装置(例えばメモリ)を有するコンピュータを備えている。この制御装置と記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。 In this case, the device includes a computer having at least one control device (e.g., a processor) and at least one storage device (e.g., a memory) as hardware for executing the program. The functions described in each of the above embodiments are realized by executing the program using the control device and storage device.
上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、1または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。 The program may be recorded on one or more computer-readable recording media, not on a temporary basis. The recording media may or may not be included in the device. In the latter case, the program may be supplied to the device via any wired or wireless transmission medium.
また、上記各制御ブロックの機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各制御ブロックとして機能する論理回路が形成された集積回路も本発明の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各制御ブロックの機能を実現することも可能である。 In addition, some or all of the functions of each of the above control blocks can be realized by a logic circuit. For example, an integrated circuit in which a logic circuit that functions as each of the above control blocks is formed is also included in the scope of the present invention. In addition, it is also possible to realize the functions of each of the above control blocks by, for example, a quantum computer.
また、上記各実施形態で説明した各処理は、AI(Artificial Intelligence:人工知能)に実行させてもよい。この場合、AIは上記制御装置で動作するものであってもよいし、他の装置(例えばエッジコンピュータまたはクラウドサーバ等)で動作するものであってもよい。 The processes described in each of the above embodiments may be executed by AI (Artificial Intelligence). In this case, the AI may run on the control device, or on another device (such as an edge computer or a cloud server).
〔付記事項〕
本発明の態様1に係る文書データ生成装置は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置であって、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、を備える。
[Additional Notes]
A document data generation device according to a first aspect of the present invention is a document data generation device that generates second document data from first document data relating to a business report, the first document data including a plurality of tagged elements, and includes an extraction unit that extracts rewrite elements to be rewritten, which are included in template data of the second document data, and a generation unit that generates the second document data by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data that corresponds to the rewrite element.
本発明の態様2に係る文書データ生成装置は、上記態様1において、前記第1の文書データには、XBRLが用いられていてもよい。
In the document data generation device according to
本発明の態様3に係る文書データ生成装置は、上記態様1または2において、前記抽出部は、前記テンプレートデータに含まれる各要素の属性値に基づいて、前記書き換え要素を抽出し、前記生成部は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定してもよい。
In the document data generation device according to
本発明の態様4に係る文書データ生成装置は、上記態様3において、前記生成部は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値に応じて前記対応要素の内容を変換した変換後内容に書き換えてもよい。
In the document data generation device according to aspect 4 of the present invention, in the
本発明の態様5に係る文書データ生成装置は、上記態様1~4のいずれか1つにおいて、前記第2の文書データは、前記第1の文書データの翻訳物であってもよい。
In the document data generation device according to
本発明の態様6に係る文書データ生成装置は、上記態様5において、前記生成部は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値をパラメータとして用いて前記対応要素の内容を機械翻訳した翻訳後内容に書き換えてもよい。
In the document data generation device according to aspect 6 of the present invention, in the
本発明の態様7に係る文書データ生成装置は、上記態様1~6のいずれか1つにおいて、前記第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する第2の生成部をさらに備え、前記抽出部は、グラフおよび文書を含む前記第3の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出し、前記前記第2の生成部は、前記第3の文書データのテンプレートデータの各書き換え要素の内容を、前記第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた前記第3の文書データを生成してもよい。
The document data generation device according to aspect 7 of the present invention may be any one of
本発明の態様8に係る文書データ生成装置は、上記態様3~7のいずれか1つにおいて、前記属性値は、(I)前記XBRL内の要素を指し、当該要素の子要素の全てを表示するdata-abs、(II)日付として表示する前記XBRL内のコンテキスト情報を指定するdata-context、(III)表示の際の書式を指定するdata-format、(IV)前記XBRLに含まれるID属性を指すdata-id、(V)表示する値の期間情報を指定するdata-keyword、(VI)前記XBRLに含まれるMember属性を指定するdata-member、(VII)対豪箇所の削除可否を指定するdata-nilable、(VIII)表示する日付の種類を指定するdata-period、(IX)表示する項目の識別子、(X)表示する単位の識別子、および、(XI)前記XBRL内の区分を指すdata-roleのうちの少なくとも1つを含んでもよい。
A document data generation device according to aspect 8 of the present invention is any one of
本発明の態様9に係る文書データ生成装置の制御方法は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置の制御方法であって、前記文書データ生成装置が、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出工程と、前記文書データ生成装置が、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成工程と、を含む。 A control method of a document data generation device according to aspect 9 of the present invention is a control method of a document data generation device that generates second document data from first document data related to a business report, the first document data including a plurality of tagged elements, and includes an extraction step in which the document data generation device extracts rewrite elements to be rewritten that are included in template data of the second document data, and a generation step in which the document data generation device generates the second document data by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data that corresponds to the rewrite element.
本発明の各態様に係る文書データ生成装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記文書データ生成装置が備える各部(ソフトウェア要素)として動作させることにより上記文書データ生成装置をコンピュータにて実現させる文書データ生成プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。 The document data generation device according to each aspect of the present invention may be realized by a computer. In this case, the document data generation program that causes the computer to operate as each unit (software element) of the document data generation device to realize the document data generation device on the computer, and the computer-readable recording medium on which it is recorded, also fall within the scope of the present invention.
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The present invention is not limited to the above-described embodiments, and various modifications are possible within the scope of the claims. The technical scope of the present invention also includes embodiments obtained by appropriately combining the technical means disclosed in different embodiments.
本発明は、事業報告に関する文書データから形式が異なる文書データを生成可能な文書データ生成装置およびその関連技術を実現できる。そのため、本発明は持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」の達成に貢献できる。 The present invention can realize a document data generation device and related technologies that can generate document data of different formats from document data related to business reports. Therefore, the present invention can contribute to the achievement of Goal 9 of the Sustainable Development Goals (SDGs): "Build resilient infrastructure, promote inclusive and sustainable industrialization."
10、10X 文書データ生成装置
121、121X 抽出部
122 生成部
123 第2の生成部
C1、C2、C3、C4、C5、C6、C7、C8、C9 対応要素
C11、C12、C13、C14、C15、C16、C17、C18、C19 要素
C21、C22、C23、C24、C25、C26、C29 翻訳後内容
D1 第1の文書データ
D2 第2の文書データ
S1、S1X 文書データ生成装置の制御方法
S11、S21 取得工程
S12、S22 抽出工程
S13、S23 生成工程
S14、S25 表示工程
S24 第2の生成工程
10, 10X Document
Claims (10)
前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、
前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、
を備える、文書データ生成装置。 A document data generation device that generates second document data from first document data relating to a business report, the first document data including a plurality of tagged elements, comprising:
an extracting unit that extracts a rewrite element to be rewritten, the rewrite element being included in the template data of the second document data;
a generating unit that generates the second document data by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data that corresponds to the rewrite element;
A document data generation device comprising:
前記生成部は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定する、請求項2に記載の文書データ生成装置。 The extraction unit extracts the rewrite element based on an attribute value of each element included in the template data,
3. The document data generating apparatus according to claim 2, wherein the generating section identifies a corresponding element that corresponds to each rewrite element based on an attribute value of the rewrite element.
前記抽出部は、グラフおよび文書を含む前記第3の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出し、
前記前記第2の生成部は、前記第3の文書データのテンプレートデータの各書き換え要素の内容を、前記第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた前記第3の文書データを生成する、請求項6に記載の文書データ生成装置。 a second generating unit configured to generate third document data by summarizing the first document data from the first document data;
The extraction unit extracts a rewrite element to be rewritten, which is included in template data of the third document data including a graph and a text;
7. The document data generation device according to claim 6, wherein the second generation unit generates the third document data by rewriting the contents of each rewrite element of template data of the third document data using a corresponding element in the first document data that corresponds to the rewrite element.
前記文書データ生成装置が、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出工程と、
前記文書データ生成装置が、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成工程と、
を含む、文書データ生成装置の制御方法。 1. A method for controlling a document data generation device that generates second document data from first document data relating to a business report, the first document data including a plurality of tagged elements, the method comprising:
an extraction step in which the document data generation device extracts a rewrite element to be rewritten, which is included in template data of the second document data;
a generating step of generating the second document data by the document data generating device by rewriting the content of each rewrite element of the template data using a corresponding element among the plurality of elements in the first document data, the corresponding element being one of the rewrite elements;
A method for controlling a document data generating apparatus, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022205839A JP7354399B1 (en) | 2022-12-22 | 2022-12-22 | Document data generation device, control method for document data generation device, and document data generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022205839A JP7354399B1 (en) | 2022-12-22 | 2022-12-22 | Document data generation device, control method for document data generation device, and document data generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7354399B1 JP7354399B1 (en) | 2023-10-02 |
JP2024090145A true JP2024090145A (en) | 2024-07-04 |
Family
ID=88198137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022205839A Active JP7354399B1 (en) | 2022-12-22 | 2022-12-22 | Document data generation device, control method for document data generation device, and document data generation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7354399B1 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139441A (en) | 2004-11-11 | 2006-06-01 | Hitachi Systems & Services Ltd | Rule definition apparatus for document conversion |
US20090019358A1 (en) | 2005-02-11 | 2009-01-15 | Rivet Software, Inc. A Delaware Corporation | Extensible business reporting language (xbrl) enabler for business documents |
JP5690472B2 (en) | 2009-01-22 | 2015-03-25 | 株式会社日立製作所 | Data extraction system |
JP5400496B2 (en) | 2009-06-25 | 2014-01-29 | 株式会社野村総合研究所 | System for creating articles based on the results of financial statement analysis |
AU2012385075B2 (en) | 2012-07-12 | 2016-07-21 | Fujitsu Limited | Program, document conversion device, and document conversion method |
JP6758448B1 (en) | 2019-04-15 | 2020-09-23 | 株式会社フィエルテ | Document analysis device, document analysis method and document analysis program |
-
2022
- 2022-12-22 JP JP2022205839A patent/JP7354399B1/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753500B (en) | Method for merging and displaying formatted electronic form and OFD (office file format) and generating catalog | |
CN101661512B (en) | System and method for identifying traditional form information and establishing corresponding Web form | |
US20190171696A1 (en) | Web-intrinsic interactive documents | |
CN108762743B (en) | Data table operation code generation method and device | |
US6915303B2 (en) | Code generator system for digital libraries | |
US20100057760A1 (en) | Generic data retrieval | |
CN105589959A (en) | Form processing method and form processing system | |
US8234570B2 (en) | Harvesting assets for packaged software application configuration | |
CN102902673A (en) | Method and device for dynamically generating web pages | |
US10146881B2 (en) | Scalable processing of heterogeneous user-generated content | |
WO2007081017A1 (en) | Document processor | |
JP2012098878A (en) | Business form creation processing system and business form creation processing method and program | |
WO2013054581A1 (en) | Method for generating workflow from business specification; program; and system | |
JP5064791B2 (en) | Form data search device, form data search method and program | |
JP2024090145A (en) | Document data generation device, control method for document data generation device, and document data generation program | |
JP7354399B1 (en) | Document data generation device, control method for document data generation device, and document data generation program | |
JP2002288153A (en) | Application-independent data forming method, information processing program, and layout information processing system | |
US20080077641A1 (en) | System and method for editing contract clauses in static web pages | |
JP4906424B2 (en) | Web service design method and apparatus | |
US7730105B2 (en) | Time sharing managing apparatus, document creating apparatus, document reading apparatus, time sharing managing method, document creating method, and document reading method | |
WO2005098698A1 (en) | Document processing device | |
JP2014164548A (en) | Information processing system | |
JP2003288332A (en) | Method and system for supporting structured document creation | |
JP2006236262A (en) | Information extraction program and method | |
US20240184985A1 (en) | Information representation structure analysis device, and information representation structure analysis method |