JP7354399B1 - 文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム - Google Patents
文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム Download PDFInfo
- Publication number
- JP7354399B1 JP7354399B1 JP2022205839A JP2022205839A JP7354399B1 JP 7354399 B1 JP7354399 B1 JP 7354399B1 JP 2022205839 A JP2022205839 A JP 2022205839A JP 2022205839 A JP2022205839 A JP 2022205839A JP 7354399 B1 JP7354399 B1 JP 7354399B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- document data
- rewritten
- rewriting
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000000605 extraction Methods 0.000 claims abstract description 56
- 239000000284 extract Substances 0.000 claims abstract description 40
- 230000006870 function Effects 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 14
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
以下、本発明の実施形態1に係る文書データ生成装置10および文書データ生成装置の制御方法S1について説明する。
図1を用いて、文書データ生成装置10について説明する。図1は、実施形態1に係る文書データ生成装置10の構成の一例を示すブロック図である。文書データ生成装置10は、第1の文書データから第2の文書データを生成する。第1の文書データおよび第2の文書データはともに事業報告に関する文書であり、第1の文書データは、タグ付けされた複数の要素を含む。図1に示すように、文書データ生成装置10は、取得部11と、制御部12と、表示部13とを備える。
取得部11は、第1の文書データを取得する。
制御部12は、文書データ生成装置10を制御する。図1に示すように、制御部12は、抽出部121と、生成部122とを備える。
抽出部121は、第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。第2の文書データのテンプレートデータは、和文であってもよいし、英文など、和文を翻訳したものであってもよい。
生成部122は、テンプレートデータの各書き換え要素の内容を、第1の文書データにおける複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた第2の文書データを生成する。
表示部13は、第1の文書データや第2の文書データなどの文書データを表示する。
以下、図2~5を用いて、文書データ生成装置の制御方法S1について説明する。図2は、実施形態1に係る文書データ生成装置の制御方法S1の一例を示すフロー図である。図3は、第1の文書データD1の一例を示す図である。図4は、第2の文書データのテンプレートデータTDの一例を示す図である。図5は、第2の文書データD2の一例を示す図である。文書データ生成装置の制御方法S1は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する。図2に示すように、文書データ生成装置の制御方法S1は、取得工程S11と、抽出工程S12と、生成工程S13と、表示工程S14とを含む。
取得工程S11において、文書データ生成装置10の取得部11は、外部から文書データ生成装置10に入力された第1の文書データを取得する。例えば、取得部11は、図3に示す第1の文書データD1を取得してもよい。
抽出工程S12において、文書データ生成装置10の抽出部121は、第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。例えば、抽出部121は、図4に示すテンプレートデータTDに含まれる要素C11~C19を書き換え要素として抽出する。抽出部121は、テンプレートデータTDに含まれる要素C11~C19の属性値に基づいて、書き換え要素を抽出してもよい。属性値としては、例えば、HTML(Hyper Text Markup Language)5 dataを用いたものが挙げられ、この場合、属性値は以下の(I)~(XI)の少なくとも1つを含んでいてもよい。属性値が、これらの少なくとも1つを含むことにより、抽出部121は、テンプレートデータTDから書き換え要素を高精度に抽出することができる。
(II)日付として表示するXBRL内のコンテキスト情報を指定するdata-context
(III)表示の際の書式を指定するdata-format
(IV)XBRLに含まれるID属性を指すdata-id
(V)表示する値の期間情報を指定するdata-keyword
(VI)XBRLに含まれるMember属性を指定するdata-member
(VII)対応箇所の削除可否を指定するdata-nilable
(VIII)表示する日付の種類を指定するdata-period
(IX)表示する項目の識別子であるdata-type
(X)表示する単位の識別子であるdata-unit
(XI)XBRL内の区分を指すdata-role
以下、図4を用いて、抽出部121がテンプレートデータTDに含まれる要素C11~C19の属性値に基づき、書き換え要素を抽出する抽出工程S12の一例を説明する。
生成工程S13において、文書データ生成装置10の生成部122は、テンプレートデータの各書き換え要素の内容を、第1の文書データにおける複数の要素のうち、書き換え要素に対応する対応要素を用いて書き換えた第2の文書データを生成する。これにより、事業報告に関する第1の文書データから形式が異なる第2の文書データを生成できる。
以下、図3~5を用いて、生成工程S13の一例について説明する。生成部122は、図4に示すテンプレートデータTDの各書き換え要素の内容を、図3に示す第1の文書データD1における複数の要素のうち、書き換え要素に対応する対応要素C1~C9を用いて書き換えた、図5に示す第2の文書データD2を生成する。
表示工程S14において、文書データ生成装置10の表示部13は、第2の文書データを表示する。例えば、表示部13は、図5に示す第2の文書データD2を表示する。
以下、実施形態2に係る文書データ生成装置10Xについて説明する。説明の便宜上、上述の実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
図6は、実施形態2に係る文書データ生成装置10Xの構成の一例を示すブロック図である。文書データ生成装置10Xは、実施形態1における制御部12の代わりに、制御部12Xを備えている。
制御部12Xは、実施形態1における抽出部121と、表示部13との代わりに、抽出部121Xと、表示部13Xとを備え、第2の生成部123をさらに備えている。この点以外は、制御部12Xは、実施形態1における制御部12と同様である。
抽出部121Xは、グラフおよび文書を含む第3の文書データ(要約抜粋版資料)のテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。
第2の生成部123は、第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する。具体的には、第2の生成部123は、第3の文書データのテンプレートデータの各書き換え要素の内容を、第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた第3の文書データを生成する。これにより、事業報告に関する第1の文書データから、第1の文書データを要約した第3の文書データを生成することができる。
表示部13Xは、第3の文書データをさらに表示する。
以下、図7を用いて、文書データ生成装置の制御方法S1Xについて説明する。図7は、実施形態2に係る文書データ生成装置の制御方法S1Xの一例を示すフロー図である。文書データ生成装置の制御方法S1Xは、取得工程S21と、抽出工程S22と、生成工程S23と、第2の生成工程S24と、表示工程S25とを含む。取得工程S21および生成工程S23は、実施形態1における取得工程S11およびS13と同様である。
抽出工程S22において、文書データ生成装置10Xの抽出部121Xは、グラフおよび文書を含む第3の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する。例えば、第3の文書データのテンプレートがグラフ用テンプレートと文書用テンプレートとの2つのテンプレートから構成されている場合、抽出部121Xは、グラフ用テンプレートおよび文書用テンプレートの各々に含まれる書き換え要素を抽出してもよい。第3の文書データのテンプレートがグラフおよび文書を含む1つのテンプレートから構成されている場合、抽出部121Xは、当該1つのテンプレートに含まれる書き換え要素を抽出してもよい。
第2の生成工程S24において、文書データ生成装置10Xの第2の生成部123は、第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する。具体的には、第2の生成部123は、第3の文書データのテンプレートデータの各書き換え要素の内容を、第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた第3の文書データを生成する。
表示工程S25において、文書データ生成装置10Xの表示部13Xは、第3の文書データを表示する。例えば、表示部13Xは、第1の文書データD1における対応要素C9を含む任意の記載T1を削除し、対応要素C3~C8を含む表を棒グラフに書き換えた第3の文書データを表示する。
文書データ生成装置10および10X(以下、「装置」と呼ぶ)の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック(特に制御部12および12Xに含まれる各部)としてコンピュータを機能させるためのプログラムにより実現することができる。
本発明の態様1に係る文書データ生成装置は、タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置であって、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、を備える。
121、121X 抽出部
122 生成部
123 第2の生成部
C1、C2、C3、C4、C5、C6、C7、C8、C9 対応要素
C11、C12、C13、C14、C15、C16、C17、C18、C19 要素
C21、C22、C23、C24、C25、C26、C29 翻訳後内容
D1 第1の文書データ
D2 第2の文書データ
S1、S1X 文書データ生成装置の制御方法
S11、S21 取得工程
S12、S22 抽出工程
S13、S23 生成工程
S14、S25 表示工程
S24 第2の生成工程
Claims (6)
- タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置であって、
前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、
前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、
を備え、
前記第1の文書データには、XBRL(eXtensible Business Reporting Language)が用いられており、
前記抽出部は、前記テンプレートデータに含まれる各要素の属性値に基づいて、前記書き換え要素を抽出し、
前記生成部は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定し、
前記生成部は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値に応じて前記対応要素の内容を変換した変換後内容に書き換え、
前記第2の文書データは、前記第1の文書データの翻訳物であり、
前記生成部は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値をパラメータとして用いて前記対応要素の内容を機械翻訳した翻訳後内容に書き換える、文書データ生成装置。 - 前記第1の文書データから、当該第1の文書データを要約した第3の文書データを生成する第2の生成部をさらに備え、
前記抽出部は、グラフおよび文書を含む前記第3の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出し、
前記第2の生成部は、前記第3の文書データのテンプレートデータの各書き換え要素の内容を、前記第1の文書データにおいて当該書き換え要素に対応する対応要素を用いて書き換えた前記第3の文書データを生成する、請求項1に記載の文書データ生成装置。 - タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置であって、
前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出部と、
前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成部と、
を備え、
前記第1の文書データには、XBRL(eXtensible Business Reporting Language)が用いられており、
前記抽出部は、前記テンプレートデータに含まれる各要素の属性値に基づいて、前記書き換え要素を抽出し、
前記生成部は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定し、
前記属性値は、(I)前記XBRL内の要素を指し、当該要素の子要素の全てを表示するdata-abs、(II)日付として表示する前記XBRL内のコンテキスト情報を指定するdata-context、(III)表示の際の書式を指定するdata-format、(IV)前記XBRLに含まれるID属性を指すdata-id、(V)表示する値の期間情報を指定するdata-keyword、(VI)前記XBRLに含まれるMember属性を指定するdata-member、(VII)対応箇所の削除可否を指定するdata-nilable、(VIII)表示する日付の種類を指定するdata-period、(IX)表示する項目の識別子であるdata-type、(X)表示する単位の識別子であるdata-unit、および、(XI)前記XBRL内の区分を指すdata-roleのうちの少なくとも1つを含む、文書データ生成装置。 - タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置の制御方法であって、
前記文書データ生成装置が、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出工程と、
前記文書データ生成装置が、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成工程と、
を含み、
前記第1の文書データには、XBRL(eXtensible Business Reporting Language)が用いられており、
前記抽出工程において、前記文書データ生成装置は、前記テンプレートデータに含まれる各要素の属性値に基づいて、前記書き換え要素を抽出し、
前記生成工程において、前記文書データ生成装置は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定し、
前記生成工程において、前記文書データ生成装置は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値に応じて前記対応要素の内容を変換した変換後内容に書き換え、
前記第2の文書データは、前記第1の文書データの翻訳物であり、
前記生成工程において、前記文書データ生成装置は、少なくとも一部の前記書き換え要素の内容を、当該書き換え要素の属性値をパラメータとして用いて前記対応要素の内容を機械翻訳した翻訳後内容に書き換える、文書データ生成装置の制御方法。 - タグ付けされた複数の要素を含む、事業報告に関する第1の文書データから第2の文書データを生成する文書データ生成装置の制御方法であって、
前記文書データ生成装置が、前記第2の文書データのテンプレートデータに含まれる、書き換え対象となる書き換え要素を抽出する抽出工程と、
前記文書データ生成装置が、前記テンプレートデータの各書き換え要素の内容を、前記第1の文書データにおける前記複数の要素のうち、当該書き換え要素に対応する対応要素を用いて書き換えた前記第2の文書データを生成する生成工程と、
を含み、
前記第1の文書データには、XBRL(eXtensible Business Reporting Language)が用いられており、
前記抽出工程において、前記文書データ生成装置は、前記テンプレートデータに含まれる各要素の属性値に基づいて、前記書き換え要素を抽出し、
前記生成工程において、前記文書データ生成装置は、各書き換え要素が有する属性値に基づいて、当該書き換え要素に対応する対応要素を特定し、
前記属性値は、(I)前記XBRL内の要素を指し、当該要素の子要素の全てを表示するdata-abs、(II)日付として表示する前記XBRL内のコンテキスト情報を指定するdata-context、(III)表示の際の書式を指定するdata-format、(IV)前記XBRLに含まれるID属性を指すdata-id、(V)表示する値の期間情報を指定するdata-keyword、(VI)前記XBRLに含まれるMember属性を指定するdata-member、(VII)対応箇所の削除可否を指定するdata-nilable、(VIII)表示する日付の種類を指定するdata-period、(IX)表示する項目の識別子であるdata-type、(X)表示する単位の識別子であるdata-unit、および、(XI)前記XBRL内の区分を指すdata-roleのうちの少なくとも1つを含む、文書データ生成装置の制御方法。 - 請求項1または3に記載の文書データ生成装置としてコンピュータを機能させるための文書データ生成プログラムであって、前記抽出部および前記生成部としてコンピュータを機能させるための文書データ生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022205839A JP7354399B1 (ja) | 2022-12-22 | 2022-12-22 | 文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022205839A JP7354399B1 (ja) | 2022-12-22 | 2022-12-22 | 文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7354399B1 true JP7354399B1 (ja) | 2023-10-02 |
JP2024090145A JP2024090145A (ja) | 2024-07-04 |
Family
ID=88198137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022205839A Active JP7354399B1 (ja) | 2022-12-22 | 2022-12-22 | 文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7354399B1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139441A (ja) | 2004-11-11 | 2006-06-01 | Hitachi Systems & Services Ltd | 文書変換のための規則定義付け装置 |
US20090019358A1 (en) | 2005-02-11 | 2009-01-15 | Rivet Software, Inc. A Delaware Corporation | Extensible business reporting language (xbrl) enabler for business documents |
JP2010170287A (ja) | 2009-01-22 | 2010-08-05 | Hitachi Ltd | データ抽出システム |
JP2011008527A (ja) | 2009-06-25 | 2011-01-13 | Nomura Research Institute Ltd | 決算書の分析結果に基づく記事を作成するシステム |
WO2014010068A1 (ja) | 2012-07-12 | 2014-01-16 | 富士通株式会社 | プログラム、文書変換装置および文書変換方法 |
JP2020177293A (ja) | 2019-04-15 | 2020-10-29 | 株式会社フィエルテ | 文書解析装置、文書解析方法及び文書解析プログラム |
-
2022
- 2022-12-22 JP JP2022205839A patent/JP7354399B1/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139441A (ja) | 2004-11-11 | 2006-06-01 | Hitachi Systems & Services Ltd | 文書変換のための規則定義付け装置 |
US20090019358A1 (en) | 2005-02-11 | 2009-01-15 | Rivet Software, Inc. A Delaware Corporation | Extensible business reporting language (xbrl) enabler for business documents |
JP2010170287A (ja) | 2009-01-22 | 2010-08-05 | Hitachi Ltd | データ抽出システム |
JP2011008527A (ja) | 2009-06-25 | 2011-01-13 | Nomura Research Institute Ltd | 決算書の分析結果に基づく記事を作成するシステム |
WO2014010068A1 (ja) | 2012-07-12 | 2014-01-16 | 富士通株式会社 | プログラム、文書変換装置および文書変換方法 |
JP2020177293A (ja) | 2019-04-15 | 2020-10-29 | 株式会社フィエルテ | 文書解析装置、文書解析方法及び文書解析プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2024090145A (ja) | 2024-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753500B (zh) | 版式化后的电子表单与ofd合并展现及目录生成的方法 | |
CN101661512B (zh) | 一种识别传统表单信息并创建对应Web表单的系统及方法 | |
CN101751382B (zh) | 一种基于标签的数据采集方法与系统 | |
JP5570608B2 (ja) | エクセル基盤の分析レポート作成システム及び方法 | |
US20090187530A1 (en) | Enabling users to edit very large xml data | |
US20020152221A1 (en) | Code generator system for digital libraries | |
JP2022041865A (ja) | テンプレートに基づくエクセル文書のオンライン作業システム | |
WO2007081017A1 (ja) | 文書処理装置 | |
JP7354399B1 (ja) | 文書データ生成装置、文書データ生成装置の制御方法および文書データ生成プログラム | |
JP6668580B2 (ja) | ファイル編集方法、ファイル編集装置及びファイル編集プログラム | |
JP4451925B1 (ja) | ガイドライン管理装置及びガイドライン管理プログラム | |
JP5064791B2 (ja) | 帳票データ検索装置、帳票データ検索方法及びプログラム | |
JP2016224550A (ja) | 変換方法 | |
JPWO2005098698A1 (ja) | 文書処理装置 | |
JP4923413B2 (ja) | 情報抽出プロブラム及び方法 | |
TWI682291B (zh) | 網頁之動態生成方法、網頁生成裝置及電腦程式產品 | |
US20110126091A1 (en) | Information processing apparatus, control method, and program | |
WO2017090054A1 (en) | Editfile | |
JP5944945B2 (ja) | インメモリ管理システムおよびインメモリ管理用プログラム | |
JP2015162107A (ja) | 対応関係抽出装置、対応関係抽出方法、対応関係抽出プログラム | |
JP5462967B1 (ja) | データ出力システム | |
JP5232748B2 (ja) | ワークフロー表示支援装置及びワークフロー表示プログラム | |
KR20070040735A (ko) | 확장성 비지니스 리포팅 언어용 리포팅 양식 형성 방법,상기 리포팅 양식을 이용한 기업정보 보고서 형성 및 수정방법 | |
JP2007157037A (ja) | データベースのアクセス環境構築方法、アクセス環境構築プログラム、およびアクセス環境構築装置 | |
JP5982308B2 (ja) | 判定装置、判定方法、判定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230317 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7354399 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |