JP7293322B1 - 文書作成システム、文書作成方法及び文書作成プログラム - Google Patents
文書作成システム、文書作成方法及び文書作成プログラム Download PDFInfo
- Publication number
- JP7293322B1 JP7293322B1 JP2021196125A JP2021196125A JP7293322B1 JP 7293322 B1 JP7293322 B1 JP 7293322B1 JP 2021196125 A JP2021196125 A JP 2021196125A JP 2021196125 A JP2021196125 A JP 2021196125A JP 7293322 B1 JP7293322 B1 JP 7293322B1
- Authority
- JP
- Japan
- Prior art keywords
- abstract
- event
- sentence
- document creation
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013145 classification model Methods 0.000 claims abstract description 17
- 230000006378 damage Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1に示すように、本実施形態の文書作成システムは、ユーザ端末10、支援サーバ20を用いる。
図2は、ユーザ端末10、支援サーバ20等として機能する情報処理装置H10のハードウェア構成例である。
(2)各種処理のうち少なくとも一部の処理を実行する1つ以上の専用のハードウェア回路、或いは
(3)それらの組み合わせ、を含む回路(circuitry)
プロセッサは、CPU並びに、RAM及びROM等のメモリを含み、メモリは、処理をCPUに実行させるように構成されたプログラムコード又は指令を格納している。メモリすなわちコンピュータ可読媒体は、汎用又は専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。
図1を用いて、ユーザ端末10、支援サーバ20の機能を説明する。
ユーザ端末10は、本システムを利用するユーザが用いるコンピュータ端末である。
制御部21は、後述する処理(取得段階、学習段階、要約段階等を含む処理)を行なう。このための文書作成プログラムを実行することにより、制御部21は、取得部210、学習部211、要約部212等として機能する。
学習部211は、報告文に含まれる抽象的事象を特定するための事象分類モデルを生成する処理を実行する。
要約部212は、報告文から抽象的事象と具体的事象とを抽出して要約文を作成する処理を実行する。
次に、図3を用いて、学習時処理及び作成時処理を説明する。
(学習時処理)
まず、抽象的事象を抽出するための事象分類モデルの学習時処理を説明する。
ここでは、支援サーバ20の制御部21は、形態素分析処理を実行する(ステップS11)。具体的には、制御部21の取得部210は、ユーザ端末10から、教師情報として「報告文、要約文の抽象的事象」のデータセットを取得する。次に、取得部210は、報告文を形態素分析により、品詞に分けて、報告文に含まれる名詞群を抽出する。次に、取得部210は、「報告文を構成する名詞群、要約文の抽象的事象」のデータセットを教師情報記憶部22に記録する。
次に、要約文の作成時処理を説明する。
ここでは、支援サーバ20の制御部21は、形態素分析処理を実行する(ステップS21)。具体的には、制御部21の取得部210は、ユーザ端末10から、要約文を作成する報告文(対象文)を取得する。そして、取得部210は、報告文を形態素分析により、品詞に分けて、報告文に含まれる名詞群を抽出する。
更に、具体的事象を特定した場合には、要約部212は、特定した具体的事象を要約文テンプレートに組み込む。ここでは、「〔障害箇所・損傷箇所〕に障害・損傷が発生」の〔障害箇所・損傷箇所〕に、具体的事象を組み込む。
なお、具体的事象が特定しない場合には、具体的事象が含まれない要約文テンプレート「障害・損傷」を用いる。
(1)本実施形態においては、支援サーバ20の制御部21は、機械学習処理を実行する(ステップS12)。そして、支援サーバ20の制御部21は、抽象的事象の特定処理を実行する(ステップS22)。これにより、報告文から、利用機材・材料や動作・状況等の抽象的事象を分類することができる。この抽象的事象により、汎用性がある要約文を作成することができる。
・上記実施形態では、支援サーバ20の制御部21は、対象文の分割処理(ステップS23)、キーワード検索処理(ステップS24)、キーワードに応じた具体的事象の特定処理(ステップS26)を実行する。これにより、具体的事象を特定する。具体的事象の特定方法は、これに限定されるものではない。例えば、抽象的事象に関連付けて、要約文テンプレートやキーワード文の特定方法を変更してもよい。この場合には、支援サーバ20に、抽象的事象に関連付けて、要約文テンプレートやキーワード文の特定方法を記憶させておく。例えば、要約文テンプレートやキーワード文の特定方法において、抽象的事象が「人」に関する報告文の場合には、「負傷」を用いる。そして、例えば、抽象的事象として、「利用物」、「事故発生時の動作」を特定し、具体的事象として「受傷した体の部位」を特定する。
・上記実施形態では、抽象的事象510としては、利用機材・材料や動作・状況を分類する。抽象的事象は、報告文に関連する事象であれば、これらに限定されるものではない。例えば、文章の背景、種類等であってもよい。
Claims (5)
- 制御部と、教師情報を記録する教師情報記憶部と、を備えた文書作成システムであって、
前記制御部が、
前記教師情報記憶部に記録された文章を構成する名詞群、及び要約文の抽象的事象を関連付けた教師情報を用いて、前記文章から前記抽象的事象を分類する事象分類モデルを生成し、
新たな文章を取得した場合、前記文章に含まれる名詞群を抽出し、前記名詞群に対して前記事象分類モデルを用いて抽象的事象を特定し、
前記文章に含まれるキーワードを検索し、前記キーワードに関連付けられた具体的事象を、前記文章から抽出し、
前記抽象的事象及び前記具体的事象をテンプレートに挿入して、要約文を作成することを特徴とする文書作成システム。 - 前記制御部が、前記特定した抽象的事象により、前記要約文の作成に用いるテンプレートを特定することを特徴とする請求項1に記載の文書作成システム。
- 前記制御部が、前記特定した抽象的事象により、前記具体的事象の特定方法を変更することを特徴とする請求項1又は2に記載の文書作成システム。
- 制御部と、教師情報を記録する教師情報記憶部と、を備えた文書作成システムを用いて、要約文を作成する方法であって、
前記制御部が、
前記教師情報記憶部に記録された文章を構成する名詞群、及び要約文の抽象的事象を関連付けた教師情報を用いて、前記文章から前記抽象的事象を分類する事象分類モデルを生成し、
新たな文章を取得した場合、前記文章に含まれる名詞群を抽出し、前記名詞群に対して前記事象分類モデルを用いて抽象的事象を特定し、
前記文章に含まれるキーワードを検索し、前記キーワードに関連付けられた具体的事象を、前記文章から抽出し、
前記抽象的事象及び前記具体的事象をテンプレートに挿入して、要約文を作成することを特徴とする文書作成方法。 - 制御部と、教師情報を記録する教師情報記憶部と、を備えた文書作成システムを用いて、要約文を作成するためのプログラムであって、
前記制御部を、
前記教師情報記憶部に記録された文章を構成する名詞群、及び要約文の抽象的事象を関連付けた教師情報を用いて、前記文章から前記抽象的事象を分類する事象分類モデルを生成し、
新たな文章を取得した場合、前記文章に含まれる名詞群を抽出し、前記名詞群に対して前記事象分類モデルを用いて抽象的事象を特定し、
前記文章に含まれるキーワードを検索し、前記キーワードに関連付けられた具体的事象を、前記文章から抽出し、
前記抽象的事象及び前記具体的事象をテンプレートに挿入して、要約文を作成する手段として機能させるための文書作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021196125A JP7293322B1 (ja) | 2021-12-02 | 2021-12-02 | 文書作成システム、文書作成方法及び文書作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021196125A JP7293322B1 (ja) | 2021-12-02 | 2021-12-02 | 文書作成システム、文書作成方法及び文書作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7293322B1 true JP7293322B1 (ja) | 2023-06-19 |
JP2023088336A JP2023088336A (ja) | 2023-06-27 |
Family
ID=86772558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021196125A Active JP7293322B1 (ja) | 2021-12-02 | 2021-12-02 | 文書作成システム、文書作成方法及び文書作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7293322B1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024144A (ja) | 2000-07-05 | 2002-01-25 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール転送方法及び装置及び電子メール転送プログラムを格納した記憶媒体 |
JP2011087005A (ja) | 2009-10-13 | 2011-04-28 | Neikusu:Kk | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
JP2013050853A (ja) | 2011-08-31 | 2013-03-14 | Fuji Xerox Co Ltd | 含意関係判定装置及びプログラム |
-
2021
- 2021-12-02 JP JP2021196125A patent/JP7293322B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024144A (ja) | 2000-07-05 | 2002-01-25 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール転送方法及び装置及び電子メール転送プログラムを格納した記憶媒体 |
JP2011087005A (ja) | 2009-10-13 | 2011-04-28 | Neikusu:Kk | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
JP2013050853A (ja) | 2011-08-31 | 2013-03-14 | Fuji Xerox Co Ltd | 含意関係判定装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023088336A (ja) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697477B2 (en) | Non-factoid question-answering system and computer program | |
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
JP2007141090A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
JP2007517338A (ja) | サーチ品質の改善システムおよび改善方法 | |
US20090112845A1 (en) | System and method for language sensitive contextual searching | |
Avner et al. | Identifying translationese at the word and sub-word level | |
JP7381052B2 (ja) | 問合せ対応支援装置、問合せ対応支援方法、プログラム及び記録媒体 | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
JP2000331032A (ja) | 文書処理装置、単語抽出装置及び単語抽出方法 | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
Marujo et al. | Key phrase extraction of lightly filtered broadcast news | |
JP7293322B1 (ja) | 文書作成システム、文書作成方法及び文書作成プログラム | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
Ye et al. | Towards Automatic Animated Storyboarding. | |
KR102395926B1 (ko) | 복합명사 분석장치 및 방법, 컴퓨터 프로그램 | |
US12026482B2 (en) | Methods, systems, and computer readable media for creating and using minimum dictionary language (MDL) to access data in closed-domain data sets | |
JP3743204B2 (ja) | データ分析支援方法および装置 | |
Silva et al. | Improving CoGrOO: the Brazilian Portuguese Grammar Checker | |
KR102372629B1 (ko) | 포인터 네트워크를 이용한 트리플 추출방법 및 그 추출장치 | |
JP3471253B2 (ja) | 文書分類方法、文書分類装置、および文書分類プログラムを記録した記録媒体 | |
JP5506482B2 (ja) | 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム | |
CN102346777A (zh) | 一种对例句检索结果进行排序的方法和装置 | |
JP2008282328A (ja) | テキスト分類装置、テキスト分類方法及びテキスト分類プログラム並びにそのプログラムを記録した記録媒体 | |
CA2363017C (en) | Multi-document summarization system and method | |
Milidiú et al. | Portuguese corpus-based learning using ETL |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7293322 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |