JP7268220B2 - Text processing device and text processing method - Google Patents

Text processing device and text processing method Download PDF

Info

Publication number
JP7268220B2
JP7268220B2 JP2022063803A JP2022063803A JP7268220B2 JP 7268220 B2 JP7268220 B2 JP 7268220B2 JP 2022063803 A JP2022063803 A JP 2022063803A JP 2022063803 A JP2022063803 A JP 2022063803A JP 7268220 B2 JP7268220 B2 JP 7268220B2
Authority
JP
Japan
Prior art keywords
classification
sentence
text
sentences
performance data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022063803A
Other languages
Japanese (ja)
Other versions
JP2022082746A (en
Inventor
整 坂入
学 菅澤
尚宏 鈴木
一樹 山根
昌幸 親松
敬之 若山
尚平 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
East Japan Railway Co
Original Assignee
Hitachi Ltd
East Japan Railway Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2018049146A external-priority patent/JP2019160134A/en
Application filed by Hitachi Ltd, East Japan Railway Co filed Critical Hitachi Ltd
Priority to JP2022063803A priority Critical patent/JP7268220B2/en
Publication of JP2022082746A publication Critical patent/JP2022082746A/en
Application granted granted Critical
Publication of JP7268220B2 publication Critical patent/JP7268220B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文章処理装置および文章処理方法に係り、特に、膨大な文章を、目的に沿って、即座に分類し、要約を効率的に取得するのに好適な文章処理に関する。 The present invention relates to a text processing apparatus and a text processing method, and more particularly to text processing suitable for quickly classifying a large amount of text according to a purpose and efficiently obtaining a summary.

インターネットの爆発的な普及に伴って、各企業は、Webシステムをどのように利用して顧客と対応するか、が最重要な課題となりつつある。そのような状況下において、企業は、Webシステムを利用した情報発信のみならず、コールセンタやSNS(Social Networking Service)と連動して、顧客の要望や商品・サービスに対する書き込みなどから情報収集して、改善点を洗い出したり、そのような要望に即座に対応することが企業活動における大切なポイントとなっている。 With the explosive spread of the Internet, the most important issue for each company is how to use Web systems to deal with customers. Under such circumstances, companies not only transmit information using web systems, but also work in conjunction with call centers and SNS (Social Networking Services) to collect information from customer requests and comments on products and services. Identifying points for improvement and promptly responding to such requests are important points in corporate activities.

インターネットから収集した文書を企業が有効活用するためには、情報処理装置により、トピックごとに、文書を分類し、要約する技術が求められる。例えば、特許文献1には、抽出された人物属性およびトピックに基づいた質問カテゴリを候補として選択し、それに対するユーザ発話をその質問カテゴリに属する質問の回答して分類する方法が開示されている。また、特許文献2には、入力されたテキストから複数の要約文を出力し、複数の評価尺度からその要約文を評価して、最も適切な要約文を抽出する技術が開示されている。 In order for companies to make effective use of documents collected from the Internet, technology for classifying and summarizing documents by topic using an information processing device is required. For example, Patent Literature 1 discloses a method of selecting a question category as a candidate based on extracted personal attributes and topics, and classifying user utterances by answering questions belonging to the question category. Further, Patent Literature 2 discloses a technique of outputting a plurality of abstract sentences from an input text, evaluating the abstract sentences based on a plurality of evaluation scales, and extracting the most appropriate abstract sentence.

特開2016-206894号公報JP 2016-206894 A 特開2016-161967号公報JP 2016-161967 A

例えば、鉄道事業者のような多角的な経営をおこなっている大企業では、そのようなインターネットから収集された文書は、年に何十万件というレベルになる。そのような文書情報を、適切にかつタイムリーに処理して企業活動に活かすのがよい。 For example, in a large diversified company such as a railroad operator, such documents collected from the Internet amount to hundreds of thousands of documents per year. It is desirable to appropriately and timely process such document information and utilize it in corporate activities.

また、特に、インターネットでトレンド入りするようなキーワードに関する文章を抜き出して、タイムリーに処理し、見解や対応情報が必要になることがある。例えば、鉄道事業者では、特定の路線の事故に関するキーワードに関する文章から情報を取得して、適切な対応をとることが必要になる。 In particular, it may be necessary to extract sentences related to keywords that are trending on the Internet, process them in a timely manner, and provide opinions and corresponding information. For example, a railway operator needs to obtain information from sentences related to keywords related to accidents on specific routes and take appropriate measures.

特許文献1に記載の技術では、そのような特定のキーワードを指定して分類するような技術については考慮されておらず、ニュースや流行に対処した文章の分類をおこなうことはできない。また、特許文献2には、ユーザの要望など特定の視点に関して、要約を作成する技術について開示されていない。例えば、ユーザより要望に関する視点に基づいた要約文を抽出することによって、ユーザの要望により、改善点を洗い出し、それに対処することにより、顧客満足度を向上することについては、考慮されていない。 The technique described in Patent Literature 1 does not take into consideration such a technique of specifying and classifying specific keywords, and cannot classify sentences in response to news and trends. Moreover, Patent Document 2 does not disclose a technique for creating a summary with respect to a specific viewpoint such as a user's request. For example, no consideration is given to improving customer satisfaction by extracting a summary sentence based on the viewpoint of the user's request, identifying points for improvement according to the user's request, and dealing with them.

本発明の目的は、膨大な対象文章に対して、ニュースや流行に対処したキーワードによる分類を行うことができ、文章構造に即した文章の要約を行い、要約した文章より特定の視点から適切に情報を取得できる文章処理装置および文章処理方法を提供することにある。 An object of the present invention is to classify a huge amount of target sentences by keywords corresponding to news and trends, to summarize the sentences according to the sentence structure, and to make the sentences more appropriate from a specific point of view than the summarized sentences. An object of the present invention is to provide a sentence processing device and a sentence processing method capable of acquiring information.

本発明の文章処理装置は、好ましくは、文章の要約を行って、その文章の要約文を出力する文章処理装置であって、分類タグを付与された文章と要約文の対である要約実績データを保持し、入力された文章の単文に対して構造解析を行い、構造解析に関係する意味を抽出し、要約実績データの分類タグごとに、構造解析に関係する意味のある単文を抽出し、入力された文章の単文と、要約実績データの文章との類似度が規定の閾値以上のときに、要約実績データの要約文を入力された文章の要約文とするようにしたものである。
本発明はまた、上記文章処理装置における文章処理方法として構成される。
The text processing device of the present invention is preferably a text processing device that summarizes a text and outputs a summary of the text, and is summary performance data that is a pair of the text to which the classification tag is assigned and the summary. , perform structural analysis on simple sentences of the input text, extract meanings related to structural analysis, extract meaningful simple sentences related to structural analysis for each classification tag of summary performance data, When the degree of similarity between the simple sentence of the input sentence and the sentence of the summarized performance data is equal to or higher than a specified threshold, the summary sentence of the summary performance data is used as the summary sentence of the input sentence.
The present invention is also configured as a text processing method for the text processing device.

本発明によれば、膨大な対象文章に対して、ニュースや流行に対処したキーワードによる分類を行うことができ、文章構造に即した文章の要約を行い、要約した文章より特定の視点から適切に情報を取得できる。 According to the present invention, it is possible to classify a huge amount of target sentences by keywords corresponding to news and trends, summarize the sentences according to the sentence structure, and appropriately classify the sentences from the summarized sentences from a specific viewpoint. information can be obtained.

文章処理装置の機能構成を示す図である。It is a figure which shows the functional structure of a sentence processing apparatus. 文章処理装置のハードウェア・ソフトウェア構成を示す図である。It is a figure which shows the hardware software configuration of a sentence processing apparatus. 本発明の文章処理の特徴の概要を示す図である。It is a figure which shows the outline|summary of the characteristic of the text processing of this invention. 分類実績データの一例を示す図である。It is a figure which shows an example of classification performance data. 要約実績データの一例を示す図である。It is a figure which shows an example of summary performance data. 分類・要約済データの一例を示す図である。It is a figure which shows an example of classified and summarized data. 文章解析結果データの一例を示す図である。It is a figure which shows an example of sentence-analysis result data. レポート作成開始画面の一例を示す図である。It is a figure which shows an example of a report preparation start screen. 文章分類・要約結果画面の一例を示す図である。It is a figure which shows an example of a sentence classification / summarization result screen. 文章分類・要約詳細一覧画面の一例を示す図である。FIG. 11 is a diagram showing an example of a text classification/summary details list screen; 分類変更画面の一例を示す図である。It is a figure which shows an example of a classification change screen. 要約変更画面の一例を示す図である。It is a figure which shows an example of a summary change screen. レポート表示画面の一例を示す図である。It is a figure which shows an example of a report display screen. 文章情報蓄積処理を示すフローチャートである。It is a flow chart which shows sentence information accumulation processing. 文章解析処理を示すフローチャートである。It is a flow chart which shows sentence analysis processing. 文章分類処理を示すフローチャートである。It is a flow chart which shows sentence classification processing. 文章要約処理を示すフローチャートである。It is a flow chart which shows text summarization processing. 分類学習処理を示すフローチャートである。4 is a flowchart showing classification learning processing; 要約学習処理を示すフローチャートである。4 is a flowchart showing summary learning processing; レポート作成処理を示すフローチャートである。4 is a flow chart showing report creation processing. 半自動分類処理を示すフローチャートである。4 is a flowchart showing semi-automatic classification processing;

以下、本発明に係る一実施形態を、図1ないし図21を用いて説明する。
先ず、図1および図2を用いて一施形態に係る文章処理装置の構成について説明する。
An embodiment according to the present invention will be described below with reference to FIGS. 1 to 21. FIG.
First, the configuration of a text processing apparatus according to an embodiment will be described with reference to FIGS. 1 and 2. FIG.

本実施形態に係る文章処理装置10は、図1にその機能構成が示されるように、文章解析部110、文章分類部120、分類変更部130、文章要約部140、要約変更部150、レポート作成部160から構成される。 As shown in FIG. 1, the text processing apparatus 10 according to the present embodiment includes a text analysis unit 110, a text classification unit 120, a classification change unit 130, a text summary unit 140, a summary change unit 150, and a report generator. It is composed of a part 160 .

文章解析部110は、外部から受信した文章の構造解析をして、文章解析結果データ(詳細は後述)を出力する部分である。文章分類部120は、文章の出現単語に基づいて、文章を分類(カテゴリ分け)して、分類タグを付与する部分である。分類変更部130は、文章分類部120で分類した分類を変更して、分類タグを付け直す部分である。文章要約部140は、文章を要約して、その要約文を作成する部分である。要約変更部150は、文章要約部140により作成された要約文を変更する部分である。レポート作成部160は、文章を分類した情報と要約した情報に基づいて、ユーザに結果を出力する部分である。 The text analysis unit 110 is a part that analyzes the structure of a text received from the outside and outputs text analysis result data (details will be described later). The sentence classification unit 120 is a part that classifies (categorizes) sentences based on words appearing in the sentences and assigns classification tags. The classification change section 130 is a section that changes the classification classified by the text classification section 120 and reattaches the classification tag. The sentence summarization section 140 is a part that summarizes the sentence and creates a summary sentence. The summary changing section 150 is a section that changes the summary created by the text summarizing section 140 . The report creation section 160 is a section that outputs a result to the user based on the information that classifies the text and the information that summarizes it.

文章解析部110は、単語解析部111、構造解析部112、文章解析結果処理部113からなる。単語解析部111は、文章を単語レベルで解析し、文章を単語に分割する部分である。構造解析部112は、文章を構造レベルで解析し、その意味を抽出する部分である。文章解析結果処理部113は、単語解析部111、構造解析部112の結果を処理する部分である。 The text analysis unit 110 is composed of a word analysis unit 111 , a structure analysis unit 112 and a text analysis result processing unit 113 . The word analysis unit 111 is a part that analyzes sentences at the word level and divides the sentences into words. The structural analysis unit 112 is a part that analyzes sentences at the structural level and extracts their meanings. The sentence analysis result processing unit 113 is a part that processes the results of the word analysis unit 111 and the structure analysis unit 112 .

文章分類部120は、分類処理部121、半自動分類部122、分類学習部123からなる。分類処理部121は、文章の分類に関する計算や判断をおこなう部分である。半自動分類部122は、分類のためのキーワードを入力して、分類させる半自動分類をおこなう部分である。分類学習部123は、文章と分類タグを関連付けた情報を、学習データとして保存する部分である。 The sentence classification section 120 is composed of a classification processing section 121 , a semi-automatic classification section 122 and a classification learning section 123 . The classification processing unit 121 is a part that performs calculations and judgments regarding the classification of sentences. The semi-automatic classification unit 122 is a part that performs semi-automatic classification by inputting a keyword for classification and classifying. The classification learning unit 123 is a part that stores information that associates sentences and classification tags as learning data.

文章要約部140は、要約処理部141、要約学習部142からなる。要約処理部141は、文章から要約を作成する部分である。要約学習部142は、文章と要約文を関連付けた情報を保存する部分である。 The text summarizing section 140 includes a summary processing section 141 and a summary learning section 142 . The summary processor 141 is a part that creates a summary from the text. The summary learning unit 142 is a part that stores information that associates sentences and abstracts.

文章処理装置のハードウェア構成としては、例えば、図2に示されるパーソナルコンピュータのような一般的な情報処理装置で実現される。 As for the hardware configuration of the text processing device, for example, it is realized by a general information processing device such as a personal computer shown in FIG.

文章処理装置10は、CPU(Central Processing Unit)202、主記憶装置204、ネットワークI/F206、表示I/F208、入出力I/F210、補助記憶I/F212が、バスにより結合された形態になっている。また、文章処理装置10は、ネットワーク60を介して、文章サーバ400と接続されている。文章サーバ400は、文章を格納しており、文章処理装置10に文章を配布するサーバである。 The text processing device 10 has a form in which a CPU (Central Processing Unit) 202, a main memory device 204, a network I/F 206, a display I/F 208, an input/output I/F 210, and an auxiliary memory I/F 212 are connected by a bus. ing. The text processing device 10 is also connected to the text server 400 via the network 60 . The text server 400 is a server that stores text and distributes the text to the text processing device 10 .

CPU202は、文章処理装置10の各部を制御し、主記憶装置204に必要なプログラムをロードして実行する。主記憶装置204は、通常、RAMなどの揮発メモリで構成され、CPU202が実行するプログラム、参照するデータが記憶される。ネットワークI/F206は、ネットワーク60と接続するためのインタフェースである。表示I/F208は、LCD(Liquid Crystal Display)などの表示装置220を接続するためのインタフェースである。入出力I/F210は、入出力装置を接続するためのインタフェースである。図2の例では、入出力装置としてキーボード230とポインティングデバイスのマウス232が接続されている。 The CPU 202 controls each part of the text processing device 10, loads necessary programs into the main memory 204, and executes them. The main memory device 204 is normally composed of a volatile memory such as a RAM, and stores programs executed by the CPU 202 and data to be referred to. A network I/F 206 is an interface for connecting with the network 60 . A display I/F 208 is an interface for connecting a display device 220 such as an LCD (Liquid Crystal Display). The input/output I/F 210 is an interface for connecting input/output devices. In the example of FIG. 2, a keyboard 230 and a mouse 232 as a pointing device are connected as input/output devices.

補助記憶I/F212は、HDD(Hard Disk Drive)250やSSD(Solid State Drive)などの補助記憶装置を接続するためのインタフェースである。 Auxiliary storage I/F 212 is an interface for connecting auxiliary storage devices such as HDD (Hard Disk Drive) 250 and SSD (Solid State Drive).

HDD250は、大容量の記憶容量を有しており、本実施形態を実行するためのプログラムが格納されている。文章処理装置10には、文章解析プログラム310、文章分類プログラム320、分類変更プログラム330、文章要約プログラム340、要約変更プログラム350、レポート作成プログラム360がインストールされている。 The HDD 250 has a large storage capacity and stores programs for executing the present embodiment. A text analysis program 310, a text classification program 320, a classification change program 330, a text summary program 340, a summary change program 350, and a report creation program 360 are installed in the text processing device 10. FIG.

文章解析プログラム310、文章分類プログラム320、分類変更プログラム330、文章要約プログラム340、要約変更プログラム350、レポート作成プログラム360は、それぞれ、文章解析部110、文章分類部120、分類変更部130、文章要約部140、要約変更部150、レポート作成部160の各機能を実現するためのプログラムである。 The text analysis program 310, the text classification program 320, the classification change program 330, the text summary program 340, the summary change program 350, and the report creation program 360 are the text analysis unit 110, the text classification unit 120, the classification change unit 130, and the text summary, respectively. It is a program for realizing each function of the section 140 , the summary changing section 150 and the report creating section 160 .

また、HDD250は、分類実績データ510、要約実績データ520、分類・要約済データ530、文章解析結果データ540を格納する。なお、各データの意義と構造については、後に詳説する。 The HDD 250 also stores classified performance data 510 , summary performance data 520 , classified/summarized data 530 , and sentence analysis result data 540 . The significance and structure of each data will be explained in detail later.

次に、図3を用いて、本発明の文章処理の特徴の概要を説明する。
従来では、文章の分類をおこなう場合には、文章から過去の分類実績データを元に、分類に当てはまる尤度/確信度を算出して、分類をおこなっていた。
Next, with reference to FIG. 3, an outline of features of text processing according to the present invention will be described.
Conventionally, when classifying sentences, the likelihood/certainty that applies to the classification is calculated based on the past classified performance data from the sentences, and the classification is performed.

本発明では、文章とともに、ユーザにより指定分類を入力させて、半自動分類を実施する(図3のphaseI)。ここで、指定分類とは、ユーザが新たに入力する分類のための分類タグ名とキーワードをいう。また、そのように分類のためのキーワードを入力して、情報処理装置に分類させることを半自動分類という。これにより、ユーザが抽出したい分類結果を半自動的に抽出可能になる。 In the present invention, the user inputs a designated classification together with a sentence, and semi-automatic classification is performed (phase I in FIG. 3). Here, the designated classification means a classification tag name and a keyword for classification newly input by the user. Inputting a keyword for classification in such a manner and causing the information processing apparatus to classify is called semi-automatic classification. This makes it possible to semi-automatically extract the classification result that the user wants to extract.

また、従来では、文章からパラメータを元に要約結果を生成していた。また、その評価結果を元にパラメータ更新していた。ここで、パラメータとは、例えば、特許文献2に記載されているように、文あるいは文の集合の特徴を重みとして表現した量である。 In addition, conventionally, summary results are generated based on parameters from sentences. Also, parameters are updated based on the evaluation results. Here, the parameter is a quantity expressing the feature of a sentence or a set of sentences as a weight, as described in Patent Document 2, for example.

本発明では、文章の要約をするときには、文章の構造・意味を解析して、その情報に、図3のphaseIでの分類の情報を加えて、要約文を作成する(図3のphaseII)。これにより、分類にあった要約文が作成可能になる。 In the present invention, when summarizing a sentence, the structure and meaning of the sentence are analyzed, and the classification information in phase I in FIG. 3 is added to the information to create a summary sentence (phase II in FIG. 3). As a result, it becomes possible to create a summary that matches the classification.

次に、図4ないし図7を用いて本実施形態の文章処理装置で用いられるデータ構造について説明する。
分類実績データ510は、文章を分類するための規範とするデータであり、図4に示されるように、分類タグ511、文章512の欄からなるデータ形式を有する。これは、文章512に格納されているテキストのパターンに対して、分類タグ511で示されるタグの分類をおこなうことを示している。この分類実績データ510は、分類学習処理(後述)によって学習されることにより生成される。
Next, the data structure used in the text processing apparatus of this embodiment will be described with reference to FIGS. 4 to 7. FIG.
The classification performance data 510 is data used as a standard for classifying sentences, and has a data format consisting of columns of classification tags 511 and sentences 512, as shown in FIG. This indicates that the text pattern stored in the sentence 512 is classified by the tag indicated by the classification tag 511 . This classification performance data 510 is generated by being learned by a classification learning process (described later).

要約実績データ520は、文章の要約文を作成するための規範とするデータであり、図5に示されるように、分類タグ521、文章522、文章構造523、要約文524の欄からなるデータ形式を有する。これは、分類タグ521により分類され、文章構造523に記載された文章構造を有する文章522のテキストパターンに対して、要約文524に記載された要約文を生成することを示している。この分類実績データ510は、要約学習処理(後述)によって学習されることにより生成される。 The summary performance data 520 is standard data for creating a summary of sentences, and as shown in FIG. have This indicates that a summary sentence 524 is generated for the text pattern of the sentence 522 classified by the classification tag 521 and having the sentence structure described in the sentence structure 523 . This classification performance data 510 is generated by learning through a summary learning process (described later).

分類・要約済データ530は、本実施形態の文章処理装置により、文章を分類し、要約を作成し終わった結果として保存されるデータであり、図6に示されるように、登録日531、文章532、分類タグ1(533)、分類タグ2(534)、要約文535の欄からなるデータ形式を有する。 The classified/summarized data 530 is data saved as a result of classifying sentences and creating a summary by the sentence processing apparatus of the present embodiment. As shown in FIG. 532, classification tag 1 (533), classification tag 2 (534), and summary text 535.

文章532に格納された文章に対して、登録日531に記載された登録日に、分類ためのタグとして、分類タグ1(533)、分類タグ2(534)に記載されたタグが付与され、要約文535に記載された要約文が生成されたことを示している。なお、本実施形態の説明では、分類タグは、二つとしているが、一つでもよいし、さらに、三以上の分類タグを有するようにしてもよい。 The text stored in the text 532 is given the tags described in the classification tag 1 (533) and the classification tag 2 (534) as tags for classification on the registration date described in the registration date 531, This indicates that the abstract written in the abstract 535 has been generated. In the description of this embodiment, the number of classification tags is two, but the number of classification tags may be one, or three or more classification tags may be provided.

文章解析結果データ540は、文章処理の対象となる文章に含まれる文章の解析結果を保持するデータであり、図7に示されるように、単文541、単語542、品詞543、文章構造544、意味545の欄からなるデータ形式を有する。 The sentence analysis result data 540 is data that holds the analysis results of sentences included in sentences to be processed. As shown in FIG. It has a data format consisting of 545 columns.

これは、単文541に記載された文が、各単語542に記載され、品詞543に記載された品詞に分解され、文章構造544に記載された文章構造を有し、その文は、単語、文章構造から意味545に記載された意味を有することを示している。例えば、図7の例では、「~してほしい」という文章構造から「速やかに放送をしてほしい」という単文は、(顧客の)要望という意味を有することを示している。 A sentence described in a simple sentence 541 is described in each word 542, decomposed into parts of speech described in a part of speech 543, and has a sentence structure described in a sentence structure 544. It indicates that it has the meaning described in the meaning 545 from the structure. For example, in the example of FIG. 7, it is shown that the simple sentence "I want you to broadcast promptly" has the meaning of a (customer's) request from the sentence structure of "I want you to do".

次に、図8ないし図12を用いて本実施形態の文章処理装置のユーザインタフェースについて説明する。
レポート作成開始画面700は、文章処理装置10により、文章分類と要約処理のレポートを生成し、表示するために最初に表示される画面であり、指定された期間における分類のための分類タグ名(以下、単に「分類タグ」ということもある)と分類キーワードを入力する画面である。レポート作成開始画面700は、図8に示されるように、文章対象範囲欄701、指定分類入力欄702、レポート作成開始ボタン705の表示要素を有する。
Next, the user interface of the text processing apparatus of this embodiment will be described with reference to FIGS. 8 to 12. FIG.
The report creation start screen 700 is a screen that is first displayed to generate and display a report of text classification and summarization processing by the text processing device 10, and the classification tag name ( Hereafter, this is a screen for inputting a classification keyword) and a classification keyword. As shown in FIG. 8, the report creation start screen 700 has display elements such as a sentence target range column 701, a specified classification input column 702, and a report creation start button 705. FIG.

文章対象範囲欄701は、取り扱う文章の期間を入力する欄である。例えば、文章の登録日時としては、文章を作成した時あるいは文章を文章サーバ400に格納した時とすることができる。指定分類入力欄702は、指定分類のための情報を入力する欄であり、分類タグ名入力欄703、分類キーワード入力欄704からなる。分類タグ名入力欄703は、分類のために使用される分類タグ名を入力する欄である。分類キーワード入力欄704は、分類に使用されるキーワードを入力する欄である。図8に示される例では、分類タグ名として、「装置故障」、分類キーワードとして、「信号」、「障害」が入力されている。レポート作成開始ボタン705は、指定分類を入力して、レポートを作成して表示するときに、選択するボタンである。 The sentence target range column 701 is a column for inputting the period of the sentence to be handled. For example, the registration date and time of the text can be the time when the text is created or the time when the text is stored in the text server 400 . A designated classification input field 702 is a field for inputting information for a designated classification, and consists of a classification tag name input field 703 and a classification keyword input field 704 . A classification tag name input field 703 is a field for inputting a classification tag name used for classification. A classification keyword input field 704 is a field for inputting a keyword used for classification. In the example shown in FIG. 8, "equipment failure" is entered as the classification tag name, and "signal" and "failure" are entered as the classification keywords. A report creation start button 705 is a button that is selected when a specified classification is entered and a report is created and displayed.

文章分類・要約結果画面710は、文章分類・要約処理の結果を表示する画面であり、図9に示されるように、分類タグ表示欄711、件数表示欄712、詳細一覧表示ボタン713がセットとして繰り返される表示要素を有する。 The text classification/summarization result screen 710 is a screen for displaying the result of the text classification/summarization processing, and as shown in FIG. It has repeated display elements.

分類タグ表示欄711は、指定分類の入力されたタグ名を表示する欄である。件数表示欄712は、その指定分類に属する文章の件数を表示する欄である。詳細一覧表示ボタン713は、その指定分類に属する文章分類・要約詳細一覧画面720(後述)を表示するために選択するボダンである。 The classification tag display field 711 is a field for displaying the input tag name of the designated classification. The number display column 712 is a column for displaying the number of sentences belonging to the specified classification. A detailed list display button 713 is a button that is selected to display a text classification/summary detailed list screen 720 (described later) belonging to the specified classification.

文章分類・要約詳細一覧画面720は、文章分類・要約処理をおこなった文章の詳細情報を表示し、変更の指定をおこなうための画面であり、図10に示されるように、原文表示欄721、要約文表示欄722、分類変更ボタン723、要約変更ボタン724の表示要素からなる。 The sentence classification/summary details list screen 720 is a screen for displaying detailed information of the sentences subjected to the sentence classification/summary processing and for designating changes. As shown in FIG. It consists of display elements such as a summary sentence display field 722 , a classification change button 723 and a summary change button 724 .

原文表示欄721は、元の文章を表示する欄である。要約文表示欄722は、元の文章の要約文を表示する欄である。分類変更ボタン723、要約変更ボタン724は、それぞれ分類変更画面730(後述)、要約変更画面740(後述)を表示するために選択するボタンである。 The original sentence display column 721 is a column for displaying the original sentence. The summary display field 722 is a field for displaying the summary of the original text. A change classification button 723 and a change summary button 724 are buttons selected to display a change classification screen 730 (described later) and a change summary screen 740 (described later), respectively.

分類変更画面730は、文章の指定分類を変更するための画面であり、図11に示されるように、原文表示欄731、要約文表示欄732、分類指定コンボボックス733、変更反映ボタン734の表示要素を有する。 The classification change screen 730 is a screen for changing the specified classification of sentences, and as shown in FIG. have elements.

原文表示欄731は、その文章の原文を表示する欄である。要約文表示欄732は、その文章の要約文を表示する欄である。分類指定コンボボックス733は、その文章の分類タグを付け替えるため入力表示要素である。変更反映ボタン734は、選択した分類タグを指定した文章に付与するために選択するボタンである。 The original sentence display column 731 is a column for displaying the original sentence of the sentence. The summary display field 732 is a field for displaying the summary of the text. A classification designation combo box 733 is an input display element for changing the classification tag of the sentence. A change reflection button 734 is a button that is selected to add the selected classification tag to the specified sentence.

なお、本実施形態では、分類のタグを三種類まで、指定できるようにしているが、それより少ない一種類、二種類を指定できるようにしてもよいし、それより多い四種類以上指定できるようにしてもよい。 In this embodiment, up to three types of classification tags can be specified. can be

要約変更画面740は、その文章要約文を編集して変更するための画面であり、図12に示されるように、原文表示欄741、分類表示欄742、要約文編集エリア743、変更反映ボタン744の表示要素を有する。 The summary change screen 740 is a screen for editing and changing the text summary, and as shown in FIG. display elements.

原文表示欄741は、その文章の原文を表示する欄である。分類表示欄742は、その文章の分類タグを表示する欄である。要約文編集エリア743は、その文章の要約文を表示する欄である。要約文編集エリア743には、現在の要約文の内容が表示され、ユーザは、キーボードなどの入力デバイスを用いて、その要約文を変更することができる。変更反映ボタン744は、要約文編集エリア743で編集した要約文を反映するために選択する表示要素である。 The original sentence display column 741 is a column for displaying the original sentence of the sentence. The classification display field 742 is a field for displaying the classification tag of the text. A summary text editing area 743 is a column for displaying a summary of the text. The abstract editing area 743 displays the contents of the current abstract, and the user can change the abstract using an input device such as a keyboard. A change reflection button 744 is a display element selected to reflect the summary edited in the summary editing area 743 .

レポート表示画面750は、指定分類入力後に作成されるレポートを表示する画面であり、図13に示されるように、文章対象範囲表示欄751、指定分類表示欄752、要約文表示欄753、印刷ボタン754、閉じるボタン755の表示要素を有する。 The report display screen 750 is a screen for displaying a report created after inputting the designated classification, and as shown in FIG. 754 , has a display element for the close button 755 .

文章対象範囲表示欄751は、レポート作成開始画面700から入力された対象文章の期間を表示する欄である。指定分類表示欄752は、レポート作成開始画面700から入力された指定分類の分類タグ名、キーワードを表示する欄である。要約文表示欄753は、取り出された要約文を表示する欄である。印刷ボタン754は、レポート表示画面750に表示される情報を印刷するときに選択するボタンである。閉じるボタン755は、レポート表示画面750を閉じるときに選択するボタンである。 The text target range display column 751 is a column for displaying the period of the target text input from the report creation start screen 700 . The designated classification display field 752 is a field for displaying the classification tag name and keyword of the designated classification input from the report creation start screen 700 . The abstract display column 753 is a column for displaying the retrieved abstract. A print button 754 is a button that is selected when printing the information displayed on the report display screen 750 . A close button 755 is a button selected when closing the report display screen 750 .

次に、図14ないし図21を用いて文章処理装置のおこなう処理について説明する。
図14のフローチャートに示される文章情報蓄積処理は、文章とその文章の分類・要約の結果を文章処理装置に蓄積する処理である。
Next, processing performed by the text processing apparatus will be described with reference to FIGS. 14 to 21. FIG.
The sentence information accumulation process shown in the flowchart of FIG. 14 is a process of accumulating sentences and the results of classification and summarization of the sentences in the sentence processing device.

文章情報蓄積処理では、先ず、文章解析処理をおこなう(S101)。この文章解析処理は、後に詳述する。
次に、文章分類処理をおこなう(S102)。この文章分類処理は、後に詳述する。
次に、文章要約処理をおこなう(S103)。この文章要約処理は、後に詳述する。
次に、S102とS103の文章分類・文章要約の結果を、図6に示した分類・要約済データ530に蓄積する(S104)。
In the text information accumulation process, text analysis processing is first performed (S101). This sentence analysis processing will be described in detail later.
Next, sentence classification processing is performed (S102). This sentence classification processing will be described in detail later.
Next, text summary processing is performed (S103). This text summarization process will be described in detail later.
Next, the results of text classification and text summarization in S102 and S103 are accumulated in the classified/summarized data 530 shown in FIG. 6 (S104).

次に、図15を用いて文章解析処理について説明する。
図15に示される文章解析処理は、文章を単語レベル・構造レベルで解析して、その結
果を保存する処理であり、図14のS101に該当する処理である。
文章解析処理では、文章処理装置10は、ネットワーク60を経由して、文章サーバ400から、文章を受信する(S201)。
Next, sentence analysis processing will be described with reference to FIG.
The sentence analysis process shown in FIG. 15 is a process of analyzing a sentence at the word level/structure level and storing the result, which corresponds to S101 in FIG.
In the text analysis process, the text processing device 10 receives text from the text server 400 via the network 60 (S201).

次に、図1に示される文章解析部110の単語解析部111が、受信した文章を解析し、図7に示した文章解析結果データ540に保存する(S202)。
次に、構造解析部112が分割した単語の関連構造を解析し、その意味を抽出し、文章解析結果データ540に保存する(S203)。
Next, the word analysis unit 111 of the sentence analysis unit 110 shown in FIG. 1 analyzes the received sentence and stores it in the sentence analysis result data 540 shown in FIG. 7 (S202).
Next, the structure analysis unit 112 analyzes the related structure of the divided words, extracts the meaning, and stores it in the sentence analysis result data 540 (S203).

図16に示される文章分類処理は、文章に分類のための分類タグを付加する処理であり、図14のS102の処理に該当する処理である。
文章分類処理では、先ず、図7に示される文章解析結果データ540に格納されている出現単語や文章構造の情報を、文章分類部120に入力する(S301)。
次に、文章処理装置が保持する分類タグ(図示せず)ごとに、S303~S305の処理をおこなう(S302~S306)。
The sentence classification process shown in FIG. 16 is a process of adding classification tags for classification to sentences, and corresponds to the process of S102 in FIG.
In the sentence classification process, first, the information of appearing words and sentence structure stored in the sentence analysis result data 540 shown in FIG. 7 is input to the sentence classification unit 120 (S301).
Next, the processing of S303 to S305 is performed for each classification tag (not shown) held by the text processing device (S302 to S306).

分類処理部121が出現単語を用いて、文章と各分類タグとの類似度を算出する(S303)。文章と各分類タグとの類似度は、例えば、分類タグのキーワードが、その文章に出てくる回数の総和をとることにより算出することができる。例えば、「装置故障」という分類タグには、{装置故障、装置不具合、装置出力}という単語群をキーワードとして関連付けて置き、文章のその単語群のいずれが出現する回数をカウントとして、文章の総語数で除したものを類似度とする。 The classification processing unit 121 uses the appearing words to calculate the degree of similarity between the sentence and each classification tag (S303). The degree of similarity between a sentence and each classification tag can be calculated, for example, by summing the number of times the keyword of the classification tag appears in the sentence. For example, a group of words {equipment failure, device failure, device output} is associated with a classification tag "equipment failure" as a keyword. The similarity is obtained by dividing by the number of words.

そして、その類似度が所定の閾値以上のときには(S304:YES)、S305に行き、その類似度が所定の閾値未満のときには(S304:NO)、次の分類タグとの評価に行く(S302)。 When the degree of similarity is equal to or greater than the predetermined threshold (S304: YES), the process proceeds to S305, and when the degree of similarity is less than the predetermined threshold (S304: NO), the process proceeds to evaluation with the next classification tag (S302). .

その類似度が所定の閾値以上のときには(S304:YES)、その文章に対し、対象となる分類タグを付与する(S305)。 When the degree of similarity is equal to or greater than a predetermined threshold (S304: YES), the sentence is given a target classification tag (S305).

図17に示される文章要約処理は、対象の文章から要約文を作成する処理であり、図14のS103の処理に該当する処理である。
文章要約処理では、先ず、図7に示される文章解析結果データ540に格納されている出現単語や文章構造の情報、分類結果(文章分類処理で付加された分類タグ)を、文章要約部140に入力する(S401)。
The text summarization process shown in FIG. 17 is a process of creating a summary from the target text, and corresponds to the process of S103 in FIG.
In the text summarization process, first, the words and sentence structure information stored in the text analysis result data 540 shown in FIG. Input (S401).

次に、要約処理部141が、対象文章に付加された分類タグを取得し(S402)、全ての分類タグについて、S404~S410の処理を繰り返す(S403~S411)。 Next, the summary processing unit 141 acquires the classification tags added to the target sentence (S402), and repeats the processes of S404 to S410 for all classification tags (S403 to S411).

先ず、要約処理部141が、文章解析結果データ540から意味のある単文を抽出する(S404)。意味のある単文とは、文章解析結果データ540の意味545の欄が空欄でないレコードに対応する単文541に格納されている単文である。例えば、図7に示される例では、意味545の「要望」に格納されているレコードの単文541に「速やかに放送してほしい。」という単文が格納されている。 First, the summary processing unit 141 extracts meaningful simple sentences from the sentence analysis result data 540 (S404). A meaningful simple sentence is a simple sentence stored in the simple sentence 541 corresponding to the record in which the column of the meaning 545 of the sentence analysis result data 540 is not blank. For example, in the example shown in FIG. 7, the simple sentence 541 of the record stored in the meaning 545 "request" stores the simple sentence "Please broadcast immediately."

次に、要約処理部141が、対象分類タグを有する要約実績データ520を取得する(S405)。
次に、取得した対象分類タグを有する要約実績データ520ごとに、S407~S409を繰り返す(S406~S410)。
Next, the summary processing unit 141 acquires the summary performance data 520 having the target classification tag (S405).
Next, S407 to S409 are repeated for each summary performance data 520 having the acquired target classification tag (S406 to S410).

先ず、要約処理部141が、対象文章の単文と要約実績データ520の文章との類似度を算出する(S407)。対象文章の単文と要約実績データ520の文章との類似度は、例えば、対象文章の単文の単語が要約実績データ520の文章の単語に出てくる回数を、要約実績データ520の文章の総語数で除した値を類似度として評価することができる。 First, the summary processing unit 141 calculates the degree of similarity between the simple sentence of the target sentence and the sentence of the summary performance data 520 (S407). The degree of similarity between the simple sentence of the target sentence and the sentence of the summary performance data 520 is, for example, the number of times the word of the simple sentence of the target sentence appears in the word of the sentence of the summary performance data 520, or the total number of words of the sentence of the summary performance data 520. A value obtained by dividing by is evaluated as a degree of similarity.

そして、その類似度が閾値以上のときには(S408:YES)、S409に行き、その類似度が閾値未満のときには(S408:NO)、次の要約実績データ520に行く。 When the degree of similarity is equal to or greater than the threshold (S408: YES), go to S409, and when the degree of similarity is less than the threshold (S408: NO), go to the next summary performance data 520. FIG.

その類似度が閾値以上のときには(S408:YES)、要約実績データ520の要約文524を、対象文章の要約文として算出する(S409)。
ここで、対象文章に対して、要約文を複数抽出することにしてもよいし、S407の類似度が高いときのものを、その対象文章の要約文としてもよい。
When the degree of similarity is equal to or greater than the threshold (S408: YES), the summary sentence 524 of the summary performance data 520 is calculated as the summary sentence of the target sentence (S409).
Here, a plurality of abstract sentences may be extracted from the target sentence, or the one when the similarity in S407 is high may be used as the abstract sentence of the target sentence.

図18に示される分類学習処理は、文章と分類タグの関連付けの学習データである分類実績データ510に、新たな情報を付け加える処理である。
分類学習処理では、先ず、図11に示した分類変更画面730より、対象文章に対する新分類タグを指定する(S501)。
次に、分類変更部130に、対象文章と新分類タグの情報を入力する(S502)。
次に、対象文章と新分類タグの情報を分類実績データ510に蓄積する(S503)。
The classification learning process shown in FIG. 18 is a process of adding new information to the classification record data 510, which is learning data for associating sentences with classification tags.
In the classification learning process, first, a new classification tag for the target sentence is designated from the classification change screen 730 shown in FIG. 11 (S501).
Next, the information of the target sentence and the new classification tag is input to the classification changing section 130 (S502).
Next, information on the target sentence and the new classification tag is stored in the classification result data 510 (S503).

図19に示される要約学習処理は、文章と要約文の関連付けの学習データである要約実績データ520に、新たな情報を付け加える処理である。
要約学習処理では、先ず、図12に示した要約変更画面740より、対象文章に対する要約文を記載する(S601)。
次に、要約変更部150に、対象文章と新要約文の情報を入力する(S602)。
次に、対象文章と新要約文の情報を要約実績データ520に蓄積する(S603)。
The summary learning process shown in FIG. 19 is a process of adding new information to the summary performance data 520, which is learning data for association between sentences and abstracts.
In the summary learning process, first, a summary sentence for the target sentence is entered from the summary change screen 740 shown in FIG. 12 (S601).
Next, the information of the target sentence and the new abstract is input to the summary changing unit 150 (S602).
Next, the information of the target sentence and the new abstract is stored in the summary performance data 520 (S603).

図20に示されるレポート作成処理は、指定分類入力後に、レポートを作成して、表示する処理である。
レポート作成処理では、先ず、図8に示されるレポート作成開始画面700より、対象文章範囲(期間)、分類タグ名、分類キーワードを記載する(S701)。
次に、レポート作成部160が、分類・要約済データ530から入力された対象文章範囲(期間)内の登録日を有するデータを取得する(S702)。
The report creation process shown in FIG. 20 is a process of creating and displaying a report after inputting a specified classification.
In the report creation process, first, a target sentence range (period), a classification tag name, and a classification keyword are described on the report creation start screen 700 shown in FIG. 8 (S701).
Next, the report creation unit 160 acquires data having a registration date within the input target sentence range (period) from the classified/summarized data 530 (S702).

次に、レポート作成部160が、分類・要約済データ530を分類カラムの情報で集計し、件数を算出する(S703)。
次に、入力された指定分類タグごとに、S705の処理を繰り返す(S704~S706)。
Next, the report creation unit 160 aggregates the classified/summarized data 530 using the information in the classification column and calculates the number of cases (S703).
Next, the process of S705 is repeated for each designated classification tag that is input (S704 to S706).

ループ内では、半自動分類・要約処理をおこなう(S705)。半自動分類・要約処理の詳細は、後述する。
最後に、レポート作成部160が、結果を図13に示したレポート表示画面750に表示する(S707)。
In the loop, semi-automatic classification/summarization processing is performed (S705). The details of the semi-automatic classification/summarization process will be described later.
Finally, the report creation unit 160 displays the result on the report display screen 750 shown in FIG. 13 (S707).

図21に示した半自動分類・要約処理は、指定分類入力後に、指定分類に基づく分類と要約処理をおこなうものであり、図20のS705に該当する処理である。
半自動分類・要約処理では、先ず、レポート作成部160が、指定分類情報に記載されたキーワードを有する分類・要約済データ530を検索する(S801)。
次に、分類学習部123が、検索された分類・要約済データ530を、指定分類タグ名の分類タグ名で、分類実績データ510に蓄積する(S802)。
The semi-automatic classification/summarization process shown in FIG. 21 performs classification and summary processing based on the designated classification after inputting the designated classification, and corresponds to S705 in FIG.
In the semi-automatic classification/summarization process, first, the report creation unit 160 searches for the classified/summarized data 530 having the keyword described in the specified classification information (S801).
Next, the classification learning unit 123 accumulates the searched classified/summarized data 530 in the classification performance data 510 with the classification tag name of the designated classification tag name (S802).

次に、分類処理部121に、文章対象範囲(期間)の登録日を有する分類・要約済データ530を入力する(S803)。
そして、文章対象範囲(期間)の登録日を有する分類・要約済データ530ごとに、S805~S808の処理を繰り返す(S804~S809)。
Next, the classified/summarized data 530 having the registration date of the sentence target range (period) is input to the classification processing unit 121 (S803).
Then, the processing of S805 to S808 is repeated for each classified/summarized data 530 having the registration date of the text target range (period) (S804 to S809).

先ず、分類処理部121が、対象文章と指定分類タグの当てはまり度を算出する(S805)。対象文章と指定分類タグの当てはまり度は、指定分類タグをその文章の分類タグとしたときの妥当性を示す指標であり、例えば、指定分類タグのタグ名に関連付けられるキーワードを定義しておき、そのキーワードが対象文章に出現する回数を、対象文章の総語数で除した値により定義することができる。 First, the classification processing unit 121 calculates the degree of matching between the target sentence and the designated classification tag (S805). The degree of applicability between the target sentence and the specified classification tag is an index indicating the validity when the specified classification tag is used as the classification tag of the sentence. For example, keywords associated with the tag name of the specified classification tag are defined, A value obtained by dividing the number of times the keyword appears in the target sentence by the total number of words in the target sentence can be defined.

対象文章データと指定分類タグの当てはまり度が、規定の閾値以上のときには(S805:YES)、S807に行き、対象文章データと指定分類タグの当てはまり度が、規定の閾値未満のときには(S805:NO)、S804に行き、次の分類・要約済データ530の処理をおこなう。 If the degree of applicability between the target text data and the designated classification tag is equal to or greater than the prescribed threshold (S805: YES), go to S807; ), go to S804 to process the next classified/summarized data 530 .

対象文章データと指定分類タグの当てはまり度が、規定の閾値以上のときには(S805:YES)、分類処理部121が、分類・要約済データ530の文章に対して、指定分類の分類タグを付与する(S807)。
次に、要約処理部141が、該当する分類・要約済データ530の要約文を取得する(S808)。
When the degree of fit between the target text data and the designated classification tag is equal to or greater than the prescribed threshold (S805: YES), the classification processing unit 121 assigns the classification tag of the designated classification to the text of the classified/summarized data 530. (S807).
Next, the summary processor 141 acquires a summary of the classified/summarized data 530 (S808).

以上説明したように、本実施形態による文章処理装置では、分類と要約をしたデータに対して、指定分類を入力することによって、再分類することにより、アップトゥデートなトピックの文章を選出し、かつ、文章構造に基づく要約処理をおこなうため、ユーザの要望を反映するなど、企業体にとって、価値のある要約文のレポートを得ることができる。 As described above, the text processing apparatus according to the present embodiment selects sentences of up-to-date topics by inputting a designated classification for data that has been classified and summarized, and reclassifying the data. In addition, since the summary processing is performed based on the sentence structure, it is possible to obtain a valuable summary report for the enterprise, such as reflecting the user's request.

10…文章処理装置
110…文章解析部
111…単語解析部
112…構造解析部
113…文章解析結果処理部
120…文章分類部
121…分類処理部
122…半自動分類部
123…分類学習部
130…分類変更部
140…文章要約部
141…要約処理部
142…要約学習部
150…要約変更部
160…レポート作成部
10 sentence processing device 110 sentence analysis unit 111 word analysis unit 112 structure analysis unit 113 sentence analysis result processing unit 120 sentence classification unit 121 classification processing unit 122 semi-automatic classification unit 123 classification learning unit 130 classification Modifying unit 140 Sentence summarizing unit 141 Summarizing processing unit 142 Summarizing learning unit 150 Summarizing changing unit 160 Report creating unit

Claims (2)

文章の要約を行って、その文章の要約文を出力する文章処理装置であって、
分類タグを付与された文章と要約文の対である要約実績データを保持し、
入力された文章の単文に対して構造解析を行い、構造解析に関係する意味を抽出し、
前記要約実績データの分類タグごとに、前記構造解析に関係する意味のある単文を抽出し、入力された文章の前記単文と、要約実績データの文章との類似度が規定の閾値以上のときに、前記要約実績データの前記要約文を前記入力された文章の要約文とすることを特徴とする文章処理装置。
A text processing device that summarizes a text and outputs a summary of the text,
Holds summary performance data, which is a pair of sentences and summary sentences given classification tags,
Structural analysis is performed on the simple sentence of the input sentence, the meaning related to the structural analysis is extracted,
For each classification tag of the summary performance data, a meaningful simple sentence related to the structural analysis is extracted, and when the similarity between the simple sentence of the input sentence and the sentence of the summary performance data is equal to or higher than a prescribed threshold value A text processing apparatus, wherein the summary of the summary result data is the summary of the input text.
文章の要約を行って、その文章の要約文を出力する文章処理方法であって、
分類タグを付与された文章と要約文の対である要約実績データを保持し、
入力された文章の単文に対して構造解析を行い、構造解析に関係する意味を抽出し、
前記要約実績データの分類タグごとに、前記構造解析に関係する意味のある単文を抽出し、入力された文章の前記単文と、要約実績データの文章との類似度が規定の閾値以上のときに、前記要約実績データの前記要約文を前記入力された文章の要約文とすることを特徴とする文章処理方法。
A text processing method for summarizing a text and outputting a summary of the text,
Holds summary performance data, which is a pair of sentences and summary sentences given classification tags,
Structural analysis is performed on the simple sentence of the input sentence, the meaning related to the structural analysis is extracted,
For each classification tag of the summary performance data, a meaningful simple sentence related to the structural analysis is extracted, and when the similarity between the simple sentence of the input sentence and the sentence of the summary performance data is equal to or higher than a prescribed threshold 7. A text processing method, wherein said summary of said summary performance data is set as said summary of said input text.
JP2022063803A 2018-03-16 2022-04-07 Text processing device and text processing method Active JP7268220B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022063803A JP7268220B2 (en) 2018-03-16 2022-04-07 Text processing device and text processing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018049146A JP2019160134A (en) 2018-03-16 2018-03-16 Sentence processing device and sentence processing method
JP2022063803A JP7268220B2 (en) 2018-03-16 2022-04-07 Text processing device and text processing method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018049146A Division JP2019160134A (en) 2018-03-16 2018-03-16 Sentence processing device and sentence processing method

Publications (2)

Publication Number Publication Date
JP2022082746A JP2022082746A (en) 2022-06-02
JP7268220B2 true JP7268220B2 (en) 2023-05-02

Family

ID=87890766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022063803A Active JP7268220B2 (en) 2018-03-16 2022-04-07 Text processing device and text processing method

Country Status (1)

Country Link
JP (1) JP7268220B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278962A (en) 2001-03-22 2002-09-27 Nippon Hoso Kyokai <Nhk> Device and method for analyzing news topic
JP2016207141A (en) 2015-04-28 2016-12-08 ヤフー株式会社 Summary generation device, summary generation method, and summary generation program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278962A (en) 2001-03-22 2002-09-27 Nippon Hoso Kyokai <Nhk> Device and method for analyzing news topic
JP2016207141A (en) 2015-04-28 2016-12-08 ヤフー株式会社 Summary generation device, summary generation method, and summary generation program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
牧野 恵 外,要約事例を用例として利用したニュース記事要約,FIT2007 第6回情報科学技術フォーラム 情報科学技術レターズ,第6巻,日本,社団法人情報処理学会 社団法人電子情報通信学会,2007年08月22日,111~114

Also Published As

Publication number Publication date
JP2022082746A (en) 2022-06-02

Similar Documents

Publication Publication Date Title
US10558712B2 (en) Enhanced online user-interaction tracking and document rendition
Stein et al. Intrinsic plagiarism analysis
US9646077B2 (en) Time-series analysis based on world event derived from unstructured content
US11023503B2 (en) Suggesting text in an electronic document
Trappey et al. An R&D knowledge management method for patent document summarization
US9270749B2 (en) Leveraging social media to assist in troubleshooting
US11182540B2 (en) Passively suggesting text in an electronic document
KR101667199B1 (en) Relative quality index estimation apparatus of the web page using keyword search
JP2007011604A (en) Fault diagnostic system and program
US20170286551A1 (en) Scalable processing of heterogeneous user-generated content
US20180247240A1 (en) Judgment support system and judgment support method
KR20190017597A (en) Method for analyzing social service data and apparatus using the same
CN113157871A (en) News public opinion text processing method, server and medium applying artificial intelligence
CN111078988B (en) Electric power service information hotspot retrieval method and device and electronic equipment
JP7268220B2 (en) Text processing device and text processing method
JP5972425B1 (en) Reputation damage risk report creation system, program and method
JP2019160134A (en) Sentence processing device and sentence processing method
JP6026036B1 (en) DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM
CN113961811A (en) Conversational recommendation method, device, equipment and medium based on event map
JP2016045552A (en) Feature extraction program, feature extraction method, and feature extraction device
US20180189699A1 (en) A method and system for locating regulatory information
JP2004185346A (en) Method and system for supporting project work
US20190236462A1 (en) System and method for predicting future news coverage
JP2017016405A (en) Business analysis program, device and method
US20240127146A1 (en) Translation Decision Assistant

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230420

R150 Certificate of patent or registration of utility model

Ref document number: 7268220

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150