JP2022055353A - Text processing method, device, apparatus, and computer-readable storage medium - Google Patents

Text processing method, device, apparatus, and computer-readable storage medium Download PDF

Info

Publication number
JP2022055353A
JP2022055353A JP2021156713A JP2021156713A JP2022055353A JP 2022055353 A JP2022055353 A JP 2022055353A JP 2021156713 A JP2021156713 A JP 2021156713A JP 2021156713 A JP2021156713 A JP 2021156713A JP 2022055353 A JP2022055353 A JP 2022055353A
Authority
JP
Japan
Prior art keywords
original text
keywords
sentence
processing
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021156713A
Other languages
Japanese (ja)
Inventor
シーホン グオ
Xihong Guo
ヤーヂュオ グワァン
Yazhuo Guan
ウェイ リィウ
Wei Liu
アンシン リ
An-Shin Lee
ラン チェン
Lan Chen
一成 中村
Kazunari Nakamura
拓 藤本
Hiroshi Fujimoto
大志 池田
Hiroshi Ikeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2022055353A publication Critical patent/JP2022055353A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a text processing method, a device, an apparatus, and a storage medium that can reduce low processing complexity and do not require consideration of grammar issues when all keywords are covered.SOLUTION: A text processing method includes the steps of: receiving an original text, one or more keywords contained in the original text, and a first processing result obtained by simplifying the original text; determining whether the first processing result includes all keywords; and when the first processing result does not include all keywords, deleting one or more sentences in the original text, continuing deletion processing until a combination of the first processing result and sentences in the original text after deletion processing includes all the keywords and the number of sentences in the original text after processing is minimum, and setting the combination as a final processing result.SELECTED DRAWING: Figure 1

Description

本出願は、テキスト処理分野に関し、具体的には、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体に関する。 The present application relates to the field of text processing, specifically to text processing methods, devices, equipment and computer-readable storage media.

テキスト要約生成とは、明確な意味を持っている一部のテキスト内容を高度に一般化して抽象化し、テキストの要約を生成することである。要約が全ての所望するキーワードを含むことをユーザが望むが、生成された要約が全ての所望するキーワードを含むわけではない場合、一般的にキーワードの各々について、オリジナルテキストから、反復的にキーワードを含む文を選択し、選択されたキーワードを含む文と、生成された要約とを組み合わせて新規の要約とすることが行われている。しかし、この方法では、所望するキーワードの数の増加に伴って、複雑度が高くなってしまう。 Text summarization generation is the generation of a text summarization by highly generalizing and abstracting some textual content that has a clear meaning. If the user wants the summary to contain all the desired keywords, but the generated summary does not contain all the desired keywords, then generally for each of the keywords, the keywords are iterated from the original text. A sentence containing the selected keyword is selected, and the sentence containing the selected keyword is combined with the generated summary to form a new summary. However, this method becomes more complex as the number of desired keywords increases.

上記問題に鑑みて、本開示は、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体を提供する。 In view of the above problems, the present disclosure provides text processing methods, devices, devices and computer readable storage media.

本開示の1つの態様によれば、テキスト処理方法が提供され、前記テキスト処理方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む。 According to one aspect of the present disclosure, a text processing method is provided, wherein the text processing method is obtained by simplifying the original text, one or more keywords contained in the original text, and the original text. A step of receiving the obtained first processing result, a step of determining whether or not the first processing result includes all keywords, and a case where the first processing result does not include all keywords. , One or more sentences in the original text are deleted, the combination of the first processing result and the sentence in the original text after the deletion process includes all keywords, and the said after the deletion process. The deletion process is continued until the number of sentences in the original text is minimized, and the combination is used as the final process result.

本開示の1つの例によれば、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップは、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップを含む。 According to one example of the present disclosure, when the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the deletion are deleted. The step of continuing the deletion process until the combination with the sentence in the original text after processing includes all the keywords and the number of sentences in the original text after the deletion process is the minimum is the first step. If the processing result of the above does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and all the keywords, and the first processing result and the above first processing result are obtained. The deletion process is continued until the combination with the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is minimized.

本開示の1つの例によれば、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除するステップは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップと、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップと、を含む。 According to one example of the present disclosure, the step of deleting a sentence in the original text based on the degree of association between each sentence of the original text and all the keywords is a step of deleting each sentence of the original text and all of the above. Includes a step of sorting each sentence of the original text in ascending order of relevance based on the degree of relevance to the keyword, and a step of deleting each sentence in the original text based on the sort.

本開示の1つの例によれば、関連度の昇順に従って、前記オリジナルテキスト中の各文を削除するステップは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップと、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップと、を含む。 According to one example of the present disclosure, the step of deleting each sentence in the original text in ascending order of relevance is the first sentence after the first sentence of each sentence in the original text is deleted. The step of determining whether or not the combination of the processing result of the above and the sentence in the original text after the deletion processing includes all the keywords, and the first processing result and the sentence in the original text after the deletion processing. When the combination of contains all keywords, the step of determining the deletion operation and continuing the processing of the next sentence of the original text, and the combination of the first processing result and the sentence in the original text after the deletion processing. Includes a step of canceling the delete operation, leaving the first sentence, and continuing processing of the next sentence of the original text, if does not contain all the keywords.

本開示の1つの例によれば、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップとをさらに含む。 According to one example of the present disclosure, after one sentence in the original text has been deleted, the combination of the first processing result and the sentence in the original text after the deletion processing is all. Before determining whether or not to include a keyword, it further includes a step of deleting a sentence in the original text that does not contain any of the keywords in ascending order of relevance.

本開示の1つの例によれば、前記オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。 According to one example of the present disclosure, the degree of association between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text. It is a thing.

本開示の別の態様によれば、テキスト処理装置が提供され、前記テキスト処理装置は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するための受信ユニットと、前記第1の処理結果が全てのキーワードを含むか否かを判断するための判断ユニットと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするための削除ユニットと、を含む。 According to another aspect of the present disclosure, a text processing device is provided, wherein the text processing device is obtained by simplifying the original text, one or more keywords contained in the original text, and the original text. A receiving unit for receiving the first processing result, a determination unit for determining whether or not the first processing result includes all keywords, and the first processing result are all keywords. If one or more sentences in the original text are deleted, the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, and , The deletion unit for continuing the deletion process until the number of sentences in the original text after the deletion process is minimized, and making the combination the final processing result.

本開示の1つの例によれば、前記削除ユニットは、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続ける。 According to one example of the present disclosure, the deletion unit is based on the degree of association between each sentence of the original text and all the keywords, if the first processing result does not include all the keywords. , The sentence in the original text is deleted, the combination of the first processing result and the sentence in the original text after the deletion process includes all keywords, and the number of sentences in the original text after the deletion process. The deletion process is continued until is the minimum.

本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除する。 According to one example of the present disclosure, the deletion unit sorts each sentence of the original text in ascending order of relevance based on the degree of association between each sentence of the original text and all the keywords. Based on the sort, each sentence in the original text is deleted.

本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行する。 According to one example of the present disclosure, the deletion unit has the first processing result and the sentence in the original text after the deletion processing after the first sentence of each sentence in the original text is deleted. It is determined whether or not the combination with and contains all the keywords, and if the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the deletion operation is determined. If the processing of the next sentence of the original text is continued, and the combination of the first processing result and the sentence in the original text after the deletion processing does not include all the keywords, the deletion operation is canceled and the deletion operation is canceled. Leave the sentence 1 and continue processing the next sentence of the original text.

本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除することにさらに用いられる。 According to one example of the present disclosure, the deletion unit is after one sentence in the original text has been deleted, with the first processing result and the sentence in the original text after the deletion processing. It is further used to delete sentences in the original text that do not contain any of the keywords in ascending order of relevance before determining whether or not the combination of the above includes all the keywords.

本開示の別の態様によれば、テキスト処理機器が提供され、プロセッサと、コンピュータ読み取り可能な命令が記憶される記憶装置と、を備えるテキスト処理機器は、前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法を実行する。 According to another aspect of the present disclosure, a text processing device comprising a processor and a storage device for storing computer-readable instructions is such that the computer-readable instructions are stored by the processor. When executed, a step of receiving the original text, one or more keywords contained in the original text, and the first processing result obtained by simplifying the original text, and the first processing. The step of determining whether the result contains all the keywords, and if the first processing result does not include all the keywords, one or more sentences in the original text are deleted and the first processing result is deleted. The deletion process is continued until the combination of the processing result of 1 and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. , A step of making the combination a final processing result, and a text processing method.

本開示の別の態様によれば、コンピュータ読み取り可能なプログラムを記憶するためのコンピュータ読み取り可能な記憶媒体が提供され、前記プログラムによって、コンピュータに以上のいずれかの態様に記載のテキスト処理方法を実行させる。 According to another aspect of the present disclosure, a computer-readable storage medium for storing a computer-readable program is provided, wherein the program performs the text processing method according to any one of the above embodiments on the computer. Let me.

本開示の上記態様では、第1の処理結果を参照し、オリジナルテキストの各文と全てのキーワードとの関連度に基づいてオリジナルテキスト中の1つ又は複数の文を削除し、第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とすることで、処理複雑度を低減させるとともに、文法の問題を考慮する必要がない。 In the above aspect of the present disclosure, referring to the first processing result, one or more sentences in the original text are deleted based on the degree of relevance between each sentence of the original text and all the keywords, and the first processing is performed. The deletion process is continued until the combination of the result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. By making it the final processing result, it is not necessary to consider the grammatical problem while reducing the processing complexity.

添付の図面を参照しながら本開示の実施例をより詳細に説明することにより、本開示の上記及び他の目的、特徴、及び利点がより明らかになる。添付の図面は、本開示の実施例のさらなる理解を提供するために使用され、明細書の一部を構成し、本開示の実施例とともに本開示を説明するために使用され、本開示を限定するものではない。図面において、同じ参照符号は、通常、同じ部材又はステップを表す。 By describing the embodiments of the present disclosure in more detail with reference to the accompanying drawings, the above and other purposes, features, and advantages of the present disclosure will become more apparent. The accompanying drawings are used to provide a further understanding of the embodiments of the present disclosure, which form part of the specification and are used in conjunction with the embodiments of the present disclosure to illustrate the present disclosure and limit the disclosure. It's not something to do. In the drawings, the same reference numerals usually represent the same member or step.

本開示の実施例に係るテキスト処理方法のフローチャートである。It is a flowchart of the text processing method which concerns on embodiment of this disclosure. 本開示の実施例に係る、オリジナルテキスト中の文を削除する方法のフローチャートである。It is a flowchart of the method of deleting the sentence in the original text which concerns on embodiment of this disclosure. 本開示の実施例に係る、オリジナルテキスト中の文を削除する方法の別のフローチャートである。It is another flowchart of the method of deleting the sentence in the original text which concerns on embodiment of this disclosure. 本開示の実施例に係るテキスト処理方法の構成図である。It is a block diagram of the text processing method which concerns on embodiment of this disclosure. 本開示の実施例に係るテキスト処理方法の例の模式図である。It is a schematic diagram of the example of the text processing method which concerns on embodiment of this disclosure. 本開示の実施例に係るテキスト処理装置の機能ブロック図である。It is a functional block diagram of the text processing apparatus which concerns on embodiment of this disclosure. 本開示の実施例に係るテキスト処理機器の機能ブロック図である。It is a functional block diagram of the text processing apparatus which concerns on embodiment of this disclosure. 本開示の実施例に係るコンピュータ読み取り可能な記憶媒体の模式図である。It is a schematic diagram of the computer-readable storage medium which concerns on embodiment of this disclosure. 本開示の実施例に係る電子機器のハードウェア構造の一例を示す図である。It is a figure which shows an example of the hardware structure of the electronic device which concerns on embodiment of this disclosure.

以下、本開示の実施例の図面を参照しながら、本開示の実施例の技術的解決手段について明瞭かつ完全に説明する。当然ながら、説明された実施例は、本開示の一部の実施例に過ぎず、全ての実施例ではない。本開示の実施例に基づいて、当業者が創造的な労働なしに得る全てのその他の実施例は、いずれも本開示の保護範囲に属するものとなる。 Hereinafter, the technical solutions of the embodiments of the present disclosure will be clearly and completely described with reference to the drawings of the embodiments of the present disclosure. Of course, the examples described are only partial examples of the present disclosure, not all examples. All other embodiments that a person skilled in the art obtains without creative labor under the embodiments of the present disclosure are all within the scope of the present disclosure.

本出願では、フローチャートを使用して、本出願の実施例による方法のステップを説明する。前のステップ又は次のステップが必ずしも順に正確に実行されるとは限らないことを理解されたい。代わりに、様々なステップを逆の順序で、又は同時に処理することができる。同時に、他の操作もこれらのプロセスに追加してもよい。又は、これらのプロセスから、あるステップ又は複数のステップを削減してもよい。 In this application, flowcharts are used to describe the steps of the method according to the embodiments of the present application. It should be understood that the previous or next step is not always performed exactly in sequence. Alternatively, the various steps can be processed in reverse order or simultaneously. At the same time, other operations may be added to these processes. Alternatively, one step or a plurality of steps may be reduced from these processes.

先ず、図1を参照しながら、本開示の実施例を実現するためのテキスト処理方法100について説明する。本開示は、第1の処理結果(例えば、テキスト要約)を参照し、オリジナルテキストの各文と全てのキーワードとの関連度に基づいて、オリジナルテキスト中の1つ又は複数の文を削除し、第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とすることで、処理複雑度を低減させるとともに、文法の問題を考慮する必要がない。 First, with reference to FIG. 1, a text processing method 100 for realizing the embodiment of the present disclosure will be described. The present disclosure refers to the first processing result (eg, text summary) and deletes one or more sentences in the original text based on the relevance of each sentence in the original text to all keywords. The deletion process is continued until the combination of the first processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. By using the above combination as the final processing result, it is not necessary to consider the grammatical problem while reducing the processing complexity.

以下、図面を参照しながら本開示の実施例及びその例について詳細に説明する。 Hereinafter, examples of the present disclosure and examples thereof will be described in detail with reference to the drawings.

本開示の少なくとも1つの実施例は、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体を提供する。以下、複数の例及び実施例にて、本開示の少なくとも1つの実施例に係るテキスト処理について非限定的に説明し、以下に説明される通り、お互いに矛盾しない場合、これらの具体的な例及び実施例の異なる特徴を相互に組み合わせ、それにより、新しい例及び実施例を得ることができ、これらの新しい例及び実施例は、全て本開示の保護範囲に属する。 At least one embodiment of the present disclosure provides text processing methods, devices, equipment and computer readable storage media. Hereinafter, the text processing according to at least one embodiment of the present disclosure will be described in a non-limiting manner in a plurality of examples and examples, and as described below, specific examples thereof when they do not contradict each other. And the different features of the examples can be combined with each other to give new examples and examples, all of which are within the scope of the present disclosure.

以下、図1~5を参照しながら、本開示の実施例に係るテキスト処理方法について説明する。 Hereinafter, the text processing method according to the embodiment of the present disclosure will be described with reference to FIGS. 1 to 5.

先ず、図1を参照しながら、本開示の実施例に係るテキスト処理方法について説明する。該方法は、コンピュータなどにより自動的に完成されてもよい。例えば、該方法は、テキスト要約生成、テキスト取りまとめなどに適用される。例えば、該テキスト処理取得方法は、ソフトウェア、ハードウェア、ファームウェア又はそれらの任意の組み合わせの形態で実現されてもよく、携帯電話、タブレットPC、ノートパソコン、デスクトップパソコン、ネットワークサーバなどの機器におけるプロセッサによってロードされて実行されてもよい。 First, the text processing method according to the embodiment of the present disclosure will be described with reference to FIG. The method may be completed automatically by a computer or the like. For example, the method applies to text summarization generation, text summarization, and the like. For example, the text processing acquisition method may be realized in the form of software, hardware, firmware, or any combination thereof, and may be realized by a processor in a device such as a mobile phone, a tablet PC, a notebook personal computer, a desktop personal computer, or a network server. It may be loaded and executed.

図1に示すように、該テキスト処理方法は、以下のステップS101~S103を含む。 As shown in FIG. 1, the text processing method includes the following steps S101 to S103.

ステップS101では、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード及び第1の処理結果を受信する。 In step S101, the original text, one or more keywords included in the original text, and the first processing result are received.

ステップS102では、前記第1の処理結果が全てのキーワードを含むか否かを判断する。 In step S102, it is determined whether or not the first processing result includes all the keywords.

ステップS103では、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し,前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とする。 In step S103, when the first processing result does not include all the keywords, one or a plurality of sentences in the original text are deleted, and the first processing result and the original text after the deletion processing are deleted. The deletion process is continued until the combination with the sentence inside includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, and the combination is used as the final processing result.

ステップS101では、例えば、オリジナルテキストは、任意の言語形式(例えば、中国語、英語、日本語など)のテキストであってもよいが、ここで限定しない。例えば、キーワードは、ユーザが重要であると考える1つ又は複数の文字、単語又はフレーズ又は短い文であってもよい。 In step S101, for example, the original text may be text in any language format (for example, Chinese, English, Japanese, etc.), but is not limited thereto. For example, the keyword may be one or more letters, words or phrases or short sentences that the user considers important.

例えば、第1の処理結果は、前記オリジナルテキストを簡略化することで得られた1つ又は複数の文である。1つの例としては、第1の処理結果は、テキスト要約であってもよい。例えば、第1の処理結果は、例えばニューラルネットワークに基づくテキスト生成モデルにより取得されるものであってもよい。第1の処理結果を取得する方法は、任意の適切な方法であってもよいが、ここで限定しない。 For example, the first processing result is one or more sentences obtained by simplifying the original text. As an example, the first processing result may be a text summary. For example, the first processing result may be obtained by, for example, a text generation model based on a neural network. The method for acquiring the first processing result may be any appropriate method, but is not limited thereto.

ステップS102では、例えば、1つ又は複数のキーワードの各々に対して、第1の処理結果の全ての文をトラバーサルすることで、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。例えば、第1の処理結果の全ての文を各単語ベクトルに分解し、全てのキーワードも単語ベクトルの形式に変換し、ニューラルネットワークに基づく方法によって、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。上記第1の処理結果が全てのキーワードを含むか否かを判断する方法は、これに限られず、その他の適切な方法を用いて、第1の処理結果が全てのキーワードを含むか否かを判断してもよいが、ここで限定しないことに留意されたい。 In step S102, for example, by traversing all the sentences of the first processing result for each of one or a plurality of keywords, it is determined whether or not the first processing result includes all the keywords. You may. For example, whether all the sentences of the first processing result are decomposed into each word vector, all the keywords are also converted into the word vector format, and the first processing result includes all the keywords by the method based on the neural network. You may decide whether or not. The method for determining whether or not the first processing result includes all keywords is not limited to this, and using another appropriate method, whether or not the first processing result includes all keywords is determined. You may decide, but keep in mind that we are not limited here.

ステップS103では、例えば、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続ける。 In step S103, for example, when the first processing result does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and the all keywords. Then, until the combination of the first processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, the deletion process is performed. Continue.

例えば、オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。例えば、オリジナルテキストの文Aが1つのキーワードを含み、文Bが3つのキーワードを含む場合、オリジナルテキストの文Bと全てのキーワードとの関連度がオリジナルテキストの文Aと全てのキーワードとの関連度よりも高いと考えられてもよい。 For example, the degree of relevance between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text. For example, when sentence A of the original text contains one keyword and sentence B contains three keywords, the degree of association between sentence B of the original text and all keywords is the relationship between sentence A of the original text and all keywords. It may be considered higher than the degree.

以下、図2~3を参照しながら、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法について説明する。 Hereinafter, a method of deleting a sentence in the original text according to the embodiment of the present disclosure will be described with reference to FIGS. 2 to 3.

図2は、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法200のフローチャートを示す。例えば、図2に示すように、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除するステップは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップ(S201)と、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップ(S202)と、を含んでもよい。 FIG. 2 shows a flowchart of the method 200 for deleting a sentence in the original text according to the embodiment of the present disclosure. For example, as shown in FIG. 2, a step of deleting a sentence in the original text based on the degree of association between each sentence of the original text and all the keywords is a step of deleting each sentence of the original text and all of the above. A step of sorting each sentence of the original text in ascending order of the degree of relevance based on the degree of relevance to the keyword (S201), and a step of deleting each sentence in the original text based on the sort (S202). , May be included.

例えば、関連度に基づいて、オリジナルテキストをソートする場合、そのままオリジナルテキストの文をソートするため、文法の問題を考慮しなくてもよい。 For example, when sorting the original text based on the degree of relevance, the sentences of the original text are sorted as they are, so it is not necessary to consider grammatical problems.

図3は、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法300の別のフローチャートを示す。例えば、図3に示すように、関連度の昇順に従って、前記オリジナルテキスト中の各文を削除するステップは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップ(S301)と、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップ(S302)と、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップ(S303)と、を含んでもよい。 FIG. 3 shows another flowchart of the method 300 for deleting a sentence in the original text according to the embodiment of the present disclosure. For example, as shown in FIG. 3, the step of deleting each sentence in the original text in ascending order of the degree of relevance is the first sentence after the first sentence of each sentence in the original text is deleted. In the step (S301) of determining whether or not the combination of the processing result and the sentence in the original text after the deletion processing includes all the keywords, and in the first processing result and the original text after the deletion processing. When the combination with the sentence includes all the keywords, the step (S302) of determining the deletion operation and continuing the processing of the next sentence of the original text, and the first processing result and the original text after the deletion processing If the combination with the sentence does not include all the keywords, it may include a step (S303) of canceling the delete operation, leaving the first sentence, and continuing the processing of the next sentence of the original text. ..

例えば、受信したキーワード集合が{m,n,p,q}であり、受信した第1の処理結果がG(Gは、1つ又は複数の文を含んでもよい)であり、オリジナルテキストの各文(A、B、C、D、E、F)と、前記全てのキーワードとの関連度の昇順に従ってソートされたオリジナルテキストがBDFACEであると仮定する場合、図3に基づくテキスト処理方法は、文Bが削除された後に、Gと削除処理後のオリジナルテキストの文DFACEとの組み合わせGDFACEが全てのキーワード{m,n,p,q}を含むか否かを判断するステップと、GDFACEが全てのキーワード{m,n,p,q}を含む場合、文Bの削除操作を決定し(すなわち、オリジナルテキストから文Bを削除する)、第1の処理結果Gと削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワード{m,n,p,q}を含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、ステップS301に従って、オリジナルテキストの次の文Dの処理を続行し、前記組み合わせを最終的な処理結果とするステップと、を含んでもよい。一方、GDFACEが全てのキーワード{m,n,p,q}を含むわけではない場合、文Bの削減操作を取り消し、オリジナルテキストの文Bを残し、第1の処理結果Gと削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワード{m,n,p,q}を含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、ステップS301に従って、オリジナルテキストの次の文Dの処理を続行し、前記組み合わせを最終的な処理結果とするステップを含んでもよい。 For example, the received keyword set is {m, n, p, q}, the received first processing result is G (G may include one or more sentences), and each of the original texts. Assuming that the original text sorted according to the ascending order of relevance of the sentence (A, B, C, D, E, F) and all the keywords is BDFACE, the text processing method according to FIG. After the sentence B is deleted, the combination of G and the original text sentence DFACE after the deletion process, the step of determining whether GDFACE contains all the keywords {m, n, p, q}, and GDFACE all When the keyword {m, n, p, q} is included, the deletion operation of the sentence B is determined (that is, the sentence B is deleted from the original text), the first processing result G and the original text after the deletion processing are performed. Following the original text according to step S301, until the combination with the sentence in the text contains all the keywords {m, n, p, q} and the number of sentences in the original text after the deletion process is minimized. It may include a step of continuing the processing of the sentence D of the above and making the combination the final processing result. On the other hand, when GDFACE does not include all the keywords {m, n, p, q}, the reduction operation of sentence B is canceled, the sentence B of the original text is left, and the first processing result G and the deletion processing are performed. The original according to step S301 until the combination with the sentence in the original text includes all the keywords {m, n, p, q} and the number of sentences in the original text after the deletion process is minimized. It may include a step of continuing the processing of the next sentence D of the text and making the combination the final processing result.

代替的には、前記オリジナルテキスト中の第1の文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップをさらに含んでもよい。該処理では、まず、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除し、次に、オリジナルテキストに残された、1つ又は複数のキーワードを含む文に対して、ステップS301~S303の処理を行うことで、処理の複雑度を低減させることができる。 Alternatively, whether the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords after the first sentence in the original text is deleted. Before determining whether or not, a step of deleting a sentence containing none of the keywords in the original text may be further included in ascending order of relevance. In the process, first, the sentences containing none of the keywords in the original text are deleted, and then the sentences containing one or more keywords left in the original text are subjected to steps S301 to S303. The complexity of the process can be reduced by performing the process of.

図4は、本開示の実施例のテキスト処理方法の構成図400を示す。図4に示すように、本開示のテキスト処理方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード及び第1の処理結果を受信するステップ(S401)と、第1の処理結果が全てのキーワードを含むか否かを判断するステップ(S402)と、前記第1の処理結果が全てのキーワードを含む場合、第1の処理結果を最終的な処理結果とするステップ(S403)と、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップ(S404)と、を主に含む。そして、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する(S405)。前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで(S408)、S404~S405のステップに従って、オリジナルテキストの次の文の処理を続行し(S406)、前記組み合わせを最終的な処理結果とする(S409)。一方、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで(S408)、S404~S405のステップに従って、オリジナルテキストの次の文の処理を続行し(S407)、前記組み合わせを最終的な処理結果とする(S409)。 FIG. 4 shows a block diagram 400 of a text processing method according to an embodiment of the present disclosure. As shown in FIG. 4, the text processing method of the present disclosure includes an original text, a step (S401) of receiving one or a plurality of keywords included in the original text, and a first processing result, and a first processing result. A step (S402) for determining whether or not all the keywords are included, and a step (S403) for the first processing result as the final processing result when the first processing result includes all the keywords. If the first processing result does not include all the keywords, each sentence of the original text is sorted in ascending order of the degree of relevance based on the relevance of each sentence of the original text and all the keywords. Then, based on the sort, the step (S404) of deleting each sentence in the original text is mainly included. Then, after the first sentence of each sentence in the original text is deleted, whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. Judgment (S405). When the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the deletion operation is determined, and the first processing result and the sentence in the original text after the deletion processing are determined. Until the combination with the sentence includes all the keywords and the number of sentences in the original text after the deletion process is the minimum (S408), the process of the next sentence of the original text is performed according to the steps S404 to S405. Continue (S406) and use the combination as the final processing result (S409). On the other hand, if the combination of the first processing result and the sentence in the original text after the deletion process does not include all the keywords, the deletion operation is canceled, the first sentence is left, and the first sentence is left. S404 to S405 until the combination of the processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum (S408). According to the steps, the processing of the next sentence of the original text is continued (S407), and the combination is used as the final processing result (S409).

以下、図5を参照しながら、本開示の実施例に係るテキスト処理方法の例について説明する。図5に示すように、先ずオリジナルテキスト50、複数のキーワード52及び第1の処理結果を受信する(例えば、従来のテキスト生成モデルなどを用いて、オリジナルテキスト50から要約51を生成する)。図5から分かるように、モデルで生成された要約51が全てのキーワードを含まない(キーワードの「クーベルタン」がない)場合、本開示の方法によって、最終的な処理結果として、全てのキーワード52及びモデルで生成された要約51を含む新規の要約53を取得することができる。以上からわかるように、モデルで生成された要約51を参照として、「減少」する考えに基づいて、オリジナルテキスト50中の文を徐々に削除し、削除処理後のオリジナルテキスト中の文(例えば、図5における「古代オリンピックが終止になってからの1500年後に、フランス人のクーベルタンは、19世紀末に現代オリンピックを主催することを提案した。」)と、モデルで生成された要約51とを組み合わせて、最終的な処理結果(図5における処理済みの要約53)とすることで、最終的な処理結果が全てのキーワードを含み、最終的な処理結果の各文が重複せず、モデルで生成された要約51及びオリジナルテキストのその他の文の組み合わせと比べて、含まれる文の数が最少になる。なお、本開示の上記方法は、キーワードの数及び文の間の文法の問題を考慮する必要がなくなるので、計算複雑度を低減させる。 Hereinafter, an example of the text processing method according to the embodiment of the present disclosure will be described with reference to FIG. As shown in FIG. 5, first, the original text 50, a plurality of keywords 52, and the first processing result are received (for example, a summary 51 is generated from the original text 50 by using a conventional text generation model or the like). As can be seen from FIG. 5, if the summary 51 generated by the model does not contain all the keywords (without the keyword "Coubertin"), the method of the present disclosure will result in all the keywords 52 and the final processing result. A new summary 53 can be obtained, including the summary 51 generated by the model. As can be seen from the above, with reference to the summary 51 generated by the model, the sentences in the original text 50 are gradually deleted based on the idea of "decreasing", and the sentences in the original text after the deletion process (for example, for example). In Figure 5, "1500 years after the end of the ancient Olympics, the Frenchman Coubertin proposed to host the modern Olympics at the end of the 19th century."), Combined with the model-generated summary 51. By setting the final processing result (processed summary 53 in FIG. 5), the final processing result includes all keywords, and each sentence of the final processing result is generated by the model without duplication. The number of sentences contained is minimal compared to the combination of the summary 51 and other sentences of the original text. It should be noted that the above method of the present disclosure reduces the complexity of calculation because it is not necessary to consider the number of keywords and the grammatical problem between sentences.

本開示は、「減少」という考えに基づいて、要約とオリジナルテキスト全体とを組み合わせ、そして、数が最少である、全てのキーワードを含む文の集合を生成するまで、要約を参照してオリジナルテキスト中の文を削除することにより、計算複雑度を低減させる。 The present disclosure combines the abstract with the entire original text, based on the idea of "decrease", and refers to the original text with reference to the abstract until it produces a minimal set of sentences containing all the keywords. By deleting the sentences inside, the calculation complexity is reduced.

以上、図面を参照して、本開示の実施例に係るテキスト処理方法について説明する。以下、本開示の実施例に係るテキスト処理装置について説明する。 The text processing method according to the embodiment of the present disclosure will be described above with reference to the drawings. Hereinafter, the text processing apparatus according to the embodiment of the present disclosure will be described.

図6は、本開示の実施例に係るテキスト処理装置を示す機能ブロック図である。図6に示すように、本開示の実施例に係るテキスト処理装置1000は、受信ユニット1010と、判断ユニット1020と、削除ユニット1030と、を含む。上記各モジュールは、それぞれ、以上に図1~図5を参照しながら説明された本開示の実施例に係るテキスト処理方法の各ステップを実行することができる。当業者は、これらのユニットモジュールが単独でハードウェア、単独でソフトウェア又はそれらの組み合わせにより、様々な形態にて実現されてもよく、本開示は、これらのいずれかに限られない。例えば、中央処理装置(CPU)、テキストプロセッサ(GPU)、テンソルプロセッサ(TPU)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はデータ処理能力及び/又は命令実行能力を有する他の形態の処理ユニット及び対応するコンピュータの命令によって、これらのユニットを実行してもよい。 FIG. 6 is a functional block diagram showing a text processing device according to an embodiment of the present disclosure. As shown in FIG. 6, the text processing apparatus 1000 according to the embodiment of the present disclosure includes a receiving unit 1010, a determination unit 1020, and a deletion unit 1030. Each of the above modules can execute each step of the text processing method according to the embodiment of the present disclosure described above with reference to FIGS. 1 to 5. Those skilled in the art may realize these unit modules in various forms by hardware alone, software alone, or a combination thereof, and the present disclosure is not limited to any of these. For example, a central processing unit (CPU), text processor (GPU), tensor processor (TPU), field programmable gate array (FPGA), or other form of processing unit with data processing and / or instruction execution capabilities. And these units may be executed at the instruction of the corresponding computer.

例えば、受信ユニット1010は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するために用いられる。 For example, the receiving unit 1010 is used to receive the original text, one or more keywords contained in the original text, and the first processing result obtained by simplifying the original text.

例えば、第1の処理結果は、前記オリジナルテキストを簡略化することで得られた1つ又は複数の文である。1つの例としては、第1の処理結果は、テキスト要約であってもよい。例えば、第1の処理結果は、例えばニューラルネットワークに基づくテキスト生成モデルによって取得されるものであってもよい。第1の処理結果を取得する方法は、任意の適切な方法であってもよいが、ここで限定しない。 For example, the first processing result is one or more sentences obtained by simplifying the original text. As an example, the first processing result may be a text summary. For example, the first processing result may be obtained by, for example, a text generation model based on a neural network. The method for acquiring the first processing result may be any appropriate method, but is not limited thereto.

例えば、判断ユニット1020は、前記第1の処理結果が全てのキーワードを含むか否かを判断するために用いられる。 For example, the determination unit 1020 is used to determine whether or not the first processing result includes all the keywords.

例えば、判断ユニット1020は、1つ又は複数のキーワードの各々に対して、第1の処理結果の全ての文をトラバーサルすることで、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。例えば、ニューラルネットワークに基づく方法によって、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。上記判断ユニット1020が、第1の処理結果が全てのキーワードを含むか否かを判断する方法は、これに限られない。判断ユニット1020は、その他の適切な方法を用いて、第1の処理結果が全てのキーワードを含むか否かを判断してもよいが、ここで限定しない。 For example, the determination unit 1020 determines whether or not the first processing result includes all the keywords by traversing all the sentences of the first processing result for each of one or a plurality of keywords. You may. For example, it may be determined whether or not the first processing result includes all the keywords by a method based on the neural network. The method by which the determination unit 1020 determines whether or not the first processing result includes all the keywords is not limited to this. The determination unit 1020 may determine whether or not the first processing result includes all the keywords by using other appropriate methods, but is not limited thereto.

例えば、削除ユニット1030は、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするために用いられる。 For example, the deletion unit 1030 deletes one or more sentences in the original text when the first processing result does not include all the keywords, and the first processing result and the deletion processing are performed. The deletion process is continued until the combination with the sentence in the original text includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, and the combination is the final processing result. It is used to.

例えば、前記第1の処理結果が全てのキーワードを含むわけではない場合、削除ユニット1030は、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けてもよい。 For example, if the first processing result does not include all the keywords, the deletion unit 1030 may use the sentences in the original text based on the degree of association between each sentence of the original text and all the keywords. The deletion is performed until the combination of the first processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. The process may be continued.

例えば、オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。 For example, the degree of relevance between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text.

例えば、削除ユニット1030は、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除してもよい。 For example, the deletion unit 1030 sorts each sentence of the original text in ascending order of the degree of relevance based on the degree of association between each sentence of the original text and the all keywords, and based on the sort, the original text. You may delete each sentence in it.

例えば、削除ユニット1030は、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行してもよい。 For example, in the deletion unit 1030, after the first sentence of each sentence in the original text is deleted, the combination of the first processing result and the sentence in the original text after the deletion processing sets all the keywords. If the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the deletion operation is determined and the processing of the next sentence of the original text is determined. If the combination of the first processing result and the sentence in the original text after the deletion process does not include all the keywords, the deletion operation is canceled, the first sentence is left, and the original text is left. You may continue processing the next statement in.

代替的には、削除ユニット1030は、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除してもよい。該処理では、削除ユニット1030は、まず、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除し、次に、オリジナルテキストに残された、1つ又は複数のキーワードを含む文に対して上記処理を行うことで、処理の複雑度を低減させることができる。 Alternatively, in the deletion unit 1030, after one sentence in the original text is deleted, all combinations of the first processing result and the sentence in the original text after the deletion processing are all. Before determining whether or not a keyword is included, a sentence that does not include any of the keywords in the original text may be deleted in ascending order of relevance. In this process, the deletion unit 1030 first deletes a sentence in the original text that does not contain any of the keywords, and then for a sentence that contains one or more keywords left in the original text. By performing the above processing, the complexity of the processing can be reduced.

以下、図7を参照しながら、本開示の実施例に係るテキスト処理機器1100について説明する。図7は、本開示の実施例に係るテキスト処理機器の模式図である。本実施例のテキスト処理機器の機能は、以上に図1を参照しながら説明された方法の詳細と同様であるため、ここでは、便宜上、同じ内容についての詳細な説明が省略される。 Hereinafter, the text processing apparatus 1100 according to the embodiment of the present disclosure will be described with reference to FIG. 7. FIG. 7 is a schematic diagram of the text processing device according to the embodiment of the present disclosure. Since the functions of the text processing device of this embodiment are the same as the details of the method described above with reference to FIG. 1, detailed description of the same contents is omitted here for convenience.

本開示のテキスト処理機器は、プロセッサ1102と、コンピュータ読み取り可能な命令が記憶される記憶装置1101と、を備え、前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、テキスト処理方法を実行する。前記方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む。 The text processing apparatus of the present disclosure includes a processor 1102, a storage device 1101 for storing computer-readable instructions, and executes a text processing method when the computer-readable instructions are executed by the processor. .. The method comprises receiving the original text, one or more keywords contained in the original text, and the first processing result obtained by simplifying the original text, and the first processing result. The step of determining whether or not all the keywords are included, and if the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first process is performed. The deletion process is continued until the combination of the processing result of the above and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. A step of making the combination a final processing result, and the like are included.

各実施例でのテキスト処理装置1000及びテキスト処理機器1100の技術的効果については、本開示の実施例に係るテキスト処理方法の技術的効果を参照することができ、ここで、繰り返し説明しない。 Regarding the technical effects of the text processing apparatus 1000 and the text processing apparatus 1100 in each embodiment, the technical effects of the text processing method according to the embodiments of the present disclosure can be referred to, and the present invention will not be repeated here.

テキスト処理装置1000及びテキスト処理機器1100は、様々な適切な電子機器に適用される。 The text processing device 1000 and the text processing device 1100 are applied to various suitable electronic devices.

図8は、本開示の実施例に係るコンピュータ読み取り可能な記憶媒体1200の模式図である。 FIG. 8 is a schematic diagram of a computer-readable storage medium 1200 according to an embodiment of the present disclosure.

図8に示すように、本開示は、コンピュータ読み取り可能な命令1201が記憶されるコンピュータ読み取り可能な記憶媒体1200をさらに備え、該コンピュータ読み取り可能な命令がコンピュータによって実行されると、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、コンピュータテキスト処理方法を実行する。 As shown in FIG. 8, the present disclosure further comprises a computer-readable storage medium 1200 in which computer-readable instructions 1201 are stored, and when the computer-readable instructions are executed by the computer, the original text, said. The step of receiving one or more keywords included in the original text and the first processing result obtained by simplifying the original text, and whether or not the first processing result includes all the keywords. If the step of determining whether or not the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the deletion processing are performed. The deletion process is continued until the combination with the sentence in the original text includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, and the combination is the final processing result. And perform computer text processing methods, including.

<ハードウェア構造>
なお、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構造部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は、特に限定されない。即ち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置によって実現されてもよく、物理的及び/又は論理的に分離された2つ以上の装置を、直接及び/又は間接的に(例えば、有線及び/又は無線)接続することにより、上記複数の装置によって実現されてもよい。
<Hardware structure>
The block diagram used in the description of the above embodiment shows a block of functional units. These functional blocks (structural parts) are realized by any combination of hardware and / or software. Further, the means for realizing each functional block is not particularly limited. That is, each functional block may be realized by one physically and / or logically coupled device, and two or more physically and / or logically separated devices are directly and / or indirectly separated. It may be realized by the above-mentioned plurality of devices by connecting (for example, wired and / or wirelessly).

例えば、本開示の一実施の形態における電子機器は、本開示のテキスト処理方法の処理を実行するコンピュータとして機能してもよい。図9は、本開示の一実施の形態に係る電子機器のハードウェア構造の一例の図である。上記の電子機器10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成してもよい。 For example, the electronic device in one embodiment of the present disclosure may function as a computer that performs the processing of the text processing method of the present disclosure. FIG. 9 is a diagram of an example of the hardware structure of the electronic device according to the embodiment of the present disclosure. The electronic device 10 may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.

なお、以下の説明において、「装置」という文言は、回路、デバイス、ユニットなどに置き替えることができる。電子機器10のハードウェア構造は、図に示されている各装置を1つ又は複数含んでもよいし、又は一部の装置を含まなくてもよい。 In the following description, the word "device" can be replaced with a circuit, device, unit, or the like. The hardware structure of the electronic device 10 may include one or more of the devices shown in the figure, or may not include some of the devices.

例えば、図には1つのプロセッサ1001のみが示されているが、複数のプロセッサが設けられてもよい。さらに、1つのプロセッサによって処理を実行してもよく、1つ以上のプロセッサによって同時に、順次に、又は他の方法によって処理を実行してもよい。なお、プロセッサ1001は、1つ以上のチップによってインストールされてもよい。 For example, although the figure shows only one processor 1001, a plurality of processors may be provided. Further, the processing may be executed by one processor, or the processing may be executed simultaneously by one or more processors, sequentially, or by another method. The processor 1001 may be installed by one or more chips.

電子機器10の各機能は、例えば、所定のソフトウェア(プログラム)をプロセッサ1001、メモリ1002などのハードウェア上に読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み取り及び/又は書き込みを制御することで実現されている。 For each function of the electronic device 10, for example, by loading predetermined software (program) onto hardware such as the processor 1001 and the memory 1002, the processor 1001 performs an operation, and communication by the communication device 1004, the memory 1002, and the memory 1002 and the like. It is realized by controlling the reading and / or writing of data in the storage 1003.

プロセッサ1001は、例えば、オペレーティングシステムを動作させて、コンピュータ全体を制御する。プロセッサ1001は、周辺機器とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU、Central Processing Unit)で構成されてもよい。 Processor 1001 operates, for example, an operating system to control the entire computer. The processor 1001 may be configured by a central processing unit (CPU, Central Processing Unit) including an interface with peripheral devices, a control device, an arithmetic unit, a register, and the like.

なお、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータなどをストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、それらに従って様々な処理を実行する。プログラムとしては、上記実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、電子機器10の制御ユニット401は、メモリ1002に格納され、プロセッサ1001によって動作する制御プログラムにより実現されてもよく、他の機能ブロックについても同様に実現されてもよい。 The processor 1001 reads a program (program code), a software module, data, and the like from the storage 1003 and / or the communication device 1004 into the memory 1002, and executes various processes according to them. As the program, a program that causes a computer to execute at least a part of the operations described in the above embodiment is used. For example, the control unit 401 of the electronic device 10 may be realized by a control program stored in the memory 1002 and operated by the processor 1001, and may be similarly realized for other functional blocks.

メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、読み取り専用メモリ(ROM、Read Only Memory)、プログラム可能な読み取り専用メモリ(EPROM、Erasable Programmable ROM)、電気的プログラム可能な読み取り専用メモリ(EEPROM、Electrically EPROM)、ランダムアクセスメモリ(RAM、Random Access Memory)、及び他の適切な記憶媒体の少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の1つの実施の形態に係る無線通信方法を実装するための実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを記憶することができる。 The memory 1002 is a computer-readable recording medium, such as a read-only memory (ROM, Read Only Memory), a programmable read-only memory (EPROM, Erasable Programmable ROM), and an electrically programmable read-only memory (EPROM). , Electrically EPROM), random access memory (RAM, Random Access Memory), and at least one of other suitable storage media. The memory 1002 may be referred to as a register, a cache, a main memory (main storage device), or the like. The memory 1002 can store an executable program (program code), a software module, and the like for implementing the wireless communication method according to one embodiment of the present disclosure.

ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、フレキシブルディスク(flexible disk)、フロッピー(登録商標)ディスク(floppy disk)、光磁気ディスク(例えば、コンパクトディスク(CD-ROM(Compact Disc ROM)など、デジタルユニバーサルディスク、ブルーレイ(Blu-ray(登録商標))ディスク、リムーバブルディスク、ハードドライブ、スマートカード、フラッシュメモリデバイス(例えば、カード、スティック(stick)、キードライバー(key driver))、磁気ストリップ、データベース、サーバ、及びその他の適切な記憶媒体の少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。 The storage 1003 is a computer-readable recording medium, and is, for example, a flexible disk, a floppy (registered trademark) disk, or an optical magnetic disk (for example, a compact disk (CD-ROM)). Digital universal discs, Blu-ray (registered trademark) discs, removable discs, hard drives, smart cards, flash memory devices (eg, cards, sticks, key drivers), magnetic strips, etc. , Database, server, and other suitable storage medium. Storage 1003 may be referred to as an auxiliary storage device.

通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送信受信機器)であり、例えば、ネットワーク装置、ネットワークコントローラ、ネットワークカード、通信モジュールなどとも呼ばれる。 The communication device 1004 is hardware (transmission / reception device) for communicating between computers via a wired and / or wireless network, and is also called, for example, a network device, a network controller, a network card, a communication module, or the like.

入力装置1005は、外部からの入力を受け取る入力機器(例えば、キーボード、マウス、マイク、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を行う出力機器(例えば、ディスプレイ、スピーカ、発光ダイオード(LED、Light Emitting Diode)ランプなど)である。なお、入力装置1005と出力装置1006とは、一体構造(例えば、タッチパネル)であってもよい。 The input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, etc.) that receives an input from the outside. The output device 1006 is an output device (for example, a display, a speaker, a light emitting diode (LED, a Light Emitting Diode) lamp, or the like) that outputs to the outside. The input device 1005 and the output device 1006 may have an integrated structure (for example, a touch panel).

なお、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007を介して接続される。バス1007は、単一のバスから構成されてもよく、装置間の異なるバスから構成されてもよい。 Each device such as the processor 1001 and the memory 1002 is connected via the bus 1007 for communicating information. Bus 1007 may be composed of a single bus or may be composed of different buses between devices.

なお、電子機器10は、マイクロプロセッサ、デジタルシグナルプロセッサ(DSP、Digital Signal Processor)、特定用途向け集積回路(ASIC、Application Specific Integrated Circuit)、プログラマブルロジックデバイス(PLD、Programmable Logic Device)、及びフィールドプログラマブルゲートアレイ(FPGA、Field Programmable Gate Array)などのハードウェアを備えてもよく、該ハードウェアを介して各機能ブロックの一部又はすべてを実現することができる。例えば、プロセッサ1001は、これらのハードウェアのうちの少なくとも1つによってインストールされてもよい。 The electronic device 10 includes a microprocessor, a digital signal processor (DSP, Digital Signal Processor), an integrated circuit for a specific application (ASIC, Application Specific Integrated Circuit), a programmable logic device (PLD, Programmable Logic Device), and a programmable logic device. Hardware such as an array (FPGA, Field Processor Gate Array) may be provided, and a part or all of each functional block can be realized through the hardware. For example, processor 1001 may be installed by at least one of these hardware.

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、コマンド、コマンドセット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能なファイル、実行スレッド、ステップ、機能などを意味するよう広く解釈されるべきである。 Software, whether called software, firmware, middleware, microcode, hardware description language, or other names, commands, command sets, codes, code segments, program codes, programs, subprograms, software modules. , Applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, steps, features, etc. should be broadly interpreted.

なお、ソフトウェア、コマンド、情報などが、伝送媒体を介して送信又は受信されてもよい。例えば、有線技術(同軸ケーブル、光ケーブル、ツイストペア、デジタル加入者線(DSL、Digital Subscriber Line)など)及び/又は無線技術(赤外線、マイクロ波など)を使用して、ウェブサイト、サーバ、又はその他のリモートソースからソフトウェアを送信する場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれている。 Note that software, commands, information, and the like may be transmitted or received via a transmission medium. For example, using wired technology (coaxial cable, optical cable, twisted pair, digital subscriber line (DSL, Digital Subscriber Line), etc.) and / or wireless technology (infrared, microwave, etc.), website, server, or other. When transmitting software from a remote source, these wired and / or wireless technologies are included within the definition of transmission medium.

本明細書で説明された各形態/実施の形態は、単独又は組み合わせて使用されてもよく、実行中に切り替えて使用されてもよい。なお、本明細書で説明した各方式/実施の形態の処理ステップ、シーケンス、フローチャートなどは、矛盾のない限り、順序を入れ替えてもよい。例えば、本明細書で説明された方法に関して、様々なステップ単位は、例示的な順序で与えられたが、与えられた特定の順序に限定されない。 Each of the embodiments / embodiments described herein may be used alone or in combination, or may be switched and used during execution. The order of the processing steps, sequences, flowcharts, etc. of each method / embodiment described in the present specification may be changed as long as there is no contradiction. For example, with respect to the methods described herein, the various step units are given in an exemplary order, but are not limited to the particular order given.

本明細書に用いられた「に基づいて」とは、他の段落に明確に記載されていない限り、「のみに基づいて」という意味ではない。つまり、「に基づいて」という表現は、「のみに基づいて」と「少なくともに基づいて」の両方を意味する。 As used herein, "based on" does not mean "based on" unless expressly stated in another paragraph. That is, the expression "based on" means both "based on only" and "based on at least."

本明細書で使用されている「第1」、「第2」などの名称を使用したユニットへのいかなる参照は、これらのユニットの量又は順序を全般的に限定するものではない。本明細書では、これらの名称を2つ以上のユニットを区別するための便利な方法として使用することができる。したがって、第1ユニットおよび第2ユニットへの参照は、2つのユニットのみそこで採用され得ること、又は第1ユニットが第2ユニットに先行しなければならないことを意味しない。 Any reference to units using names such as "first", "second" as used herein does not generally limit the quantity or order of these units. As used herein, these names can be used as a convenient way to distinguish between two or more units. Therefore, references to the first and second units do not mean that only two units can be employed there, or that the first unit must precede the second unit.

「含む(including)」、「含有(comprising)」、及びそれらの変形を、本明細書あるいは特許請求の範囲で使用されている限り、これらの用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲で使用される「又は(or)」という用語は、排他的論理和ではない。 As long as "inclusion", "comprising", and variations thereof are used herein or within the scope of the claims, these terms are as comprehensive as the term "comprising". Is intended to be. Moreover, the term "or" as used herein or in the claims is not an exclusive OR.

当業者は、本出願の様々な態様が、新規で有用なプロセス、機械、製品、又は物質の組み合わせ、又はそれらの任意の組み合わせ、又はそれらに対して新規で有用な改良を含む、いくつかの特許可能なカテゴリ又は状況を通じて説明及び記載できることを理解できる。それに従って、本出願の様々な態様は、ハードウェアによって完全に実行されてもよく、ソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)によって完全に実行されてもよく、又はハードウェアとソフトウェアの組み合わせによって実行されてもよい。上記のハードウェア又はソフトウェアはいずれも、「データブロック」、「モジュール」、「エンジン」、「ユニット」、「アセンブリ」、又は「システム」と呼ばれてもよい。なお、本出願の様々な態様は、1つ又は複数のコンピュータ読み取り可能な媒体に設けられるコンピュータ製品として具現化されてもよく、該製品がコンピュータ読み取り可能なプログラムコードを含む。 Those skilled in the art will appreciate that various aspects of this application include new and useful combinations of processes, machines, products, or substances, or any combinations thereof, or new and useful improvements to them. Understand what can be explained and described through patentable categories or situations. Accordingly, various aspects of the present application may be performed entirely by hardware, may be performed entirely by software (including firmware, resident software, microcode, etc.), or may be performed entirely by hardware and software. It may be executed by a combination. Any of the above hardware or software may be referred to as a "data block", "module", "engine", "unit", "assembly", or "system". It should be noted that various aspects of the present application may be embodied as computer products provided on one or more computer-readable media, the product including computer-readable program code.

本出願は、特定の単語を使用して、本出願の実施例を説明した。例えば、「1つの実施例」、「一実施例」、及び/又は「いくつかの実施例」は、本出願の少なくとも1つの実施例に関連する特定の特徴、構造、又は特性を意味する。したがって、本明細書において異なる位置で2回以上言及される「一実施例」又は「1つの実施例」又は「一代替実施例」は、必ずしも同じ実施例を指すとは限らないことを強調し、留意されるべきである。なお、本出願の1つ又は複数の実施例におけるいくつかの特徴、構造、又は特性は、適切に組み合わせられてもよい。 This application uses specific words to describe examples of this application. For example, "one example," "one example," and / or "several examples" mean a particular feature, structure, or characteristic associated with at least one example of the present application. Therefore, it is emphasized that "one example" or "one example" or "one alternative example" referred to in different positions more than once in the present specification does not necessarily refer to the same embodiment. , Should be noted. It should be noted that some features, structures, or properties in one or more embodiments of the present application may be combined appropriately.

特に定義されない限り、ここで使用されるすべての用語(技術用語及び科学用語を含む)は、本開示の当業者によって一般に理解されるのと同じ意味を有する。なお、通常の辞書で定義されているような用語は、関連する技術の文脈での意味と一致する意味を持つものとして解釈されるべきであり、ここで明示的に述べられていない限り、理想的又は極端に形式化された意味で解釈されるべきではないことも理解されたい。 Unless otherwise defined, all terms used herein (including technical and scientific terms) have the same meaning as commonly understood by those skilled in the art of the present disclosure. It should be noted that terms such as those defined in ordinary dictionaries should be construed as having a meaning consistent with the meaning in the context of the relevant technology and are ideal unless explicitly stated here. It should also be understood that it should not be interpreted in a targeted or extremely formalized sense.

以上、本開示について詳細に説明したが、本開示が本明細書で説明した実施の形態に限定されないことは、当業者には明らかである。本開示は、特許請求の範囲の説明によって決定される本開示の趣旨及び範囲から逸脱することなく、修正及び変更された形態として実装することができる。したがって、本明細書における記載は、例示説明を目的とするものであり、本開示に対して何ら限定的な意味を有するものではない。 Although the present disclosure has been described in detail above, it will be apparent to those skilled in the art that the present disclosure is not limited to the embodiments described herein. The present disclosure may be implemented as amended and modified forms without departing from the gist and scope of the present disclosure as determined by the description of the scope of the patent claim. Therefore, the description herein is for purposes of illustration only and has no limiting meaning to the present disclosure.

Claims (9)

テキスト処理方法であって、
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法。
It ’s a text processing method.
A step of receiving the original text, one or more keywords contained in the original text, and a first processing result obtained by simplifying the original text.
The step of determining whether or not the first processing result includes all the keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The deletion process is continued until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is minimized, and the combination is used as the final processing result. , Text processing method.
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップは、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップを含む、請求項1に記載のテキスト処理方法。
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The step of continuing the deletion process until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is the minimum is
When the first processing result does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and the all keywords, and the first sentence is deleted. The deletion process is continued until the combination of the processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. The text processing method according to claim 1.
前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除するステップは、
前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップと、
前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップと、を含む、請求項2に記載のテキスト処理方法。
The step of deleting a sentence in the original text based on the degree of association between each sentence in the original text and all the keywords is
A step of sorting each sentence of the original text in ascending order of the degree of association based on the degree of association between each sentence of the original text and all the keywords.
The text processing method according to claim 2, comprising a step of deleting each sentence in the original text based on the sort.
関連度の昇順に従って、前記オリジナルテキスト中の各文を削除するステップは、
前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップと、
前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップと、を含む、請求項3に記載のテキスト処理方法。
The step of deleting each sentence in the original text in ascending order of relevance is
After the first sentence of each sentence in the original text is deleted, it is determined whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. Steps and
When the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the step of determining the deletion operation and continuing the processing of the next sentence of the original text, and
If the combination of the first processing result and the sentence in the original text after the deletion process does not include all the keywords, the deletion operation is canceled, the first sentence is left, and the sentence following the original text is left. 3. The text processing method according to claim 3, comprising the step of continuing the processing of.
前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、
関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップをさらに含む、請求項4に記載のテキスト処理方法。
After one sentence in the original text is deleted, but before it is determined whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. To,
The text processing method according to claim 4, further comprising a step of deleting a sentence containing none of the keywords in the original text in ascending order of relevance.
前記オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである、請求項2~請求項5のいずれか一項に記載のテキスト処理方法。 The degree of relevance between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text, claim 2 to claim. Item 5. The text processing method according to any one of items 5. テキスト処理装置であって、
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するための受信ユニットと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するための判断ユニットと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするための削除ユニットと、を備える、テキスト処理装置。
It ’s a text processing device.
An original text, one or more keywords contained in the original text, and a receiving unit for receiving the first processing result obtained by simplifying the original text.
A determination unit for determining whether or not the first processing result includes all keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. With a deletion unit for continuing the deletion process until the combination of the above includes all keywords and the number of sentences in the original text after the deletion process is the minimum, and making the combination the final processing result. , A text processing device.
プロセッサと、
コンピュータ読み取り可能な命令が記憶される記憶装置と、を備えるテキスト処理機器であって、
前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法を実行する、テキスト処理機器。
With the processor
A text processing device comprising a storage device for storing computer-readable instructions.
When the computer-readable instruction is executed by the processor,
A step of receiving the original text, one or more keywords contained in the original text, and a first processing result obtained by simplifying the original text.
The step of determining whether or not the first processing result includes all the keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The deletion process is continued until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is minimized, and the combination is used as the final processing result. A text processing device that performs a text processing method.
コンピュータ読み取り可能なプログラムを記憶するためのコンピュータ読み取り可能な記憶媒体であって、
前記プログラムによって、コンピュータに請求項1~請求項6のいずれか一項に記載のテキスト処理方法を実行させる、コンピュータ読み取り可能な記憶媒体。
A computer-readable storage medium for storing computer-readable programs.
A computer-readable storage medium that causes a computer to execute the text processing method according to any one of claims 1 to 6 by the program.
JP2021156713A 2020-09-27 2021-09-27 Text processing method, device, apparatus, and computer-readable storage medium Pending JP2022055353A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011030736.5A CN114281927A (en) 2020-09-27 2020-09-27 Text processing method, device, equipment and computer readable storage medium
CN202011030736.5 2020-09-27

Publications (1)

Publication Number Publication Date
JP2022055353A true JP2022055353A (en) 2022-04-07

Family

ID=80867620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021156713A Pending JP2022055353A (en) 2020-09-27 2021-09-27 Text processing method, device, apparatus, and computer-readable storage medium

Country Status (2)

Country Link
JP (1) JP2022055353A (en)
CN (1) CN114281927A (en)

Also Published As

Publication number Publication date
CN114281927A (en) 2022-04-05

Similar Documents

Publication Publication Date Title
US7953692B2 (en) Predicting candidates using information sources
JP5802292B2 (en) Shared language model
US20200285808A1 (en) Synonym dictionary creation apparatus, non-transitory computer-readable recording medium storing synonym dictionary creation program, and synonym dictionary creation method
US20140019462A1 (en) Contextual query adjustments using natural action input
EP3055789A1 (en) Smart selection of text spans
US10108698B2 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
AU2021200962A1 (en) Model-based semantic text searching
KR20080024156A (en) Back-off mechanism for search
AU2017277831B2 (en) Query optimizer for CPU utilization and code refactoring
CN102955773B (en) For identifying the method and system of chemical name in Chinese document
US9552411B2 (en) Trending suggestions
JP2010520532A (en) Input stroke count
JP6976448B2 (en) Machine translation controller
JP2022055353A (en) Text processing method, device, apparatus, and computer-readable storage medium
JP7247593B2 (en) Generation device, software robot system, generation method and generation program
JP6895580B2 (en) Dialogue system
CN114663718A (en) Training apparatus, method, device, and computer-readable medium
US10546061B2 (en) Predicting terms by using model chunks
JP2022002090A (en) Information processing method, apparatus, device, and computer readable storage media
JP2020123134A (en) Extraction method, information processing device, and extraction program
US12073299B2 (en) Systems and methods for using contrastive pre-training to generate text and code embeddings
JP6976447B2 (en) Machine translation controller
US20230409830A1 (en) Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method
US20230015324A1 (en) Retrieval device
CN111597323B (en) Key field filtering method and device, storage medium and electronic equipment

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230928

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240911