JP2022055353A - Text processing method, device, apparatus, and computer-readable storage medium - Google Patents
Text processing method, device, apparatus, and computer-readable storage medium Download PDFInfo
- Publication number
- JP2022055353A JP2022055353A JP2021156713A JP2021156713A JP2022055353A JP 2022055353 A JP2022055353 A JP 2022055353A JP 2021156713 A JP2021156713 A JP 2021156713A JP 2021156713 A JP2021156713 A JP 2021156713A JP 2022055353 A JP2022055353 A JP 2022055353A
- Authority
- JP
- Japan
- Prior art keywords
- original text
- keywords
- sentence
- processing
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 36
- 238000012217 deletion Methods 0.000 claims abstract description 117
- 230000037430 deletion Effects 0.000 claims abstract description 117
- 238000000034 method Methods 0.000 claims description 97
- 230000008569 process Effects 0.000 claims description 69
- 230000001174 ascending effect Effects 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、テキスト処理分野に関し、具体的には、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体に関する。 The present application relates to the field of text processing, specifically to text processing methods, devices, equipment and computer-readable storage media.
テキスト要約生成とは、明確な意味を持っている一部のテキスト内容を高度に一般化して抽象化し、テキストの要約を生成することである。要約が全ての所望するキーワードを含むことをユーザが望むが、生成された要約が全ての所望するキーワードを含むわけではない場合、一般的にキーワードの各々について、オリジナルテキストから、反復的にキーワードを含む文を選択し、選択されたキーワードを含む文と、生成された要約とを組み合わせて新規の要約とすることが行われている。しかし、この方法では、所望するキーワードの数の増加に伴って、複雑度が高くなってしまう。 Text summarization generation is the generation of a text summarization by highly generalizing and abstracting some textual content that has a clear meaning. If the user wants the summary to contain all the desired keywords, but the generated summary does not contain all the desired keywords, then generally for each of the keywords, the keywords are iterated from the original text. A sentence containing the selected keyword is selected, and the sentence containing the selected keyword is combined with the generated summary to form a new summary. However, this method becomes more complex as the number of desired keywords increases.
上記問題に鑑みて、本開示は、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体を提供する。 In view of the above problems, the present disclosure provides text processing methods, devices, devices and computer readable storage media.
本開示の1つの態様によれば、テキスト処理方法が提供され、前記テキスト処理方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む。 According to one aspect of the present disclosure, a text processing method is provided, wherein the text processing method is obtained by simplifying the original text, one or more keywords contained in the original text, and the original text. A step of receiving the obtained first processing result, a step of determining whether or not the first processing result includes all keywords, and a case where the first processing result does not include all keywords. , One or more sentences in the original text are deleted, the combination of the first processing result and the sentence in the original text after the deletion process includes all keywords, and the said after the deletion process. The deletion process is continued until the number of sentences in the original text is minimized, and the combination is used as the final process result.
本開示の1つの例によれば、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップは、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップを含む。 According to one example of the present disclosure, when the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the deletion are deleted. The step of continuing the deletion process until the combination with the sentence in the original text after processing includes all the keywords and the number of sentences in the original text after the deletion process is the minimum is the first step. If the processing result of the above does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and all the keywords, and the first processing result and the above first processing result are obtained. The deletion process is continued until the combination with the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is minimized.
本開示の1つの例によれば、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除するステップは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップと、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップと、を含む。 According to one example of the present disclosure, the step of deleting a sentence in the original text based on the degree of association between each sentence of the original text and all the keywords is a step of deleting each sentence of the original text and all of the above. Includes a step of sorting each sentence of the original text in ascending order of relevance based on the degree of relevance to the keyword, and a step of deleting each sentence in the original text based on the sort.
本開示の1つの例によれば、関連度の昇順に従って、前記オリジナルテキスト中の各文を削除するステップは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップと、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップと、を含む。 According to one example of the present disclosure, the step of deleting each sentence in the original text in ascending order of relevance is the first sentence after the first sentence of each sentence in the original text is deleted. The step of determining whether or not the combination of the processing result of the above and the sentence in the original text after the deletion processing includes all the keywords, and the first processing result and the sentence in the original text after the deletion processing. When the combination of contains all keywords, the step of determining the deletion operation and continuing the processing of the next sentence of the original text, and the combination of the first processing result and the sentence in the original text after the deletion processing. Includes a step of canceling the delete operation, leaving the first sentence, and continuing processing of the next sentence of the original text, if does not contain all the keywords.
本開示の1つの例によれば、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップとをさらに含む。 According to one example of the present disclosure, after one sentence in the original text has been deleted, the combination of the first processing result and the sentence in the original text after the deletion processing is all. Before determining whether or not to include a keyword, it further includes a step of deleting a sentence in the original text that does not contain any of the keywords in ascending order of relevance.
本開示の1つの例によれば、前記オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。 According to one example of the present disclosure, the degree of association between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text. It is a thing.
本開示の別の態様によれば、テキスト処理装置が提供され、前記テキスト処理装置は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するための受信ユニットと、前記第1の処理結果が全てのキーワードを含むか否かを判断するための判断ユニットと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするための削除ユニットと、を含む。 According to another aspect of the present disclosure, a text processing device is provided, wherein the text processing device is obtained by simplifying the original text, one or more keywords contained in the original text, and the original text. A receiving unit for receiving the first processing result, a determination unit for determining whether or not the first processing result includes all keywords, and the first processing result are all keywords. If one or more sentences in the original text are deleted, the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, and , The deletion unit for continuing the deletion process until the number of sentences in the original text after the deletion process is minimized, and making the combination the final processing result.
本開示の1つの例によれば、前記削除ユニットは、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続ける。 According to one example of the present disclosure, the deletion unit is based on the degree of association between each sentence of the original text and all the keywords, if the first processing result does not include all the keywords. , The sentence in the original text is deleted, the combination of the first processing result and the sentence in the original text after the deletion process includes all keywords, and the number of sentences in the original text after the deletion process. The deletion process is continued until is the minimum.
本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除する。 According to one example of the present disclosure, the deletion unit sorts each sentence of the original text in ascending order of relevance based on the degree of association between each sentence of the original text and all the keywords. Based on the sort, each sentence in the original text is deleted.
本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行する。 According to one example of the present disclosure, the deletion unit has the first processing result and the sentence in the original text after the deletion processing after the first sentence of each sentence in the original text is deleted. It is determined whether or not the combination with and contains all the keywords, and if the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the deletion operation is determined. If the processing of the next sentence of the original text is continued, and the combination of the first processing result and the sentence in the original text after the deletion processing does not include all the keywords, the deletion operation is canceled and the deletion operation is canceled. Leave the sentence 1 and continue processing the next sentence of the original text.
本開示の1つの例によれば、前記削除ユニットは、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除することにさらに用いられる。 According to one example of the present disclosure, the deletion unit is after one sentence in the original text has been deleted, with the first processing result and the sentence in the original text after the deletion processing. It is further used to delete sentences in the original text that do not contain any of the keywords in ascending order of relevance before determining whether or not the combination of the above includes all the keywords.
本開示の別の態様によれば、テキスト処理機器が提供され、プロセッサと、コンピュータ読み取り可能な命令が記憶される記憶装置と、を備えるテキスト処理機器は、前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法を実行する。 According to another aspect of the present disclosure, a text processing device comprising a processor and a storage device for storing computer-readable instructions is such that the computer-readable instructions are stored by the processor. When executed, a step of receiving the original text, one or more keywords contained in the original text, and the first processing result obtained by simplifying the original text, and the first processing. The step of determining whether the result contains all the keywords, and if the first processing result does not include all the keywords, one or more sentences in the original text are deleted and the first processing result is deleted. The deletion process is continued until the combination of the processing result of 1 and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. , A step of making the combination a final processing result, and a text processing method.
本開示の別の態様によれば、コンピュータ読み取り可能なプログラムを記憶するためのコンピュータ読み取り可能な記憶媒体が提供され、前記プログラムによって、コンピュータに以上のいずれかの態様に記載のテキスト処理方法を実行させる。 According to another aspect of the present disclosure, a computer-readable storage medium for storing a computer-readable program is provided, wherein the program performs the text processing method according to any one of the above embodiments on the computer. Let me.
本開示の上記態様では、第1の処理結果を参照し、オリジナルテキストの各文と全てのキーワードとの関連度に基づいてオリジナルテキスト中の1つ又は複数の文を削除し、第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とすることで、処理複雑度を低減させるとともに、文法の問題を考慮する必要がない。 In the above aspect of the present disclosure, referring to the first processing result, one or more sentences in the original text are deleted based on the degree of relevance between each sentence of the original text and all the keywords, and the first processing is performed. The deletion process is continued until the combination of the result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. By making it the final processing result, it is not necessary to consider the grammatical problem while reducing the processing complexity.
添付の図面を参照しながら本開示の実施例をより詳細に説明することにより、本開示の上記及び他の目的、特徴、及び利点がより明らかになる。添付の図面は、本開示の実施例のさらなる理解を提供するために使用され、明細書の一部を構成し、本開示の実施例とともに本開示を説明するために使用され、本開示を限定するものではない。図面において、同じ参照符号は、通常、同じ部材又はステップを表す。 By describing the embodiments of the present disclosure in more detail with reference to the accompanying drawings, the above and other purposes, features, and advantages of the present disclosure will become more apparent. The accompanying drawings are used to provide a further understanding of the embodiments of the present disclosure, which form part of the specification and are used in conjunction with the embodiments of the present disclosure to illustrate the present disclosure and limit the disclosure. It's not something to do. In the drawings, the same reference numerals usually represent the same member or step.
以下、本開示の実施例の図面を参照しながら、本開示の実施例の技術的解決手段について明瞭かつ完全に説明する。当然ながら、説明された実施例は、本開示の一部の実施例に過ぎず、全ての実施例ではない。本開示の実施例に基づいて、当業者が創造的な労働なしに得る全てのその他の実施例は、いずれも本開示の保護範囲に属するものとなる。 Hereinafter, the technical solutions of the embodiments of the present disclosure will be clearly and completely described with reference to the drawings of the embodiments of the present disclosure. Of course, the examples described are only partial examples of the present disclosure, not all examples. All other embodiments that a person skilled in the art obtains without creative labor under the embodiments of the present disclosure are all within the scope of the present disclosure.
本出願では、フローチャートを使用して、本出願の実施例による方法のステップを説明する。前のステップ又は次のステップが必ずしも順に正確に実行されるとは限らないことを理解されたい。代わりに、様々なステップを逆の順序で、又は同時に処理することができる。同時に、他の操作もこれらのプロセスに追加してもよい。又は、これらのプロセスから、あるステップ又は複数のステップを削減してもよい。 In this application, flowcharts are used to describe the steps of the method according to the embodiments of the present application. It should be understood that the previous or next step is not always performed exactly in sequence. Alternatively, the various steps can be processed in reverse order or simultaneously. At the same time, other operations may be added to these processes. Alternatively, one step or a plurality of steps may be reduced from these processes.
先ず、図1を参照しながら、本開示の実施例を実現するためのテキスト処理方法100について説明する。本開示は、第1の処理結果(例えば、テキスト要約)を参照し、オリジナルテキストの各文と全てのキーワードとの関連度に基づいて、オリジナルテキスト中の1つ又は複数の文を削除し、第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とすることで、処理複雑度を低減させるとともに、文法の問題を考慮する必要がない。
First, with reference to FIG. 1, a
以下、図面を参照しながら本開示の実施例及びその例について詳細に説明する。 Hereinafter, examples of the present disclosure and examples thereof will be described in detail with reference to the drawings.
本開示の少なくとも1つの実施例は、テキスト処理方法、装置、機器及びコンピュータ読み取り可能な記憶媒体を提供する。以下、複数の例及び実施例にて、本開示の少なくとも1つの実施例に係るテキスト処理について非限定的に説明し、以下に説明される通り、お互いに矛盾しない場合、これらの具体的な例及び実施例の異なる特徴を相互に組み合わせ、それにより、新しい例及び実施例を得ることができ、これらの新しい例及び実施例は、全て本開示の保護範囲に属する。 At least one embodiment of the present disclosure provides text processing methods, devices, equipment and computer readable storage media. Hereinafter, the text processing according to at least one embodiment of the present disclosure will be described in a non-limiting manner in a plurality of examples and examples, and as described below, specific examples thereof when they do not contradict each other. And the different features of the examples can be combined with each other to give new examples and examples, all of which are within the scope of the present disclosure.
以下、図1~5を参照しながら、本開示の実施例に係るテキスト処理方法について説明する。 Hereinafter, the text processing method according to the embodiment of the present disclosure will be described with reference to FIGS. 1 to 5.
先ず、図1を参照しながら、本開示の実施例に係るテキスト処理方法について説明する。該方法は、コンピュータなどにより自動的に完成されてもよい。例えば、該方法は、テキスト要約生成、テキスト取りまとめなどに適用される。例えば、該テキスト処理取得方法は、ソフトウェア、ハードウェア、ファームウェア又はそれらの任意の組み合わせの形態で実現されてもよく、携帯電話、タブレットPC、ノートパソコン、デスクトップパソコン、ネットワークサーバなどの機器におけるプロセッサによってロードされて実行されてもよい。 First, the text processing method according to the embodiment of the present disclosure will be described with reference to FIG. The method may be completed automatically by a computer or the like. For example, the method applies to text summarization generation, text summarization, and the like. For example, the text processing acquisition method may be realized in the form of software, hardware, firmware, or any combination thereof, and may be realized by a processor in a device such as a mobile phone, a tablet PC, a notebook personal computer, a desktop personal computer, or a network server. It may be loaded and executed.
図1に示すように、該テキスト処理方法は、以下のステップS101~S103を含む。 As shown in FIG. 1, the text processing method includes the following steps S101 to S103.
ステップS101では、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード及び第1の処理結果を受信する。 In step S101, the original text, one or more keywords included in the original text, and the first processing result are received.
ステップS102では、前記第1の処理結果が全てのキーワードを含むか否かを判断する。 In step S102, it is determined whether or not the first processing result includes all the keywords.
ステップS103では、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し,前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とする。 In step S103, when the first processing result does not include all the keywords, one or a plurality of sentences in the original text are deleted, and the first processing result and the original text after the deletion processing are deleted. The deletion process is continued until the combination with the sentence inside includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, and the combination is used as the final processing result.
ステップS101では、例えば、オリジナルテキストは、任意の言語形式(例えば、中国語、英語、日本語など)のテキストであってもよいが、ここで限定しない。例えば、キーワードは、ユーザが重要であると考える1つ又は複数の文字、単語又はフレーズ又は短い文であってもよい。 In step S101, for example, the original text may be text in any language format (for example, Chinese, English, Japanese, etc.), but is not limited thereto. For example, the keyword may be one or more letters, words or phrases or short sentences that the user considers important.
例えば、第1の処理結果は、前記オリジナルテキストを簡略化することで得られた1つ又は複数の文である。1つの例としては、第1の処理結果は、テキスト要約であってもよい。例えば、第1の処理結果は、例えばニューラルネットワークに基づくテキスト生成モデルにより取得されるものであってもよい。第1の処理結果を取得する方法は、任意の適切な方法であってもよいが、ここで限定しない。 For example, the first processing result is one or more sentences obtained by simplifying the original text. As an example, the first processing result may be a text summary. For example, the first processing result may be obtained by, for example, a text generation model based on a neural network. The method for acquiring the first processing result may be any appropriate method, but is not limited thereto.
ステップS102では、例えば、1つ又は複数のキーワードの各々に対して、第1の処理結果の全ての文をトラバーサルすることで、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。例えば、第1の処理結果の全ての文を各単語ベクトルに分解し、全てのキーワードも単語ベクトルの形式に変換し、ニューラルネットワークに基づく方法によって、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。上記第1の処理結果が全てのキーワードを含むか否かを判断する方法は、これに限られず、その他の適切な方法を用いて、第1の処理結果が全てのキーワードを含むか否かを判断してもよいが、ここで限定しないことに留意されたい。 In step S102, for example, by traversing all the sentences of the first processing result for each of one or a plurality of keywords, it is determined whether or not the first processing result includes all the keywords. You may. For example, whether all the sentences of the first processing result are decomposed into each word vector, all the keywords are also converted into the word vector format, and the first processing result includes all the keywords by the method based on the neural network. You may decide whether or not. The method for determining whether or not the first processing result includes all keywords is not limited to this, and using another appropriate method, whether or not the first processing result includes all keywords is determined. You may decide, but keep in mind that we are not limited here.
ステップS103では、例えば、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続ける。 In step S103, for example, when the first processing result does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and the all keywords. Then, until the combination of the first processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum, the deletion process is performed. Continue.
例えば、オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。例えば、オリジナルテキストの文Aが1つのキーワードを含み、文Bが3つのキーワードを含む場合、オリジナルテキストの文Bと全てのキーワードとの関連度がオリジナルテキストの文Aと全てのキーワードとの関連度よりも高いと考えられてもよい。 For example, the degree of relevance between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text. For example, when sentence A of the original text contains one keyword and sentence B contains three keywords, the degree of association between sentence B of the original text and all keywords is the relationship between sentence A of the original text and all keywords. It may be considered higher than the degree.
以下、図2~3を参照しながら、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法について説明する。 Hereinafter, a method of deleting a sentence in the original text according to the embodiment of the present disclosure will be described with reference to FIGS. 2 to 3.
図2は、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法200のフローチャートを示す。例えば、図2に示すように、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除するステップは、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップ(S201)と、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップ(S202)と、を含んでもよい。
FIG. 2 shows a flowchart of the
例えば、関連度に基づいて、オリジナルテキストをソートする場合、そのままオリジナルテキストの文をソートするため、文法の問題を考慮しなくてもよい。 For example, when sorting the original text based on the degree of relevance, the sentences of the original text are sorted as they are, so it is not necessary to consider grammatical problems.
図3は、本開示の実施例に係る、オリジナルテキスト中の文を削除する方法300の別のフローチャートを示す。例えば、図3に示すように、関連度の昇順に従って、前記オリジナルテキスト中の各文を削除するステップは、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップ(S301)と、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップ(S302)と、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップ(S303)と、を含んでもよい。
FIG. 3 shows another flowchart of the
例えば、受信したキーワード集合が{m,n,p,q}であり、受信した第1の処理結果がG(Gは、1つ又は複数の文を含んでもよい)であり、オリジナルテキストの各文(A、B、C、D、E、F)と、前記全てのキーワードとの関連度の昇順に従ってソートされたオリジナルテキストがBDFACEであると仮定する場合、図3に基づくテキスト処理方法は、文Bが削除された後に、Gと削除処理後のオリジナルテキストの文DFACEとの組み合わせGDFACEが全てのキーワード{m,n,p,q}を含むか否かを判断するステップと、GDFACEが全てのキーワード{m,n,p,q}を含む場合、文Bの削除操作を決定し(すなわち、オリジナルテキストから文Bを削除する)、第1の処理結果Gと削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワード{m,n,p,q}を含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、ステップS301に従って、オリジナルテキストの次の文Dの処理を続行し、前記組み合わせを最終的な処理結果とするステップと、を含んでもよい。一方、GDFACEが全てのキーワード{m,n,p,q}を含むわけではない場合、文Bの削減操作を取り消し、オリジナルテキストの文Bを残し、第1の処理結果Gと削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワード{m,n,p,q}を含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、ステップS301に従って、オリジナルテキストの次の文Dの処理を続行し、前記組み合わせを最終的な処理結果とするステップを含んでもよい。 For example, the received keyword set is {m, n, p, q}, the received first processing result is G (G may include one or more sentences), and each of the original texts. Assuming that the original text sorted according to the ascending order of relevance of the sentence (A, B, C, D, E, F) and all the keywords is BDFACE, the text processing method according to FIG. After the sentence B is deleted, the combination of G and the original text sentence DFACE after the deletion process, the step of determining whether GDFACE contains all the keywords {m, n, p, q}, and GDFACE all When the keyword {m, n, p, q} is included, the deletion operation of the sentence B is determined (that is, the sentence B is deleted from the original text), the first processing result G and the original text after the deletion processing are performed. Following the original text according to step S301, until the combination with the sentence in the text contains all the keywords {m, n, p, q} and the number of sentences in the original text after the deletion process is minimized. It may include a step of continuing the processing of the sentence D of the above and making the combination the final processing result. On the other hand, when GDFACE does not include all the keywords {m, n, p, q}, the reduction operation of sentence B is canceled, the sentence B of the original text is left, and the first processing result G and the deletion processing are performed. The original according to step S301 until the combination with the sentence in the original text includes all the keywords {m, n, p, q} and the number of sentences in the original text after the deletion process is minimized. It may include a step of continuing the processing of the next sentence D of the text and making the combination the final processing result.
代替的には、前記オリジナルテキスト中の第1の文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップをさらに含んでもよい。該処理では、まず、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除し、次に、オリジナルテキストに残された、1つ又は複数のキーワードを含む文に対して、ステップS301~S303の処理を行うことで、処理の複雑度を低減させることができる。 Alternatively, whether the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords after the first sentence in the original text is deleted. Before determining whether or not, a step of deleting a sentence containing none of the keywords in the original text may be further included in ascending order of relevance. In the process, first, the sentences containing none of the keywords in the original text are deleted, and then the sentences containing one or more keywords left in the original text are subjected to steps S301 to S303. The complexity of the process can be reduced by performing the process of.
図4は、本開示の実施例のテキスト処理方法の構成図400を示す。図4に示すように、本開示のテキスト処理方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード及び第1の処理結果を受信するステップ(S401)と、第1の処理結果が全てのキーワードを含むか否かを判断するステップ(S402)と、前記第1の処理結果が全てのキーワードを含む場合、第1の処理結果を最終的な処理結果とするステップ(S403)と、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップ(S404)と、を主に含む。そして、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する(S405)。前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで(S408)、S404~S405のステップに従って、オリジナルテキストの次の文の処理を続行し(S406)、前記組み合わせを最終的な処理結果とする(S409)。一方、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで(S408)、S404~S405のステップに従って、オリジナルテキストの次の文の処理を続行し(S407)、前記組み合わせを最終的な処理結果とする(S409)。 FIG. 4 shows a block diagram 400 of a text processing method according to an embodiment of the present disclosure. As shown in FIG. 4, the text processing method of the present disclosure includes an original text, a step (S401) of receiving one or a plurality of keywords included in the original text, and a first processing result, and a first processing result. A step (S402) for determining whether or not all the keywords are included, and a step (S403) for the first processing result as the final processing result when the first processing result includes all the keywords. If the first processing result does not include all the keywords, each sentence of the original text is sorted in ascending order of the degree of relevance based on the relevance of each sentence of the original text and all the keywords. Then, based on the sort, the step (S404) of deleting each sentence in the original text is mainly included. Then, after the first sentence of each sentence in the original text is deleted, whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. Judgment (S405). When the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the deletion operation is determined, and the first processing result and the sentence in the original text after the deletion processing are determined. Until the combination with the sentence includes all the keywords and the number of sentences in the original text after the deletion process is the minimum (S408), the process of the next sentence of the original text is performed according to the steps S404 to S405. Continue (S406) and use the combination as the final processing result (S409). On the other hand, if the combination of the first processing result and the sentence in the original text after the deletion process does not include all the keywords, the deletion operation is canceled, the first sentence is left, and the first sentence is left. S404 to S405 until the combination of the processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum (S408). According to the steps, the processing of the next sentence of the original text is continued (S407), and the combination is used as the final processing result (S409).
以下、図5を参照しながら、本開示の実施例に係るテキスト処理方法の例について説明する。図5に示すように、先ずオリジナルテキスト50、複数のキーワード52及び第1の処理結果を受信する(例えば、従来のテキスト生成モデルなどを用いて、オリジナルテキスト50から要約51を生成する)。図5から分かるように、モデルで生成された要約51が全てのキーワードを含まない(キーワードの「クーベルタン」がない)場合、本開示の方法によって、最終的な処理結果として、全てのキーワード52及びモデルで生成された要約51を含む新規の要約53を取得することができる。以上からわかるように、モデルで生成された要約51を参照として、「減少」する考えに基づいて、オリジナルテキスト50中の文を徐々に削除し、削除処理後のオリジナルテキスト中の文(例えば、図5における「古代オリンピックが終止になってからの1500年後に、フランス人のクーベルタンは、19世紀末に現代オリンピックを主催することを提案した。」)と、モデルで生成された要約51とを組み合わせて、最終的な処理結果(図5における処理済みの要約53)とすることで、最終的な処理結果が全てのキーワードを含み、最終的な処理結果の各文が重複せず、モデルで生成された要約51及びオリジナルテキストのその他の文の組み合わせと比べて、含まれる文の数が最少になる。なお、本開示の上記方法は、キーワードの数及び文の間の文法の問題を考慮する必要がなくなるので、計算複雑度を低減させる。
Hereinafter, an example of the text processing method according to the embodiment of the present disclosure will be described with reference to FIG. As shown in FIG. 5, first, the
本開示は、「減少」という考えに基づいて、要約とオリジナルテキスト全体とを組み合わせ、そして、数が最少である、全てのキーワードを含む文の集合を生成するまで、要約を参照してオリジナルテキスト中の文を削除することにより、計算複雑度を低減させる。 The present disclosure combines the abstract with the entire original text, based on the idea of "decrease", and refers to the original text with reference to the abstract until it produces a minimal set of sentences containing all the keywords. By deleting the sentences inside, the calculation complexity is reduced.
以上、図面を参照して、本開示の実施例に係るテキスト処理方法について説明する。以下、本開示の実施例に係るテキスト処理装置について説明する。 The text processing method according to the embodiment of the present disclosure will be described above with reference to the drawings. Hereinafter, the text processing apparatus according to the embodiment of the present disclosure will be described.
図6は、本開示の実施例に係るテキスト処理装置を示す機能ブロック図である。図6に示すように、本開示の実施例に係るテキスト処理装置1000は、受信ユニット1010と、判断ユニット1020と、削除ユニット1030と、を含む。上記各モジュールは、それぞれ、以上に図1~図5を参照しながら説明された本開示の実施例に係るテキスト処理方法の各ステップを実行することができる。当業者は、これらのユニットモジュールが単独でハードウェア、単独でソフトウェア又はそれらの組み合わせにより、様々な形態にて実現されてもよく、本開示は、これらのいずれかに限られない。例えば、中央処理装置(CPU)、テキストプロセッサ(GPU)、テンソルプロセッサ(TPU)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はデータ処理能力及び/又は命令実行能力を有する他の形態の処理ユニット及び対応するコンピュータの命令によって、これらのユニットを実行してもよい。
FIG. 6 is a functional block diagram showing a text processing device according to an embodiment of the present disclosure. As shown in FIG. 6, the
例えば、受信ユニット1010は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するために用いられる。
For example, the receiving
例えば、第1の処理結果は、前記オリジナルテキストを簡略化することで得られた1つ又は複数の文である。1つの例としては、第1の処理結果は、テキスト要約であってもよい。例えば、第1の処理結果は、例えばニューラルネットワークに基づくテキスト生成モデルによって取得されるものであってもよい。第1の処理結果を取得する方法は、任意の適切な方法であってもよいが、ここで限定しない。 For example, the first processing result is one or more sentences obtained by simplifying the original text. As an example, the first processing result may be a text summary. For example, the first processing result may be obtained by, for example, a text generation model based on a neural network. The method for acquiring the first processing result may be any appropriate method, but is not limited thereto.
例えば、判断ユニット1020は、前記第1の処理結果が全てのキーワードを含むか否かを判断するために用いられる。
For example, the
例えば、判断ユニット1020は、1つ又は複数のキーワードの各々に対して、第1の処理結果の全ての文をトラバーサルすることで、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。例えば、ニューラルネットワークに基づく方法によって、第1の処理結果が全てのキーワードを含むか否かを判断してもよい。上記判断ユニット1020が、第1の処理結果が全てのキーワードを含むか否かを判断する方法は、これに限られない。判断ユニット1020は、その他の適切な方法を用いて、第1の処理結果が全てのキーワードを含むか否かを判断してもよいが、ここで限定しない。
For example, the
例えば、削除ユニット1030は、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするために用いられる。
For example, the
例えば、前記第1の処理結果が全てのキーワードを含むわけではない場合、削除ユニット1030は、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けてもよい。
For example, if the first processing result does not include all the keywords, the
例えば、オリジナルテキストの各文と前記全てのキーワードとの関連度は、前記オリジナルテキストの各文に含まれる前記1つ又は複数のキーワードの数に基づいて判断されるものである。 For example, the degree of relevance between each sentence of the original text and all the keywords is determined based on the number of the one or more keywords included in each sentence of the original text.
例えば、削除ユニット1030は、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートし、前記ソートに基づいて、前記オリジナルテキスト中の各文を削除してもよい。
For example, the
例えば、削除ユニット1030は、前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行してもよい。
For example, in the
代替的には、削除ユニット1030は、前記オリジナルテキスト中の1つの文が削除された後であって、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断する前に、関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除してもよい。該処理では、削除ユニット1030は、まず、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除し、次に、オリジナルテキストに残された、1つ又は複数のキーワードを含む文に対して上記処理を行うことで、処理の複雑度を低減させることができる。
Alternatively, in the
以下、図7を参照しながら、本開示の実施例に係るテキスト処理機器1100について説明する。図7は、本開示の実施例に係るテキスト処理機器の模式図である。本実施例のテキスト処理機器の機能は、以上に図1を参照しながら説明された方法の詳細と同様であるため、ここでは、便宜上、同じ内容についての詳細な説明が省略される。
Hereinafter, the
本開示のテキスト処理機器は、プロセッサ1102と、コンピュータ読み取り可能な命令が記憶される記憶装置1101と、を備え、前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、テキスト処理方法を実行する。前記方法は、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む。
The text processing apparatus of the present disclosure includes a
各実施例でのテキスト処理装置1000及びテキスト処理機器1100の技術的効果については、本開示の実施例に係るテキスト処理方法の技術的効果を参照することができ、ここで、繰り返し説明しない。
Regarding the technical effects of the
テキスト処理装置1000及びテキスト処理機器1100は、様々な適切な電子機器に適用される。
The
図8は、本開示の実施例に係るコンピュータ読み取り可能な記憶媒体1200の模式図である。
FIG. 8 is a schematic diagram of a computer-
図8に示すように、本開示は、コンピュータ読み取り可能な命令1201が記憶されるコンピュータ読み取り可能な記憶媒体1200をさらに備え、該コンピュータ読み取り可能な命令がコンピュータによって実行されると、オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、コンピュータテキスト処理方法を実行する。
As shown in FIG. 8, the present disclosure further comprises a computer-
<ハードウェア構造>
なお、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構造部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は、特に限定されない。即ち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置によって実現されてもよく、物理的及び/又は論理的に分離された2つ以上の装置を、直接及び/又は間接的に(例えば、有線及び/又は無線)接続することにより、上記複数の装置によって実現されてもよい。
<Hardware structure>
The block diagram used in the description of the above embodiment shows a block of functional units. These functional blocks (structural parts) are realized by any combination of hardware and / or software. Further, the means for realizing each functional block is not particularly limited. That is, each functional block may be realized by one physically and / or logically coupled device, and two or more physically and / or logically separated devices are directly and / or indirectly separated. It may be realized by the above-mentioned plurality of devices by connecting (for example, wired and / or wirelessly).
例えば、本開示の一実施の形態における電子機器は、本開示のテキスト処理方法の処理を実行するコンピュータとして機能してもよい。図9は、本開示の一実施の形態に係る電子機器のハードウェア構造の一例の図である。上記の電子機器10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成してもよい。
For example, the electronic device in one embodiment of the present disclosure may function as a computer that performs the processing of the text processing method of the present disclosure. FIG. 9 is a diagram of an example of the hardware structure of the electronic device according to the embodiment of the present disclosure. The
なお、以下の説明において、「装置」という文言は、回路、デバイス、ユニットなどに置き替えることができる。電子機器10のハードウェア構造は、図に示されている各装置を1つ又は複数含んでもよいし、又は一部の装置を含まなくてもよい。
In the following description, the word "device" can be replaced with a circuit, device, unit, or the like. The hardware structure of the
例えば、図には1つのプロセッサ1001のみが示されているが、複数のプロセッサが設けられてもよい。さらに、1つのプロセッサによって処理を実行してもよく、1つ以上のプロセッサによって同時に、順次に、又は他の方法によって処理を実行してもよい。なお、プロセッサ1001は、1つ以上のチップによってインストールされてもよい。
For example, although the figure shows only one
電子機器10の各機能は、例えば、所定のソフトウェア(プログラム)をプロセッサ1001、メモリ1002などのハードウェア上に読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み取り及び/又は書き込みを制御することで実現されている。
For each function of the
プロセッサ1001は、例えば、オペレーティングシステムを動作させて、コンピュータ全体を制御する。プロセッサ1001は、周辺機器とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU、Central Processing Unit)で構成されてもよい。
なお、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータなどをストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、それらに従って様々な処理を実行する。プログラムとしては、上記実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、電子機器10の制御ユニット401は、メモリ1002に格納され、プロセッサ1001によって動作する制御プログラムにより実現されてもよく、他の機能ブロックについても同様に実現されてもよい。
The
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、読み取り専用メモリ(ROM、Read Only Memory)、プログラム可能な読み取り専用メモリ(EPROM、Erasable Programmable ROM)、電気的プログラム可能な読み取り専用メモリ(EEPROM、Electrically EPROM)、ランダムアクセスメモリ(RAM、Random Access Memory)、及び他の適切な記憶媒体の少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の1つの実施の形態に係る無線通信方法を実装するための実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを記憶することができる。
The
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、フレキシブルディスク(flexible disk)、フロッピー(登録商標)ディスク(floppy disk)、光磁気ディスク(例えば、コンパクトディスク(CD-ROM(Compact Disc ROM)など、デジタルユニバーサルディスク、ブルーレイ(Blu-ray(登録商標))ディスク、リムーバブルディスク、ハードドライブ、スマートカード、フラッシュメモリデバイス(例えば、カード、スティック(stick)、キードライバー(key driver))、磁気ストリップ、データベース、サーバ、及びその他の適切な記憶媒体の少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。
The
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送信受信機器)であり、例えば、ネットワーク装置、ネットワークコントローラ、ネットワークカード、通信モジュールなどとも呼ばれる。
The
入力装置1005は、外部からの入力を受け取る入力機器(例えば、キーボード、マウス、マイク、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を行う出力機器(例えば、ディスプレイ、スピーカ、発光ダイオード(LED、Light Emitting Diode)ランプなど)である。なお、入力装置1005と出力装置1006とは、一体構造(例えば、タッチパネル)であってもよい。
The
なお、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007を介して接続される。バス1007は、単一のバスから構成されてもよく、装置間の異なるバスから構成されてもよい。
Each device such as the
なお、電子機器10は、マイクロプロセッサ、デジタルシグナルプロセッサ(DSP、Digital Signal Processor)、特定用途向け集積回路(ASIC、Application Specific Integrated Circuit)、プログラマブルロジックデバイス(PLD、Programmable Logic Device)、及びフィールドプログラマブルゲートアレイ(FPGA、Field Programmable Gate Array)などのハードウェアを備えてもよく、該ハードウェアを介して各機能ブロックの一部又はすべてを実現することができる。例えば、プロセッサ1001は、これらのハードウェアのうちの少なくとも1つによってインストールされてもよい。
The
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、コマンド、コマンドセット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能なファイル、実行スレッド、ステップ、機能などを意味するよう広く解釈されるべきである。 Software, whether called software, firmware, middleware, microcode, hardware description language, or other names, commands, command sets, codes, code segments, program codes, programs, subprograms, software modules. , Applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, steps, features, etc. should be broadly interpreted.
なお、ソフトウェア、コマンド、情報などが、伝送媒体を介して送信又は受信されてもよい。例えば、有線技術(同軸ケーブル、光ケーブル、ツイストペア、デジタル加入者線(DSL、Digital Subscriber Line)など)及び/又は無線技術(赤外線、マイクロ波など)を使用して、ウェブサイト、サーバ、又はその他のリモートソースからソフトウェアを送信する場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれている。 Note that software, commands, information, and the like may be transmitted or received via a transmission medium. For example, using wired technology (coaxial cable, optical cable, twisted pair, digital subscriber line (DSL, Digital Subscriber Line), etc.) and / or wireless technology (infrared, microwave, etc.), website, server, or other. When transmitting software from a remote source, these wired and / or wireless technologies are included within the definition of transmission medium.
本明細書で説明された各形態/実施の形態は、単独又は組み合わせて使用されてもよく、実行中に切り替えて使用されてもよい。なお、本明細書で説明した各方式/実施の形態の処理ステップ、シーケンス、フローチャートなどは、矛盾のない限り、順序を入れ替えてもよい。例えば、本明細書で説明された方法に関して、様々なステップ単位は、例示的な順序で与えられたが、与えられた特定の順序に限定されない。 Each of the embodiments / embodiments described herein may be used alone or in combination, or may be switched and used during execution. The order of the processing steps, sequences, flowcharts, etc. of each method / embodiment described in the present specification may be changed as long as there is no contradiction. For example, with respect to the methods described herein, the various step units are given in an exemplary order, but are not limited to the particular order given.
本明細書に用いられた「に基づいて」とは、他の段落に明確に記載されていない限り、「のみに基づいて」という意味ではない。つまり、「に基づいて」という表現は、「のみに基づいて」と「少なくともに基づいて」の両方を意味する。 As used herein, "based on" does not mean "based on" unless expressly stated in another paragraph. That is, the expression "based on" means both "based on only" and "based on at least."
本明細書で使用されている「第1」、「第2」などの名称を使用したユニットへのいかなる参照は、これらのユニットの量又は順序を全般的に限定するものではない。本明細書では、これらの名称を2つ以上のユニットを区別するための便利な方法として使用することができる。したがって、第1ユニットおよび第2ユニットへの参照は、2つのユニットのみそこで採用され得ること、又は第1ユニットが第2ユニットに先行しなければならないことを意味しない。 Any reference to units using names such as "first", "second" as used herein does not generally limit the quantity or order of these units. As used herein, these names can be used as a convenient way to distinguish between two or more units. Therefore, references to the first and second units do not mean that only two units can be employed there, or that the first unit must precede the second unit.
「含む(including)」、「含有(comprising)」、及びそれらの変形を、本明細書あるいは特許請求の範囲で使用されている限り、これらの用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲で使用される「又は(or)」という用語は、排他的論理和ではない。 As long as "inclusion", "comprising", and variations thereof are used herein or within the scope of the claims, these terms are as comprehensive as the term "comprising". Is intended to be. Moreover, the term "or" as used herein or in the claims is not an exclusive OR.
当業者は、本出願の様々な態様が、新規で有用なプロセス、機械、製品、又は物質の組み合わせ、又はそれらの任意の組み合わせ、又はそれらに対して新規で有用な改良を含む、いくつかの特許可能なカテゴリ又は状況を通じて説明及び記載できることを理解できる。それに従って、本出願の様々な態様は、ハードウェアによって完全に実行されてもよく、ソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)によって完全に実行されてもよく、又はハードウェアとソフトウェアの組み合わせによって実行されてもよい。上記のハードウェア又はソフトウェアはいずれも、「データブロック」、「モジュール」、「エンジン」、「ユニット」、「アセンブリ」、又は「システム」と呼ばれてもよい。なお、本出願の様々な態様は、1つ又は複数のコンピュータ読み取り可能な媒体に設けられるコンピュータ製品として具現化されてもよく、該製品がコンピュータ読み取り可能なプログラムコードを含む。 Those skilled in the art will appreciate that various aspects of this application include new and useful combinations of processes, machines, products, or substances, or any combinations thereof, or new and useful improvements to them. Understand what can be explained and described through patentable categories or situations. Accordingly, various aspects of the present application may be performed entirely by hardware, may be performed entirely by software (including firmware, resident software, microcode, etc.), or may be performed entirely by hardware and software. It may be executed by a combination. Any of the above hardware or software may be referred to as a "data block", "module", "engine", "unit", "assembly", or "system". It should be noted that various aspects of the present application may be embodied as computer products provided on one or more computer-readable media, the product including computer-readable program code.
本出願は、特定の単語を使用して、本出願の実施例を説明した。例えば、「1つの実施例」、「一実施例」、及び/又は「いくつかの実施例」は、本出願の少なくとも1つの実施例に関連する特定の特徴、構造、又は特性を意味する。したがって、本明細書において異なる位置で2回以上言及される「一実施例」又は「1つの実施例」又は「一代替実施例」は、必ずしも同じ実施例を指すとは限らないことを強調し、留意されるべきである。なお、本出願の1つ又は複数の実施例におけるいくつかの特徴、構造、又は特性は、適切に組み合わせられてもよい。 This application uses specific words to describe examples of this application. For example, "one example," "one example," and / or "several examples" mean a particular feature, structure, or characteristic associated with at least one example of the present application. Therefore, it is emphasized that "one example" or "one example" or "one alternative example" referred to in different positions more than once in the present specification does not necessarily refer to the same embodiment. , Should be noted. It should be noted that some features, structures, or properties in one or more embodiments of the present application may be combined appropriately.
特に定義されない限り、ここで使用されるすべての用語(技術用語及び科学用語を含む)は、本開示の当業者によって一般に理解されるのと同じ意味を有する。なお、通常の辞書で定義されているような用語は、関連する技術の文脈での意味と一致する意味を持つものとして解釈されるべきであり、ここで明示的に述べられていない限り、理想的又は極端に形式化された意味で解釈されるべきではないことも理解されたい。 Unless otherwise defined, all terms used herein (including technical and scientific terms) have the same meaning as commonly understood by those skilled in the art of the present disclosure. It should be noted that terms such as those defined in ordinary dictionaries should be construed as having a meaning consistent with the meaning in the context of the relevant technology and are ideal unless explicitly stated here. It should also be understood that it should not be interpreted in a targeted or extremely formalized sense.
以上、本開示について詳細に説明したが、本開示が本明細書で説明した実施の形態に限定されないことは、当業者には明らかである。本開示は、特許請求の範囲の説明によって決定される本開示の趣旨及び範囲から逸脱することなく、修正及び変更された形態として実装することができる。したがって、本明細書における記載は、例示説明を目的とするものであり、本開示に対して何ら限定的な意味を有するものではない。 Although the present disclosure has been described in detail above, it will be apparent to those skilled in the art that the present disclosure is not limited to the embodiments described herein. The present disclosure may be implemented as amended and modified forms without departing from the gist and scope of the present disclosure as determined by the description of the scope of the patent claim. Therefore, the description herein is for purposes of illustration only and has no limiting meaning to the present disclosure.
Claims (9)
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法。 It ’s a text processing method.
A step of receiving the original text, one or more keywords contained in the original text, and a first processing result obtained by simplifying the original text.
The step of determining whether or not the first processing result includes all the keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The deletion process is continued until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is minimized, and the combination is used as the final processing result. , Text processing method.
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキスト中の文を削除し、前記第1の処理結果と削除処理後のオリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後のオリジナルテキスト中の文の数が最少になるまで、前記削除処理を続けるステップを含む、請求項1に記載のテキスト処理方法。 When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The step of continuing the deletion process until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is the minimum is
When the first processing result does not include all the keywords, the sentences in the original text are deleted based on the degree of association between each sentence of the original text and the all keywords, and the first sentence is deleted. The deletion process is continued until the combination of the processing result and the sentence in the original text after the deletion process includes all the keywords and the number of sentences in the original text after the deletion process is the minimum. The text processing method according to claim 1.
前記オリジナルテキストの各文と前記全てのキーワードとの関連度に基づいて、前記オリジナルテキストの各文を関連度の昇順に従ってソートするステップと、
前記ソートに基づいて、前記オリジナルテキスト中の各文を削除するステップと、を含む、請求項2に記載のテキスト処理方法。 The step of deleting a sentence in the original text based on the degree of association between each sentence in the original text and all the keywords is
A step of sorting each sentence of the original text in ascending order of the degree of association based on the degree of association between each sentence of the original text and all the keywords.
The text processing method according to claim 2, comprising a step of deleting each sentence in the original text based on the sort.
前記オリジナルテキスト中の各文の第1の文が削除された後に、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含む場合、削除操作を決定し、オリジナルテキストの次の文の処理を続行するステップと、
前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含むわけではない場合、削除操作を取り消し、前記第1の文を残し、オリジナルテキストの次の文の処理を続行するステップと、を含む、請求項3に記載のテキスト処理方法。 The step of deleting each sentence in the original text in ascending order of relevance is
After the first sentence of each sentence in the original text is deleted, it is determined whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. Steps and
When the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords, the step of determining the deletion operation and continuing the processing of the next sentence of the original text, and
If the combination of the first processing result and the sentence in the original text after the deletion process does not include all the keywords, the deletion operation is canceled, the first sentence is left, and the sentence following the original text is left. 3. The text processing method according to claim 3, comprising the step of continuing the processing of.
関連度の昇順に従って、前記オリジナルテキスト中の、キーワードのいずれも含まない文を削除するステップをさらに含む、請求項4に記載のテキスト処理方法。 After one sentence in the original text is deleted, but before it is determined whether or not the combination of the first processing result and the sentence in the original text after the deletion processing includes all the keywords. To,
The text processing method according to claim 4, further comprising a step of deleting a sentence containing none of the keywords in the original text in ascending order of relevance.
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するための受信ユニットと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するための判断ユニットと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするための削除ユニットと、を備える、テキスト処理装置。 It ’s a text processing device.
An original text, one or more keywords contained in the original text, and a receiving unit for receiving the first processing result obtained by simplifying the original text.
A determination unit for determining whether or not the first processing result includes all keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. With a deletion unit for continuing the deletion process until the combination of the above includes all keywords and the number of sentences in the original text after the deletion process is the minimum, and making the combination the final processing result. , A text processing device.
コンピュータ読み取り可能な命令が記憶される記憶装置と、を備えるテキスト処理機器であって、
前記コンピュータ読み取り可能な命令が前記プロセッサにより実行されると、
オリジナルテキスト、前記オリジナルテキストに含まれる1つ又は複数のキーワード、及び前記オリジナルテキストを簡略化することで得られた第1の処理結果を受信するステップと、
前記第1の処理結果が全てのキーワードを含むか否かを判断するステップと、
前記第1の処理結果が全てのキーワードを含むわけではない場合、前記オリジナルテキスト中の1つ又は複数の文を削除し、前記第1の処理結果と削除処理後の前記オリジナルテキスト中の文との組み合わせが全てのキーワードを含み、且つ、削除処理後の前記オリジナルテキスト中の文の数が最少になるまで、前記削除処理を続け、前記組み合わせを最終的な処理結果とするステップと、を含む、テキスト処理方法を実行する、テキスト処理機器。 With the processor
A text processing device comprising a storage device for storing computer-readable instructions.
When the computer-readable instruction is executed by the processor,
A step of receiving the original text, one or more keywords contained in the original text, and a first processing result obtained by simplifying the original text.
The step of determining whether or not the first processing result includes all the keywords, and
When the first processing result does not include all the keywords, one or more sentences in the original text are deleted, and the first processing result and the sentence in the original text after the deletion processing are deleted. The deletion process is continued until the combination of the above includes all the keywords and the number of sentences in the original text after the deletion process is minimized, and the combination is used as the final processing result. A text processing device that performs a text processing method.
前記プログラムによって、コンピュータに請求項1~請求項6のいずれか一項に記載のテキスト処理方法を実行させる、コンピュータ読み取り可能な記憶媒体。 A computer-readable storage medium for storing computer-readable programs.
A computer-readable storage medium that causes a computer to execute the text processing method according to any one of claims 1 to 6 by the program.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011030736.5A CN114281927A (en) | 2020-09-27 | 2020-09-27 | Text processing method, device, equipment and computer readable storage medium |
CN202011030736.5 | 2020-09-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022055353A true JP2022055353A (en) | 2022-04-07 |
Family
ID=80867620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021156713A Pending JP2022055353A (en) | 2020-09-27 | 2021-09-27 | Text processing method, device, apparatus, and computer-readable storage medium |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2022055353A (en) |
CN (1) | CN114281927A (en) |
-
2020
- 2020-09-27 CN CN202011030736.5A patent/CN114281927A/en active Pending
-
2021
- 2021-09-27 JP JP2021156713A patent/JP2022055353A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114281927A (en) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7953692B2 (en) | Predicting candidates using information sources | |
JP5802292B2 (en) | Shared language model | |
US20200285808A1 (en) | Synonym dictionary creation apparatus, non-transitory computer-readable recording medium storing synonym dictionary creation program, and synonym dictionary creation method | |
US20140019462A1 (en) | Contextual query adjustments using natural action input | |
EP3055789A1 (en) | Smart selection of text spans | |
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
AU2021200962A1 (en) | Model-based semantic text searching | |
KR20080024156A (en) | Back-off mechanism for search | |
AU2017277831B2 (en) | Query optimizer for CPU utilization and code refactoring | |
CN102955773B (en) | For identifying the method and system of chemical name in Chinese document | |
US9552411B2 (en) | Trending suggestions | |
JP2010520532A (en) | Input stroke count | |
JP6976448B2 (en) | Machine translation controller | |
JP2022055353A (en) | Text processing method, device, apparatus, and computer-readable storage medium | |
JP7247593B2 (en) | Generation device, software robot system, generation method and generation program | |
JP6895580B2 (en) | Dialogue system | |
CN114663718A (en) | Training apparatus, method, device, and computer-readable medium | |
US10546061B2 (en) | Predicting terms by using model chunks | |
JP2022002090A (en) | Information processing method, apparatus, device, and computer readable storage media | |
JP2020123134A (en) | Extraction method, information processing device, and extraction program | |
US12073299B2 (en) | Systems and methods for using contrastive pre-training to generate text and code embeddings | |
JP6976447B2 (en) | Machine translation controller | |
US20230409830A1 (en) | Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method | |
US20230015324A1 (en) | Retrieval device | |
CN111597323B (en) | Key field filtering method and device, storage medium and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230928 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240911 |