JP7078244B2 - Data processing equipment, data processing methods, data processing systems and programs - Google Patents
Data processing equipment, data processing methods, data processing systems and programs Download PDFInfo
- Publication number
- JP7078244B2 JP7078244B2 JP2017044433A JP2017044433A JP7078244B2 JP 7078244 B2 JP7078244 B2 JP 7078244B2 JP 2017044433 A JP2017044433 A JP 2017044433A JP 2017044433 A JP2017044433 A JP 2017044433A JP 7078244 B2 JP7078244 B2 JP 7078244B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- event
- posted
- data processing
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、インターネット上から収集した投稿文データを処理するデータ処理装置、データ処理方法、データ処理システム及びプログラムに関する。より詳しくは、内容毎に分類された投稿文章群にタイトルや見出しなどを付与する技術に関する。 The present invention relates to a data processing device, a data processing method, a data processing system and a program for processing posted text data collected from the Internet. More specifically, the present invention relates to a technique for giving a title, a headline, etc. to a group of posted sentences classified by content.
インターネット上には、日々、数多くの文章が投稿されている。特に、ソーシャル・ネットワーキング・サービス(social networking service:SNS)は、手軽にコメントや写真を投稿できるため、事件、事故及び災害などに関する情報がリアルタイムで投稿されることがあり、投稿写真や投稿動画などがニュースに利用され始めている。 Many sentences are posted on the Internet every day. In particular, the social networking service (SNS) allows you to easily post comments and photos, so information about incidents, accidents, disasters, etc. may be posted in real time, such as posted photos and posted videos. Is beginning to be used in the news.
一方、インターネット上に投稿された多種多様な文章の中から、ニュースソースとなり得る情報を抽出するには、投稿文を1つずつ読んで内容を確認する必要があり、手間と時間がかかる。また、事件、事故及び災害などのニュースには速報性が求められるが、インターネット上の投稿からこれらの事象の発生を知るには、投稿文を常にモニターしている必要があり、効率が悪い。 On the other hand, in order to extract information that can be a news source from a wide variety of sentences posted on the Internet, it is necessary to read the posted sentences one by one and check the contents, which takes time and effort. In addition, news such as incidents, accidents, and disasters are required to be breaking news, but in order to know the occurrence of these events from posts on the Internet, it is necessary to constantly monitor the posted text, which is inefficient.
そこで、近時、インターネット上から特定の投稿文や記事を収集し、利用者に提供するサービスが注目されている。しかしながら、このようなサービスを利用する場合でも、個々の文章について「目的とする事象に関するものか」や「信頼できるものか」を確認する作業は必要となる。このような他者が作成した文章の内容を短時間で効率的に判断する方法としては、それらに付されているタイトルや見出しを利用する方法があり、従来、投稿記事や新聞記事に自動でタイトルを付与する技術が提案されている(特許文献1,2参照)。
Therefore, recently, a service that collects specific posts and articles from the Internet and provides them to users is attracting attention. However, even when using such a service, it is necessary to confirm whether each sentence is "related to the target event" or "reliable". As a method of efficiently judging the contents of sentences created by others in a short time, there is a method of using the titles and headlines attached to them, and conventionally, it is automatically added to posted articles and newspaper articles. A technique for giving a title has been proposed (see
例えば、特許文献1に記載の方法では、入力記事と同一カテゴリーの過去の記事を用いて、タイトル用の特徴語としての固有表現を抽出し、入力記事のタイトルを作成している。また、特許文献2に記載の方法では、新聞記事中からタイトル文作成のための候補文を抽出し、その候補文からデータベース用のタイトル文に必要な主語や述語を抽出し、タイトル文を作成している。
For example, in the method described in
しかしながら、前述した従来のタイトル作成方法は、いずれも1つの記事に対してその内容を表すタイトルを付与する技術であり、投稿者が異なる複数の投稿文からなる投稿文章群にタイトルや見出しを付与したり、その内容を示す要約や記事などの短文を作成したりするものではない。このため、特許文献1,2に記載の技術を適用しても、インターネットを介して収集した任意の事象に関する投稿文章群について、その内容を示す短文を作成することはできない。
However, all of the above-mentioned conventional title creation methods are techniques for giving a title indicating the content to one article, and give a title or a headline to a posted sentence group consisting of a plurality of posted sentences by different contributors. It does not create short sentences such as summaries or articles that show the contents. Therefore, even if the techniques described in
そこで、本発明は、インターネットを介して収集した事件・事故・災害などに関する投稿文章群について、その内容を示す短文を作成可能なデータ処理装置、データ処理方法、データ処理システム及びプログラムを提供することを目的とする。 Therefore, the present invention provides a data processing device, a data processing method, a data processing system, and a program capable of creating a short sentence showing the contents of a group of posted sentences related to an incident, an accident, a disaster, etc. collected via the Internet. With the goal.
本発明に係るデータ処理装置は、インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析部と、前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成部と、事象を特定可能な名詞が記憶され、前記短文作成部において事象を特定できる単語を選定する際に利用される事象単語データベースと、を有し、前記事象は、事件、事故又は災害であり、前記短文作成部における前記事象を特定できる単語の選定では、出現頻度が高順位の単語を優先して選定する。
前記文章解析部には、前記投稿文毎に品詞分解する品詞分解部と、品詞分解された単語から名詞を抽出する名詞抽出部と、抽出された名詞を出現頻度で順位付けする名詞カウント部とが設けられていてもよく、その場合、前記短文作成部は例えば出現頻度が高順位の名詞を用いて前記短文を作成することができる。
前記短文作成部は、例えば、前記投稿文章群に含まれる名詞の中から前記投稿文章群の各投稿文に共通する事象を特定できる名詞を選定する単語選定部と、前記単語選定部で選定された名詞を用いて短文を作成する短文生成部とを備え、前記単語選定部は、前記事象単語データベースに蓄積された名詞のデータと前記文章解析部で作成された名詞の順位データとを比較し、出現頻度が高順位の名詞を優先して選定する構成とすることもできる。
その場合、前記事象を特定できる名詞は、地域を表す名詞及び/又は事象を表す名詞とすることができる。
一方、本発明のデータ処理装置は、更に、前記単語の出現頻度の順位データを記憶する順位データ記憶部を有していてもよい。
前記短文は、例えばタイトルや見出しである。
The data processing device according to the present invention analyzes each posted sentence of a posted sentence group composed of two or more posted sentences related to the same event collected via the Internet, and appears a word included in the posted sentence group. The sentence analysis unit that ranks by frequency selects words that can identify the event that is common to each posted sentence from the words included in the posted sentence group, and the content of the event is used using the selected words. It has a short sentence creation unit that automatically creates a short sentence representing the above, and an event word database that stores a nomenclature that can identify an event and is used when selecting a word that can identify an event in the short sentence creation unit. The described event is an incident, an accident, or a disaster, and in the selection of words that can identify the event in the short sentence preparation unit, the word having the highest frequency of appearance is preferentially selected.
The sentence analysis unit includes a part-speech decomposition unit that decomposes part of speech for each posted sentence, a noun extraction unit that extracts nouns from words that have been decomposed into part speech, and a noun counting unit that ranks the extracted nouns according to their appearance frequency. In that case, the short sentence creation unit can create the short sentence by using, for example, a noun having a high frequency of appearance.
The short sentence creation unit is selected by, for example, a word selection unit that selects a noun that can identify an event common to each posted sentence of the posted sentence group from among the nouns included in the posted sentence group, and the word selection unit. It is equipped with a short sentence generation unit that creates short sentences using the nouns, and the word selection unit compares the noun data stored in the event word database with the noun ranking data created by the sentence analysis unit. However, it is also possible to preferentially select nouns with a high frequency of appearance.
In that case, the noun that can identify the event can be a noun representing a region and / or a noun representing an event.
On the other hand, the data processing apparatus of the present invention may further have a ranking data storage unit for storing ranking data of the frequency of appearance of the word.
The short sentence is, for example, a title or a headline.
本発明に係るデータ処理方法は、1又は複数のデータ処理装置を用いて短文を自動作成する方法であって、前記データ処理装置により、インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析工程と、前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を作成する短文作成工程と、を行い、前記事象は、事件、事故又は災害であり、前記短文作成工程における前記事象を特定できる単語の選定では、事象を特定可能な名詞が記憶された事象単語データベースを利用し、出現頻度が高順位の単語を優先して選定する。
本発明のデータ処理方法では、前記文章解析工程で、前記投稿文毎に品詞分解する工程と、品詞分解された単語から名詞を抽出する工程と、抽出された名詞を出現頻度で順位付けする工程とを実施し、前記短文作成工程で出現頻度が高順位の名詞を用いて前記短文を作成してもよい。
また、前記短文作成工程では、前記投稿文章群に含まれる名詞の中から前記投稿文章群の各投稿文に共通する事象を特定できる名詞を選定する工程と、選定された名詞を用いて短文を作成する工程を行うことができ、その場合、例えば前記名詞を選定する工程では、前記事象単語データベースに蓄積された名詞のデータと前記文章解析工程で作成された名詞の順位データとを比較し、出現頻度が高順位の名詞を優先して選定することができる。
The data processing method according to the present invention is a method of automatically creating a short sentence using one or a plurality of data processing devices, and two or more posts relating to the same event collected via the Internet by the data processing device. A sentence analysis process that analyzes each posted sentence of the posted sentence group composed of sentences and ranks the words included in the posted sentence group according to the frequency of appearance, and each posted sentence from the words included in the posted sentence group. A short sentence creation step of selecting a word that can identify the event common to the above and creating a short sentence expressing the content of the event using the selected word is performed, and the event is an incident, an accident, or a disaster. In the selection of words that can identify the event in the short sentence creation process , a word database in which nomenclature that can specify the event is stored is used, and words with a high frequency of appearance are preferentially selected.
In the data processing method of the present invention, in the sentence analysis step, a step of part-speech decomposition for each posted sentence, a step of extracting nouns from the part-speech-decomposed words, and a step of ranking the extracted nouns by appearance frequency. And may be carried out, and the short sentence may be created by using a noun having a high frequency of appearance in the short sentence creation step.
Further, in the short sentence creation step, a step of selecting a noun that can identify an event common to each posted sentence of the posted sentence group from the nouns included in the posted sentence group, and a short sentence using the selected noun. In that case, for example, in the step of selecting the noun, the noun data stored in the event word database is compared with the noun ranking data created in the sentence analysis step. , Nouns with high frequency of appearance can be selected with priority.
本発明に係るデータ処理システムは、インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析装置と、前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成装置と、事象を特定可能な名詞が記憶され、前記短文作成装置において事象を特定できる単語を選定する際に利用される事象単語データベースと、を有し、前記事象は、事件、事故又は災害であり、前記短文作成装置における前記事象を特定できる単語の選定では、出現頻度が高順位の単語を優先して選定する。
本発明のデータ処理システムは、更に、インターネットを介して収集した複数の投稿文を事象毎に分類し、同一の事象に関する2以上の投稿文で構成されるテキストデータの集合体である投稿文章群を作成する投稿文分類装置を備えていてもよく、その場合、前記文章解析装置は、前記投稿文分類装置で作成された投稿文章群を解析する。
また、本発明のデータ処理システムは、前記短文作成装置で作成された短文のデータを、前記投稿文章群のデータに付加して外部配信する配信装置を有していてもよい。
The data processing system according to the present invention analyzes each posted sentence of a posted sentence group composed of two or more posted sentences related to the same event collected via the Internet, and appears a word included in the posted sentence group. From the sentence analysis device that ranks by frequency and the words included in the posted sentence group, the words that can identify the event common to each posted sentence are selected, and the content of the event is used using the selected words. It has a short sentence creation device that automatically creates a short sentence representing the above, and an event word database that stores a nomenclature that can identify an event and is used when selecting a word that can identify an event in the short sentence creation device. The described event is an incident, an accident, or a disaster, and in the selection of a word capable of identifying the event in the short sentence creating device, a word having a high frequency of appearance is preferentially selected.
The data processing system of the present invention further classifies a plurality of posted sentences collected via the Internet for each event, and is a group of posted sentences which is a collection of text data composed of two or more posted sentences related to the same event. The posted sentence classification device may be provided, and in that case, the sentence analysis device analyzes the posted sentence group created by the posted sentence classification device.
Further, the data processing system of the present invention may have a distribution device that adds the short sentence data created by the short sentence creation device to the data of the posted sentence group and distributes it externally.
本発明に係るプログラムは、コンピュータに、インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析機能と、前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成機能とを実行させ、前記事象は、事件、事故又は災害であり、前記短文作成機能における前記事象を特定できる単語の選定では、事象を特定可能な名詞が記憶された事象単語データベースを利用し、出現頻度が高順位の単語を優先して選定するものである。 The program according to the present invention analyzes each posted sentence of a posted sentence group composed of two or more posted sentences related to the same event collected via the Internet on a computer, and obtains words included in the posted sentence group. A sentence analysis function that ranks by frequency of appearance and a word that can identify the event common to each posted sentence are selected from the words included in the posted sentence group, and the selected word is used to identify the event. The short sentence creation function that automatically creates a short sentence representing the content is executed, and the event is an incident, an accident, or a disaster, and the event can be specified by selecting a word that can identify the event in the short sentence creation function. Using the event word database in which nomenclature is stored, words with the highest frequency of appearance are prioritized and selected.
本発明において、「投稿文章群」とは、インターネットを介して収集された任意の事象に関する2以上の投稿文で構成されるテキストデータの集合体を指す。
また、本発明における「事象」には、事件、事故、災害など報道などで取り上げられる様々な出来事が含まれ、その発生場所は国内に限られず、海外も含む。
In the present invention, the "posted text group" refers to a collection of text data composed of two or more posted texts relating to an arbitrary event collected via the Internet.
In addition, the "event" in the present invention includes various events such as incidents, accidents, and disasters that are taken up in the media, and the place of occurrence is not limited to Japan but also includes overseas.
本発明によれば、インターネットを介して収集した投稿文章群について、特定の単語の出現頻度を解析し、上位の単語を抽出して短文を生成しているため、その投稿文章群に関係する事象の内容を示す短文を自動作成することが可能となる。 According to the present invention, in a posted sentence group collected via the Internet, the frequency of appearance of a specific word is analyzed, and a high-ranking word is extracted to generate a short sentence. Therefore, an event related to the posted sentence group. It is possible to automatically create a short sentence showing the contents of.
以下、本発明を実施するための形態について、添付の図面を参照して、詳細に説明する。なお、本発明は、以下に説明する実施形態に限定されるものではない。 Hereinafter, embodiments for carrying out the present invention will be described in detail with reference to the accompanying drawings. The present invention is not limited to the embodiments described below.
(第1の実施形態)
先ず、本発明の第1の実施形態に係るデータ処理装置について説明する。図1は本実施形態のデータ処理装置の構成例を示す概念図である。図1に示すように、本実施形態のデータ処理装置1は、文章解析部2と短文作成部3とを有し、タイトルや見出しなどの投稿文章群に関する短文を自動作成するものである。このデータ処理装置1には、必要に応じて順位データ記憶部4や事象単語データベース5などを設けることもできる。
(First Embodiment)
First, the data processing apparatus according to the first embodiment of the present invention will be described. FIG. 1 is a conceptual diagram showing a configuration example of the data processing device of the present embodiment. As shown in FIG. 1, the
[文章解析部2]
文章解析部2は、入力された投稿文章群の各投稿文を解析し、その中に含まれる単語を出現頻度で順位付けするものである。ここで、文章解析部2で解析される「投稿文章群」は、インターネットを介して収集された任意の事象に関する2以上の投稿文で構成されるテキストデータの集合体である。また、「投稿文」は、インターネットを介して収集可能なものであればよく、例えばSNS、ブログ、電子掲示板(Bulletin Board System:BBS)などに投稿された情報などが挙げられる。なお、解析する投稿文の長さは、特に限定されるものではなく、長くても、短くてもよい。
[Sentence analysis unit 2]
The
文章解析部2の構成は、特に限定されるものではないが、例えば、投稿文毎に品詞分解を行う品詞分解部21と、品詞分解された単語から名詞を抽出する名詞抽出部22と、抽出された名詞を出現頻度で順位付けする名詞カウント部23とを備える構成とすることができる。なお、文章解析部2は、名詞以外の品詞も抽出して順位付けする構成、或いは、品詞分解された全ての単語を順位付けし、順位付けられた単語の中から名詞のみを抽出する構成とすることもできる。
The structure of the
文章解析部2における各投稿文の解析方法、即ち、品詞分解部21、名詞抽出部22及び名詞カウント部23などでの処理方法は、特に限定されるものではないが、例えばテキストマイニング、ワードカウント及び全文検索技術などの手法を適用することができる。
The analysis method of each posted sentence in the
[短文作成部3]
短文作成部3は、文章解析部2で作成された投稿文章群に含まれる単語(又は名詞)の順位データに基づいて、投稿文章群に関する短文を作成する。短文作成部3で作成される短文としては、タイトルや見出しなどのように事象を特定するものの他に、事象の具体的内容を簡単にまとめた要約や記事などが挙げられる。
[Short sentence creation section 3]
The short
短文作成部3において、短文を自動作成する方法は、特に限定されるものではないが、例えば、高順位の単語(又は名詞)から地域や事象などの特定の内容を表す名詞を選定し、選定された名詞を用いて文章を作成する方法を用いることができる。その場合、短文作成部3には、単語(又は名詞)の順位データに基づき投稿文章群の各投稿文に含まれる名詞の中から特定の内容を表す名詞を選定する単語選定部31と、単語選定部31で選定された名詞を用いて短文を作成する短文生成部32とを設ければよい。
The method of automatically creating a short sentence in the short
[順位データ記憶部4]
順位データ記憶4は、文章解析部2で生成された単語(又は名詞)の順位データを記憶するものであり、必要に応じて設けられる。本実施形態のデータ処理装置1では、文章解析部2での解析処理の後、引き続き短文作成部3で短文作成を行ってもよいが、文章解析部2で解析した結果を順位データ記憶部4に記憶しておき、短文作成部3は順位データ記憶部4に記憶されたデータを利用して、短文を作成することもできる。
[Ranking data storage unit 4]
The rank data storage 4 stores the rank data of the word (or noun) generated by the
[事象単語データベース5]
事象単語データベース5には、事象を特定可能な名詞が記録されているものであり、必要に応じて設けられる。ここで、事象を特定可能な名詞としては、例えば、事件、事故、災害などの事象を表す際に多用される名詞や、その事象特有の名詞、地域を表す名詞などが挙げられる。この事象単語データベース5に記録されている名詞は、短文作成部3の単語選定部31などにおいて、地域や事象などの特定の内容を表す名詞を選定する際に利用される。
[Event word database 5]
Nouns that can identify an event are recorded in the event word database 5, and are provided as necessary. Here, examples of nouns that can identify an event include nouns that are frequently used to represent events such as incidents, accidents, and disasters, nouns specific to the event, and nouns that represent regions. The nouns recorded in the event word database 5 are used when a noun representing a specific content such as a region or an event is selected in the
[動作]
次に、本実施形態のデータ処理装置1の動作、即ち、データ処理装置1を用いて投稿文章群に関する短文を自動作成する方法について説明する。本実施形態のデータ処理方法は、1又は複数のデータ処理装置1により、文章解析工程と、短文作成工程とを行い、投稿文章群に関する短文を自動作成する。図2は本実施形態のデータ処理方法を示すフローチャートであり、図3は順位データの例である。
[motion]
Next, the operation of the
[文章解析工程]
文章解析工程は、主にデータ処理装置1の記事解析部2で行われ、インターネットを介して収集した任意の事象に関する投稿文章群の各投稿文を解析し、投稿文に含まれる単語を出現頻度で順位付けする。単語の抽出及び順位付けの方法は、特に限定されるものではないが、例えば、図2に示すように、投稿文毎に品詞分解した後(ステップS1)、品詞分解された単語から名詞を抽出し(ステップS2)、抽出された名詞を出現頻度で順位付けする(ステップS3)ことにより、実施することができる。
[Sentence analysis process]
The sentence analysis process is mainly performed by the
ステップS1の品詞分解について、投稿文章群の各投稿文のテキストデータは、既存の日本語形態素解析システムなどを用いることで、単語毎に分割することができる。また、ステップS2の名詞抽出については、機械学習や日本語形態素解析システムを用いることで、品詞分解された単語の中から名詞のみを抽出することができる。そして、ステップS3の順位付けは、図3に示すように、抽出された名詞などについてその語が使われた数(出現頻度)を数え、その数が多いものから順位を付ければよい。 Regarding the part-speech decomposition in step S1, the text data of each posted sentence in the posted sentence group can be divided into words by using an existing Japanese morphological analysis system or the like. As for the noun extraction in step S2, only the noun can be extracted from the part-speech-decomposed words by using machine learning or a Japanese morphological analysis system. Then, in the ranking of step S3, as shown in FIG. 3, the number of used words (appearance frequency) of the extracted nouns and the like may be counted, and the ranking may be made from the one with the largest number.
なお、文章解析工程では、名詞の抽出と併せて、又は、名詞の抽出の後で副詞などの名詞以外の品詞を抽出し、順位付けしてもよい。また、文章解析工程では、品詞分解された全ての単語を順位付けし、順位付けられた単語の中から名詞のみを抽出することもできる。 In the sentence analysis step, part of speech other than nouns such as adverbs may be extracted and ranked in combination with noun extraction or after noun extraction. Further, in the sentence analysis step, all the words decomposed by part of speech can be ranked, and only nouns can be extracted from the ranked words.
[短文作成工程]
短文作成工程は、主に情報処理装置1の短文作成部3で行われ、名詞の順位データに基づいて投稿文章群に関する短文を作成する。その方法は特に限定されるものではないが、例えば、図2に示すように、投稿文章群の各投稿文に含まれる名詞の中から、特定の内容を表す名詞を選定し(ステップS4)、必要に応じて場所や事象を特定する副詞などの他の品詞も選定し、選定された名詞などを用いて文章を作成する(ステップS5)ことにより実施することができる。
[Short sentence creation process]
The short sentence creation process is mainly performed by the short
具体的には、ステップS4の名詞選定工程では、例えば「地域」や「事象」などのように投稿文章群の各投稿文に共通する事象を特定できる名詞を、高順位のものを優先して選定する。名詞の選定は、例えば、予め事象単語データベース5に蓄積しておいた「事象を特定できる名詞」のデータと、名詞の順位データとを比較することで行うことができる。 Specifically, in the noun selection step of step S4, nouns that can identify an event common to each posted sentence in the posted sentence group, such as "region" and "event", are given priority to those having a high rank. Select. The noun can be selected, for example, by comparing the data of the "noun that can specify the event" stored in the event word database 5 in advance with the ranking data of the noun.
その結果、例えば、図3に示す順位データの場合、「地域」として”福岡”が選定され、「事象」として”事故”が選定される。このとき、「事象」を表す名詞の第一候補としては、最も順位の高い”事故”が選定されるが、第二候補として次に順位の高い”地震”を選定することもできる。 As a result, for example, in the case of the ranking data shown in FIG. 3, "Fukuoka" is selected as the "region" and "accident" is selected as the "event". At this time, the highest-ranked "accident" is selected as the first candidate for the noun representing "event", but the next highest-ranked "earthquake" can also be selected as the second candidate.
また、前述した名詞の選定と併せて、又は、名詞の選定の後に、事象を特定できる他の品詞を選定してもよい。具体的には、場所や事象を特定する際に重要な副詞(例えば「で」など)を、名詞と同様の方法で選定する。これにより、より自然な短文を作成することが可能となる。 Further, another part of speech that can identify the event may be selected in combination with the above-mentioned selection of the noun or after the selection of the noun. Specifically, an adverb (for example, "de") that is important when specifying a place or an event is selected by the same method as a noun. This makes it possible to create more natural short sentences.
そして、ステップS5の短文生成工程において、名詞選定工程で選定された名詞やその他の品詞を用いて、投稿文章群に関する短文を作成する。例えば、図3に示す順位データの場合は、『福岡県で事故発生の可能性あり』、『福岡県で地震発生の可能性あり』若しくは『福岡県で事故又は地震発生の可能性あり』という短文が作成される。このように、本実施形態のデータ処理装置1では、最も順位の高い名詞だけでなく、高順位にある複数の名詞を選定し、選定された複数の名詞を組み合わせて1つの短文を作成したり、名詞毎に複数の短文を作成したりすることもできる。
Then, in the short sentence generation step of step S5, a short sentence related to the posted sentence group is created using the noun and other part of speech selected in the noun selection step. For example, in the case of the ranking data shown in FIG. 3, "there is a possibility of an accident in Fukuoka Prefecture", "there is a possibility of an earthquake in Fukuoka Prefecture", or "there is a possibility of an accident or an earthquake in Fukuoka Prefecture". A short sentence is created. As described above, in the
なお、前述した文章解析工程と短文作成工程は、連続して行ってもよいが、それぞれ独立して実施することもできる。例えば、文章解析工程は、全ての投稿文又は投稿文章群に対して実施し、短文作成工程は必要なものだけ選択的に実施することも可能である。また、前述した短文作成工程では、品詞分解された単語の中から特定の名詞を選択的に抽出しているが、本発明はこれに限定されるものではなく、投稿文章群表す単語であれば名詞以外の単語でもよく、名詞以外の単語を選定して短文を作成してもよい。 The sentence analysis step and the short sentence creation step described above may be performed continuously, but they may also be performed independently. For example, it is possible to carry out the sentence analysis process for all the posted sentences or the posted sentence group, and selectively carry out only the necessary short sentence creation steps. Further, in the above-mentioned short sentence creation step, a specific noun is selectively extracted from the words decomposed into part speech, but the present invention is not limited to this, and any word representing a posted sentence group is used. Words other than nouns may be used, and words other than nouns may be selected to create a short sentence.
また、前述した各工程により作成された投稿文章群に関する短文(テキストデータ)は、例えば、該当する投稿文章群データに付与され(ステップS6)、ユーザーに向けて配信される。又は、投稿文章群データとは別に、作成された短文のみを、ウェブサイトやSNSに掲載して、特定のユーザー向けの情報として提供することもできる。 Further, a short sentence (text data) related to the posted sentence group created by each of the above-mentioned steps is attached to the corresponding posted sentence group data (step S6) and distributed to the user, for example. Alternatively, apart from the posted text group data, only the created short text can be posted on the website or SNS and provided as information for a specific user.
[プログラム]
前述した各工程は、データ処理装置の各機能を実現するためのコンピュータプログラムを作成し、1又は2以上のコンピュータに実装することにより実施することができる。即ち、本実施形態のデータ処理方法は、インターネットを介して収集した任意の事象に関する投稿文章群の各投稿文を解析し、投稿文に含まれる単語を出現頻度で順位付けする文章解析機能と、単語の順位データに基づいて投稿文章群に関する短文を自動作成する短文作成部とをコンピュータに実行させるプログラムにより実行することができる。
[program]
Each of the above-mentioned steps can be carried out by creating a computer program for realizing each function of the data processing device and implementing it on one or more computers. That is, the data processing method of the present embodiment has a sentence analysis function that analyzes each posted sentence of a posted sentence group related to an arbitrary event collected via the Internet and ranks the words included in the posted sentence according to the frequency of appearance. It can be executed by a program that causes a computer to execute a short sentence creation unit that automatically creates short sentences related to a group of posted sentences based on word ranking data.
このコンピュータプログラムでは、文章解析機能を、投稿文毎に品詞分解する機能と、品詞分解された単語の中から名詞を抽出する機能と、抽出された名詞を出現頻度で順位付けする機能により実現してもよい。また、短文作成機能を、単語(又は名詞)の順位データに基づき、投稿文章群の各投稿文に含まれる名詞の中から特定の内容を表す名詞を選定する機能と、単語選定部で選定された名詞を用いて短文を作成する文章生成機能とで実現し、名詞を選定する機能では、順位が上位の名詞を優先して選定するようにしてもよい。 In this computer program, the sentence analysis function is realized by the function of part-speech decomposition for each posted sentence, the function of extracting nouns from the part-speech-decomposed words, and the function of ranking the extracted nouns by the frequency of appearance. You may. In addition, the short sentence creation function is selected by the word selection unit and the function to select a noun that represents a specific content from the nouns included in each posted sentence of the posted sentence group based on the ranking data of the word (or noun). It is realized by a sentence generation function that creates a short sentence using a noun, and in the function of selecting a noun, the noun with the higher rank may be preferentially selected.
なお、前述した各機能は、一のプログラムに搭載されている必要はなく、機能毎にプログラムを作成し、それらを連動させることにより実行してもよい。その場合、各プログラムを2台以上のコンピュータ又は装置に分割して実装し、動作させることもできる。 It should be noted that each of the above-mentioned functions does not have to be installed in one program, and may be executed by creating a program for each function and linking them. In that case, each program may be divided into two or more computers or devices, mounted, and operated.
投稿文章群に含まれる投稿文は、特定の事象に関する情報以外にも様々な情報を含んでいるため、投稿文毎にテキストデータを解析し、タイトルや見出しなどの事象を特定する短文を作成すると、事象とは関係ない情報により特定精度が低下する。これに対して、本実施形態のデータ処理装置では、投稿文章群を構成する各投稿文に含まれる単語を出現頻度で順位付けし、高順位の単語を用いて文章を作成しているため、各投稿文が話題としている事象の内容や発生地域などを、精度よく特定することができる。 Since the posted text included in the posted text group contains various information other than the information related to a specific event, if you analyze the text data for each posted text and create a short sentence that identifies the event such as the title or heading. , Specific accuracy is reduced by information unrelated to the event. On the other hand, in the data processing device of the present embodiment, the words included in each posted sentence constituting the posted sentence group are ranked according to the frequency of appearance, and the sentence is created using the high-ranked words. It is possible to accurately identify the content and area of occurrence of the event that each posted text is talking about.
その結果、本実施形態のデータ処理装置やデータやデータ処理方法を用いることで、インターネットを介して収集した事件・事故・災害などに関する投稿文章群について、その内容を適確に表した見出し、タイトル、要約及び紹介文などの短文を、自動作成することが可能となる。また、本実施形態のデータ処理装置により、SNS上にある投稿してから時間が経過していない最新の投稿文章群を解析すると、各地で発生している事象をいち早く発見し、その内容を必要な人に、迅速にかつわかりやすい状態で提供することができる。 As a result, by using the data processing device, data, and data processing method of this embodiment, the headings and titles that accurately represent the contents of the posted texts related to incidents, accidents, disasters, etc. collected via the Internet. , Summary and introductory texts can be automatically created. In addition, when the data processing device of the present embodiment analyzes the latest posted texts on the SNS that have not been posted for a long time, it is necessary to quickly discover the events occurring in each place and their contents. It can be provided to people in a quick and easy-to-understand manner.
なお、本実施形態のデータ処理装置は、インターネットを介して収集された任意の事象に関する2以上の投稿文で構成される「投稿文章群」の処理に特に有効であるが、当然ながら1つの投稿文への適用も可能である。その場合、1つの文章のみ解析を行い、単語を順位付けし、その順位付けデータに基づいて、その投稿文に関する短文を作成する。 The data processing device of the present embodiment is particularly effective for processing a "posted sentence group" composed of two or more posted sentences related to an arbitrary event collected via the Internet, but of course, one post. It can also be applied to sentences. In that case, only one sentence is analyzed, words are ranked, and a short sentence related to the posted sentence is created based on the ranking data.
(第2の実施形態)
次に、本発明の第2の実施形態に係るデータ処理システムについて説明する。図4は本実施形態のデータ処理システムの構成を示す概念図である。前述した第1の実施形態では、投稿文章群の各投稿文の解析と短文作成を同じ装置で行っているが、本発明はこれに限定するものではなく、これらの工程をそれぞれ別の装置で実施してもよい。即ち、本実施形態のデータ処理システム10は、図4に示すように、文章解析装置20と、短文作成装置30とを有する。
(Second embodiment)
Next, the data processing system according to the second embodiment of the present invention will be described. FIG. 4 is a conceptual diagram showing the configuration of the data processing system of the present embodiment. In the first embodiment described above, the analysis of each posted sentence of the posted sentence group and the creation of a short sentence are performed by the same device, but the present invention is not limited to this, and these steps are performed by different devices. It may be carried out. That is, as shown in FIG. 4, the
[文章解析装置20]
文章解析装置20は、インターネット5を介して収集した任意の事象に関する投稿文章群の各投稿文6a,6bを解析し、投稿文6a,6bに含まれる単語を出現頻度で順位付けするものである。なお、文章解析装置20における上記以外の構成及び動作は、前述した第1の実施形態の文章解析部2と同様である。
[Sentence analysis device 20]
The
[短文作成装置30]
短文作成装置30は、文章解析装置20で作成した単語の順位データに基づいて投稿短文作成群に関する短文を作成するものである。なお、文章解析装置30における上記以外の構成及び動作は、前述した第1の実施形態の短文作成部3と同様である。
[Short sentence creation device 30]
The short
[投稿文分類装置7]
本実施形態のデータ処理システム10には、インターネットを介して収集した複数の投稿文を分類し、同一事象毎に投稿文章群を作成する投稿文分類装置7が設けられていてもよい。その場合、文章解析装置20には、この投稿文分類装置7で作成された投稿文章群が入力され、解析処理が行われる。
[Posted sentence classification device 7]
The
本実施形態のデータ処理システム10では、投稿文分類装置7で分類した投稿文章群のうち、必要なものだけ文章解析装置20に出力し、解析処理を行ってもよい。例えば、投稿文分類装置7で事象の発生をモニターし、変化が現れたタイミングでその前後のデータを収集し、分類して文章解析装置20に送ることも可能である。これにより、効率良くデータ解析を行うことができる。
In the
また、本実施形態のデータ処理システム10には、短文作成装置30で作成された文章のデータを、投稿文章群のデータに付加し、外部配信する配信装置が設けられていてもよい。なお、図4に示すデータ処理システム10では、投稿文分類装置7が配信装置も兼ねており、短文作成装置30で作成された文章は、投稿文分類装置7で投稿文章群のデータに付加され、インターネット5を介して外部に配信される。
Further, the
本実施形態のデータ処理システムは、同一事象に関する投稿文を集め、そのテキストデータに含まれる単語を出現頻度で順位付けし、高順位の単語を用いて文章を作成しているため、その事象を適確に表す短文を自動作成することができる。なお、本実施形態における上記以外の構成及び効果は、前述した第1の実施形態と同様である。 The data processing system of the present embodiment collects posts related to the same event, ranks the words contained in the text data according to the frequency of appearance, and creates a sentence using the high-ranked words. It is possible to automatically create a short sentence that accurately represents it. The configurations and effects other than the above in this embodiment are the same as those in the first embodiment described above.
1 データ処理装置
2 文章解析部
3 短文作成部
4 順位データ記憶部
5 事象単語データベース
6a、6b 投稿文
7 投稿文分類装置
8 インターネット
10 データ処理システム
20 文章解析装置
21 品詞分解部
22 名詞抽出部
23 名詞カウント部
30 短文作成装置
31 単語選定部
32 短文生成部
1
Claims (13)
前記投稿文章群に含まれる単語の中から各投稿文に共通する事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成部と、
事象を特定可能な名詞が記憶され、前記短文作成部において事象を特定できる単語を選定する際に利用される事象単語データベースと、
を有し、
前記事象は、事件、事故又は災害であり、
前記短文作成部における前記事象を特定できる単語の選定では、出現頻度が高順位の単語を優先して選定するデータ処理装置。 With a sentence analysis unit that analyzes each posted sentence of a posted sentence group consisting of two or more posted sentences related to the same event collected via the Internet, and ranks the words included in the posted sentence group by the frequency of appearance. ,
A short sentence creation unit that selects a word that can identify an event common to each posted sentence from the words included in the posted sentence group and automatically creates a short sentence that expresses the content of the event using the selected word.
An event word database in which nouns that can identify an event are stored and used when selecting a word that can identify an event in the short sentence creation unit.
Have,
The event is an incident, accident or disaster and
In the selection of words that can identify the event in the short sentence creation unit, a data processing device that preferentially selects words having a high frequency of appearance.
前記投稿文毎に品詞分解する品詞分解部と、
品詞分解された単語から名詞を抽出する名詞抽出部と、
抽出された名詞を出現頻度で順位付けする名詞カウント部と、
を備え、
前記短文作成部は出現頻度が高順位の名詞を用いて前記短文を作成する請求項1に記載のデータ処理装置。 The sentence analysis unit
The part-speech decomposition part that decomposes the part of speech for each post,
A noun extractor that extracts nouns from words that have been decomposed into parts of speech,
A noun count section that ranks the extracted nouns according to their frequency of appearance,
Equipped with
The data processing device according to claim 1, wherein the short sentence creating unit creates the short sentence using a noun having a high frequency of appearance.
前記投稿文章群に含まれる名詞の中から前記投稿文章群の各投稿文に共通する事象を特定できる名詞を選定する単語選定部と、
前記単語選定部で選定された名詞を用いて短文を作成する短文生成部と、
を備え、
前記単語選定部は、前記事象単語データベースに蓄積された名詞のデータと前記文章解析部で作成された名詞の順位データとを比較し、出現頻度が高順位の名詞を優先して選定する請求項1又は2に記載のデータ処理装置。 The short sentence making part
A word selection unit that selects nouns that can identify events common to each posted sentence in the posted sentence group from among the nouns included in the posted sentence group.
A short sentence generation unit that creates a short sentence using the nouns selected by the word selection unit, and
Equipped with
The word selection unit compares the noun data stored in the event word database with the noun ranking data created by the sentence analysis unit, and requests that the noun with the highest frequency of appearance be preferentially selected. Item 2. The data processing apparatus according to Item 1.
前記データ処理装置により、
インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析工程と、
前記投稿文章群に含まれる単語の中から各投稿文に共通する事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を作成する短文作成工程と、を行い、
前記事象は、事件、事故又は災害であり、
前記短文作成工程における前記事象を特定できる単語の選定では、事象を特定可能な名詞が記憶された事象単語データベースを利用し、出現頻度が高順位の単語を優先して選定するデータ処理方法。 A method of automatically creating a short sentence using one or more data processing devices.
With the data processing device
A sentence analysis process that analyzes each posted sentence of a posted sentence group consisting of two or more posted sentences related to the same event collected via the Internet, and ranks the words included in the posted sentence group by the frequency of appearance. ,
A short sentence creation process in which a word that can identify an event common to each posted sentence is selected from the words included in the posted sentence group and a short sentence expressing the content of the event is created using the selected word. Do,
The event is an incident, accident or disaster and
In the selection of a word that can specify the event in the short sentence creation step, a data processing method that preferentially selects a word having a high frequency of appearance by using an event word database in which a noun that can specify the event is stored .
前記投稿文毎に品詞分解する工程と、
品詞分解された単語から名詞を抽出する工程と、
抽出された名詞を出現頻度で順位付けする工程と、
を有し、
前記短文作成工程は出現頻度が高順位の名詞を用いて前記短文を作成する請求項7に記載のデータ処理方法。 The sentence analysis step is
The process of part-speech decomposition for each posted sentence and
The process of extracting nouns from words that have been decomposed into parts of speech,
The process of ranking the extracted nouns by frequency of appearance,
Have,
The data processing method according to claim 7, wherein the short sentence creation step uses a noun having a high frequency of appearance to create the short sentence.
前記投稿文章群に含まれる名詞の中から前記投稿文章群の各投稿文に共通する事象を特定できる名詞を選定する工程と、
選定された名詞を用いて短文を作成する工程と、
を有し、
前記名詞を選定する工程では、前記事象単語データベースに蓄積された名詞のデータと前記文章解析工程で作成された名詞の順位データとを比較し、出現頻度が高順位の名詞を優先して選定する請求項7又は8に記載のデータ処理方法。 The short sentence creation process is
The process of selecting a noun that can identify an event common to each posted sentence of the posted sentence group from the nouns included in the posted sentence group, and
The process of creating a short sentence using the selected nouns,
Have,
In the step of selecting the noun, the noun data accumulated in the event word database is compared with the noun rank data created in the sentence analysis step, and the noun with the highest frequency of appearance is preferentially selected. The data processing method according to claim 7 or 8.
前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成装置と、
事象を特定可能な名詞が記憶され、前記短文作成装置において事象を特定できる単語を選定する際に利用される事象単語データベースと、
を有し、
前記事象は、事件、事故又は災害であり、
前記短文作成装置における前記事象を特定できる単語の選定では、出現頻度が高順位の単語を優先して選定するデータ処理システム。 A sentence analysis device that analyzes each posted sentence of a posted sentence group consisting of two or more posted sentences related to the same event collected via the Internet, and ranks the words included in the posted sentence group by the frequency of appearance. ,
A short sentence creation device that selects a word that can identify the event common to each posted sentence from the words included in the posted sentence group, and automatically creates a short sentence that expresses the content of the event using the selected word. When,
An event word database in which nouns that can identify an event are stored and used when selecting a word that can identify an event in the short sentence creation device.
Have,
The event is an incident, accident or disaster and
A data processing system that preferentially selects words with a high frequency of appearance in the selection of words that can identify the event in the short sentence creation device.
前記文章解析装置は、前記投稿文分類装置で作成された投稿文章群を解析する請求項10に記載のデータ処理システム。 Equipped with a post text classification device that classifies multiple post texts collected via the Internet for each event and creates a post text group that is a collection of text data composed of two or more post texts related to the same event.
The data processing system according to claim 10, wherein the sentence analysis device analyzes a group of posted sentences created by the posted sentence classification device.
インターネットを介して収集された同一の事象に関する2以上の投稿文で構成される投稿文章群の各投稿文を解析し、前記投稿文章群に含まれる単語を出現頻度で順位付けする文章解析機能と、
前記投稿文章群に含まれる単語の中から各投稿文に共通する前記事象を特定できる単語を選定し、選定された単語を用いて前記事象の内容を表す短文を自動作成する短文作成機能と、を実行させ、
前記事象は、事件、事故又は災害であり、
前記短文作成機能における前記事象を特定できる単語の選定では、事象を特定可能な名詞が記憶された事象単語データベースを利用し、出現頻度が高順位の単語を優先して選定するプログラム。 On the computer
With a sentence analysis function that analyzes each posted sentence of a posted sentence group consisting of two or more posted sentences related to the same event collected via the Internet, and ranks the words included in the posted sentence group according to the frequency of appearance. ,
A short sentence creation function that selects a word that can identify the event common to each posted sentence from the words included in the posted sentence group, and automatically creates a short sentence that expresses the content of the event using the selected word. And execute,
The event is an incident, accident or disaster and
In the selection of words that can identify the event in the short sentence creation function, a program that preferentially selects words with a high frequency of appearance by using an event word database in which nouns that can identify the event are stored .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017044433A JP7078244B2 (en) | 2017-03-08 | 2017-03-08 | Data processing equipment, data processing methods, data processing systems and programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017044433A JP7078244B2 (en) | 2017-03-08 | 2017-03-08 | Data processing equipment, data processing methods, data processing systems and programs |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018147411A JP2018147411A (en) | 2018-09-20 |
JP2018147411A5 JP2018147411A5 (en) | 2020-02-06 |
JP7078244B2 true JP7078244B2 (en) | 2022-05-31 |
Family
ID=63592194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017044433A Active JP7078244B2 (en) | 2017-03-08 | 2017-03-08 | Data processing equipment, data processing methods, data processing systems and programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7078244B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7333931B2 (en) * | 2019-02-08 | 2023-08-28 | 憲一 坂 | Post analysis system, post analysis device and post analysis method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163277A (en) | 2000-11-28 | 2002-06-07 | Auto Network Gijutsu Kenkyusho:Kk | Document information supply system, information terminal unit and document information supply method |
JP2015045833A (en) | 2013-07-31 | 2015-03-12 | 日本電信電話株式会社 | Speech sentence generation device, and method and program for the same |
WO2016027364A1 (en) | 2014-08-22 | 2016-02-25 | 株式会社日立製作所 | Topic cluster selection device, and search method |
JP2016110213A (en) | 2014-12-02 | 2016-06-20 | シャープ株式会社 | Information processing device, information processing system, terminal device, information processing method, and information processing program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134066A (en) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | Sentence summarizing up device |
JP2005250648A (en) * | 2004-03-02 | 2005-09-15 | Fuji Xerox Co Ltd | Article summarizing device and news distributing device |
KR100810999B1 (en) * | 2006-06-30 | 2008-03-11 | 엔에이치엔(주) | On-line e mail service system, and service method thereof |
CN101296128A (en) * | 2007-04-24 | 2008-10-29 | 北京大学 | Method for monitoring abnormal state of internet information |
KR101196935B1 (en) * | 2010-07-05 | 2012-11-05 | 엔에이치엔(주) | Method and system for providing reprsentation words of real-time popular keyword |
JP2015103101A (en) * | 2013-11-26 | 2015-06-04 | 日本電信電話株式会社 | Text summarization device, method, and program |
-
2017
- 2017-03-08 JP JP2017044433A patent/JP7078244B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163277A (en) | 2000-11-28 | 2002-06-07 | Auto Network Gijutsu Kenkyusho:Kk | Document information supply system, information terminal unit and document information supply method |
JP2015045833A (en) | 2013-07-31 | 2015-03-12 | 日本電信電話株式会社 | Speech sentence generation device, and method and program for the same |
WO2016027364A1 (en) | 2014-08-22 | 2016-02-25 | 株式会社日立製作所 | Topic cluster selection device, and search method |
JP2016110213A (en) | 2014-12-02 | 2016-06-20 | シャープ株式会社 | Information processing device, information processing system, terminal device, information processing method, and information processing program |
Also Published As
Publication number | Publication date |
---|---|
JP2018147411A (en) | 2018-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145215B (en) | Network public opinion analysis method, device and storage medium | |
US10546005B2 (en) | Perspective data analysis and management | |
US9753916B2 (en) | Automatic generation of a speech by processing raw claims to a set of arguments | |
US20190121806A1 (en) | Managing a search | |
CN109145216A (en) | Network public-opinion monitoring method, device and storage medium | |
US20160239500A1 (en) | System and methods for extracting facts from unstructured text | |
US9436768B2 (en) | System and method for pushing and distributing promotion content | |
US20120330968A1 (en) | System and method for matching comment data to text data | |
US10366154B2 (en) | Information processing device, information processing method, and computer program product | |
US9965459B2 (en) | Providing contextual information associated with a source document using information from external reference documents | |
JP6301966B2 (en) | DATA ANALYSIS SYSTEM, DATA ANALYSIS METHOD, DATA ANALYSIS PROGRAM, AND RECORDING MEDIUM OF THE PROGRAM | |
US20200004792A1 (en) | Automated website data collection method | |
US20170270098A1 (en) | External resource identification | |
US9563666B2 (en) | Unsupervised detection and categorization of word clusters in text data | |
JP5952756B2 (en) | Prediction server, program and method for predicting future number of comments in prediction target content | |
US20160085843A1 (en) | Perspective data analysis and management | |
JP7078244B2 (en) | Data processing equipment, data processing methods, data processing systems and programs | |
Fekih et al. | Humset: Dataset of multilingual information extraction and classification for humanitarian crisis response | |
JP2009199341A (en) | Spam/event detection device, method and program | |
WO2016027364A1 (en) | Topic cluster selection device, and search method | |
JP6260678B2 (en) | Information processing apparatus, information processing method, and information processing program | |
Yin et al. | Research of integrated algorithm establishment of a spam detection system | |
JP2006293616A (en) | Document aggregating method, and device and program | |
JP7042720B2 (en) | Information processing equipment, information processing methods, and programs | |
Selvadurai | A natural language processing based web mining system for social media analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210514 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220202 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220202 |
|
C876 | Explanation why request for accelerated appeal examination is justified |
Free format text: JAPANESE INTERMEDIATE CODE: C876 Effective date: 20220202 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220215 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220216 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220311 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220315 |
|
C305 | Report on accelerated appeal examination |
Free format text: JAPANESE INTERMEDIATE CODE: C305 Effective date: 20220316 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220322 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20220329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220330 |
|
C302 | Record of communication |
Free format text: JAPANESE INTERMEDIATE CODE: C302 Effective date: 20220331 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220405 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20220412 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20220511 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20220511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7078244 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |