JP2023504961A - Typhoon incident information convergence method - Google Patents

Typhoon incident information convergence method Download PDF

Info

Publication number
JP2023504961A
JP2023504961A JP2022505249A JP2022505249A JP2023504961A JP 2023504961 A JP2023504961 A JP 2023504961A JP 2022505249 A JP2022505249 A JP 2022505249A JP 2022505249 A JP2022505249 A JP 2022505249A JP 2023504961 A JP2023504961 A JP 2023504961A
Authority
JP
Japan
Prior art keywords
information
typhoon
convergence
attribute
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022505249A
Other languages
Japanese (ja)
Inventor
雪英 張
安 懐
鵬 叶
Original Assignee
南京師範大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 南京師範大学 filed Critical 南京師範大学
Publication of JP2023504961A publication Critical patent/JP2023504961A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本発明に係る台風事件情報の収束方法は、ソーシャルメディアにおいて由来がばらばらである台風事件情報について選別、組織及び整合を行うことにより、台風事件についてその過程が進行する段階や態勢を探すことに規則化の情報基礎を提供する。【解決手段】本発明に係る台風事件情報収束方法は、ソーシャルメディアにおける台風事件と関連するメッセージ文書を集めて、台風事件情報を抽出しながら、構造化の情報タプルフォーマットに転換する第一ステップと、多特徴の類似度に基づいて対象情報を収束する第二ステップと、時空特徴に基づいて状態情報を収束する第三ステップと、状態の過程情報を収束し、対象情報を収束した結果から、時間と位置範囲の要求を満たす時空ノード情報を選別し、これらの時空ノードについてそれぞれ状態情報を収束しながら、複数の状態情報の収束結果をソートして、動的特徴が現れる過程情報の収束結果を形成する、第四ステップを主に含む。A method for converging typhoon incident information according to the present invention searches for a stage or a posture in which the process of typhoon incidents progresses by selecting, organizing, and matching typhoon incident information that has different origins in social media. In particular, it provides an information basis for regularization. A typhoon incident information convergence method according to the present invention includes a first step of collecting message documents related to typhoon incidents on social media, extracting typhoon incident information, and converting them into a structured information tuple format. , the second step of converging the target information based on the similarity of the multi-features, the third step of converging the state information based on the spatio-temporal features, the convergence of the state process information, and the result of converging the target information, Select the spatio-temporal node information that satisfies the time and position range requirements, converge the state information for each of these spatio-temporal nodes, sort the convergence results of multiple state information, and obtain the convergence result of the process information in which dynamic features appear. , mainly including the fourth step.

Description

本発明は、ビッグデータマイニングの分野に関し、特に、台風事件情報収束方法に関する。 The present invention relates to the field of big data mining, and in particular to a typhoon event information convergence method.

台風は、自然生態、社会経済、ひいては、人間の持続可能な発展に、非常に悪い破壊的影響を与えてしまうことから、台風事件が進行する過程についての関連情報をタイムリーで取得することは、災害のインシデントレスポンス用の重要な根拠や参照となっている。現在、ビッグデータによる環境では、ソーシャルメディア(social media)は、効率が高い更新の頻度、数多くの源からの広がりルート及び深い関与程度により、災害を管理する際に、大きな適用の見通しが現れると共に、段々と、台風事件情報を取得する新たな手段となる。しかしながら、ソーシャルメディアそのものは、文書が短いという特徴を有する以外、情報が非常に断片化し、表現のフォーマットがばらばらであり、情報の粒度が多様化するなどの特徴も有する。乱れ散るようなソーシャルメディア情報は、台風事件の進行する全貌を示すことが難しいのみならず、利用者が台風事件過程を効果的に予測することを妨げてしまう。 Since typhoons have a very negative and destructive impact on the natural ecology, socio-economy, and even on the sustainable development of humans, it is difficult to obtain relevant information on the process of typhoon events in a timely manner. , has become an important basis and reference for disaster incident response. Currently, in an environment driven by big data, social media has great prospects for application in managing disasters due to its efficient update frequency, spread routes from numerous sources and deep involvement. , gradually become a new means of acquiring typhoon incident information. However, social media itself has characteristics such as extremely fragmented information, various formats of expression, and diversified granularity of information, in addition to the fact that documents are short. The disorganized social media information not only makes it difficult to show the progress of the typhoon event, but also prevents users from effectively predicting the typhoon event process.

情報収束方法は、有効な情報資源を利用者が取得するニーズと利便性を満たすように、情報資源を効果的に表現することにより、情報構造の合理性を向上させると共にアクセス効率を最適化させる。災害事件向けの情報収束方式は、主に、統計による方法、主題モデルによる方法及び知識要素による方法が含まれる。(1)統計による方法は、単語頻度、TF-IDF、N-gram、相互情報量などの統計特徴を用いて、情報セルにおけるキーワードの重みを算出し、そのうち最も代表的なキーワードを選び、それに基づいて収束を行うものである。当該方法は、簡単で主観的に分かりやすいが、キーワードを選別する精度が高くなく、一般的に補助情報と共に二回目の選別が必要となる。(2)確率主題モデルは、各ドキュメントは全ての主題ワードに潜在的な分布が存在するとして、主題ワードの確率分布を用いて、情報セルにおける主題を表現するものである。しかしながら、当該方法の效果は、主題の数により定められており、現実におけるソーシャルメディアに、異なる主題が常に動的に変わっている。ソーシャルメディアにおける同一のメッセージには複数の主題による内容を含むことがあり、これにより、主題ワードを解釈する範囲にも大きな争いが存在する。(3)知識要素は、異なる概念間の倫理関係及び階級構造を定義するものであり、知識要素における良く見られる形態に、主体、語義のネットワークや関連データなどが存在する。知識要素による収束は、知識要素理論を基に、災害事件の構成を表現する概念モデルを構築することにより、モデルにおいて定義された語義の関係に基づいて、情報を再度ソートして構成し、情報の特徴及びその関連が表れるようにする。 The information convergence method improves the rationality of the information structure and optimizes the access efficiency by effectively expressing the information resources so as to meet the needs and convenience of users to acquire effective information resources. . Information convergence methods for disaster events mainly include statistical methods, thematic model methods and knowledge element methods. (1) The statistical method uses statistical features such as word frequency, TF-IDF, N-gram, and mutual information to calculate the weight of the keywords in the information cell, select the most representative keyword, and It converges based on The method is simple and subjectively understandable, but the accuracy of keyword screening is not high and generally requires a second screening with auxiliary information. (2) A probabilistic theme model expresses the subject in an information cell using the probability distribution of the subject words, assuming that each document has a potential distribution for all the subject words. However, the effectiveness of this method is determined by the number of subjects, and in real social media, different subjects are constantly changing dynamically. The same message on social media may contain content from multiple themes, and thus there is a great deal of contention about the scope of interpretation of the subject words. (3) Knowledge elements define ethical relationships and hierarchical structures between different concepts, and common forms of knowledge elements include subjects, semantic networks, and related data. Convergence by knowledge elements involves constructing a conceptual model that expresses the composition of disaster events based on the knowledge element theory, sorting and structuring information again based on the semantic relationships defined in the model, and structuring the information. characteristics and their relationships.

現在、統計と主題モデルによる方法は、災害事件情報収束に最もよく用いられる形態である。しかしながら、この二つの方法により収束する結果は、その情報の粒度が大きく、通常に、災害事件と関連する各種の情報を集めたものに過ぎない。一方、知識要素による収束方法は、災害分野における概念の体系に基づいて、原始の資源を分解して再構成し、一定の知識構造を有する深い収束結果を取得することができる。しかし、現在、台風事件知識のモデリングは、台風事件における各概念の階級構造と関連関係がよく注目されるが、台風事件の動的過程を記載して表現することがよく見落とされる。大量かつ類別が複雑であるソーシャルメディアの資源が散在する状況に鑑み、情報収束方法を作成し、事件の進行する過程に基づいて台風事件情報をソートして整合することが必要である。 Currently, statistical and thematic model methods are the most popular forms of disaster incident information convergence. However, the results converged by these two methods have a large granularity of information, and are usually nothing more than collections of various types of information related to disaster events. On the other hand, the convergence method by knowledge elements can decompose and reconstruct primitive resources based on the concept system in the disaster field, and obtain deep convergence results with a certain knowledge structure. However, at present, modeling of typhoon event knowledge often focuses on the hierarchical structure and relational relationships of each concept in typhoon events, but often overlooks the description and representation of the dynamic processes of typhoon events. In view of the scattered social media resources, which are large in volume and complex in categorization, it is necessary to create an information convergence method to sort and match typhoon incident information based on the incident progressing process.

本発明は、ソーシャルメディアにおける由来が散在する台風事件情報について、選別、組織及び整合を行うことにより、台風事件について過程の発展段階や態勢を調べることに、規則化する情報の基礎を築くと共に、インシデントレスポンスを管理する際において、ソーシャルメディア資源によるサービスのレベルを向上させることに役立つ、台風事件情報収束方法を提供することを目的とする。 The present invention lays a foundation for regulating information in examining the development stage and posture of the process of typhoon incidents by sorting, organizing and matching typhoon incident information with scattered sources in social media, and It is an object of the present invention to provide a typhoon incident information convergence method that helps improve the level of service provided by social media resources in managing incident responses.

上記の目的を達成するために、本発明は、以下の技術的手段を提供する。
台風事件情報収束方法は、
ソーシャルメディアにおける台風事件と関連するメッセージ文書を集めて、台風事件情報を抽出しながら、構造化の情報タプルのフォーマットに転換する第一ステップと、
In order to achieve the above object, the present invention provides the following technical means.
The typhoon incident information convergence method is
A first step of collecting message documents related to typhoon incidents on social media, extracting typhoon incident information, and converting them into a structured information tuple format;

多特徴の類似度に基づく対象情報収束というステップであって、対象名称間の類似度によって、同一の対象の情報タプルに該当するかどうかを判断し、同一の対象を表現する情報タプルを収束することが必要である第二ステップと、 A step of target information convergence based on the similarity of multi-features, in which the similarity between target names is used to determine whether the information tuples correspond to the same target, and the information tuples representing the same target are converged. a second step in which it is necessary to

時空特徴に基づく状態情報収束というステップであって、対象情報を収束した結果から、単一の時間と位置条件の要求を満たす属性値と行為値を選別しており、時間情報、位置情報及び選別された属性値と行為値は、共に、特定の時空状態で対象情報を収束した結果を構成する第三ステップと、 It is a step of state information convergence based on spatio-temporal features, and from the result of converging target information, attribute values and action values that satisfy the requirements of a single time and location condition are selected. a third step in which the obtained attribute values and action values together constitute a result of converging the target information in a particular spatio-temporal state;

状態に基づく過程情報収束というステップであって、対象情報を収束した結果から、時間と位置範囲の要求を満たす時空ノード情報を選別し、これらの時空ノードについて、それぞれ、状態情報を収束しながら、複数の状態情報を収束した結果をソートして、動的特徴が表れる過程情報の収束結果を形成する、第四ステップを主に含む。 A step of process information convergence based on state, in which spatio-temporal node information that satisfies the requirements of time and position range is selected from the result of converging target information, and for each of these spatio-temporal nodes, while converging state information, Mainly includes a fourth step of sorting the converged results of the plurality of state information to form a converged result of process information representing dynamic features.

好ましくは、第一ステップでは、前記台風事件情報には、対象名称、時間情報、位置情報、属性情報及び行為情報が含まれている。 Preferably, in the first step, the typhoon event information includes target name, time information, location information, attribute information and action information.

好ましくは、第二ステップでは、同一の対象を表現する異なる情報タプルについて、同じ類別の属性項目と行為項目をさらに収束することが必要である。 Preferably, in the second step, it is necessary to further converge attribute items and action items of the same category for different information tuples representing the same object.

好ましくは、第一ステップでは、台風事件情報を抽出することには、情報要素の識別と情報要素の関連付けという二つの部分が少なくとも含まれている。
情報要素の識別は、台風事件における構成対象を特定し、分類体系を構築し、ソーシャルメディア文書から、異なる類別対象を表現する名称と特徴情報を抽出し、ただし、特徴情報に時間、位置、属性及び行為を含む。属性情報は、さらに、属性の類別を示す属性項目、及び、当該類別属性の有するデータ又はデータ量を示す属性値に分けられてもよい。行為情報は、属性情報と同様である。
Preferably, in the first step, extracting typhoon incident information includes at least two parts: identification of information elements and association of information elements.
The identification of information elements identifies the constituent objects in the typhoon event, constructs a classification system, and extracts the names and characteristic information representing different classified objects from the social media documents, provided that the characteristic information includes time, location, and attributes. and conduct. The attribute information may be further divided into an attribute item indicating the classification of the attribute and an attribute value indicating the data or data volume of the attribute of the classification. Action information is similar to attribute information.

情報要素の関連付けは、同一のソーシャルメディア文書において、特徴情報について、その表れる対象と名称を関連付け、On=<T、L、A、B>というフォーマットである情報タプルを形成する。ただし、Onは対象名称、Tは時間情報、Lは位置情報、Aは属性情報、Bは行為情報である。 The association of information elements associates the objects and names of feature information in the same social media document to form an information tuple in the format On=<T, L, A, B>. However, On is a target name, T is time information, L is position information, A is attribute information, and B is action information.

好ましくは、第二ステップでは、単語の埋め込みの類似度を用いて、対象名称、属性項目及び行為項目間の類似性を判断し、以下のステップを含む。
ステップS1は、全てのソーシャルメディア文書のデータを切り出す。
Preferably, the second step uses the similarity of word embedding to determine the similarity between the object name, the attribute item and the action item, and includes the following steps.
Step S1 extracts data of all social media documents.

ステップS2は、取り出した結果を訓練用データセットとして、Skip-gramモデルを用いて、単語の埋め込みを訓練する。 Step S2 trains word embedding using the Skip-gram model with the extracted result as a training data set.

ステップS3は、対象名称をOn1、On2、属性項目をA1、A2、行為項目をB1、B2とすると、訓練された単語の埋め込みモデルに基づいて、それぞれ、On1、On2、A1、A2、B1、B2について、単語の埋め込みE(On1)、E(On2)、E(A1)、E(A2)、E(B1)、E(B2)を取得する。 In step S3, given that the target names are On1 and On2, the attribute items are A1 and A2, and the action items are B1 and B2, On1, On2, A1, A2, B1, For B2, get the word embeddings E(On1), E(On2), E(A1), E(A2), E(B1), E(B2).

ステップS4は、コサイン類似度を用いて、それぞれ、E(On1)とE(On2)、E(A1)とE(A2)、E(B1)与E(B2)との間の類似度の値simn、sima及びsimbを算出する。simn≧εn、sima≧εa、simb≧εb(εn、εa、εbは閾値である)である場合は、On1とOn2、A1とA2、B1とB2が同じの対象名称、属性項目及び行為項目であり、情報を対応的に収束することが可能であるということが分かる。 Step S4 uses the cosine similarity to calculate similarity values between E(On1) and E(On2), E(A1) and E(A2), E(B1) and E(B2), respectively. Calculate simn, sima and simb. If simn≧εn, sima≧εa, simb≧εb (εn, εa, εb are thresholds), then On1 and On2, A1 and A2, B1 and B2 are the same object name, attribute item and action item. It turns out that it is possible to converge the information correspondingly.

好ましくは、第四ステップでは、複数の状態情報を収束した結果をソートすることは、以下のステップを含む。
ステップA1は、状態の時間情報に基づいて、正順又は逆順という方式に従ってソートする。
Preferably, in the fourth step, sorting the results of converging the plurality of state information includes the following steps.
Step A1 sorts according to forward order or reverse order according to the state time information.

ステップA2は、状態の位置情報に基づいて、寸法が大きいから或いは小さいからという方式に従ってソートする。 Step A2 sorts according to the method of large size or small size according to the position information of the states.

ステップA3は、状態の属性情報と行為情報に基づいて、特徴値の大きさ又は階級に基づいてソートしてもよいし、利用者の収束条件との類似度に基づいてソートしてもよい。 In step A3, the state attribute information and the action information may be sorted based on the magnitude or class of the feature value, or may be sorted based on the degree of similarity with the user's convergence conditions.

以上の技術的手段を用いて、以下の技術的効果を得ることができる。
本発明は、ソーシャルメディアに基づく台風事件過程情報収束方法を構築しており、ソーシャルメディア文書における台風事件と関連する異なる対象情報タプルを識別する上で、それぞれ、「対象-状態-過程」から、多等級の収束モードを論述する。まず、対象層において多次元特徴の類似度に基づいて、同一の対象における散在する各特徴情報を収束し、次に、状態層において特定する時空特徴を満たす対象の属性情報と行為情報を収束して、情報の時空粒度を統一にし、最後、過程層において、複数の状態を時空の関係でソートして、情報を規則化にして構造した效果を達成する。このような収束モードは、ソーシャルメディアに、情報が分散化し、粒度が大きく、規則化でないという表現の特徴に応じる以外、台風事件が動的に進行する特徴を十分に考えて、いずれかの時空ノードにおいて、異なる対象の特徴情報を取得できると共に、台風事件の過程特徴を表す規則化の情報を形成する。実際応用の場面では、政府機関により、インシデントレスポンスのタスクを行うというニーズと社会中の公衆が事理を認知するというニーズを満たす際に、重要な役割を果たすことができる。
The following technical effects can be obtained using the above technical means.
The present invention constructs a typhoon event process information convergence method based on social media, in identifying different target information tuples related to typhoon events in social media documents, from "object-state-process" respectively: Multi-order convergence modes are discussed. First, based on the similarity of multidimensional features in the object layer, we converge the scattered feature information of the same object, and then converge the attribute information and action information of the object that satisfy the spatio-temporal features specified in the state layer. Then, the spatio-temporal granularity of the information is unified, and finally, in the process layer, the states are sorted according to the spatio-temporal relationship to achieve the effect of regularizing and structuring the information. Such a convergence mode should be based on social media, where information is distributed, granular, and non-regularized, but it is also possible to consider the dynamic progress of typhoon events, and to consider the dynamic progression of typhoon events. At the nodes, the feature information of different objects can be obtained and the regularization information representing the process features of the typhoon event is formed. In practical applications, it can play an important role in meeting the needs of government agencies to perform incident response tasks and public awareness throughout society.

多等級の台風事件の過程情報の収束モードである。It is the convergence mode of process information of multi-magnitude typhoon events. ソーシャルメディアに作成された時空語義手段である。It is a spatio-temporal semantic means created in social media. ソーシャルメディアに台風事件情報を抽出した結果の例示である。It is an example of the result of extracting typhoon incident information from social media. 対象情報を収束した結果について組織構成及び例示である。It is an organizational structure and an example about the result of having converged object information. 状態情報を収束した結果について組織構成及び例示である。Figure 10 is an organizational structure and example of the results of converging state information; 過程情報を収束する異なる段階である。There are different stages of converging process information. 過程情報を収束した結果について組織構成及び例示である。Organizational structure and examples of the results of converging process information.

以下、図面と具体的な実施例を参照しながら、本発明を詳しく説明する。
実施例
本発明は、ソーシャルメディアに基づく台風事件の過程情報を収束する方法を開示しており、以下のステップを含む。
第一ステップは、ソーシャルメディアにおける台風事件と関連するメッセージ文書を集めて、対象名称、時間情報、位置情報、属性情報及び行為情報を含む台風事件情報を抽出しながら構造化の情報タプルのフォーマットに転換する。
The present invention will now be described in detail with reference to the drawings and specific embodiments.
Embodiment The present invention discloses a method for converging process information of a typhoon event based on social media, which includes the following steps.
The first step is to collect message documents related to typhoon incidents on social media, extract typhoon incident information including target name, time information, location information, attribute information and action information, and convert it into a structured information tuple format. Convert.

第二ステップは、多特徴の類似度に基づく対象情報収束である。対象名称間の類似度によって同一の対象の情報タプルに該当するかどうかを判断し、同一の対象を表現する情報タプルを収束することが必要である。同一の対象を表現する異なる情報タプルについては、その同じ類別である属性項目と行為項目をさらに収束することが必要である。 The second step is target information convergence based on multi-feature similarity. It is necessary to determine whether the information tuples correspond to the same target based on the degree of similarity between the target names, and to converge the information tuples expressing the same target. For different information tuples representing the same object, it is necessary to further converge attribute items and action items of the same category.

第三ステップは、時空特徴に基づく状態情報収束である。対象情報を収束した結果から単一の時間と位置条件の要求を満たす属性値と行為値を選別しており、時間情報、位置情報及び選別された属性値と行為値は、共に、特定の時空状態で対象情報を収束した結果を構成する。 The third step is state information convergence based on spatiotemporal features. Attribute values and action values that satisfy the requirements of a single time and location condition are selected from the result of converging the target information. Construct the result of converging the target information in the state.

第四ステップは、状態に基づく過程情報収束である。対象情報を収束した結果から、時間と位置範囲の要求を満たす時空ノード情報を選別し、これらの時空ノードについてそれぞれ状態情報を収束しながら、複数の状態を収束した結果をソートして、動的特徴が表れる過程情報の収束結果を形成する。 The fourth step is state-based process information convergence. Select spatio-temporal node information that satisfies the time and position range requirements from the results of converging the target information, converge state information for each of these spatio-temporal nodes, sort the results of converging multiple states, and dynamically Form a convergence result of the characterized process information.

好ましい技術的手段としては、第一ステップにおいて台風事件情報を抽出することは、以下のことを含む。
1、台風事件における構成対象を特定し、分類体系を作成し、ソーシャルメディア文書から、異なる類別対象を表現する名称と特徴情報を抽出し、ただし、特徴情報に時間、位置、属性及び行為を含む。属性情報は、さらに、属性の類別を示す属性項目、及び、当該類別属性の有するデータ又はデータ量を示す属性値に分けられてもよい。行為情報は、属性情報と同様である。
As preferred technical means, extracting typhoon event information in the first step includes:
1. Identify the constituent objects in the typhoon event, create a classification system, and extract the names and characteristic information representing different classified objects from the social media documents, where the characteristic information includes time, location, attributes and actions. . The attribute information may be further divided into an attribute item indicating the classification of the attribute and an attribute value indicating the data or data volume of the attribute of the classification. Action information is similar to attribute information.

2、同一のソーシャルメディア文書において、特徴情報について、その表れる対象と名称を関連付け、On=<T、L、A、B>というフォーマットである情報タプルを形成する。ただし、Onは対象名称、Tは時間情報、Lは位置情報、Aは属性情報、Bは行為情報である。 2. In the same social media document, for the feature information, associate the object that appears with the name, and form an information tuple in the format On=<T, L, A, B>. However, On is a target name, T is time information, L is position information, A is attribute information, and B is action information.

好ましい技術的手段としては、台風事件における構成対象は、主体対象と客体対象に分けられる。サイクロンは、災害をもたらす要素として事件における主体対象に該当しており、サイクロンに破壊され、作用され、又は、影響された他の対象は、いずれも、事件における客体対象に該当する。客体対象における異なる性質は、人物、インフラストラクチャー、交通設施や社会活動などの類別を主に含むように、それぞれ分類されてもよい。説明すべきことは、異なる対象について、関連分野における分類方法を参照して、実際のニーズに応じて、より詳しい類別で分けてもよい(表1)。 As a preferred technical measure, constituent objects in a typhoon event are divided into subject objects and object objects. A cyclone is the subject object in an event as a disaster-causing element, and any other object destroyed, acted upon, or affected by the cyclone is the object object in the event. Different properties in the object subject may be classified respectively, mainly including categories such as people, infrastructure, transportation facilities and social activities. What should be explained can be divided into more detailed categories according to actual needs, referring to the classification methods in related fields for different subjects (Table 1).

表1 台風事件中主要の対象類別
対象類別 対象名称
主体対象 サイクロン
客体対象 人物 人類
事物 インフラストラクチャー 建物/外壁の装飾/看板/…
通信設施
電力供給設施
水供給設施
ガス供給設施
都市緑化/樹木/庭園/…
交通設施 一般道路/橋/トンネル/…
高速道路
飛行機
汽車/動力車/高速鉄道
自動車
汽船/フェリー
社会活動 商業地区/ショッピングモール
工場
幼稚園/小学校/高等学校/大学
観光地/生態園/遊園地/…
Table 1 Major target categories during a typhoon event Target category Target name Subject target Cyclone Object target Person Mankind Thing Infrastructure Building/Outer wall decoration/Signboard/…
Communication facility
power supply facility
water supply facility
Gas supply facility
Urban greening/trees/gardens/…
Transportation facilities General roads/bridges/tunnels/…
highway
plane
train/motor vehicle/high-speed rail
car
Steamship/ferry Social activity Commercial area/shopping mall Factory
Kindergarten/Elementary school/High school/University
Sightseeing spots/ecological gardens/amusement parks/…

好ましい技術的手段としては、ソーシャルメディア文書における異なる類別対象を表現する名称と特徴情報を抽出することは、以下のことを含む。
ステップS1は、ソーシャルメディア文書における台風事件の情報を表記するコーパスを構築して、表記された内容に、異なる類別対象を表現する名称、時間、位置、属性及び行為情報要素を含む。
As preferred technical measures, extracting names and characteristic information representing different categorized objects in social media documents includes: a.
Step S1 builds a corpus representing information of typhoon events in social media documents, and the represented contents include name, time, location, attributes and action information elements representing different categorized objects.

ステップS2は、表記コーパスに従って、条件付き確率場のモデルに基づいて、時間情報抽出モデルを構築してソーシャルメディア文書における時間情報を自動識別する。 Step S2 builds a temporal information extraction model according to the notation corpus and based on the conditional random field model to automatically identify the temporal information in the social media document.

ステップS3は、表記コーパスに従って、ディープビリーフネットワークに基づいて、位置情報抽出モデルを構築し、ソーシャルメディア文書における位置情報を自動識別する。 Step S3 builds a location information extraction model according to the notation corpus and based on the deep belief network to automatically identify the location information in the social media document.

ステップS4は、表記コーパスに従って、トリガーの辞典と文法モードを含む、対象名称、属性情報及び行為情報の規則モデルを纏めて、ソーシャルメディア文書における対象名称、属性情報及び行為情報を自動識別する。
好ましい技術的手段としては、ソーシャルメディアから抽出された各情報の要素を関連付けることは、以下のステップを含む。
Step S4 summarizes the rule model of object name, attribute information and action information, including trigger dictionary and grammatical mode, according to the notation corpus, and automatically identifies the object name, attribute information and action information in the social media document.
As a preferred technical measure, associating each information element extracted from social media includes the following steps.

ステップS1は、時空語義手段を構築する。文字、語彙、フレーズ、サブセンテンス、センテンス又は段落などは、それぞれ、文書における言語の単位であり、異なる言語の単位同士は、語義の関係により文書の基本的な構造を形成する。一部の言語の単位により、又は、異なる言語の単位を組み合わせると、完全的な語義の内包を表現でき、つまり、語義の手段を表現できる。語義手段に時間情報と空間情報を含み、語義手段に内容を論述すると、存在する時空特徴を明確に表現することから、本方法では、この語義手段を時空語義手段として定義する。 Step S1 constructs spatio-temporal semantic means. Characters, vocabulary, phrases, subsentences, sentences, paragraphs, etc. are each linguistic units in a document, and different linguistic units form the basic structure of the document through their semantic relationships. By some linguistic units, or by combining different linguistic units, complete semantic connotations can be expressed, that is, semantic means can be expressed. In this method, this word meaning means is defined as a spatio-temporal meaning means because the word meaning means includes temporal information and spatial information, and when the contents are discussed in the word meaning means, the existing spatio-temporal features are clearly expressed.

台風事件を含んだソーシャルメディア文書を分析する。時空語義手段の分布は、大別すると、(1)同一の時間と位置しか記載しない対象情報であり、このような文書は、ソーシャルメディア文書の大部分を占めている。(2)描述了時間が同一であるが位置が異なるように記載する対象情報であり、このような文書の数が比較的少ない。(3)複数の時間と位置を挙げて比較した対象情報であり、それは、統合的報道に該当しており、このような文書の数が少ないという三つの種類に分けられる。 Analyze social media documents containing typhoon incidents. The distribution of spatio-temporal semantic means can be broadly divided into (1) target information describing only the same time and position, and such documents occupy the majority of social media documents. (2) The target information has the same writing completion time but different positions, and the number of such documents is relatively small. (3) Target information that compares multiple times and locations, which falls under integrated reporting and can be divided into three categories: low number of such documents;

時空情報を用いて、追跡文書における対象特徴の変化状況を追跡することができる。従って、本方法では、抽出された時空情報に基づいて、ソーシャルメディア文書を、異なる時空語義手段(図2)に分ける。文書における時空情報の存在位置によって、時空語義手段の根拠を分ける。具体的に、以下のことを含む。
(1)第一種類の場合について、唯一の時間と位置の情報しか含まないことから、文書全体を一つの時空語義手段に分ける。
Spatio-temporal information can be used to track changes in target features in tracked documents. Therefore, the method divides the social media documents into different spatio-temporal semantic means (FIG. 2) based on the extracted spatio-temporal information. The grounds for spatio-temporal semantic means are divided according to the position of the spatio-temporal information in the document. Specifically, it includes:
(1) For the first type case, the whole document is divided into one spatio-temporal semantic means because it contains only one time and position information.

(2)第二と第三の場合について、先に、時間情報に基づいて、文書を複数の時間手段に分ける。時間手段に複数の位置情報が存在する場合に、位置情報に基づいて、さらに分けを行い、分けられた時空語義手段について、時間手段における時間情報を共有する。 (2) For the second and third cases, first divide the document into multiple time means based on the time information. When a plurality of pieces of position information exist in the time means, further division is performed based on the position information, and the time information in the time means is shared for the divided spatio-temporal semantic means.

ステップS2は、対象名称と特徴情報の関連規則である。ソーシャルメディア文書を複数の時空語義手段に分けることを基に、識別された対象名称及び各種類の特徴情報を異なる手段内に分布させる。従って、各情報要素がそれぞれ所属する手段により組織を構造化させることができる。各時空語義手段では、以下のステップに従って、異なる情報要素を関連づける。 Step S2 is an association rule between the object name and feature information. Based on dividing the social media document into multiple spatio-temporal semantic means, the identified object names and each kind of characteristic information are distributed in different means. Therefore, the organization can be structured by the means to which each information element belongs. Each spatio-temporal semantic means associates different information elements according to the following steps.

(1)特徴のトリガーワードと特徴値を関連付ける。特徴のトリガーワードと特徴値とが共に、対象の特徴情報を構成する。この場合には、属性特徴と行為特徴だけを意味しており、特徴のトリガーワードは、属性項目と行為項目を示し、特徴値は、属性値と行為値を示す。特徴のトリガーワードと特徴値を表現する際に、近接の規律に準ずるため、「特徴のトリガーワード特徴値」という構成を形成する。属性値における先の三つの語彙の単語頻度を統計することにより、特徴のトリガーワードが現れる頻度が99%よりも高い。従って、特徴値と、その位置が先に最も近接する特徴のトリガーワードとを関連付ける。 (1) Associating feature trigger words with feature values. Together, the feature trigger word and the feature value constitute the feature information of interest. In this case, only the attribute feature and the action feature are meant, the feature trigger word indicates the attribute item and the action item, and the feature value indicates the attribute value and the action value. In order to follow the discipline of proximity in expressing feature trigger words and feature values, we form the construct "feature trigger word feature value". By statistically counting the word frequencies of the previous three vocabularies in attribute values, the feature trigger words appear more frequently than 99%. Therefore, we associate the feature value with the trigger word of the feature whose position is closest first.

(2)属性、行為情報及び対象名称を関連付ける。中国語の基本的な表現の習慣では、一般的に、対象名称を言及し、次に、それぞれ、対象が有する各種の特徴を論述する。従って、同一の時空語義手段に、属性情報と行為情報を、それぞれ、その位置が先に最も近接する対象名称に関連付ける。 (2) Associate attributes, action information and object names. The basic phraseological practice of Chinese generally refers to the name of the object and then discusses, respectively, the various characteristics that the object has. Therefore, the attribute information and the action information are each associated with the target name whose position is closest to the same spatio-temporal semantic means.

(3)対象名称と時間、位置情報に関連付ける。対象名称が所在する時空語義手段について、その時間情報と位置情報を、それぞれ対象名称に関連付ける。
順に関連関係を構築する対象名称と各種の特徴情報について、On=<T、L、A、B>というタプルフォーマットに従って、充填する(図3)。説明するべきことは、一つの時空語義手段において台風事件を表現するは、一つの局面しか限定されないことがあり、対象情報タプルを構築する場合に、属性と行為のうちの一つが欠けることがある。
(3) Associate the target name with time and location information. For the spatio-temporal semantic means in which the target name is located, the time information and the position information are associated with the target name, respectively.
Object names and various feature information for which a relational relationship is constructed in order are filled according to a tuple format of On=<T, L, A, B> (FIG. 3). What should be explained is that representing a typhoon event in one spatio-temporal semantic means may be limited to only one aspect, and one of attributes and actions may be missing when constructing the target information tuple. .

好ましい技術的手段としては、第二ステップにおいて対象情報を収束することは、以下の収束を含む。
1、対象名称に基づく収束。収束条件の対象名称をNとすると、On名称とNの類似度simnを順次に判断する。simn≧εn(εnは対象の類似度の閾値)である場合には、同一の対象であると分かり、そして、同一の対象の情報タプルを合弁する。
As preferred technical means, converging the target information in the second step includes the following convergence.
1, convergence based on object name; Assuming that the target name of the convergence condition is N, the degree of similarity simn between the On name and N is determined sequentially. If simn≧εn, where εn is the similarity threshold of the objects, then we know the same object and merge the information tuples of the same object.

対象名称の類似度の大きさを判断する方法は、単語の埋め込み類似度法が採用される。単語の埋め込み類似度法は、Skip-gramモデルを用いて、単語の埋め込みモデルを訓練することを基に、まず、対象名称を一つの多次元空間のベクトルに写像し、類似度の算法により、異なるベクトルが多次元空間における方向に一致するかどうかを判断すると共に、コサイン類似度を用いて大きさを判断する。
例えば、O(台風)=<2019年8月10日1:45、浙江省温嶺市、風速、16階級、上陸>、O(熱帯サイクロン)=<2019年8月11日20:50、山東省青島市、風速、9階級、上陸>は、ソーシャルメディアから抽出された情報タプルである。収束条件の対象名称を「台風」とすると、それぞれ、情報タプルにおける対象名称「台風」及び「熱帯サイクロン」について類似度を判断し、その語義が共に、サイクロンそのものを表現するものであると、この二つの項目情報タプルを収束結果とする。
A word embedding similarity method is adopted as a method for determining the degree of similarity of target names. The word embedding similarity method is based on training a word embedding model using a Skip-gram model. It determines whether the different vectors match directions in multi-dimensional space, and uses cosine similarity to determine magnitude.
For example, O (typhoon) = < 1:45 on August 10, 2019, Wenling City, Zhejiang Province, wind speed, 16 classes, landfall>, O (tropical cyclone) = < 20:50 on August 11, 2019, Shandong Qingdao, province, wind speed, class 9, landing> is an information tuple extracted from social media. If the target name of the convergence condition is "typhoon", the degree of similarity is judged for the target names "typhoon" and "tropical cyclone" in the information tuples, respectively, and it is assumed that both of these terms express the cyclone itself. Let the two item information tuples be the convergence result.

2、対象特徴を結合する収束。同一の対象の情報タプルを収束する場合には、多項目に、類別が同じである属性と行為の特徴情報が現れることになり、そして、特定の特徴に合致する対象情報をさらに収束する。対象名称を収束した結果に基づいて、収束条件における対象属性特徴Aと行為特徴Bを設定する。属性特徴の収束については、単語の埋め込み類似度法を用いて、On属性項目とAの類似度simaを判断する。sima≧εa(εaが属性の類似度の閾値)である場合には、属性項目が同じであり情報を収束すると共に、収束してから、同様に、各属性値及び時空特徴をそのまま保留でき、さもなければ、同一の対象における異なる属性項目を表現し、属性項目を収束しないと分かる。 2. Convergence that combines the features of interest. When converging information tuples of the same target, feature information of attributes and actions with the same classification will appear in multiple items, and target information that matches specific features is further converged. Based on the result of converging the target names, the target attribute feature A and the action feature B in the convergence conditions are set. For attribute feature convergence, the similarity sima between the On attribute item and A is determined using the word embedding similarity method. When sima≧εa (where εa is the attribute similarity threshold), the attribute items are the same and the information converges, and after convergence, each attribute value and spatio-temporal feature can be retained as they are, Otherwise, it expresses different attribute terms in the same object, and it turns out that the attribute terms do not converge.

行為特徴を収束することは、単語の埋め込み類似度法を用いて、On行為項目とBの類似度simbを判断する。simb≧εb(εbは行為の類似度閾値)である場合には、表明行為項目が同じであり、情報を収束すると共に、収束してから同様に、各行為情報及び時空特徴をそのまま保留でき、さもなければ、同一の対象における異なる行為項目を表現し、行為項目を収束しないと分かる。
例えば、上記したO(台風)とO(熱帯サイクロン)対象情報タプルに基づいて、台風に係る「風速」の属性特徴情報をさらに収束する。O(台風)とO(熱帯サイクロン)とに、それぞれ、類似度閾値に合致する属性項目「風速」があることから、<2019年8月10日1、45、浙江省温嶺市、風速、16階級>と<2019年8月11日20、50、山東省青島市、風速、9階級>を、対象特徴の収束結果とする。
Converging action features determines the similarity simb of On action items and B using the word embedding similarity method. If simb≧εb (εb is the action similarity threshold), the manifestation action item is the same, the information converges, and similarly after convergence, each action information and spatiotemporal feature can be retained as it is, Otherwise, it represents different action items in the same object, and it turns out that the action items do not converge.
For example, based on the O (typhoon) and O (tropical cyclone) target information tuples described above, the attribute feature information of "wind speed" related to the typhoon is further converged. O (typhoon) and O (tropical cyclone) each have an attribute item "wind speed" that matches the similarity threshold. 16 class> and <20, 50, August 11, 2019, Qingdao City, Shandong Province, wind speed, 9 class> are the convergence results of the target feature.

3、対象収束結果の情報を構造化する。対象情報収束結果の組織フォーマットは、図4に示される。ただし、O(N)は収束の対象、Alは収束された対象の属性項目、alsは具体の属性値、Bnは収束された対象の行為項目、bnuは具体の行為値、<T、S>は属性値又は行為値が発生した時間と場所である。そして、そもそも散在する情報の断片は、表現された対象と関連付け、対象における同じの属性項目と行為項目が合弁されており、各属性と行為項目には、複数の時空条件で表現された異なる特徴値が含まれると分かる。 3. Structuring the information of the target convergence result. The organizational format of the target information convergence result is shown in FIG. However, O (N) is the target of convergence, Al is the attribute item of the converged target, als is the specific attribute value, Bn is the action item of the converged target, bnu is the specific action value, <T, S> is the time and place at which the attribute value or action value occurred. In the first place, the scattered pieces of information are associated with the expressed object, and the same attribute item and action item in the object are jointed, and each attribute and action item has different characteristics expressed in multiple spatio-temporal conditions. I know it contains a value.

好ましい技術的手段としては、第三ステップに状態情報を収束することは、以下のことを含む。
1、時空基準を統一させること。時空框架は、状態が存在する基礎であり、状態情報を収束することに、統一の時空基準を構築することが必要である。本明細書に係る時間基準は、日期を西暦、時間を北京時間、空間基準をCGCS2000座標系とする。
As a preferred technical means, converging state information in the third step includes: a.
1. To unify the space-time standards. The space-time frame is the basis on which states exist, and converging state information requires building a unified space-time reference. The time reference used herein is the Gregorian calendar, the time is Beijing time, and the spatial reference is the CGCS2000 coordinate system.

2、時空情報を正規化させること。時間情報と位置情報は、それに関連する属性情報と行為情報が、特定時空条件で対象状態を表現する特徴であるかどうか根拠となる。時間情報については、現在、人々が日常に使用する習慣に従って、西暦、暦時間及び時計時間を用いて正規化で表現する。時間の正規化フォーマットは、「日期+時間」というフォーマットによる「YYYY-MM-DD HH、MM、SS」であり、例えば、「2019-08-10 12、00、00」である。位置情報は、統一の空間基準に従って、正規化の表示フォーマットに転換し、地名、アドレスと空間座標などの表現内容を含む。ただし、地名は、特定時間で国家が公表した標準名称、コード及び類別を参照してもよい。アドレスに含まれるアドレス要素の類別と要素の組み合わせ形態は、国家または業界が公表した標準規範を参照してもよい。空間座標は、空間基準の要求に従って、座標転換を対応的に行う。 2. To normalize spatio-temporal information. Time information and location information are grounds for whether or not their associated attribute information and action information are features that express the target state under specific spatio-temporal conditions. Time information is now normalized using the Western calendar, calendar time, and clock time according to people's daily habits. The time normalization format is 'YYYY-MM-DD HH, MM, SS' with the format 'Date+Time', for example, '2019-08-10 12, 00, 00'. The location information is converted into a normalized display format according to the uniform spatial standard, and includes representation contents such as place names, addresses and spatial coordinates. However, place names may refer to standard names, codes and classifications published by the state at a specific time. The classification of address elements included in the address and the combination form of the elements may refer to standard norms published by the state or industry. Spatial coordinates undergo coordinate transformation correspondingly according to the requirements of the spatial standard.

3、状態向けの収束。収束すべき時間特徴tと位置特徴lを設定し、対象層情報に基づいて、結果O(N)を収束し、O(N)における各属性項目と行為項目に、T=tかつS=lの特徴値(属性値と行為値)が存在するかどうかを判断し、存在する場合にこの特徴値を収束情報とし、さもなければ、S=l、T<tかつtと最も近接する特徴値が存在するかどうかを引き続き判断し、存在する場合に、この特徴値を収束情報とする。存在しない場合に、Sがlと近く、T<tかつtと最も近接する特徴値が存在するかどうかを引き続き判断し、存在する場合に、同様に、この特徴値を収束情報とする。依然として不存在しない場合に、この属性項目又は行為項目を収束しない。O(N)におけるあらゆる属性項目と行為項目をトラバーサルすることにより、各属性項目と行為項目から、多くても一つの項目が最も時空特徴に合致するする特徴値を選別する。これらの属性情報と行為情報を収束し、共に、特定時空条件下で対象の状態情報を収束した結果を形成する。 3. Convergence for states. Set the time feature t and the position feature l to be converged, converge the result O(N) based on the target layer information, and set T = t and S = l for each attribute item and action item in O(N) If there is a feature value (attribute value and action value) of exists, and if it exists, this feature value is taken as convergence information, otherwise S = l, T < t and the feature value closest to t If it exists, this feature value is used as convergence information. If not, continue to determine if there exists a feature value with S close to l, T<t and closest to t, and if so, similarly take this feature value as convergence information. Do not converge this attribute item or action item if it still does not exist. By traversing all attribute items and action items in O(N), from each attribute item and action item, at most one item selects a feature value that best matches the spatio-temporal feature. These attribute information and action information are converged and together form a converged result of the state information of the object under the specified spatiotemporal conditions.

例えば、ソーシャルメディアに、8月10日1:45、サイクロン風速が浙江省温嶺市に16階級になるというメッセージが記録されるとすると、(2、00、温嶺市)のサイクロン状態を収束する時、1:45-2:00間に風速についての情報が更新されないことから、「風速が16階級」を、サイクロン対象における(2:00、温嶺市)状態の一つ項目の属性特徴とする。このような収束のメカニズムにより、取得されたいずれかの時空ノードにおける収束結果について、状態情報に、現在時空に所属すると明確に言及される対象特徴が限定されておらず、今までのすべての時間に、あらゆる対象の特徴における現在までの最新進捗をさらに含み、全面的にかつ完全的に収束結果を保証することができる。 For example, if a message is recorded on social media at 1:45 on August 10th, the cyclone wind speed reaches level 16 in Wenling City, Zhejiang Province, the cyclone state at (2,00, Wenling City) will be converged. However, since the information about the wind speed is not updated between 1:45 and 2:00, the attribute feature of one item of the state (2:00, Wenling City) in the cyclone target is “16 levels of wind speed”. and With such a convergence mechanism, for the convergence result at any space-time node obtained, the state information is not limited to the target features explicitly mentioned as belonging to the current space-time, and In addition, the latest progress to date in every feature of interest can be included to ensure a fully and completely convergent result.

4、状態を収束した結果の情報の構造化。状態の情報を収束した結果の組織フォーマットは、図5に示される。ただし、Sは対象O(N)が時間tと位置lに存在する状態であり、Alとalsは、状態の属性特徴を示し、Bnとbnuは、状態の行為特徴を示し、<T、S>は、属性と行為特徴が発生した時間と位置である。 4. Structuring of information resulting from state convergence. The resulting organizational format of converging state information is shown in FIG. where S is the state where the object O(N) exists at time t and position l, Al and als denote the attribute features of the state, Bn and bnu denote the action features of the state, <T, S > is the time and position at which the attribute and action feature occurred.

好ましい技術的手段としては、第四ステップに、過程情報を収束することは、状態序列の収束と事件過程の収束という二つの部分を含む。過程は、異なる状態の時空上の繋がりであり、状態における属性情報と行為情報の変化により過程の動的が表れる。台風事件には、事件の発生期間に複数の対象が進化する過程を含み、台風事件の過程は、複数の対象の異なる状態により一緒に構成されたものである。従って、過程層情報を収束する時に、階級ごとに分解するという形態を用いて、状態情報と過程情報の繋がりを階級ごとに対象状態、状態序列及び事件過程という三つの段階に抽象する(図6)。ただし、対象状態は、ある時空で対象の属性情報と行為情報が収束されており、状態序列は、同一の対象の進化過程を記録したものであり、同一の対象について異なる状態を収束する必要があり、事件過程は、複数の対象が共に進化した過程であり、複数の状態の序列により一緒に構成される。 As a preferred technical means, in the fourth step, the process information convergence includes two parts: state sequence convergence and event process convergence. A process is a spatio-temporal connection of different states, and the dynamics of the process are expressed by changes in attribute information and action information in the state. A typhoon event involves the evolution process of multiple objects during the occurrence of the event, and the process of a typhoon event is composed together by different states of multiple objects. Therefore, when the process layer information is converged, we use the form of decomposing it by class, and abstract the connection between the state information and the process information into three stages: the target state, the state order, and the event process (Fig. 6). ). However, the object state is the convergence of the object's attribute information and action information in a certain space-time, and the state sequence records the evolution process of the same object, and it is necessary to converge different states for the same object. Yes, an event process is a process in which multiple objects have evolved together, and are composed together by a sequence of multiple states.

好ましい技術的手段としては、状態序列を収束することは、以下のステップを含む。
ステップS1は、収束すべき時間範囲trと空間範囲srを設定し、対象情報に基づいて、結果O(N)を収束し、O(N)における全ての属性項目と行為項目を順次にトラバーサルする。各属性項目と行為項目について、T⊆trとS⊆srの属性値又は行為値が存在するかどうかを判断し、tr与sr範囲を満たす全ての<T、S>を時空ノード集合として形成する。集合における全ての時空ノードについて、それぞれ、第三ステップに係る方法により、複数の状態の収束結果を取得する。
As a preferred technical means, converging the state hierarchy includes the following steps.
Step S1 sets the time range tr and the spatial range sr to be converged, converges the result O(N) based on the target information, and sequentially traverses all attribute items and action items in O(N). . For each attribute item and action item, determine whether the attribute value or action value of T⊆tr and S⊆sr exists, and form all <T, S> satisfying the tr given sr range as a spatio-temporal node set . For all space-time nodes in the set, the convergence results of multiple states are obtained by the method according to the third step.

ステップS2は、すべての状態の収束結果をソートして、まず、状態の時間情報に基づいて、正順又は逆順の形態でソートし、次に、状態の位置情報に基づいて、大きさが大きいから又は小さいからという形態でソートし、最後に、状態の属性情報と行為情報に基づいて、特徴値の大きさ又は階級によりソートしてもよいし、利用者の収束条件との類似度によりソートしてもよい。三次元条件により並べた状態の序列は、単一の対象の過程を収束した結果となる。 Step S2 sorts the convergence results of all states, first according to the time information of the states, sorting in the form of forward or reverse order, and then according to the position information of the states, the magnitude Sorted in the form of from or from small, and finally, based on the state attribute information and action information, may be sorted by the magnitude or class of the feature value, or sorted by the degree of similarity with the user's convergence condition You may The ordering of states ordered by three-dimensional conditions is the result of converging the process of a single object.

ステップS3は、状態序列を収束した結果の情報を構造化させる。状態序列情報を収束した結果の組織フォーマットは、図5に示される。ただし、Pは対象O(N)が時間範囲trと空間範囲srに経過した上過程であり、Sは、時空ノード<tn、ln>での対象状態である。 Step S3 structures the information resulting from the convergence of the state order. The organizational format resulting from converging state hierarchy information is shown in FIG. where P is the upper process of the object O(N) over time range tr and space range sr, and S is the object state at the spatio-temporal node <tn, ln>.

好ましい技術的手段、事件の過程を収束することは、以下のステップを含む。
ステップS1は、収束すべき時間範囲trと空間範囲srを設定し、多項目の対象情報について結果O(Ns)-O(Nt)を収束し、まず、O(Ns)における全ての属性項目と行為項目をトラバーサルして、trとsr範囲に合致する<T、S>を取得する。次に、O(Nt)の全てがトラバーサルされるまで、O(Ns+1)を繰り返してトラバーサルする。tr与sr範囲に合致する全ての<T、S>を時空ノードの集合として形成する。
The preferred technical means, converging the course of events, includes the following steps.
Step S1 sets the time range tr and the space range sr to be converged, converges the result O(Ns)-O(Nt) for the target information of multiple items, first, all the attribute items in O(Ns) and Traversal the action items to get <T, S> that match the tr and sr ranges. Then traverse O(Ns+1) repeatedly until all of O(Nt) have been traversed. Form all <T, S> that match the tr given sr range as a set of spatiotemporal nodes.

ステップS2は、複数の対象状態序列について、収束結果全体に秩序が一致しているように保証するように、同じのソートメカニズムを用いることが必要である。事件過程向けの収束結果について、過程の前後において異なる時間ノードにおける状態特徴を比べると、空間特徴の移動及び属性や行為特徴の相違を分析し、台風事件全体の動的過程(図7)を明示的に記録する。 Step S2 needs to use the same sorting mechanism for multiple target state orders to ensure that the overall convergence results are consistent in order. Regarding the convergence results for the event process, comparing the state features at different time nodes before and after the process, we analyzed the movement of the spatial features and the differences in the attributes and action features, and clarified the dynamic process of the entire typhoon event (Fig. 7). to be recorded.

以上、本発明創造における好ましい実施例を詳しく説明したが、本発明創造は、前記の実施例に限定されておらず、当業者にとって、本発明創造の趣旨を逸脱しない限り、様々な均等変化や置換が可能である。これら均等変化や置換は、いずれも、本願の特許請求の範囲に限定される範囲に含まれる。 Although the preferred embodiments of the creation of the present invention have been described in detail above, the creation of the present invention is not limited to the above-described examples. Substitution is possible. All of these equivalent changes and substitutions are included within the scope of the claims of this application.

Claims (6)

ソーシャルメディアにおける台風事件と関連するメッセージ文書を集めて、台風事件情報を抽出しながら、構造化の情報タプルフォーマットに転換する第一ステップと、
多特徴の類似度に基づく対象情報収束というステップであって、対象名称間の類似度によって同一の対象の情報タプルに該当するかどうかを判断し、同一の対象を表現する情報タプルを収束することが必要である第二ステップと、
時空特徴に基づく状態情報収束というステップであって、対象情報を収束した結果から単一の時間と位置条件の要求を満たす属性値と行為値を選別しており、時間情報、位置情報及び選別された属性値と行為値は、共に、特定の時空状態での対象情報を収束した結果を構成する、第三ステップと、
状態に基づく過程情報収束というステップであって、対象情報を収束した結果から、時間と位置範囲の要求を満たす時空ノード情報を選別し、これらの時空ノードについてそれぞれ、状態情報を収束しながら、複数の状態情報を収束した結果をソートして、動的特徴が現れる過程情報の収束結果を形成する、第四ステップを主に含む、ことを特徴とする台風事件情報収束方法。
A first step of collecting message documents related to typhoon incidents on social media, extracting typhoon incident information, and converting them into a structured information tuple format;
A step of target information convergence based on the similarity of multiple features, in which it is determined whether or not the information tuples correspond to the same target based on the similarity between the target names, and the information tuples expressing the same target are converged. a second step requiring
It is a step of state information convergence based on spatiotemporal features, and selects attribute values and action values that satisfy the requirements of a single time and location condition from the result of converging target information. a third step, wherein the attribute value and the action value together constitute a result of converging the target information in a particular spatio-temporal state;
In the step of process information convergence based on the state, spatio-temporal node information that satisfies the requirements of time and position range is selected from the result of converging the target information. A typhoon incident information convergence method mainly comprising a fourth step of sorting the state information convergence results of to form a process information convergence result in which dynamic features appear.
前記第一ステップでは、前記台風事件情報には、対象名称、時間情報、位置情報、属性情報及び行為情報が含まれている、ことを特徴とする請求項1に記載の台風事件情報収束方法。 The method of claim 1, wherein in the first step, the typhoon incident information includes object name, time information, location information, attribute information and action information. 前記第二ステップでは、同一の対象を表現する異なる情報タプルについて、同じ類別の属性項目と行為項目をさらに収束することが必要である、ことを特徴とする請求項1に記載の台風事件情報収束方法。 The typhoon incident information convergence according to claim 1, wherein in the second step, for different information tuples representing the same object, it is necessary to further converge attribute items and action items of the same category. Method. 前記第一ステップでは、台風事件情報を抽出することには、情報要素の識別と情報要素の関連付けという二つの部分が少なくとも含まれており、
情報要素の識別は、台風事件における構造対象を特定し分類体系を構築し、ソーシャルメディア文書から、異なる類別対象を表現する名称と特徴情報を抽出し、ただし、特徴情報に、時間、位置、属性及び行為を含み、属性情報は、さらに、属性の類別を示す属性項目、及び、類別属性の有するデータ又はデータ量を示す属性値に分けられてもよく、行為情報は、属性情報と同様であり、
情報要素の関連付けは、同一のソーシャルメディア文書において、特徴情報についてその表れる対象と名称を関連付け、On=<T、L、A、B>というフォーマットである情報タプルを形成し、ただし、Onは対象名称、Tは時間情報、Lは位置情報、Aは属性情報、Bは行為情報である、ことを特徴とする請求項1に記載の台風事件情報収束方法。
In the first step, extracting typhoon incident information includes at least two parts: identification of information elements and association of information elements;
Identification of information elements involves identifying structural objects in typhoon events, building a classification system, and extracting names and characteristic information representing different classification objects from social media documents. and actions, the attribute information may be further divided into attribute items indicating the classification of attributes, and attribute values indicating the data or data volume possessed by the category attributes, and the action information is the same as the attribute information. ,
Information element association associates feature information with its appearing object and name in the same social media document, forming an information tuple in the format On=<T, L, A, B>, where On is the object The typhoon incident information convergence method according to claim 1, characterized in that name, T is time information, L is location information, A is attribute information, and B is action information.
前記第二ステップでは、単語の埋め込みの類似度を用いて、対象名称、属性項目及び行為項目間の類似性を判断し、
全てのソーシャルメディア文書のデータを切り出すステップS1と、
取り出した結果を訓練用データセットとして、Skip-gramモデルを用いて、単語の埋め込みを訓練するステップS2と、
対象名称をOn1、On2、属性項目をA1、A2、行為項目をB1、B2とすると、訓練された単語の埋め込みモデルに基づいて、それぞれ、On1、On2、A1、A2、B1、B2について単語の埋め込みE(On1)、E(On2)、E(A1)、E(A2)、E(B1)、E(B2)を取得するステップS3と、
コサイン類似度を用いて、それぞれ、E(On1)与E(On2)、E(A1)とE(A2)、E(B1)とE(B2)間の類似度値simn、sima及びsimbを算出し、simn≧εn、sima≧εa、simb≧εb(ただし、εn、εa、εbは閾値)である場合に、表明On1とOn2、A1とA2、B1とB2が同じの対象名称、属性項目及び行為項目であり、情報を対応的に収束することが可能であるということが分かる、ステップS4、を含む、ことを特徴とする請求項1に記載の台風事件情報収束方法。
In the second step, using the similarity of word embedding, the similarity between the target name, the attribute item and the action item is determined,
a step S1 of extracting data of all social media documents;
step S2 of training word embedding using the Skip-gram model with the extracted result as a training data set;
Let On1 and On2 be the target names, A1 and A2 be the attribute items, and B1 and B2 be the action items. a step S3 of obtaining embeddings E(On1), E(On2), E(A1), E(A2), E(B1), E(B2);
Using cosine similarity, calculate the similarity values simn, sima and simb between E(On1) given E(On2), E(A1) and E(A2), E(B1) and E(B2) respectively If simn≧εn, sima≧εa, and simb≧εb (where εn, εa, and εb are thresholds), then assertions On1 and On2, A1 and A2, and B1 and B2 have the same object name, attribute item, and The typhoon incident information convergence method according to claim 1, characterized by comprising step S4, which is an action item and finds that the information can be converged correspondingly.
前記第四ステップでは、複数の状態情報を収束した結果をソートすることは、
状態の時間情報に基づいて、正順又は逆順という方式に従ってソートするステップA1と、
状態の位置情報に基づいて、寸法が大きいから或いは小さいからという方式に従ってソートするステップA2と、
状態の属性情報と行為情報に基づいて、特徴値の大きさ又は等階級に従ってソートしてもよいし、利用者の収束条件との類似度に従ってソートしてもよいステップA3を含む、ことを特徴とする請求項1に記載の台風事件情報収束方法。
In the fourth step, sorting the results of converging a plurality of state information includes:
Step A1 of sorting according to the forward order or reverse order according to the time information of the state;
Step A2 of sorting according to the mode of large size or small size according to the position information of the state;
Based on the attribute information of the state and the action information, sorting may be performed according to the magnitude of the feature value or the grade, or may be sorted according to the degree of similarity with the user's convergence condition. The typhoon incident information convergence method according to claim 1.
JP2022505249A 2020-11-10 2021-01-20 Typhoon incident information convergence method Pending JP2023504961A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011245204.3 2020-11-10
CN202011245204.3A CN112328794B (en) 2020-11-10 2020-11-10 Typhoon event information aggregation method
PCT/CN2021/072796 WO2022099927A1 (en) 2020-11-10 2021-01-20 Information aggregation method for typhoon events

Publications (1)

Publication Number Publication Date
JP2023504961A true JP2023504961A (en) 2023-02-08

Family

ID=74317863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022505249A Pending JP2023504961A (en) 2020-11-10 2021-01-20 Typhoon incident information convergence method

Country Status (3)

Country Link
JP (1) JP2023504961A (en)
CN (1) CN112328794B (en)
WO (1) WO2022099927A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903238B (en) * 2021-09-23 2023-10-03 成都信息工程大学 Typhoon virtual simulation experiment teaching system and typhoon virtual simulation experiment teaching method
CN114282534A (en) * 2021-12-30 2022-04-05 南京大峡谷信息科技有限公司 Meteorological disaster event aggregation method based on element information extraction
CN114003646A (en) * 2021-12-30 2022-02-01 南京师范大学 High-concurrency real-time multi-attribute aggregated map cluster service system
CN114880498B (en) * 2022-07-11 2022-11-29 北京百度网讯科技有限公司 Event information display method and device, equipment and medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180096057A1 (en) * 2016-10-03 2018-04-05 Sap Se Collecting event related tweets
KR20210086833A (en) * 2019-12-30 2021-07-09 동국대학교 산학협력단 System and method of providing disaster information using SNS database

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5147570B2 (en) * 2008-07-02 2013-02-20 株式会社日立製作所 Storage system and remote copy recovery method
CN102541886B (en) * 2010-12-20 2015-04-01 郝敬涛 System and method for identifying relationship among user group and users
CN106484767B (en) * 2016-09-08 2019-06-21 中国科学院信息工程研究所 A kind of event extraction method across media
CN107220286B (en) * 2017-04-24 2020-03-17 深圳市龙岗远望软件技术有限公司 Emergency command information presentation method, emergency command system platform and server
CN110009158B (en) * 2019-04-11 2022-04-15 中国水利水电科学研究院 Typhoon, rainstorm and flood disaster full life cycle monitoring method and system
CN110008355A (en) * 2019-04-11 2019-07-12 华北科技学院 The disaster scene information fusion method and device of knowledge based map
CN111241311B (en) * 2020-01-09 2023-02-03 腾讯科技(深圳)有限公司 Media information recommendation method and device, electronic equipment and storage medium
CN111708879A (en) * 2020-05-11 2020-09-25 北京明略软件系统有限公司 Text aggregation method and device for event and computer-readable storage medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180096057A1 (en) * 2016-10-03 2018-04-05 Sap Se Collecting event related tweets
KR20210086833A (en) * 2019-12-30 2021-07-09 동국대학교 산학협력단 System and method of providing disaster information using SNS database

Also Published As

Publication number Publication date
CN112328794B (en) 2021-08-24
WO2022099927A1 (en) 2022-05-19
CN112328794A (en) 2021-02-05

Similar Documents

Publication Publication Date Title
JP2023504961A (en) Typhoon incident information convergence method
JP7468929B2 (en) How to acquire geographical knowledge
Ramakrishnan et al. 'Beating the news' with EMBERS: forecasting civil unrest using open source indicators
CN101799835B (en) Ontology-driven geographic information retrieval system and method
CN106021508A (en) Sudden event emergency information mining method based on social media
Neumaier et al. Enabling spatio-temporal search in open data
Zhou et al. Real world city event extraction from Twitter data streams
CN102663122A (en) Semantic query expansion algorithm based on emergency ontology
CN115114455A (en) Ontology-based multi-granularity urban rainstorm waterlogging knowledge map construction method
CN113239111A (en) Network public opinion visual analysis method and system based on knowledge graph
CN114282534A (en) Meteorological disaster event aggregation method based on element information extraction
Chen et al. Construction of spatiotemporal knowledge graph for emergency decision making
Sukel et al. Multimodal classification of urban micro-events
Yin Crime Prediction Methods Based on Machine Learning: A Survey.
Ballatore et al. The context of outdoor walking: A classification of user‐generated routes
Salehi et al. A formal conceptual model and definitional framework for spatial datacubes
Riga et al. Atmospheric environment and quality of life information extraction from twitter with the use of self-organizing maps
CN115759253A (en) Power grid operation and maintenance knowledge map construction method and system
CN115203295A (en) Construction and visual analysis method for marginal environment database
Dashdorj et al. High‐level event identification in social media
Williams GeoContext: Discovering geographical topics from social media
Sergeeva et al. Semagr: semantic method for accurate geolocations reconstruction within extensive urban sites
CN113821739B (en) Local event detection method, device, equipment and storage medium
Kwakye Semantic data warehouse modelling for trajectories
Liu et al. Optimization of Computer Aided Query System for Tourism Information Based on Internet of Things

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230307

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231003