WO2014174797A1 - 情報処理システム、情報処理方法および記憶媒体 - Google Patents

情報処理システム、情報処理方法および記憶媒体 Download PDF

Info

Publication number
WO2014174797A1
WO2014174797A1 PCT/JP2014/002128 JP2014002128W WO2014174797A1 WO 2014174797 A1 WO2014174797 A1 WO 2014174797A1 JP 2014002128 W JP2014002128 W JP 2014002128W WO 2014174797 A1 WO2014174797 A1 WO 2014174797A1
Authority
WO
WIPO (PCT)
Prior art keywords
attribute
processing unit
rule
information
subject
Prior art date
Application number
PCT/JP2014/002128
Other languages
English (en)
French (fr)
Inventor
聡 中澤
善雄 石澤
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2015513525A priority Critical patent/JPWO2014174797A1/ja
Publication of WO2014174797A1 publication Critical patent/WO2014174797A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Definitions

  • the present invention relates to an information processing system and the like.
  • the monitoring system is a system aimed at improving security at stations and airports.
  • the monitoring system includes a sensor such as a camera or a microphone.
  • the monitoring system monitors an abnormal situation using the output of the sensor and the monitoring rule.
  • the monitoring rule is a conditional expression that determines, for example, what value the output of the sensor determines as an abnormal situation.
  • the monitoring rule is, for example, a conditional expression “if (an image in which a person places a baggage appears on the camera, and then a person does not approach the baggage for a certain period of time) then (alerts an alarm)”.
  • condition clause of such a monitoring rule is satisfied, the operator of the monitoring system interprets that an abnormal situation “having been left behind” has occurred.
  • Non-Patent Document 1 discloses an example of a monitoring system for monitoring that a bag is left behind in a public place.
  • Patent Document 1 discloses detecting an abnormal situation at a plurality of different locations. Patent Document 1 is set when monitoring a store that manages products using a POS (Point Of Sale System) sensor and when monitoring a store that manages products using an RFID (Radio Frequency IDentification) tag. Disclose that the monitoring rules to be different are different from each other.
  • POS Point Of Sale System
  • RFID Radio Frequency IDentification
  • Patent Document 2 discloses a system that determines whether or not a given situation is an abnormal situation by using a machine learning technique.
  • the system disclosed in Patent Document 2 accepts input of learning data.
  • the learning data is information in which information indicating a situation is associated with a label indicating whether or not the situation is an abnormal situation.
  • the technique disclosed in Patent Literature 2 determines whether or not a given situation is an abnormal situation using a machine learning technique based on input learning data.
  • Patent Document 3 discloses a technique for automatically generating a monitoring rule based on a database in which data on abnormal events is registered and a database in which data on normal events are registered.
  • Non-Patent Document 1 and Patent Document 1 it is necessary for the operator of the monitoring system to manually set the monitoring rules.
  • manually setting a large number of monitoring rules is an operation that requires a great number of man-hours for the operator of the monitoring system.
  • Patent Document 2 In order for the technique disclosed in Patent Document 2 to appropriately determine whether or not a given situation is an abnormal situation, it is necessary to input a large number of learning data. In the technique disclosed in Patent Document 2, it is necessary for a human to generate learning data manually. Generating a large amount of learning data manually is a cumbersome task for the operator of the monitoring system.
  • Patent Document 3 cannot generate a monitoring rule according to the environment to be monitored.
  • An object of the present invention is to assist the operator of the monitoring system to set a monitoring rule according to the environment to be monitored.
  • a first aspect of the present invention is a rule in which a generation unit that generates a processing unit including a subject or a main part from text information described with respect to a certain theme, and a rule that stores a rule for assigning an attribute to the processing unit
  • the attribute assignment unit that assigns an attribute to the processing unit based on the subject or main part included in the processing unit, and text mining the processing unit to which the same attribute is assigned
  • An extraction unit that extracts a feature for each attribute based on a result of the text mining, and the attribute is a role played by the subject or the main part in the theme, or the subject or the main part, It is an information processing system that is information representing the position of the theme.
  • a rule storage unit that stores a rule for assigning an attribute to a processing unit that is a unit of a sentence including a subject or a main part generated from text information described with respect to a certain theme, A processing unit including a subject or a main part is generated from text information by an accessible computer, and a rule storage unit storing a rule for assigning an attribute to the processing unit is referred to and included in the processing unit.
  • an attribute is given to the processing unit, text mining is performed for each processing unit to which the same attribute is given, and a feature for each attribute is extracted based on the result of the text mining
  • the attribute is information representing the role of the subject or the main part in the theme or the position of the subject or the main part regarding the theme.
  • a rule storage unit that stores a rule for assigning an attribute to a processing unit that is a unit of a sentence including a subject or a main part generated from text information described with respect to a certain theme
  • An accessible computer refers to a rule storage unit that stores a process for generating a processing unit including a subject or main part from text information and a rule for assigning an attribute to the processing unit.
  • the process of assigning an attribute to the processing unit and the text mining for each processing unit to which the same attribute is assigned, and for each attribute based on the result of the text mining A process of extracting features, wherein the attribute is a role played by the subject or the main part in the theme, or before the subject or the main part. Is information that represents a position on the subject, is a program.
  • the object of the present invention is also achieved by a computer-readable storage medium storing the above program.
  • the operator of the monitoring system can support the operation of setting the monitoring rule according to the environment to be monitored.
  • the monitoring system must judge abnormal situations without omission.
  • the monitoring system must not erroneously determine a normal situation that is not an abnormal situation as an abnormal situation.
  • it is necessary to set an appropriate monitoring rule in the monitoring system. For this reason, the operator is required to have expert knowledge about the characteristics of the abnormal situation.
  • the present inventor considered extracting characteristics of an abnormal situation from a text describing the abnormal situation.
  • a known text mining device or the like is used for feature extraction.
  • the text describing the abnormal situation is, for example, a report describing criminal activity or a news article about criminal activity.
  • the operator uses the characteristics of the abnormal situation extracted from the text mining device for setting the monitoring rule. This will be described using a specific example. Assume that a text mining device extracts features of a snatching case from a news article about the purse-snatching case.
  • the news article about snatching has the following contents, for example.
  • the text mining device extracts, for example, the following features from the news article. ⁇ Characteristics representing time: “around 21:30”, “around evening”, ⁇ Characteristics representing the location: “In Tokyo”, “At the intersection of 2-chome”, ⁇ Characteristics representing the parties involved: “Riding a bicycle”, “Woman”, “Men”, “Aged”.
  • the characteristics of “around 21:30”, “around evening”, “in Tokyo” and “at the intersection of 2-chome” are appropriate as information indicating characteristics of time zones and places where snatching is likely to occur.
  • the characteristics of “riding a bicycle”, “female”, “male”, and “aged” are not appropriate as characteristics of persons involved in the snatching case. This is because these characteristics include both the characteristics of the perpetrator and victim of the snatching case. It is not possible to properly grasp the characteristics of the persons involved in the snatching case from the set of characteristics in which the characteristics of the perpetrator and the characteristics of the victim are mixed.
  • the known text mining device cannot appropriately extract the characteristics of the abnormal situation from the text describing the abnormal situation.
  • the present inventor has found that the characteristics of the abnormal situation should be extracted for each “attribute” of the parties involved.
  • “Attribute” is a term that represents a function or role that a person concerned in an abnormal situation plays in the abnormal situation.
  • the “attribute” is a term representing the position of the person concerned in the abnormal situation in the abnormal situation.
  • the related person is, for example, a person, an organization, a group, an animal, or a machine computer.
  • FIG. 1 is a block diagram showing a configuration of an information processing system 1000 according to the first embodiment of the present invention.
  • the information processing system 1000 according to the first embodiment includes an input reception unit 110, a generation unit 120, an attribute assignment unit 130, an extraction unit 140, and a rule storage unit 210.
  • the information processing system 1000 is operated by, for example, an operator of the monitoring system.
  • the input reception unit 110 receives input of a plurality of text information.
  • the text information is, for example, a document explaining or reporting what kind of abnormal situation has occurred in what kind of environment.
  • the text information is, for example, a report describing criminal activity or a news article about criminal activity. It is desirable that the input receiving unit 110 receives input of text information having the same type of abnormal situation described. Alternatively, it is desirable that the input receiving unit 110 receives an input of text information describing an abnormal situation that occurred at a specific place or at a specific time. For example, when the input reception unit 110 receives input of text information describing a snatching event that has occurred in the last three months, the information processing system 1000 extracts the characteristics of the snatching event that has occurred in the last three months. To do.
  • Text information 1 A snatching incident occurred in Tokyo at around 21:30 last night. The victim's woman was riding a bicycle, and her handbag was stolen in the front basket. The criminal man was riding a bicycle and ran away. The criminal was an elderly man.
  • Text information 2 At the intersection of 2-chome in the evening, there was an incident where a man riding a bicycle and snatching the victim's wallet. The victim was an elderly woman.
  • the generation unit 120 generates a processing unit from the text information.
  • the processing unit represents a unit of a character string to be processed when the extraction unit 140 described later executes text mining.
  • the processing unit is a sentence unit including a subject or a main part.
  • the processing unit includes a description of an action performed by a party related to the abnormal situation, a description of characteristics of the party related to the abnormal situation, and the like.
  • the processing unit is, for example, “section (clause in English)”.
  • a “section” is an element comprising a combination of a subject and a predicate verb having a unique tense among elements constituting a part of a sentence.
  • the generation unit 120 generates a processing unit from text information using known natural language processing techniques such as morphological analysis, syntax analysis, and dependency analysis. In the generation unit 120, information on how to generate a processing unit is determined in advance.
  • the generation unit 120 may generate a processing unit by dividing the text information into predicate units. When generating the processing unit, the generation unit 120 may supplement the subject with each predicate so that the subject for the predicate is not unknown.
  • the generation unit 120 generates the following processing unit from the second sentence and the third sentence of the “text information 1”.
  • the processing unit shown below includes a character string to be subjected to text mining and information for identifying the text information of the generation source.
  • Processing unit 1 “Victim's woman is riding a bicycle” ⁇ Generator “Text information 1”
  • Processing unit 2 “Victim's woman was taken away from the handbag that was in the front basket” ⁇ Source “Text information 1”
  • Processing unit 3 “The criminal man is riding a bicycle” ⁇ Generator “Text information 1”
  • Processing unit 4 “The criminal man fleeed as it is” ⁇ Source “Text information 1”
  • Processing unit 5 “The criminal was an elderly man” ⁇ Generator “Text information 1”,
  • the generation unit 120 generates the following processing units from the first sentence and the second sentence of the “text information 2”.
  • Processing unit 6 “A man rides a bicycle” ⁇ Generator “Text information 2” Processing unit 7: “Man picks up victim's wallet” ⁇ Source “Text information 2”, Processing unit 8: “The victim was an elderly woman” ⁇ Generator “Text information 2”.
  • the rule storage unit 210 stores a rule for assigning an attribute to a processing unit.
  • FIG. 2 is a diagram illustrating an example of rules stored in the rule storage unit 210.
  • the rule is information including an attribute to be assigned to the processing unit and a condition for determining whether or not the attribute should be given to the processing unit.
  • the examples shown below are specific examples of rules.
  • Rules 1 to 4 are rules for assigning attributes to processing units generated from text information describing criminal acts.
  • a predicate or predicate corresponding to a subject or main part included in a processing unit includes an active verb that represents an action that tends to be performed before or after the criminal act, the perpetrator's Assign attributes.
  • Examples of verbs representing actions that are likely to be executed before and after criminal acts are “look-ahead”, “run away”, “run away”, and the like.
  • Rule 4 When the subject or main part included in the processing unit includes a word representing the meaning close to “victim”, the attribute “victim” is assigned to the processing unit. Examples of words representing meanings close to “victim” are “victim”, “victim”, “casualty”.
  • a predicate or predicate corresponding to a subject or main part included in a processing unit includes a passive verb that represents an action that tends to be executed before or after the criminal act, Assign attributes.
  • the rule storage unit 210 stores a list of “words representing close meanings” in advance for each rule as described above. Further, “words representing close meanings” do not necessarily have synonyms or synonyms. For example, “perpetrator” and “criminal” are generally not synonymous with each other. However, when classifying the attributes of persons involved in criminal cases into “perpetrators” and “victims”, “perpetrators” and “criminals” may be regarded as “words representing close meaning”. .
  • the attribute assigning unit 130 focuses on a subject or a main part included in a processing unit, or a predicate or a predicate corresponding to the subject or the main part.
  • the attribute assigning unit 130 refers to the rule storage unit 210 and assigns an attribute to the processing unit based on the subject, the main part, the predicate, and the predicate included in the processing unit of interest.
  • the attribute assigning unit 130 assigns the attribute “perpetrator” to the processing units 3, 4, and 5 based on the rule 1.
  • the attribute assigning unit 130 assigns the attribute “perpetrator” to the processing unit 7 based on the rule 2.
  • the attribute assigning unit 130 assigns the “victim” attribute to the processing units 1, 2, and 8 based on the rule 4.
  • the attribute assigning unit 130 may pay attention to the subject or the main part included in the processing unit to which the attribute has been assigned, and may assign the attribute to another processing unit having the same subject or the main part. For example, paying attention to the processing unit 7 “a man pulls a victim's wallet” generated from the above-described text information example 2, the attribute “perpetrator” is given. Therefore, the attribute assigning unit 130 also assigns the attribute “perpetrator” to the processing unit 6 “Man riding a bicycle” generated from the same text information example 2 and having the same subject as the processing unit 7.
  • the attribute assigning unit 130 may assign attributes such as “others” and “determination impossible” to a processing unit to which attributes cannot be assigned.
  • Processing unit 1 attribute “victim” ⁇ “victim's woman is riding a bicycle” ⁇ generator “text information 1”
  • Processing Unit 2 Attribute “Victim” ⁇ “Victim's woman has been taken away from the handbag in the previous basket” ⁇ Source “Text Information 1”
  • Processing unit 3 attribute “perpetrator” ⁇ “criminal man is riding a bicycle” ⁇ source “text information 1”
  • Processing unit 4 Attribute “perpetrator” ⁇ “criminal man fleeed as it is” ⁇ source “text information 1”
  • Processing unit 5 attribute “perpetrator” ⁇ “criminal was an elderly man” ⁇ source “text information 1”
  • Processing unit 6 attribute “perpetrator” ⁇ “man rides a bicycle” ⁇ source “text information 2”
  • Processing unit 7 attribute “perpetrator” ⁇ “man pulls victim's wallet” ⁇ generation source “text information 2”
  • Processing unit 8 attribute “victim” ⁇ “victim” ⁇ “vic
  • the extraction unit 140 performs text mining for each processing unit to which the same attribute is assigned, and extracts features for each attribute.
  • the extraction unit 140 extracts features by using, for example, a known text mining technique. Focusing on the processing units 1 to 5 generated from the text information 1, the extraction unit 140 performs processing units 3 to 5 to which the attribute “perpetrator” is assigned and processing units to which the attribute “victim” is assigned. Text mining is performed for 1-2. As a result, the extraction unit 140 extracts the following features from the text information 1.
  • the extraction unit 140 when attention is paid to the processing units 6 to 8 generated from the text information 2, the extraction unit 140 has the processing units 6 to 7 to which the attribute “perpetrator” is assigned and the attribute “victim”. Text mining is performed on each processing unit 8. As a result, the extraction unit 140 extracts the following features from the text information 2.
  • the extraction unit 140 counts how many times the feature is extracted for each attribute.
  • the result of adding the two text mining results is as follows.
  • the feature “male” is a feature extracted from both text information 1 and text information 2. Therefore, the extraction unit 140 counts that “male” has been extracted twice as a feature of the “perpetrator”.
  • the feature “age” is also a feature extracted from both the text information 1 and the text information 2. However, the extraction unit 140 does not count that the feature of “aged” has been extracted twice. Even if the same feature is extracted a plurality of times across different attributes, the extraction unit 140 does not count that the feature is extracted a plurality of times.
  • the feature “aged” is a feature extracted once from the attribute “perpetrator” and once from the attribute “victim”. Therefore, the extraction unit 140 counts that the feature “aged” is extracted once from the attribute of the “perpetrator” and counts that it is extracted once from the attribute of the “victim”.
  • the extraction unit 140 may output the extracted features for each attribute as they are.
  • the extraction unit 140 may output the feature together with the attribute when the number of times the feature is extracted exceeds a predetermined threshold.
  • the extraction unit 140 may output the feature together with the attribute when the number of times the feature of interest is extracted is statistically significant compared to the number of times the other feature is extracted. Good.
  • the extraction unit 140 For example, if the extraction unit 140 is set to “output features extracted twice or more”, the extraction unit 140 outputs the following information.
  • FIG. 3 is a hardware configuration diagram of the information processing system 1000 shown in FIG. As illustrated in FIG. 3, the information processing system 1000 includes a CPU (Central Processing Unit) 10, a storage device 20, a communication interface 30, an input device 40, and an output device 50.
  • a CPU Central Processing Unit
  • the functions of the information processing system 1000 are realized, for example, when the CPU 10 executes a computer program (software program, hereinafter simply referred to as “program”) read to the storage device 20. In execution, the CPU 10 appropriately controls the communication interface 30, the input device 40, and the output device 50. Communication executed by the information processing system 1000 is realized by an application program controlling the communication interface 30 using a function provided by an OS (Operating System), for example.
  • the input device 40 is, for example, a keyboard, a mouse, or a touch panel.
  • the output device 50 is a display, for example.
  • the present invention which is described by taking this embodiment and each embodiment described later as an example, may be configured by a non-volatile storage medium 70 such as a compact disk in which such a program is stored.
  • the program stored in the storage medium 70 is read by the drive device 60, for example.
  • the information processing system 1000 may be configured by connecting two or more physically separated devices in a wired or wireless manner.
  • FIG. 4 is a flowchart for explaining the operation of the information processing system 1000 according to the first embodiment.
  • the input receiving unit 110 receives input of text information (S101).
  • the generation unit 120 generates a processing unit, which is a unit for executing text mining, from the text information received by the input reception unit 110 (S102).
  • the attribute assigning unit 130 refers to the rule storage unit 210 and assigns an attribute to the processing unit generated by the generating unit 120 (S103).
  • the extraction unit 140 performs text mining for each piece of processing information to which the same attribute is assigned, and extracts features for each attribute (S104).
  • the effect of the information processing system 1000 according to the first embodiment will be described.
  • the information processing system 1000 according to the first embodiment can appropriately extract the characteristics of the parties involved in the abnormal situation from the text information describing the abnormal situation.
  • the reason is that the extraction unit 140 extracts features of abnormal situations by distinguishing each attribute.
  • the operator of the monitoring system can use the information output from the information processing system 1000 for the work of setting and verifying the monitoring rule. That is, the information processing system 1000 can assist the operator in setting the monitoring rule.
  • the operator can grasp the characteristics of the snatching event as follows by confirming the information output by the extraction unit 140.
  • the operator can create, for example, the following monitoring rules using the information output by the extraction unit 140.
  • This monitoring rule is appropriate for efficiently detecting the snatching incident described in the text information 1 and the text information 2.
  • the information processing system 1000 can output a condition useful for detecting the abnormal situation from the case of the abnormal situation described in the text.
  • the generation unit 120 may exclude expressions that are not directly related to the abnormal situation (for example, “I will tell you the news”).
  • the attribute assigning unit 130 may assign an attribute to the processing technique using a machine learning technique.
  • the rule storage unit 210 stores machine learning learning data.
  • the attribute assigning unit 130 performs a text matching process on the character string included in the processing unit and the word, the phrase, or the combination of the word and the phrase included in the rule.
  • the attribute assigning unit 130 may assign an attribute associated with the rule to the processing unit based on the result of the text matching process.
  • Attribute may be, for example, “single offender” and “two-person offender”.
  • the attributes may be, for example, “executive offender” and “cooker”.
  • Attributes are not limited to categorizing parties involved in abnormal situations. For example, there may be attributes such as “escape means” and “crime tools”.
  • a rule for determining whether or not to give the attribute of “escape means” to a certain processing unit is, for example, the following rule.
  • a rule for determining whether or not to give the attribute of “criminal tool” to a certain processing unit is, for example, the following rule.
  • the rule can be expressed more generally as follows.
  • Rules are information that associates predetermined verbs with attributes.
  • the attribute assigning unit 130 when the predicate or predicate corresponding to the main part or the subject included in the processing unit includes the verb included in the rule, the attribute associated with the verb as the processing unit. Give.
  • Rules are information that associates predetermined verbs with attributes.
  • the attribute assigning unit 130 when the predicate or predicate corresponding to the main part or the subject included in the processing unit includes the verb included in the rule, the attribute associated with the verb as the processing unit. Give.
  • the rule is information that associates a predetermined verb and a voice of the verb with an attribute.
  • the attribute assigning unit 130 includes a main part included in the processing unit or a predicate corresponding to the subject or a predicate including a verb included in the rule, and the state of the verb matches the state included in the rule. If so, the attribute associated with the verb is assigned to the processing unit.
  • the rule is information that associates a predetermined word, a predetermined phrase, or a combination of a predetermined word and phrase with an attribute.
  • the attribute assigning unit 130 performs a text matching process on a character string included in the processing unit and a word, a phrase, or a combination of a word and a phrase constituting the rule.
  • the attribute assigning unit 130 assigns an attribute associated with the rule to the processing unit based on the result of the text matching process.
  • FIG. 5 is a block diagram illustrating a configuration of an information processing system 2000 according to the second embodiment. Components that are substantially the same as those shown in FIG. As illustrated in FIG. 5, the information processing system 2000 according to the second embodiment further includes a monitoring rule generation unit 150.
  • the monitoring rule generation unit 150 generates a monitoring rule for detecting the abnormal situation based on the characteristic of the abnormal situation output by the extraction unit 140.
  • a template for generating a monitoring rule may be set in advance.
  • the monitoring rule generation unit 150 generates a monitoring rule expressed in a format that can be read by the monitoring system, using a template, based on the characteristics of the abnormal situation output by the extraction unit 140.
  • the effect of the information processing system 2000 according to the second embodiment will be described.
  • the information processing system 2000 according to the second embodiment can automatically generate a monitoring rule from text information describing an abnormal situation. Therefore, the information processing system 2000 according to the second embodiment can reduce the burden on the operator who sets the monitoring rule.
  • FIG. 6 is a block diagram illustrating a configuration of an information processing system 3000 according to the third embodiment. Components that are substantially the same as those shown in FIG. As illustrated in FIG. 6, the information processing system 2000 according to the third embodiment includes a generation unit 120, an attribute assignment unit 130, and an extraction unit 140.
  • the generation unit 120 generates a processing unit that is a unit including a subject or a main part from text information described for a certain theme.
  • the attribute assigning unit 130 refers to the rule storage unit 210 that stores a rule for assigning an attribute to the processing unit, and assigns the attribute to the processing unit based on the subject or main part included in the processing unit.
  • the rule storage unit 210 may be mounted on the same device as the attribute assigning unit 130, or may be connected to a device on which the attribute assigning unit 130 is installed via a communication network.
  • the extraction unit 140 performs text mining for each processing unit to which the same attribute is assigned, and extracts features for each attribute based on the result of the text mining.
  • the attribute is information representing the role of the subject or the main part in the theme or the position of the subject or the main part regarding the theme.
  • the operator of the monitoring system can support the work of setting the monitoring rule.
  • FIG. 7 shows another specific example of the text information received by the input receiving unit 110.
  • a specific example of the text information shown in FIG. 7 is as follows.
  • Text information 3 The man took a bicycle on the wide side of the road, approached from behind, took a woman's bag on the sidewalk, and escaped. The woman who was damaged was in her 70s and was not injured.
  • Text information 4 This Asian man used a wide knife-like object to tear the traveler's bag, extracted the contents from it, and escaped. The Asian man is seen in his late 60s and 70s, and the police are currently investigating more detailed eyewitness testimony.
  • Text information 5 An incident occurred in which a person on a bicycle took a passer's baggage and ran away. The victim was a 70-year-old man living in the neighborhood who suffered a minor injury for about a week due to a fall when he took his baggage. According to witnesses, the runaway person wears a hat and mask, and the gender and age are unknown.
  • FIG. 8 is a diagram showing information obtained by assigning the attribute of the perpetrator or the victim to the processing unit generated from the text information shown in FIG.
  • the following processing units are generated from the text information 3, for example, and the following attributes are given to the generated processing units, for example.
  • the following processing units are generated from the text information 4, for example, and the following attributes are given to the generated processing units, for example.
  • the following processing units are generated from the text information 5, and the following attributes are given to the generated processing units, for example.
  • the following processing units are generated from the text information 6, and the following attributes are given to the generated processing units, for example.
  • FIG. 9 is a diagram showing another specific example of the rules stored in the rule storage unit 210.
  • Rules 7 to 11 shown in FIG. 9 are rules for assigning an attribute to a processing unit generated from text information describing a demo act.
  • Rule 7 When the subject or the main part included in the processing unit includes a word representing a meaning close to “participant”, the attribute of “participant” is given to the processing unit.
  • a word representing a meaning close to “participant” are “participant”, “participant”, “organizer”, and the like.
  • Rule 8 When a subject included in a processing unit or a predicate or predicate corresponding to the main unit includes a verb activity representing a demonstration action, an attribute of “participant” is given to the processing unit.
  • verbs representing a demonstration act are “participate”, “sue”, “appeal”, and the like.
  • Rule 10 When the subject or main part included in the processing unit includes a word representing the meaning close to “security officer”, the attribute “security officer” is assigned to the processing unit.
  • words representing a meaning close to “security officer” are “security officer”, “security officer”, “police officer”, “riot police”, and the like.
  • Rule 11 If a predicate or predicate corresponding to a subject or main part included in a processing unit is an active verb of a security action, the attribute “security officer” is assigned to the processing unit.
  • verbs representing a security action include “guard”, “protect security”, and “organize”.
  • the present invention can be used to assist the operator of the monitoring system to set the monitoring rules.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

監視システムのオペレータが監視ルールを設定する作業を支援する。 情報処理システムは、あるテーマについて記載されたテキスト情報から、主語または主部を含む処理単位を生成する生成部と、前記処理単位に属性を付与するための規則が格納された規則記憶部を参照し、前記処理単位に含まれる主語または主部に基づいて前記処理単位に属性を付与する属性付与部と、同一の属性が付与された前記処理単位に対してテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出する抽出部と、を備える。

Description

情報処理システム、情報処理方法および記憶媒体
 本発明は、情報処理システムなどに関する。
 監視システムは、駅や空港などにおけるセキュリティ向上を目的としたシステムである。監視システムは、カメラやマイクなどのセンサを備える。監視システムは、センサの出力と監視ルールとを用いて異常事態を監視する。監視ルールは、例えば、センサの出力がどのような値になった時に異常事態と判断するかという条件式である。
 監視ルールは例えば、「if(人が荷物を置く画像がカメラに写りその後一定時間その荷物に人が近づかない)then(警報を出す)」という条件式である。このような監視ルールの条件節が満たされた場合、「鞄が置き去りにされた」という異常事態が発生していると監視システムのオペレータは解釈する。
 非特許文献1は、公共の場所に鞄が置き去りにされたことを監視するための監視システムの一例を開示する。
 特許文献1は、複数の異なる場所で異常事態を検出することを開示する。特許文献1は、POS(Point Of Sale system)センサを用いて商品管理を行う店舗を監視する場合と、RFID(Radio Frequency IDentification)タグを用いて商品管理を行う店舗を監視する場合とで、設定すべき監視ルールが互いに異なることを開示する。
 特許文献2は、与えられた状況が異常事態であるか否かを機械学習の手法を用いて判定するシステムを開示する。特許文献2が開示するシステムは、学習データの入力を受け付ける。学習データは、状況を表す情報に、その状況が異常事態であるか否かを示すラベルを関連付けた情報である。特許文献2が開示する技術は、入力された学習データに基づき、与えられた状況が異常事態であるか否かを機械学習の手法を用いて判定する。
 特許文献3は、異常事象に関するデータが登録されたデータベースと、正常事象に関するデータが登録されたデータベースとに基づいて、監視ルールを自動的に生成する技術を開示する。
Detecting Abandoned Luggage Items in a Public Space Kevin Smith, Pedro Quelhas, and Daniel Gatica-Perez Proceedings of the 9th IEEE International Workshop on Performance Evaluation in Tracking and Surveillance (PETS '06), June 2006, 75-82
特表2009-539182号公報 米国特許第8131012号明細書 特開2013-003929号公報
 非特許文献1および特許文献1が開示する技術においては、監視システムのオペレータが監視ルールを人手で設定する必要がある。しかし、多数の監視ルールを人手で設定することは、監視システムのオペレータにとって多大な工数が必要な作業である。また、監視システムについて専門知識の無いオペレータにとって、適切な監視ルールを設定することは困難な作業である。
 特許文献2が開示する技術が、与えられた状況が異常事態であるか否かを適切に判定するためには、多数の学習データの入力が必要となる。特許文献2が開示する技術においては、人間が学習データを人手で生成する必要がある。多数の学習データを人手で生成することは、監視システムのオペレータにとって煩雑な作業である。
 特許文献3が開示する技術では、監視対象となる環境に応じた監視ルールを生成することができない。
 本発明は、監視システムのオペレータが、監視対象となる環境に応じた監視ルールを設定する作業を支援することを一つの目的とする。
 本発明の第1の側面は、あるテーマについて記載されたテキスト情報から、主語または主部を含む処理単位を生成する生成部と、前記処理単位に属性を付与するための規則が格納された規則記憶部を参照し、前記処理単位に含まれる主語または主部に基づいて前記処理単位に属性を付与する属性付与部と、同一の属性が付与された前記処理単位に対してテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出する抽出部と、を備え、前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、情報処理システムである。
 本発明の第2の側面は、あるテーマについて記載されたテキスト情報から生成された主語または主部を含む文の単位である処理単位に属性を付与するための規則を記憶する規則記憶部に、アクセス可能なコンピュータによって、テキスト情報から、主語または主部を含む処理単位を生成し、前記処理単位に属性を付与するための規則が格納された規則記憶部を参照し、前記処理単位に含まれる主語または主部に基づいて、前記処理単位に属性を付与し、同一の属性が付与された前記処理単位ごとにテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出し、前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、情報処理方法である。
 本発明の第3の側面は、あるテーマについて記載されたテキスト情報から生成された主語または主部を含む文の単位である処理単位に属性を付与するための規則を記憶する規則記憶部に、アクセス可能なコンピュータに、テキスト情報から、主語または主部を含む処理単位を生成する処理と、前記処理単位に属性を付与するための規則が格納された規則記憶部を参照し、前記処理単位に含まれる主語または主部に基づいて、前記処理単位に属性を付与する処理と、同一の属性が付与された前記処理単位ごとにテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出する処理と、を実行させ、前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、プログラムである。
 また、本発明の目的は、上記のプログラムが格納されたコンピュータ読み取り可能な記憶媒体によっても達成される。
 本発明によれば、監視システムのオペレータが、監視対象となる環境に応じた監視ルールを設定する作業を支援することができる。
本発明の第1の実施形態にかかる情報処理システム1000の構成を示すブロック図である。 第1の実施形態にかかる規則記憶部210が記憶する情報の一例を示す図である。 第1の実施形態にかかる情報処理システム1000を実現可能なハードウェア構成の一例を示す図である。 第1の実施形態にかかる情報処理システム1000の動作を示すフローチャートである。 本発明の第2の実施形態にかかる情報処理システム2000の構成を示すブロック図である。 本発明の第3の実施形態にかかる情報処理システム3000の構成を示すブロック図である。 本発明の実施例にかかる、テキスト情報の例を示す図である。 本発明の実施例にかかる、属性が付与された処理単位の例を示す図である。 本発明の実施例にかかる、規則記憶部210が記憶する情報の一例を示す図である。
 一般に、監視システムは、異常事態を漏れなく判定しなければならない。監視システムは、異常事態ではない通常の事態を異常事態として誤判定してもいけない。監視システムが異常事態を効率的に判定するためには、監視システムに適切な監視ルールが設定される必要がある。このため、オペレータには、異常事態の特徴について専門知識を有することが求められる。
 本発明者は、異常事態の特徴を、異常事態について記載されたテキストから抽出することを考えた。特徴の抽出には、既知のテキストマイニング装置等が用いられる。異常事態について記載されたテキストは、例えば、犯罪行為について記載された報告書や、犯罪行為についてのニュース記事である。オペレータは、テキストマイニング装置から抽出された異常事態の特徴を、監視ルールの設定に利用する。具体例を用いて説明する。テキストマイニング装置が、ひったくり(purse-snatching)事件に関するニュース記事から、ひったくり事件の特徴を抽出する場合を想定する。ひったくりに関するニュース記事は、例えば下記のような内容である。
 ニュース記事の例1:昨晩21時30分頃、東京都内でひったくり事件が発生した。被害者の女性は自転車に乗っており、前カゴにいれておいたハンドバッグを奪取された。犯人の男は自転車に乗っておりそのまま逃走した。犯人は高齢の男だった。
 ニュース記事の例2:夕方頃2丁目の交差点において、男が自転車に乗って、被害者の財布をひったくる事件が発生しました。被害者は高齢の女性でした。
 テキストマイニング装置は、上記ニュース記事から、例えば以下のような特徴を抽出する。
・時間を表す特徴:「21時30分頃」、「夕方頃」、
・場所を表す特徴:「東京都内で」、「2丁目の交差点において」、
・関係者を表す特徴:「自転車に乗って」、「女性」、「男」、「高齢」。
 ここで、「21時30分頃」、「夕方頃」、「東京都内で」および「2丁目の交差点において」という特徴は、ひったくりが起きやすい時間帯や場所の特徴を示す情報として適切である。しかし、「自転車に乗って」、「女性」、「男」および「高齢」という特徴は、ひったくり事件の関係者の特徴として適切ではない。なぜなら、これらの特徴は、ひったくり事件の加害者の特徴と被害者の特徴との両方を含むからである。加害者の特徴と被害者の特徴とが混在している特徴の集合からは、ひったくり事件の関係者の特徴を適切に把握することはできない。このように、既知のテキストマイニング装置は、異常事態について記載されたテキストから、異常事態の特徴を適切に抽出することができない。
 以下、本発明の実施形態について、図面を参照して詳細に説明する。
 <第1の実施形態>
 異常事態の関係者の特徴を適切に抽出するために、本発明者は、異常事態の特徴を関係者の「属性」ごとにそれぞれ抽出すべきことを見出した。「属性」とは、異常事態の関係者が、当該異常事態において果たす働きや役割を表す用語である。または「属性」とは、異常事態の関係者の、当該異常事態における立場を表す用語である。関係者は、例えば、人、組織、団体、動物または機械コンピュータなどである。
 図1は、本発明の第1の実施形態にかかる情報処理システム1000の構成を示すブロック図である。図1に示すように、第1の実施形態にかかる情報処理システム1000は、入力受付部110、生成部120、属性付与部130、抽出部140および規則記憶部210を備える。情報処理システム1000は、例えば、監視システムのオペレータにより操作される。
 入力受付部110は、複数のテキスト情報の入力を受け付ける。テキスト情報は、例えば、どのような環境においてどのような異常な状況が発生したかを説明または報告する文書である。テキスト情報は、例えば、犯罪行為について記載された報告書や犯罪行為についてのニュース記事である。入力受付部110は、記載されている異常事態の種類が共通するテキスト情報の入力を受け付けることが望ましい。または、入力受付部110は、特定の場所または特定の時間に起こった異常事態が記載されているテキスト情報の入力を受け付けることが望ましい。例えば、入力受付部110が、最近三ヶ月の間に発生したひったくり事件について記載されたテキスト情報の入力を受け付けると、情報処理システム1000は、最近三ヶ月の間に発生したひったくり事件の特徴を抽出する。
 入力受付部110が受け付けるテキスト情報の例を、再度下記に示す。
 テキスト情報1:昨晩21時30分頃に、東京都内でひったくり事件が発生した。被害者の女性は自転車に乗っており、前カゴにいれておいたハンドバッグを奪取された。犯人の男は自転車に乗っておりそのまま逃走した。犯人は高齢の男だった。
 テキスト情報2:夕方頃2丁目の交差点において、男が自転車に乗って、被害者の財布をひったくる事件が発生しました。被害者は高齢の女性でした。
 生成部120は、テキスト情報から処理単位を生成する。係る処理単位は、後述する抽出部140がテキストマイニングを実行する際の、処理対象である文字列の単位を表す。また、処理単位は、主語または主部を含むような文章の単位である。処理単位は、異常事態の関係者が行った行為の記述や、異常事態の関係者の特徴の記述などを含む。処理単位は、例えば、「節(英語ではclause)」である。「節」は、文の一部を構成する要素のうち、主語と独自の時制を持つ述語動詞との組み合わせを備える要素である。
 生成部120は、形態素解析、構文解析、係り受け解析などの既知の自然言語処理技術を用いて、テキスト情報から処理単位を生成する。生成部120には、どのように処理単位を生成するかの情報があらかじめ定められる。生成部120は、テキスト情報を述語単位で区切ることにより、処理単位を生成してもよい。生成部120は、処理単位を生成する際に、述語に対する主語が不明にならないよう、各述語に主語を補ってもよい。
 生成部120は、例えば、上記「テキスト情報1」の第2文と第3文とから、以下のような処理単位を生成する。下記に示す処理単位は、テキストマイニングの対象となる文字列と、生成元のテキスト情報を識別する情報とを含む。
処理単位1:「被害者の女性は自転車に乗っており」→生成元「テキスト情報1」、
処理単位2:「被害者の女性は前カゴにいれておいたハンドバッグを奪取された」→生成元「テキスト情報1」、
処理単位3:「犯人の男は自転車に乗っており」→生成元「テキスト情報1」、
処理単位4:「犯人の男はそのまま逃走した」→生成元「テキスト情報1」、
処理単位5:「犯人は高齢の男だった」→生成元「テキスト情報1」、
 生成部120は、例えば、上記「テキスト情報2」の第1文と第2文とから、以下の処理単位を生成する。
処理単位6:「男が自転車に乗って」→生成元「テキスト情報2」、
処理単位7:「男が被害者の財布をひったくる」→生成元「テキスト情報2」、
処理単位8:「被害者は高齢の女性でした」→生成元「テキスト情報2」。
 規則記憶部210は、処理単位に属性を付与するための規則を記憶する。図2は、規則記憶部210が記憶する規則の一例を示す図である。規則は、処理単位に付与する属性と、処理単位に当該属性を付与すべきか否かを判定するための条件とを含む情報である。下記に示す例は、規則の具体例である。規則1から規則4までは、犯罪行為について記載されたテキスト情報から生成された処理単位に、属性を付与するための規則である。
 規則1:処理単位に含まれる主語または主部が「加害者」に近い意味を表す言葉を含む場合、当該処理単位に「加害者」の属性を付与する。ここで、「加害者」に近い意味を表す言葉の例としては、「加害者」、「犯人」、「犯罪者」などである。
 規則2:処理単位に含まれる主語または主部に対応する述語または述部が、暴力を表す動詞または犯罪を表す動詞の能動態を含む場合、当該処理単位に「加害者」の属性を付与する。ここで、暴力を表す動詞または犯罪を表す動詞の例としては、「殺す」、「殴る」、「刺す」、「壊す」、「盗む」、「奪う」などである。
 規則3:処理単位に含まれる主語または主部に対応する述語または述部が、犯罪行為の前後で実行する傾向が高い行為を表す動詞の能動態を含む場合、当該処理単位に「加害者」の属性を付与する。犯罪行為の前後で実行する傾向が高い行為を表す動詞の例としては、「下見する」、「逃げる」、「逃走する」などである。
 規則4:処理単位に含まれる主語または主部が「被害者」に近い意味を表す言葉を含む場合、当該処理単位に「被害者」の属性を付与する。「被害者」に近い意味を表す言葉の例としては、「被害者」、「犠牲者」、「死傷者」などである。
 規則5:処理単位に含まれる主語または主部に対応する述語または述部が、暴力を表す動詞または犯罪を表す動詞の受動態を含む場合、当該処理単位に「被害者」の属性を付与する。
 規則6:処理単位に含まれる主語または主部に対応する述語または述部が、犯罪行為の前後で実行する傾向が高い行為を表す動詞の受動態を含む場合、当該処理単位に「被害者」の属性を付与する。
 規則記憶部210は、上記のような規則ごとに、あらかじめ「近い意味を表す言葉」のリストを記憶している。また、「近い意味を表す言葉」同士は、必ずしも同義語または類義語の関係を有している必要はない。例えば、「加害者」と「犯罪者」とは、一般的には互いに類義語の関係には無い。しかし、犯罪事件における関係者の属性を「加害者」と「被害者」とに分類する際には、「加害者」と「犯罪者」とは「近い意味を表す言葉」とみなしてもよい。
 図1の説明に戻る。属性付与部130は、処理単位に含まれる主語や主部、または、主語や主部に対応する述語や述部に着目する。属性付与部130は、規則記憶部210を参照して、注目する処理単位に含まれる主語や主部、述語や述部に基づいて、当該処理単位に属性を付与する。
 上述した処理単位1~8の例では、属性付与部130は、規則1に基づき、処理単位3、4および5に「加害者」の属性を付与する。属性付与部130は、規則2に基づき、処理単位7に「加害者」の属性を付与する。属性付与部130は、規則4に基づき、処理単位1、2および8に「被害者」の属性を付与する。
 属性付与部130は、属性を付与済みの処理単位に含まれる主語または主部に着目し、同一の主語または主部を有する他の処理単位にも、当該属性を付与してもよい。例えば、前述したテキスト情報の例2から生成された処理単位7「男が被害者の財布をひったくる」に着目すると、「加害者」の属性が付与されている。よって属性付与部130は、同じテキスト情報の例2から生成され、処理単位7と同一の主語を持つ処理単位6「男が自転車に乗って」にも「加害者」の属性を付与する。属性付与部130は、属性を付与できない処理単位に対しては、「その他」や「判定不可」という属性を付与してもよい。
 属性が付与された処理単位の具体例を下記に示す。
処理単位1:属性「被害者」→「被害者の女性は自転車に乗っており」→生成元「テキスト情報1」、
処理単位2:属性「被害者」→「被害者の女性は前カゴにいれておいたハンドバッグを奪取された」→生成元「テキスト情報1」、
処理単位3:属性「加害者」→「犯人の男は自転車に乗っており」→生成元「テキスト情報1」、
処理単位4:属性「加害者」→「犯人の男はそのまま逃走した」→生成元「テキスト情報1」、
処理単位5:属性「加害者」→「犯人は高齢の男だった」→生成元「テキスト情報1」、
処理単位6:属性「加害者」→「男が自転車に乗って」→生成元「テキスト情報2」、
処理単位7:属性「加害者」→「男が被害者の財布をひったくる」→生成元「テキスト情報2」、
処理単位8:属性「被害者」→「被害者は高齢の女性でした」→生成元「テキスト情報2」。
 抽出部140は、同一の属性が付与された処理単位ごとにテキストマイニングを行い、属性ごとの特徴を抽出する。抽出部140は、例えば既知のテキストマイニング技術を用いることにより特徴を抽出する。テキスト情報1から生成された処理単位1~5に着目すると、抽出部140は、「加害者」の属性が付与された処理単位3~5と、「被害者」の属性が付与された処理単位1~2と、に対してそれぞれテキストマイニングを行う。その結果、抽出部140は、テキスト情報1から下記のような特徴を抽出する。
 [テキスト情報1(処理単位1~5)に対するテキストマイニングの結果]
加害者の特徴:「男」、「自転車に乗って」、「高齢」、「そのまま逃走した」、
被害者の特徴:「女性」、「自転車に乗って」、「前カゴにいれておいたハンドバッグを奪取された」。
 同様に、テキスト情報2から生成された処理単位6~8に着目すると、抽出部140は、「加害者」の属性が付与された処理単位6~7と、「被害者」の属性が付与された処理単位8と、に対してそれぞれテキストマイニングを行う。その結果、抽出部140はテキスト情報2から下記のような特徴を抽出する。
 [テキスト情報2(処理単位5~7)に対するテキストマイニングの結果]
加害者の特徴:「男」、「自転車に乗って」、「被害者の財布をひったくる」、
被害者の特徴:「女性」、「歩道を歩いていた」、「被害者は高齢の女性でした」。
 抽出部140は、属性ごとに、特徴が何回抽出されたかをカウントする。上記2つのテキストマイニングの結果を足し合わせると、下記のようになる。
 [テキスト情報1および2(処理単位1~8)に対するテキストマイニング]
加害者の特徴:
「男」→抽出回数2回、
「自転車に乗って」→抽出回数2回、
「高齢」→抽出回数1回、
「そのまま逃走した」→抽出回数1回、
「被害者の財布をひったくる」→抽出回数1回。
 被害者の特徴:
「女性」→抽出回数2回、
「自転車に乗って」→抽出回数1回、
「前カゴにいれておいたハンドバッグを奪取された」→抽出回数1回、
「高齢」→抽出回数1回。
 「加害者」の特徴について、例えば「男」という特徴は、テキスト情報1とテキスト情報2との両方からそれぞれ抽出された特徴である。よって、抽出部140は、「加害者」の特徴として、「男」は2回抽出されたとカウントする。一方で「高齢」という特徴も、テキスト情報1とテキスト情報2との両方からそれぞれ抽出された特徴である。しかし、抽出部140は、「高齢」という特徴が2回抽出されたとはカウントしない。抽出部140は、異なる属性をまたいで同一の特徴が複数回抽出されたとしても、当該特徴が複数回抽出されたとはカウントしない。上記の具体例では、「高齢」という特徴は、「加害者」の属性から1回、「被害者」の属性から1回、それぞれ抽出された特徴である。よって、抽出部140は、「高齢」という特徴は、「加害者」の属性から1回抽出されたとカウントし、かつ、「被害者」の属性から1回抽出されたとカウントする。
 抽出部140は、抽出した属性ごとの特徴をそのまま出力してもよい。抽出部140は、特徴が抽出された回数が所定の閾値を超えた場合に、当該特徴を属性とともに出力してもよい。または、抽出部140は、注目する特徴が抽出された回数が、他の特徴が抽出した回数と比較して統計的に有意な偏りが見られた場合に、その特徴を属性とともに出力してもよい。
 例えば、抽出部140に、「2回以上抽出された特徴を出力する」という設定がなされていた場合、抽出部140は、以下のような情報を出力する。
 加害者の特徴:「男」、「自転車に乗って」、
 被害者の特徴:「女性」。
 図3は、図1に示した情報処理システム1000のハードウェア構成図である。図3に示すように、情報処理システム1000は、CPU(Central Processing Unit)10、記憶装置20および通信インターフェイス30、入力装置40および出力装置50を備える。
 情報処理システム1000の機能は、例えばCPU10が、記憶装置20に読み出されたコンピュータプログラム(ソフトウェアプログラム、以下単に「プログラム」と記載する)を実行することにより実現される。実行に際して、CPU10は、通信インターフェイス30、入力装置40および出力装置50を適宜制御する。情報処理システム1000が実行する通信は、例えばOS(Operating System)が提供する機能を使ってアプリケーションプログラムが通信インターフェイス30を制御することによって実現される。入力装置40は例えばキーボード、マウスまたはタッチパネルである。出力装置50は例えばディスプレイである。
 尚、本実施形態および後述する各実施形態を例として説明される本発明は、係るプログラムが格納されたコンパクトディスク等の不揮発性の記憶媒体70によって構成されてもよい。記憶媒体70が格納するプログラムは、例えばドライブ装置60により読み出される。
 情報処理システム1000は、2つ以上の物理的に分離した装置が有線または無線で接続されることによってされて構成されていてもよい。
 次に、図1に示す情報処理システム1000の動作を、図4を用いて説明する。図4は、第1の実施形態にかかる情報処理システム1000の動作を説明するフローチャートである。
 入力受付部110は、テキスト情報の入力を受け付ける(S101)。生成部120は、入力受付部110が受け付けたテキスト情報から、テキストマイニングを実行する単位である処理単位を生成する(S102)。属性付与部130は、規則記憶部210を参照して、生成部120が生成した処理単位に属性を付与する(S103)。抽出部140は、同一の属性が付与された処理情報ごとにテキストマイニングを行い、属性ごとの特徴を抽出する(S104)。
 第1実施形態にかかる情報処理システム1000の効果を説明する。第1の実施形態にかかる情報処理システム1000は、異常事態が記載されたテキスト情報から、その異常事態の関係者の特徴を適切に抽出することができる。その理由は、抽出部140が、属性ごとに区別して異常事態の特徴を抽出するからである。
 監視システムのオペレータは、監視ルールを設定・検証する作業に情報処理システム1000が出力する情報を利用することができる。すなわち、情報処理システム1000は、オペレータが監視ルールを設定する作業を支援することができる。
 上述したひったくり事件の具体例では、オペレータは、抽出部140が出力する情報を確認することで、ひったくり事件の特徴を以下のように把握することができる。
 加害者の特徴:「自転車に乗った男性」、
 被害者の特徴:「女性」。
 オペレータは、抽出部140が出力する情報を利用して、例えば下記のような監視ルールを作成することができる。
 監視ルール:「if(自転車に乗った男性が女性に接近した)then(自転車に乗った男性を録画する)」。
 この監視ルールは、テキスト情報1およびテキスト情報2に記載されたひったくり事件を効率的に検出するために適切である。
 このように、第1の実施形態にかかる情報処理システム1000は、テキストで記載された異常事態の事例から、当該異常事態を検出するために有用な条件を出力することができる。
 (第1の実施形態の変形例)
 生成部120は、テキスト情報から処理単位を生成する際、異常事態に直接関係しない表現(例えば「ニュースをお伝えします。」等)を除外してもよい。
 属性付与部130は、機械学習の手法を用いて、処理技術に属性を付与してもよい。この場合、規則記憶部210には機械学習の学習データが記憶される。
 属性付与部130は、前記処理単位に含まれる文字列と、規則に含まれる単語、フレーズまたは単語とフレーズとの組み合わせとに、テキストマッチング処理を行う。属性付与部130は、前記テキストマッチング処理の結果に基づいて、前記規則に関連づけられた属性を前記処理単位に付与しても良い。
 属性は、例えば、「単独犯」と「2人組の犯人」などであってもよい。属性は、例えば、「実行犯」と「おとり役」などであってもよい。属性は、異常事態の関係者を分類するだけには限られない。例えば、「逃走手段」や「犯罪道具」のような属性があってもよい。
 ある処理単位に「逃走手段」の属性を付与するか否かを判定する規則は、例えば下記のような規則である。
 規則:処理単位が、逃走行為を表す動詞を含み、かつ、「~を用いて」、「~を使って」など、手段を表す助詞等を含んでいる場合、当該処理単位に「逃走手段」の属性を付与する。
 ある処理単位に「犯罪道具」の属性を付与するか否かを判定する規則は、例えば下記のような規則である。
 規則:処理単位が、暴力的述語を含み、かつ、「~を用いて」、「~を使って」など、手段を表す助詞等を含んでいる場合、当該処理単位に「犯罪道具」の属性を付与する。
 規則は、より一般的には下記のように表現することができる。
 規則は、あらかじめ定められた動詞と属性とを関連付けた情報である。属性付与部130は、前記処理単位に含まれる主部または主語に対応する述語または述部が、前記規則に含まれる動詞を含んでいた場合に、前記動詞に関連付けられた属性を前記処理単位に付与する。
 規則は、あらかじめ定められた動詞と属性とを関連付けた情報である。属性付与部130は、前記処理単位に含まれる主部または主語に対応する述語または述部が、前記規則に含まれる動詞を含んでいた場合に、前記動詞に関連付けられた属性を前記処理単位に付与する。
 規則は、あらかじめ定められた動詞およびその動詞の態(voice)と、属性とを関連付けた情報である。属性付与部130は、前記処理単位に含まれる主部または主語に対応する述語または述部が、前記規則に含まれる動詞を含んでおり、かつ、前記動詞の態が規則に含まれる態と一致した場合に、前記動詞に関連付けられた属性を前記処理単位に付与する。
 規則は、属性に、あらかじめ定められた単語、あらかじめ定められたフレーズまたはあらかじめ定められた単語とフレーズの組み合わせを、関連づけた情報である。属性付与部130は、前記処理単位に含まれる文字列と前記規則を構成する単語、フレーズまたは単語とフレーズの組み合わせとにテキストマッチング処理を行う。属性付与部130は、前記テキストマッチング処理の結果に基づいて、前記規則に関連づけられた属性を前記処理単位に付与する。
 <第2の実施形態>
 次に、上述した第1の実施形態を基本とする第2の実施形態について説明する。図5は、第2の実施形態にかかる情報処理システム2000の構成を示すブロック図である。図1に示した構成と実質的に同一の構成には同一の符号が付されているので説明を省略する。図5に示すように、第2の実施形態にかかる情報処理システム2000は、監視ルール生成部150を更に備える。
 監視ルール生成部150は、抽出部140が出力する異常事態の特徴に基づいて、当該異常事態を検出するための監視ルールを生成する。
 監視ルール生成部150には、あらかじめ監視ルールを生成するためのテンプレートが設定されるとしてもよい。この場合、監視ルール生成部150は、抽出部140が出力する異常事態の特徴に基づいて、テンプレートを用いて、監視システムが読み込み可能な形式によって表された監視ルールを生成する。
 第2の実施形態にかかる情報処理システム2000の効果を説明する。第2の実施形態にかかる情報処理システム2000は、異常事態が記載されたテキスト情報から、自動的に監視ルールを生成することができる。よって、第2の実施形態にかかる情報処理システム2000は、監視ルールを設定するオペレータの負担を軽減することができる。
 <第3の実施形態>
 図6は、第3の実施形態にかかる情報処理システム3000の構成を示すブロック図である。図1に示した構成と実質的に同一の構成には同一の符号が付されているので説明を省略する。図6に示すように、第3の実施形態にかかる情報処理システム2000は、生成部120と、属性付与部130と、抽出部140とを備える。
 生成部120は、あるテーマについて記載されたテキスト情報から、主語または主部を含む単位である処理単位を生成する。
 属性付与部130は、前記処理単位に属性を付与するための規則を記憶する規則記憶部210を参照し、前記処理単位に含まれる主語または主部に基づいて前記処理単位に属性を付与する。規則記憶部210は、属性付与部130と同一の装置に実装されていてもよいし、属性付与部130が実装された装置と通信ネットワークを介して通信可能に接続されていてもよい。抽出部140は、同一の属性が付与された前記処理単位ごとにテキストマイニングを行い、当該テキストマイニングの結果に基づいて、前記属性ごとの特徴を抽出する。
 前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である。
 第3の実施形態にかかる情報処理システム3000によれば、監視システムのオペレータが監視ルールを設定する作業を支援することができる。
 (実施例)
 上述したテキスト情報や規則などの具体例を下記に示す。
 入力受付部110が受け付けるテキスト情報の、他の具体例を図7に示す。図7に示すテキスト情報の具体例は、下記の通りである。
 テキスト情報3:男は、道路の広い側で自転車に乗って後ろから近づき、歩道を歩いていた女性の鞄を奪取、そのまま逃走した。被害を受けた女性は70代で、怪我はないとのこと。
 テキスト情報4:このアジア系の男は、幅の広いナイフ状のものを用いて、旅行者のバッグを切り裂き、そこから中身を抜き出し、逃走した。このアジア系の男は、60代後半から70代と見られ、警察が現在、より詳しい目撃証言がないか調査を続けている。
 テキスト情報5:自転車に乗った人物が、通行人の荷物を奪取し、そのまま走り去るという事件が発生。被害を受けた通行人は、近隣に住む70代男性で、荷物を取られたときに転倒したことが原因で全治一週間程度の軽い怪我をおっている。目撃者によると、走り去った人物は、帽子とマスクをつけており、性別、年齢は不明。
 テキスト情報6:3/28未明、集金回りをしていた会社員から、2人組の男が現金の入った鞄を奪うという事件が発生。被害にあった会社員が川崎通りに沿って自転車に乗っていたところ、急に一人の男が、大声でこの会社員を怒鳴りつけ、自転車を止めさせた。ついで、別の男が自転車の籠においてあった鞄を持って逃げた、という手口とのこと。
 図8は、図7に示すテキスト情報から生成された処理単位に、加害者または被害者の属性を付与した情報示す図である。
 図8に示すように、テキスト情報3からは例えば下記のような処理単位が生成され、生成された処理単位には例えば下記のような属性が付与される。
 [加害者の属性が付与される処理単位]
・「男は、道路の広い側で自転車に乗って」、
・「男は、後ろから近づき」、
・「男は、歩道を歩いていた女性の鞄を奪取」、
・「男は、そのまま逃走した」。
 [加害者の属性が付与される処理単位]
・「被害を受けた女性は、70代で」、
・「被害を受けた女性は、怪我はない」。
 図8に示すように、テキスト情報4からは例えば下記のような処理単位が生成され、生成された処理単位には例えば下記のような属性が付与される。
  [加害者の属性が付与される処理単位]
・「このアジア系の男は、幅の広いナイフ状のものを用いて」、
・「このアジア系の男は、旅行者のバッグを切り裂き」、
・「このアジア系の男は、そこから中身を取り出し」、
・「このアジア系の男は、逃走した」、
・「このアジア系の男は、60代後半から70代と見られ」。
 図8に示すように、テキスト情報5からは例えば下記のような処理単位が生成され、生成された処理単位には例えば下記のような属性が付与される。
  [加害者の属性が付与される処理単位]
・「自転車に乗った人物が、通行人の荷物を奪取し」、
・「自転車に乗った人物が、そのまま走り去る」、
・「走り去った人物は、帽子とマスクを付けており、性別、年齢は不明」。
 [被害者の属性が付与される処理単位]
・「被害を受けた通行人は、近隣に住む70代男性で」、
・「被害を受けた通行人は、荷物を取られたときに転倒した」、
・「被害を受けた通行人は、全治1週間程度の軽い怪我をおっている」。
 図8に示すように、テキスト情報6からは例えば下記のような処理単位が生成され、生成された処理単位には例えば下記のような属性が付与される。
 [加害者の属性が付与される処理単位]
・「3/28未明、集金周りをしていた会社員から、2人組の男が現金の入った鞄を奪う」、
・「急に1人の男が、大声でこの会社員を怒鳴りつけ」、
・「1人の男が、自転車を止めさせた」、
・「別の男が自転車の籠においてあった鞄を持って逃げた」。
 [被害者の属性が付与される処理単位]
・「被害にあった会社員が川崎通りに沿って自転車に乗っていた」。
 図9は、規則記憶部210が記憶している規則の他の具体例を示す図である。図9に示す規則7から規則11は、デモ行為について記載されたテキスト情報から生成された処理単位に属性を付与するための規則である。
 規則7:処理単位に含まれる主語または主部が「参加者」に近い意味を表す言葉を含む場合、当該処理単位に「参加者」の属性を付与する。ここで、「参加者」に近い意味を表す言葉の例としては、「参加者」、「参与者」、「主催者」などである。
 規則8:処理単位に含まれる主語または主部に対応する述語または述部が、デモンストレーション行為を表す動詞の能動態を含む場合、当該処理単位に「参加者」の属性を付与する。ここで、デモンストレーション行為を表す動詞の例としては、「参加する」、「訴える」、「アピールする」などである。
 規則9:処理単位に含まれる主語または主部が「通行人」に近い意味を表す言葉を含む場合、当該処理単位に「通行人」の属性を付与する。ここで、「通行人」に近い意味を表す言葉の例としては、「通行人」、「野次馬」などである。
 規則10:処理単位に含まれる主語または主部が「警備担当者」に近い意味を表す言葉を含む場合、当該処理単位に「警備担当者」の属性を付与する。ここで、「警備担当者」に近い意味を表す言葉の例としては「警備担当者」、「警備員」、「警察官」、「機動隊」などである。
 規則11:処理単位に含まれる主語または主部に対応する述語または述部が、警備行為を表す動詞の能動態である場合、当該処理単位に「警備担当者」の属性を付与する。ここで、警備行為を表す動詞の例としては、「警備する」、「治安を守る」、「整理する」などである。
 規則の他の具体例を下記に示す。 
・暴力を表す動詞に対し、「~を用いて」、「~を使って」、「で」など、手段を表す助詞等を介して修飾している名詞と、その修飾表現を、属性付与部130は「犯罪道具」とみなす、
・犯罪を表す動詞に対し、「~を用いて」、「~を使って」、「で」など、手段を表す助詞等を介して修飾している名詞と、その修飾表現を、属性付与部130は「犯罪道具」とみなす、
・逃走行為を表す動詞に対し、「~を用いて」、「~を使って」、「~に乗って」、「で」など、手段を表す助詞等を介して修飾している名詞と、その修飾表現を、属性付与部130は「逃走手段」とみなす。
 以上、本発明を実施するための形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得ると共に、本発明にはその等価物も含まれる。
 この出願は、2013年4月23日に出願された日本出願特願2013-090535を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明は、監視システムのオペレータが監視ルールを設定する作業を支援することに利用できる。
 1000 情報処理システム
 2000 情報処理システム
 10 CPU
 20 記憶装置
 30 通信インターフェイス
 40 入力装置
 50 出力装置
 60 ドライブ装置
 70 記憶媒体
 110 入力受付部
 120 生成部
 130 属性付与部
 140 抽出部
 150 監視ルール生成部
 210 規則記憶部

Claims (10)

  1.  あるテーマについて記載されたテキスト情報から、主語または主部を含む処理単位を生成する生成手段と、
     前記処理単位に属性を付与するための規則が格納された規則記憶手段を参照し、前記処理単位に含まれる主語または主部に基づいて前記処理単位に属性を付与する属性付与手段と、
     同一の属性が付与された前記処理単位に対してテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出する抽出手段と、を備え、
     前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、
     情報処理システム。
  2.  前記テキスト情報は、異常事態について記載された情報であり、
     前記属性付与手段は、前記処理単位に対して、加害者という属性または被害者という属性を付与し、
     前記抽出手段は、前記異常事態について、加害者の特徴と被害者の特徴とをそれぞれ抽出する、
     請求項1に記載の情報処理システム。
  3.  前記規則記憶手段を自システムに更に備え、
     前記規則は、あらかじめ定められた名詞と属性とを関連付けた情報であり
     前記属性付与手段は、前記処理単位に含まれる主部または主語と、前記規則に含まれる名詞とが一致した場合に、前記名詞に関連付けられた属性を前記処理単位に付与する、
     請求項1または2に記載の情報処理システム。
  4.  前記規則記憶手段を自システムに更に備え、
     前記規則は、あらかじめ定められた動詞と属性とを関連付けた情報であり、
     前記属性付与手段は、前記処理単位に含まれる主部または主語に対応する述語または述部が、前記規則に含まれる動詞を含んでいた場合に、前記動詞に関連付けられた属性を前記処理単位に付与する、
     請求項1または2に記載の情報処理システム。
  5.  前記規則記憶手段を自システムに更に備え、
     前記規則は、属性に、あらかじめ定められた単語、あらかじめ定められたフレーズまたはあらかじめ定められた単語とフレーズの組み合わせを、関連づけた情報であり、
     前記属性付与手段は、前記処理単位に含まれる文字列と前記規則を構成する単語、フレーズまたは単語とフレーズの組み合わせとにテキストマッチング処理を行い、前記テキストマッチング処理の結果に基づいて、前記規則に関連づけられた属性を前記処理単位に付与する、
     請求項1または2に記載の情報処理システム。
  6.  前記処理単位は、前記主語または主部を含む節である、請求項1から5のいずれかに記載の情報処理システム。
  7.  前記抽出手段は、前記属性ごとに特徴が抽出された回数を算出する、請求項1から6のいずれかに記載の情報処理システム。
  8.  前記抽出手段が抽出した属性ごとの特徴に基づいて、異常事態の発生を検知するための監視ルールを生成する監視ルール生成手段を更に備える
     請求項1から7のいずれかに記載の情報処理システム。
  9.  あるテーマについて記載されたテキスト情報から生成された主語または主部を含む文の単位である処理単位に属性を付与するための規則を記憶する規則記憶手段に、アクセス可能なコンピュータによって、
      テキスト情報から、主語または主部を含む処理単位を生成し、
      前記処理単位に属性を付与するための規則が格納された規則記憶手段を参照し、前記処理単位に含まれる主語または主部に基づいて、前記処理単位に属性を付与し、
      同一の属性が付与された前記処理単位ごとにテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出し、
      前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、
      情報処理方法。
  10.  あるテーマについて記載されたテキスト情報から生成された主語または主部を含む文の単位である処理単位に属性を付与するための規則を記憶する規則記憶手段に、アクセス可能なコンピュータに、
      テキスト情報から、主語または主部を含む処理単位を生成する処理と、
      前記処理単位に属性を付与するための規則が格納された規則記憶手段を参照し、前記処理単位に含まれる主語または主部に基づいて、前記処理単位に属性を付与する処理と、
      同一の属性が付与された前記処理単位ごとにテキストマイニングを行い、当該テキストマイニングの結果に基づいて前記属性ごとの特徴を抽出する処理と、を実行させ、
      前記属性は、前記主語または主部が、前記テーマにおいて果たす役割、または、前記主語または主部の、前記テーマに関する立場を表す情報である、
      プログラムが格納されたコンピュータ読み取り可能な記憶媒体。
PCT/JP2014/002128 2013-04-23 2014-04-15 情報処理システム、情報処理方法および記憶媒体 WO2014174797A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015513525A JPWO2014174797A1 (ja) 2013-04-23 2014-04-15 情報処理システム、情報処理方法およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013090535 2013-04-23
JP2013-090535 2013-04-23

Publications (1)

Publication Number Publication Date
WO2014174797A1 true WO2014174797A1 (ja) 2014-10-30

Family

ID=51791386

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/002128 WO2014174797A1 (ja) 2013-04-23 2014-04-15 情報処理システム、情報処理方法および記憶媒体

Country Status (2)

Country Link
JP (1) JPWO2014174797A1 (ja)
WO (1) WO2014174797A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003248681A (ja) * 2001-11-20 2003-09-05 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2007241765A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 属性表現獲得方法及び評価表現獲得方法及び装置及びプログラム
JP2010020731A (ja) * 2008-07-14 2010-01-28 Datasection Inc 情報分析装置及び情報分析プログラム
JP2011198156A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd イベント情報抽出誤り検知装置、方法、及びプログラム
JP2012003572A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性分析システム及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003248681A (ja) * 2001-11-20 2003-09-05 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2007241765A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 属性表現獲得方法及び評価表現獲得方法及び装置及びプログラム
JP2010020731A (ja) * 2008-07-14 2010-01-28 Datasection Inc 情報分析装置及び情報分析プログラム
JP2011198156A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd イベント情報抽出誤り検知装置、方法、及びプログラム
JP2012003572A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性分析システム及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHIN ISHIDA: "News Site ni yoru Jinbutsu ya Soshiki ni Kansuru Kijutsu no Tokucho Bunseki Dai 1 Kai Forum", DATA ENGINEERING AND INFORMATION MANAGEMENT -DEIM FORUM- RONBUNSHU, 9 May 2009 (2009-05-09), pages 1 T 8 *

Also Published As

Publication number Publication date
JPWO2014174797A1 (ja) 2017-02-23

Similar Documents

Publication Publication Date Title
Rossy et al. Integrating forensic information in a crime intelligence database
Ku et al. A decision support system: Automated crime report analysis and classification for e-government
Jain et al. Effective surveillance and predictive mapping of mosquito-borne diseases using social media
CN110276068B (zh) 法律案情分析方法及装置
US20100153597A1 (en) Generating Furtive Glance Cohorts from Video Data
TWI638569B (zh) 監控系統與監控方法
Lamsal et al. Twitter conversations predict the daily confirmed COVID-19 cases
CN110717357B (zh) 预警方法、装置、电子设备及存储介质
KR101879444B1 (ko) Cctv 구동 방법 및 시스템
Sabir et al. An Automated Real-Time Face Mask Detection System Using Transfer Learning with Faster-RCNN in the Era of the COVID-19 Pandemic.
Akshaya et al. Social Distance Monitoring Framework Using YOLO V5 Deep Architecture
KR20160123101A (ko) 특정 범죄자의 범죄 유형 분류 방법 및 시스템
WO2011123181A1 (en) System and method for predicting events via dynamic ontologies
Brewster et al. Knowledge management and human trafficking: Using conceptual knowledge representation, text analytics and open-source data to combat organized crime
Grover et al. Review of current crime prediction techniques
WO2014174797A1 (ja) 情報処理システム、情報処理方法および記憶媒体
Syed et al. Migrant workers, migrants, internally displaced persons, asylum seekers and refugees-The silent sufferers of the COVID-19 pandemic: A brief review of media reports
Klimenko et al. A technique of deviant behaviour detection in video surveillance systems based on complex behaviour analysis
US9666064B2 (en) Information processing system, information processing method and storage medium
Drias et al. Sentiment evolution analysis and association rule mining for covid-19 tweets
US20220406155A1 (en) Methods and systems for object tracking
Cartwright et al. Deploying Artificial Intelligence to Combat COVID-19 Misinformation on Social Media: Technological and Ethical Considerations
Johnson et al. Law enforcement ontology for identification of related information of interest across free text dcouments
Mande et al. An intelligent analysis of crime data using data mining & auto correlation models
Farooqi Intelligent safety management system for crowds using sensors

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14788762

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015513525

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14788762

Country of ref document: EP

Kind code of ref document: A1