WO2023127631A1 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
WO2023127631A1
WO2023127631A1 PCT/JP2022/047069 JP2022047069W WO2023127631A1 WO 2023127631 A1 WO2023127631 A1 WO 2023127631A1 JP 2022047069 W JP2022047069 W JP 2022047069W WO 2023127631 A1 WO2023127631 A1 WO 2023127631A1
Authority
WO
WIPO (PCT)
Prior art keywords
keyword
analysis target
trend data
viewpoint
trend
Prior art date
Application number
PCT/JP2022/047069
Other languages
English (en)
French (fr)
Inventor
望田詩織
高橋夕香子
柳沢永樹
三井毅
Original Assignee
本田技研工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 本田技研工業株式会社 filed Critical 本田技研工業株式会社
Publication of WO2023127631A1 publication Critical patent/WO2023127631A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Definitions

  • the present invention relates to an information processing device, an information processing method, and a program.
  • Japanese Patent Application Laid-Open No. 2004-110149 discloses a regulatory information management system that can promptly provide customers with product data in accordance with legal revisions.
  • Japanese Patent Application Laid-Open No. 2004-110149 can only provide customers with product data in response to legal revisions. There is a long-awaited technology for better coping with the enactment or revision of laws and regulations.
  • An object of the present invention is to solve the above-mentioned problems.
  • An information processing apparatus includes an information acquisition unit that acquires information from a website at intervals, and a keyword extraction unit that extracts a keyword from the acquired information that is the information acquired by the information acquisition unit. and analysis subject trend data that quantitatively indicates the trend of the analysis subject keyword by analyzing the trend of the analysis subject keyword, which is the keyword subject to the trend analysis, from a predetermined viewpoint.
  • a data generation unit past case trend data obtained by analyzing past case keywords, which are keywords related to past cases that led to the enactment or revision of laws and regulations or standards, from the above-mentioned viewpoint, and the above-mentioned trend data to be analyzed.
  • a specific keyword determination unit for determining whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict trends in enactment or revision of regulations or standards, based on the above.
  • An information processing method comprises an acquisition step of acquiring information from a website at intervals, and a keyword extraction step of extracting a keyword from the information acquired in the acquisition step.
  • Analysis target trend data for generating analysis target trend data quantitatively indicating the trend of the analysis target keyword by analyzing the trend of the analysis target keyword, which is the target keyword of the trend analysis, from a predetermined viewpoint.
  • a generation step past case trend data obtained by analyzing past case keywords, which are keywords related to past cases that led to the enactment or revision of laws and regulations or standards, from the above-mentioned viewpoint, and the above-mentioned trend data to be analyzed.
  • a specific keyword determination step of determining whether or not the analysis target keyword corresponds to a specific keyword which is a keyword that can be used to predict trends in enactment or revision of regulations or standards, based on the above.
  • a program comprises, in a computer, an acquisition step of acquiring information from a website at intervals; and analyzing the trend of the analysis target keyword, which is the target keyword of the trend analysis, from a predetermined viewpoint to generate analysis target trend data quantitatively indicating the trend of the analysis target keyword.
  • a trend data generation step past case trend data obtained by analyzing past case keywords, which are keywords related to past cases that led to the establishment or revision of laws and regulations or standards, from the above-mentioned viewpoint, and the above-mentioned trend to be analyzed.
  • a specific keyword determination step of determining whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict trends in enactment or revision of regulations or standards, based on the data.
  • FIG. 1 is a block diagram showing an information processing device according to one embodiment.
  • FIG. 2 is a flowchart illustrating an information processing method according to one embodiment.
  • FIG. 3 is a flowchart illustrating an information processing method according to one embodiment.
  • FIG. 1 is a block diagram showing an information processing apparatus according to this embodiment.
  • the information processing device 10 can communicate with the server device 14 via a network 12 such as the Internet.
  • a network 12 such as the Internet.
  • FIG. 1 one server device 14 out of many server devices 14 is extracted and shown.
  • the information processing device 10 may include a calculation unit 16 , a storage unit 18 , an operation unit 20 , a display unit 22 and a communication unit 24 .
  • the information processing apparatus 10 may be provided with components other than these components, but description thereof will be omitted here.
  • the server device 14 is, for example, a web server. A website can be built on the server device 14 .
  • the server device 14 may be provided with an arithmetic unit 26 , a storage unit 28 , and a communication unit 30 . Although the server device 14 may be provided with components other than these components, the description thereof is omitted here.
  • the information processing device 10 may be provided with the computing unit 16 .
  • the computing unit 16 can be configured by a processor such as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit), that is, a processing circuit.
  • the calculation unit 16 includes a control unit 32, an information acquisition unit 34, a keyword extraction unit 36, a classification unit 37, a related keyword determination unit 38, an analysis target trend data generation unit 40, and a specific keyword determination unit 44. , a specific keyword acquisition unit 45 , a storage processing unit 46 , and a display control unit 48 .
  • the computing unit 16 may be provided with components other than these components, but the description thereof will be omitted here.
  • control unit 32, the information acquisition unit 34, the keyword extraction unit 36, the classification unit 37, the related keyword determination unit 38, the analysis target trend data generation unit 40, the specific keyword determination unit 44, the specific keyword acquisition unit 45, and the storage processing unit 46 , at least part of the display control unit 48 may be implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field-Programmable Gate Array).
  • control unit 32, information acquisition unit 34, keyword extraction unit 36, classification unit 37, related keyword determination unit 38, analysis target trend data generation unit 40, specific keyword determination unit 44, specific keyword acquisition unit 45, storage processing unit 46 , at least part of the display control unit 48 may be configured by an electronic circuit including a discrete device.
  • the storage unit 18 can include a volatile memory (not shown) and a non-volatile memory (not shown). Volatile memory may include, for example, RAM (Random Access Memory). A volatile memory is used as a working memory of a processor and temporarily stores data required for processing or calculation. Examples of nonvolatile memory include ROM (Read Only Memory), flash memory, and the like. Non-volatile memory is used as storage memory to store programs, tables, maps, and the like. At least part of the storage unit 18 may be provided in the processor, integrated circuit, or the like as described above. In addition, the storage unit 18 may further include a HDD (Hard Disk Drive), an SSD (Solid State Drive), and the like.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • the storage unit 18 may also include a past case trend data storage unit 50 that stores past case trend data, which will be described later. At least part of the storage unit 18 may be configured by a storage (not shown) provided separately from the information processing device 10 . Examples of such storage include AWS (Amazon Web Service) storage and the like, but are not limited to this.
  • AWS Amazon Web Service
  • the information processing device 10 may be provided with the operation unit 20 .
  • the operation unit 20 can be used when a user performs an operation input on the information processing device 10 .
  • the operation unit 20 may include a keyboard, mouse, etc., but is not limited to this.
  • the information processing device 10 may be provided with the display unit 22 .
  • the display unit 22 is provided with a display element (not shown).
  • a display element for example, a liquid crystal display element, an organic electroluminescence display element, or the like can be used.
  • the operation unit 20 and the display unit 22 may be configured by a touch panel (not shown) provided with such a display element.
  • the information processing device 10 may be provided with the communication unit 24 .
  • the communication unit 24 includes, for example, a communication module (not shown).
  • the communication unit 24 can communicate with a communication unit 30 provided in the server device 14 via the network 12 .
  • the server device 14 may be provided with the computing unit 26 .
  • the computing unit 26 can be configured by a processor such as a CPU or GPU, that is, a processing circuit.
  • the calculation unit 26 may be provided with a control unit 54 .
  • the control unit 54 controls the entire server device 14 .
  • the control unit 54 can be realized by executing a program stored in the storage unit 28 by the calculation unit 26 .
  • the computing unit 26 may also include components other than the control unit 54, but the description thereof will be omitted here.
  • At least part of the control unit 54 may be realized by an integrated circuit such as ASIC or FPGA. Also, at least part of the control unit 54 may be configured by an electronic circuit including a discrete device.
  • the server device 14 may be provided with the storage unit 28 .
  • the storage unit 28 can include a volatile memory (not shown) and a non-volatile memory (not shown).
  • the storage unit 28 may further include an HDD, SSD, and the like.
  • a website is built on the server device 14 .
  • the storage unit 28 can store page data forming a web page.
  • a web page may contain textual information.
  • the information processing device 10 may be provided with the control unit 32 .
  • the control unit 32 controls the entire information processing apparatus 10 .
  • the information processing device 10 may be provided with the information acquisition unit 34 .
  • the information acquisition unit 34 acquires information from a designated site, which is a website designated in advance by the user. More specifically, the information acquisition unit 34 acquires text information from the specified site. Only one website may be designated as the designated site, or multiple websites may be designated as the designated site.
  • Designated sites may include, but are not limited to, public websites, specialized websites, and national policy websites.
  • Popular websites may include, but are not limited to, news sites and the like.
  • a professional website may include, but is not limited to, a website of a professional institution, for example.
  • Websites related to national policies may include, but are not limited to, websites of political parties, websites of public offices, and the like.
  • the information acquisition unit 34 may acquire information from an unspecified site, which is a website other than the website specified in advance by the user.
  • the general process by which laws and regulations or standards are enacted or revised is as follows. That is, in the first stage, an interest in the case arises. In the first stage, the case becomes a hot topic. In the first stage, it is common for the case to be reported by general sources. Common sources of information may include, but are not limited to, news media and the like. In the first stage, the incident may be reported, for example, from a public website or the like. That is, in the first stage, the case can be reported from the website of a news organization or the like. In the first stage, the case will also be reported by professional sources. That is, in the first stage, for example, the case will be reported also from a specialized organization.
  • the case will be reported from, for example, the website of a specialized agency.
  • the case becomes a social problem.
  • technological progress occurs to solve the case.
  • the matter becomes the agenda of a meeting or the like.
  • the incidents will be reported by political parties, government agencies, etc.
  • the case will be reported from the websites of political parties, public offices, etc.
  • legislation or standards are enacted or revised. More specifically, in the fourth stage, the case will be reported from the website of legal information, standard information, etc.
  • the information acquisition unit 34 acquires such information at intervals.
  • the information acquisition unit 34 acquires such information periodically, for example.
  • the information acquisition unit 34 acquires such information, for example, once a week, but is not limited to this.
  • the information acquisition unit 34 may acquire such information every day or every month. Also, the information acquisition unit 34 may acquire such information irregularly.
  • the information processing device 10 may be provided with the keyword extraction unit 36 .
  • the keyword extraction unit 36 extracts keywords from the acquired information that is the information acquired by the information acquisition unit 34 .
  • Keyword extraction can be performed as follows. First, the keyword extraction unit 36 divides the text information acquired by the information acquisition unit 34 into words. Next, the keyword extraction unit 36 extracts keywords from the multiple words obtained by the division. Keyword extraction can be performed, for example, as follows. That is, in extracting keywords, independent words are extracted as keywords, but attached words are not extracted as keywords. An independent word is a word that can form a clause by itself. Auxiliary words are words that cannot form a clause by themselves, but are added after independent words to form a clause. The keyword extraction technique is not limited to the above. Keywords are thus extracted from the information acquired by the information acquisition unit 34 . When the text information acquired by the information acquisition unit 34 needs to be translated, the keyword extraction unit 36 performs do the translation. At least part of the keyword extraction unit 36 may use artificial intelligence (AI).
  • AI artificial intelligence
  • the information processing device 10 may be provided with the classification section 37 .
  • the classification unit 37 determines whether the keyword extracted by the keyword extraction unit 36 belongs to one of a plurality of fields classified in advance. Such fields may include, but are not limited to, politics, economics, industry, technology, entertainment, and the like.
  • the classification unit 37 associates information indicating the field to which the keyword belongs with the keyword. Artificial intelligence may be used for at least part of the classification unit 37 .
  • the information processing device 10 may be provided with the related keyword determination unit 38 .
  • the related keyword determination unit 38 determines related keywords related to the keyword.
  • the related keyword determination unit 38 determines a keyword that is relatively highly related to one keyword as a related keyword of the one keyword.
  • the related keyword determining unit 38 does not determine keywords having relatively low relevance to one keyword as related keywords of the one keyword.
  • the related keyword determination unit 38 determines related keywords as follows. That is, when a sentence contains multiple keywords, these keywords are associated with each other.
  • the related keyword determining unit 38 can determine the relationship between keywords, for example, based on the number of times the keywords appear in the same document. For example, the number of occurrences of ties between keywords can be set as a value indicating the degree of relevance, but the present invention is not limited to this.
  • first sentence a sentence that describes the following sentence.
  • the first sentence is, for example, "I like dogs.” Keywords extracted from the first sentence are “I”, “dog”, and “like”. Since “I”, “dog” and “like” exist in the first sentence, "I”, “dog” and “like” are associated with each other. When focusing only on the first sentence, the number of times of linking between these keywords is one.
  • the document contains not only the first sentence, but also the second sentence.
  • the related keyword determination unit 38 focuses on both the first sentence and the second sentence.
  • the second sentence is, for example, "I also like cats.” Keywords extracted from the second sentence are "I”, “cat”, and “like”.
  • the first and second sentences have in common that they contain "I”. Also, the first sentence and the second sentence have in common that they include "like”. Therefore, the related keyword determination unit 38 focuses on both the first sentence and the second sentence. Since "I”, “cat”, and “like” exist in the second sentence, "I", "cat” and “like” are associated with each other.
  • the number of appearances of the linkage between keywords is as follows. That is, the number of occurrences of the linking between “I” and “I like” is two times as a whole. The total number of times that "me” and “dog” are connected is one time. The number of times of linking between “I” and “cat” is one. The number of occurrences of the linking between “dog” and “like” is one as a whole. The number of occurrences of the string attachment between “cat” and “like” is one as a whole. The number of occurrences of strings attached to “dog” and “cat” is 0 as a whole.
  • the related keyword determining unit 38 determines the relationship between keywords by focusing on a large number of sentences included in the acquired information.
  • the related keyword determining unit 38 determines that a keyword whose relevance to one keyword is equal to or greater than the relevance threshold is a related keyword of the one keyword. For example, if the number of appearances of a string between "I” and “I like” is 10, and the relevance threshold is 5, the relevance of "I like” to “I” is greater than or equal to the relevance threshold. Therefore, in such a case, the related keyword determining unit 38 determines that "like” is a related keyword of "me”. In such a case, the relevance of "I” to “Like” is also above the relevance threshold. Therefore, the related keyword determining unit 38 determines that "I” is a related keyword of "like". Although the case of setting the relevance threshold has been described as an example here, the present invention is not limited to this. You don't have to set a relevance threshold.
  • the related keyword determination unit 38 does not determine that a keyword whose relevance to one keyword is less than the relevance threshold is a related keyword of the one keyword. For example, if the number of occurrences of ties between "me” and “dog” is 3 and the relevance threshold is 5, then the relevance of "dog” to "me” is less than the relevance threshold. Therefore, in such a case, the related keyword determination unit 38 does not determine "dog” as a related keyword of "me”. In such a case, the relevance of "I” to "Dog” is also below the relevance threshold. Therefore, the related keyword determining unit 38 does not determine that "I” is a related keyword of "dog".
  • the related keyword determination unit 38 determines related keywords related to the keyword. Artificial intelligence may be used for at least part of the related keyword determination unit 38 .
  • the related keyword determination unit 38 stores the keyword and the related keyword of the keyword in the storage unit 18 in association with each other.
  • the information processing apparatus 10 may be provided with the analysis target trend data generation unit 40 .
  • the analysis target trend data generation unit 40 analyzes trends of analysis target keywords (analysis target keywords) from a predetermined viewpoint (indicator).
  • the analysis target keyword is a keyword to be subjected to trend analysis (trend analysis).
  • the analysis target trend data generation unit 40 can generate analysis target trend data that quantitatively indicates the trend of the analysis target keyword by analyzing the trend of the analysis target keyword from a predetermined viewpoint.
  • Such viewpoints can include the following first, second, third, and fourth viewpoints.
  • the first viewpoint is, for example, elapsed time.
  • the elapsed period is the period from when the analysis target keyword began to appear in the acquired information. That is, the elapsed period is the period from when the keyword to be analyzed first appeared on the designated site.
  • the first point of view may be the continuous appearance period.
  • a continuous appearance period is a period in which the analysis target keyword appears continuously in the acquired information.
  • the second point of view is, for example, the change in the number of appearances over time.
  • the number of appearances is the number of analysis target keywords that appear in the acquired information.
  • the number of appearances is the number of the analysis target keywords included in the acquired information obtained this time.
  • the number of the analysis target keywords included in the acquired information obtained before the previous time is not included in the number of occurrences this time.
  • the temporal change in the number of occurrences can be interpreted broadly. That is, the temporal change in the rate of increase in the number of occurrences can also be included in the temporal change in the number of occurrences.
  • the third point of view is, for example, the change in the number of related keywords over time.
  • the number of related keywords is the number of related keywords related to the analysis target keyword.
  • a change in the number of related keywords over time can be broadly interpreted. That is, the temporal change in the rate of increase in the number of related keywords can also be included in the temporal change in the number of related keywords.
  • a third aspect may be the change over time in the number of new related keywords.
  • the number of new related keywords is the number of new related keywords that are related keywords newly related to the analysis target keyword.
  • the number of related keywords that were related to the analysis target keyword at the previous stage is not included in the number of new related keywords.
  • the change over time in the number of new related keywords can be broadly interpreted. That is, the temporal change in the rate of increase in the number of new related keywords can also be included in the temporal change in the number of new related keywords.
  • the fourth point of view is, for example, temporal changes in related fields.
  • a related field is a field to which a related keyword related to the analysis target keyword belongs.
  • the fourth viewpoint may be the change over time in the number of related fields.
  • the number of related fields is the number of related fields to which the related keyword belongs.
  • the change in the number of relevant fields over time can be interpreted broadly. That is, the temporal change in the rate of increase in the number of related fields can also be included in the temporal change in the number of related fields.
  • the analysis target trend data generation unit 40 generates analysis target trend data that quantitatively indicates the trend of analysis target keywords based on the above analysis results. That is, the analysis target trend data generation unit 40 generates analysis target trend data based on the analysis results of the above four viewpoints.
  • the analysis target trend data generation unit 40 stores the analysis target trend data thus generated in the storage unit 18 .
  • the analysis target trend data generated by the analysis target trend data generation unit 40 is stored in the storage unit 18 in a state of being associated with the analysis target keyword.
  • the information processing device 10 may be provided with the specific keyword determination unit 44 .
  • the specific keyword determination unit 44 determines whether or not the keyword to be analyzed corresponds to the specific keyword.
  • a specific keyword is a keyword that can be used to predict trends in enactment or revision of regulations or standards. Determination of whether or not the analysis target keyword is the specific keyword can be performed as follows. That is, the specific keyword determination unit 44 determines the degree of similarity between the past case trend data and the analysis target trend data. More specifically, the specific keyword determination unit 44 compares at least a portion of the past case trend data with at least a portion of the analysis target trend data to determine the approximation of the past case trend data and the analysis target trend data.
  • Past case trend data is data obtained by analyzing past case keywords, which are keywords related to past cases that led to the enactment or revision of laws and regulations or standards, from the above-mentioned viewpoints. More specifically, past case trend data is obtained by analyzing past case keywords, which are keywords related to past cases that led to the enactment or revision of laws and regulations or standards, from the above four perspectives. data.
  • the past case trend data is pre-stored in the past case trend data storage unit 50 .
  • the past case trend data storage unit 50 can store, for example, a plurality of past case trend data, but is not limited to this. Artificial intelligence may be used for at least part of the specific keyword determination unit 44 .
  • the specific keyword determination unit 44 determines whether or not the degree of approximation between the past case trend data and the analysis target trend data is equal to or greater than a predetermined degree threshold. If the degree of approximation between the trend data of past cases and the trend data to be analyzed is equal to or greater than a predetermined degree threshold, the keyword to be analyzed may be used to predict trends in the enactment or revision of laws and regulations or standards. is relatively high. Therefore, in such a case, the specific keyword determination unit 44 determines that the analysis target keyword corresponds to the specific keyword.
  • the keyword to be analyzed may be used to predict trends in the establishment or revision of laws and regulations or standards. is considered to be relatively low. Therefore, in such a case, the specific keyword determination unit 44 does not determine that the analysis target keyword corresponds to the specific keyword. In this way, the specific keyword determination unit 44 determines whether or not the analysis target keyword corresponds to the specific keyword based on the past case trend data and the analysis target trend data.
  • the past case trend data storage unit 50 can store a plurality of past case trend data.
  • the specific keyword determination unit 44 can determine that the analysis target keyword corresponds to the specific keyword when the degree of approximation between any one of the plurality of past case trend data and the analysis target trend data is equal to or greater than the degree threshold.
  • the specific keyword acquisition unit 45 acquires the specific keyword specified by the specific keyword determination unit 44.
  • the specific keyword acquisition unit 45 stores the acquired specific keyword in the storage unit 18 .
  • the specific keyword is stored in the storage unit 18 in a state of being associated with the analysis target trend data.
  • the specific keywords stored in the storage unit 18 are used to predict trends in enactment or revision of regulations or standards. In other words, the user can predict trends in enactment or revision of regulations or standards by searching for information using such specific keywords.
  • the information processing device 10 may be provided with the storage processing unit 46 .
  • the storage processing unit 46 performs the following processing when a law or standard is enacted or revised regarding an analysis target keyword determined by the specific keyword determination unit 44 to correspond to a specific keyword. That is, in such a case, the storage processing unit 46 adds the analysis target trend data related to the analysis target keyword to the past case trend data storage unit 50 as past case trend data.
  • the information processing device 10 may be provided with the display control unit 48 .
  • the display control section 48 can control the screen display of the display section 22 .
  • Artificial intelligence may be used for at least part of the display control unit 48 .
  • FIG. 2 is a flowchart showing an information processing method according to this embodiment.
  • step S1 the information acquisition unit 34 acquires information from a designated site, which is a website designated in advance by the user. After that, the process transitions to step S2.
  • step S2 the keyword extraction unit 36 extracts keywords from the acquired information that is the information acquired by the information acquisition unit 34. After that, the process transitions to step S3.
  • step S3 the classifying unit 37 determines whether the keyword extracted by the keyword extracting unit 36 belongs to any of a plurality of pre-divided fields. After that, the process transitions to step S4.
  • step S4 the related keyword determination unit 38 determines related keywords related to the keyword. After that, the process transitions to step S5.
  • step S5 the analysis target trend data generation unit 40 analyzes the trend of the analysis target keyword from the first viewpoint.
  • the first aspect is the elapsed period or continuous appearance period, as described above.
  • the elapsed period is, as described above, the period from when the analysis target keyword began to appear in the acquired information.
  • a continuous appearance period is a period in which the analysis target keyword appears continuously in the acquired information.
  • step S6 the analysis target trend data generation unit 40 analyzes the trend of the analysis target keyword from the second viewpoint.
  • the second aspect is the change in the number of occurrences over time, as described above.
  • the number of appearances is the number of analysis target keywords that appear in the acquired information, as described above.
  • step S7 the analysis target trend data generation unit 40 analyzes the trend of the analysis target keyword from the third viewpoint.
  • the third aspect is the change over time in the number of related keywords or the change over time in the number of new related keywords, as described above.
  • the change over time in the number of related keywords is the number of related keywords related to the analysis target keyword, as described above.
  • the number of new related keywords is, as described above, the number of new related keywords that are related keywords newly related to the analysis target keyword.
  • step S8 the analysis target trend data generation unit 40 analyzes the trend of the analysis target keyword from the fourth viewpoint.
  • the fourth aspect as described above, is the temporal change in related fields or the temporal change in the number of related fields.
  • the related field is the field to which the related keyword belongs, as described above.
  • the number of related fields is the number of related fields, as described above.
  • step S9 the analysis target trend data generation unit 40 generates analysis target trend data that quantitatively indicates the trend of the analysis target keyword based on the above analysis results. After that, the process transitions to step S10.
  • step S10 the specific keyword determination unit 44 determines the degree of similarity between the analysis target trend data and the past case trend data.
  • past case trend data is data obtained by analyzing past case keywords, which are keywords related to past cases that led to the enactment or revision of laws and regulations or standards, from the above perspectives. be.
  • the past case trend data storage unit 50 can store a plurality of past case trend data.
  • the specific keyword determination unit 44 determines the degree of similarity between each of the plurality of past case trend data and the analysis target trend data. After that, the process transitions to step S11.
  • step S11 the specific keyword determination unit 44 determines whether or not the degree of approximation between the trend data to be analyzed and the past case trend data is equal to or greater than a predetermined degree threshold. If the degree of approximation between the trend data to be analyzed and the past case trend data is greater than or equal to the predetermined degree threshold (YES in step S11), the process proceeds to step S12. More specifically, when the degree of approximation between at least one of the plurality of past case trend data and the analysis target trend data is equal to or greater than a predetermined degree threshold value, the process transitions to step S12. If the degree of approximation between the trend data to be analyzed and the past case trend data is less than the predetermined degree threshold (NO in step S11), the processing shown in FIG. 2 is completed.
  • step S12 the specific keyword determination unit 44 determines that the analysis target keyword corresponds to the specific keyword. Thus, the processing shown in FIG. 2 is completed.
  • steps S5 to S12 The processing shown in steps S5 to S12 is performed for each of the plurality of keywords to be analyzed.
  • a specific keyword can be extracted from among the plurality of analysis target keywords by performing the processing shown in steps S5 to S12 for each of the plurality of analysis target keywords.
  • FIG. 3 is a flow chart showing an information processing method according to this embodiment.
  • step S21 it is determined whether or not a law or standard has been enacted or revised regarding the analysis target keyword determined by the specific keyword determination unit 44 to correspond to the specific keyword.
  • the user may grasp whether or not a law or standard has been enacted or revised regarding the case of the keyword to be analyzed, but the present invention is not limited to this. If the regulation or standard regarding the matter is enacted or revised (YES in step S21), the process proceeds to step S22. If the regulation or standard for the case has not been enacted or revised (NO in step S21), the process shown in FIG. 3 is completed.
  • step S22 the storage processing unit 46 stores the analysis target trend data related to the analysis target keyword in the storage unit 18 as past case trend data. More specifically, the storage processing unit 46 adds analysis target trend data related to the analysis target keyword to the past case trend data storage unit 50 as past case trend data. Thus, the processing shown in FIG. 3 is completed.
  • the analysis target trend data that quantitatively indicates the trend of the analysis target keyword is generated. Based on the analysis target trend data and the past case trend data, it is determined whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict the trend of enactment or revision of laws and regulations or standards.
  • Past case trend data also includes data at the stage when there were signs of enactment or revision of laws and regulations. Since such past case trend data is used when determining whether or not the keyword to be analyzed corresponds to the specific keyword, the specific keyword can be accurately identified at the stage when there is a sign of the enactment or revision of laws and regulations.
  • analysis target trend data may be generated by analyzing the analysis target keyword from at least one of the second, third, and fourth viewpoints. Further, analysis target trend data may be generated by analyzing the analysis target keyword from at least one of the second, third, and fourth viewpoints and the first viewpoint. Further, analysis target trend data may be generated by analyzing the analysis target keyword from two of the second, third, and fourth viewpoints and from the first viewpoint. Further, the analysis target trend data may be generated by analyzing the analysis target keyword from two of the second viewpoint, the third viewpoint, and the fourth viewpoint. Analysis target trend data may be generated by analyzing analysis target keywords from the second, third, and fourth viewpoints.
  • the detection of specific keywords that can be used to predict trends in enactment or revision of regulations or standards has been described as an example, but the present invention is not limited to this.
  • INDUSTRIAL APPLICABILITY The present invention can be widely applied to detection of specific keywords that can predict trends in the world.
  • the present invention can be used to detect specific keywords that can be used to predict commercialization.
  • An information processing apparatus (10) includes an information acquisition unit (34) that acquires information from a website at intervals; and a keyword extracting unit (36) that quantitatively indicates the trend of the analysis target keyword by analyzing the trend of the analysis target keyword, which is the target keyword of the trend analysis, from a predetermined viewpoint.
  • Analysis subject trend data generating unit (40) for generating subject trend data and past incident keywords, which are keywords related to past incidents that led to enactment or revision of laws and regulations or standards, are obtained by analyzing from the above viewpoint.
  • analysis target trend data quantitatively indicating the trend of the analysis target keyword is generated by analyzing the trend of the analysis target keyword from a predetermined viewpoint. Based on the analysis target trend data and the past case trend data, it is determined whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict the trend of enactment or revision of laws and regulations or standards.
  • the past case trend data also includes data at the stage when there were signs of revisions to laws and regulations. Since such past case trend data is used when it is determined whether or not the keyword to be analyzed corresponds to the specific keyword, the specific keyword can be accurately identified at the stage when there is a sign of revision of laws and regulations. . Since the specific keyword can be obtained at the stage when there is a sign of revision of laws and regulations, revision of laws and regulations can be anticipated at an early stage according to such a configuration. Therefore, according to such a configuration, it is possible to satisfactorily cope with revisions of laws and regulations.
  • the viewpoint is at least one of a second viewpoint, a third viewpoint, and a fourth viewpoint
  • the second viewpoint is the analysis target keyword that appears in the acquired information.
  • the third aspect is the temporal change in the number of related keywords, which is the number of related keywords related to the analysis target keyword, or the time change in the number of related keywords that are newly related to the analysis target keyword.
  • the fourth aspect is the time change in the number of new related keywords, which is the number of related keywords, and the fourth aspect is the time change in the related field, which is the field to which the related keyword belongs, or the related field, which is the number of the related fields. It may be a change in number over time.
  • the analysis target trend data generation unit generates the analysis target trend data by analyzing the trend of the analysis target keyword from a plurality of predetermined viewpoints, and determines the specific keyword.
  • the department determines whether the analysis target keyword corresponds to the specific keyword based on the past case trend data obtained by analyzing the past case keyword from a plurality of the above viewpoints and the analysis target trend data.
  • the plurality of viewpoints includes at least one of the second viewpoint, the third viewpoint, and the fourth viewpoint, and a first viewpoint, and the first viewpoint is the analysis It may be an elapsed period, which is a period from when the target keyword started to appear in the acquired information, or a continuous appearance period, which is a period in which the analysis target keyword has continuously appeared in the acquired information.
  • the specific keyword determination unit determines that the analysis target keyword is the specified You may determine that it corresponds to a keyword.
  • the one A storage processing unit (46) may be further provided for adding the analysis target trend data related to the analysis target keyword to the storage unit (18) as the past case trend data. According to such a configuration, since abundant past case trend data can be obtained, it can be determined with high accuracy whether or not the keyword to be analyzed corresponds to the specific keyword.
  • An information processing method comprises an acquisition step (S1) of acquiring information from a website at intervals; In the extracting step (S2), by analyzing the trend of the analysis target keyword, which is the target keyword of the trend analysis, from a predetermined viewpoint, analysis target trend data quantitatively indicating the trend of the analysis target keyword is obtained.
  • Analysis target trend data generation step (S9) to be generated and past case trends obtained by analyzing past case keywords that are keywords related to past cases that led to the enactment or revision of laws and regulations or standards from the above point of view
  • Specific keyword determination for determining whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict the trend of enactment or revision of laws and regulations or standards, based on the data and the analysis target trend data. and a step (S12).
  • the viewpoint is at least one of a second viewpoint, a third viewpoint, and a fourth viewpoint
  • the second viewpoint is the analysis target keyword that appears in the acquired information.
  • the third aspect is the temporal change in the number of related keywords, which is the number of related keywords related to the analysis target keyword, or the time change in the number of related keywords that are newly related to the analysis target keyword.
  • the fourth aspect is the time change in the number of new related keywords, which is the number of related keywords, and the fourth aspect is the time change in the related field, which is the field to which the related keyword belongs, or the related field, which is the number of the related fields. It may be a change in number over time.
  • the analysis target trend data generation step the analysis target trend data is generated by analyzing the trend of the analysis target keyword from a plurality of predetermined viewpoints, and the specific keyword determination is performed.
  • the step based on the past case trend data obtained by analyzing the past case keywords from a plurality of the viewpoints and the analysis target trend data, whether the analysis target keyword corresponds to the specific keyword
  • the plurality of viewpoints includes at least one of the second viewpoint, the third viewpoint, and the fourth viewpoint, and a first viewpoint, and the first viewpoint is the analysis It may be an elapsed period, which is a period from when the target keyword started to appear in the acquired information, or a continuous appearance period, which is a period in which the analysis target keyword has continuously appeared in the acquired information.
  • the analysis target keyword is the specified keyword. You may determine that it corresponds to a keyword.
  • the one A storage processing step (S22) of adding the analysis target trend data related to the analysis target keyword to the storage unit as the past case trend data may be further provided.
  • a program comprising, in a computer, an acquisition step of acquiring information from a website at intervals; and analyzing the trend of the analysis target keyword, which is the target keyword of the trend analysis, from a predetermined viewpoint to generate analysis target trend data quantitatively indicating the trend of the analysis target keyword.
  • a trend data generation step past case trend data obtained by analyzing past case keywords, which are keywords related to past cases that led to the establishment or revision of laws and regulations or standards, from the above-mentioned viewpoint, and the above-mentioned trend to be analyzed.
  • a specific keyword determination step of determining whether or not the analysis target keyword corresponds to a specific keyword that is a keyword that can be used to predict trends in enactment or revision of regulations or standards, based on the data.
  • the viewpoint is at least one of a second viewpoint, a third viewpoint, and a fourth viewpoint
  • the second viewpoint is the number of the analysis target keywords appearing in the acquired information.
  • the third aspect is the time change in the number of related keywords, which is the number of related keywords related to the analysis target keyword, or the number of related keywords newly related to the analysis target keyword
  • the fourth aspect is the change over time in related fields, to which the related keywords belong, or the number of related fields, which is the number of related fields. It may change with time.
  • the analysis target trend data generation step generates the analysis target trend data by analyzing trends of the analysis target keyword from a plurality of predetermined viewpoints, and the specific keyword determination step , based on the past case trend data obtained by analyzing the past case keywords from a plurality of the viewpoints and the analysis target trend data, whether or not the analysis target keyword corresponds to the specific keyword
  • the plurality of viewpoints includes at least one of the second viewpoint, the third viewpoint, and the fourth viewpoint, and a first viewpoint
  • the first viewpoint is the analysis target keyword may be an elapsed period, which is a period from when the keyword starts to appear in the acquired information, or a continuous appearance period, which is a period in which the analysis target keyword continuously appears in the acquired information.
  • the analysis target keyword is determined to be the specific keyword. may be determined to be applicable.
  • the one analysis target The computer may be further caused to execute a storage processing step of adding the analysis subject trend data relating to the keyword to the storage unit as the past case trend data.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

情報処理装置(10)は、取得情報のうちからキーワードを抽出するキーワード抽出部(36)と、分析対象キーワードの動向を予め決められた観点で分析することによって、分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成部(40)と、法規又は規格が制定又は改訂されるに至った過去の事案に関する過去事案キーワードに関する過去事案動向データと、分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能な特定キーワードに分析対象キーワードが該当するか否かを判定する特定キーワード判定部(44)と、を備える。

Description

情報処理装置、情報処理方法及びプログラム
 本発明は、情報処理装置、情報処理方法及びプログラムに関する。
 特開2004-110149号公報には、法改正に応じた製品データを顧客に迅速に提供し得る法規制情報管理システムが開示されている。
 しかしながら、特開2004-110149号公報は、法改正に応じた製品データを顧客に提供し得るにすぎない。法規等の制定又は改訂に対して、より良好に対応するための技術が待望されている。
 本発明は、上述した課題を解決することを目的とする。
 本発明の一態様による情報処理装置は、期間を隔ててウェブサイトから情報を取得する情報取得部と、前記情報取得部によって取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出部と、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成部と、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定部と、を備える。
 本発明の他の態様による情報処理方法は、期間を隔ててウェブサイトから情報を取得する取得ステップと、前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップと、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップと、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップと、を有する。
 本発明の更に他の態様によるプログラムは、コンピュータに、期間を隔ててウェブサイトから情報を取得する取得ステップと、前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップと、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップと、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップと、を実行させる。
 本発明によれば、法規等の制定又は改訂に対して、より良好に対応することが可能となる。
図1は、一実施形態による情報処理装置を示すブロック図である。 図2は、一実施形態による情報処理方法を示すフローチャートである。 図3は、一実施形態による情報処理方法を示すフローチャートである。
 [一実施形態]
 一実施形態による情報処理装置、情報処理方法、及び、プログラムについて図1~図3を用いて説明する。図1は、本実施形態による情報処理装置を示すブロック図である。
 本実施形態による情報処理装置10は、インターネット等のネットワーク12を介して、サーバ装置14と通信し得る。図1においては、多数のサーバ装置14のうちの1つのサーバ装置14が抜き出して示されている。
 情報処理装置10には、演算部16と、記憶部18と、操作部20と、表示部22と、通信部24とが備えられ得る。情報処理装置10には、これらの構成要素以外の構成要素も備えられ得るが、ここでは説明を省略する。
 サーバ装置14は、例えばWebサーバである。サーバ装置14には、ウェブサイトが構築され得る。サーバ装置14には、演算部26と、記憶部28と、通信部30とが備えられ得る。サーバ装置14には、これらの構成要素以外の構成要素も備えられ得るが、ここでは説明を省略する。
 上述したように、情報処理装置10には、演算部16が備えられ得る。演算部16は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等のプロセッサ(processor)、即ち、処理回路(processing circuitry)によって構成され得る。演算部16には、制御部32と、情報取得部34と、キーワード抽出部36と、分類部37と、関連キーワード判定部38と、分析対象動向データ生成部40と、特定キーワード判定部44と、特定キーワード取得部45と、記憶処理部46と、表示制御部48とが備えられ得る。制御部32と、情報取得部34と、キーワード抽出部36と、分類部37と、関連キーワード判定部38と、分析対象動向データ生成部40と、特定キーワード判定部44と、特定キーワード取得部45と、記憶処理部46と、表示制御部48とは、記憶部18に記憶されているプログラムが演算部16によって実行されることによって実現され得る。なお、演算部16には、これらの構成要素以外の構成要素も備えられ得るが、ここでは説明を省略する。
 なお、制御部32、情報取得部34、キーワード抽出部36、分類部37、関連キーワード判定部38、分析対象動向データ生成部40、特定キーワード判定部44、特定キーワード取得部45、記憶処理部46、表示制御部48の少なくとも一部が、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等の集積回路によって実現されるようにしてもよい。また、制御部32、情報取得部34、キーワード抽出部36、分類部37、関連キーワード判定部38、分析対象動向データ生成部40、特定キーワード判定部44、特定キーワード取得部45、記憶処理部46、表示制御部48の少なくとも一部が、ディスクリートデバイスを含む電子回路によって構成されるようにしてもよい。
 上述したように、情報処理装置10には、記憶部18が備えられ得る。記憶部18は、不図示の揮発性メモリと、不図示の不揮発性メモリとを備え得る。揮発性メモリとしては、例えばRAM(Random Access Memory)等が挙げられ得る。揮発性メモリは、プロセッサのワーキングメモリとして使用され、処理又は演算に必要なデータ等を一時的に記憶する。不揮発性メモリとしては、例えばROM(Read Only Memory)、フラッシュメモリ等が挙げられ得る。不揮発性メモリは、保存用のメモリとして使用され、プログラム、テーブル、マップ等を記憶する。記憶部18の少なくとも一部が、上述したようなプロセッサ、集積回路等に備えられていてもよい。また、記憶部18には、HDD(Hard Disk Drive)、SSD(Solid State Drive)等が更に備えられ得る。記憶部18には、本実施形態による情報処理方法をコンピュータに実行させるためのアプリケーションプログラムが予めインストールされる。また、記憶部18には、後述する過去事案動向データが記憶される過去事案動向データ記憶部50が備えられ得る。記憶部18の少なくとも一部が、情報処理装置10とは別個に設けられた不図示のストレージによって構成されてもよい。かかるストレージとしては、例えば、AWS(Amazon Web Service)のストレージ等が挙げられ得るが、これに限定されない。
 上述したように、情報処理装置10には、操作部20が備えられ得る。操作部20は、ユーザが情報処理装置10に対して操作入力を行う際に用いられ得る。操作部20としては、キーボード、マウス等が挙げられ得るが、これに限定されない。
 上述したように、情報処理装置10には、表示部22が備えられ得る。表示部22には、不図示の表示素子が備えられている。表示素子としては、例えば、液晶表示素子、有機エレクトロルミネッセンス表示素子等が用いられ得る。このような表示素子が備えられた不図示のタッチパネルによって、操作部20と表示部22とが構成されてもよい。
 上述したように、情報処理装置10には、通信部24が備えられ得る。通信部24には、例えば、不図示の通信モジュールが備えられている。通信部24は、ネットワーク12を介して、サーバ装置14に備えられた通信部30との間で通信を行い得る。
 上述したように、サーバ装置14には、演算部26が備えられ得る。演算部26は、CPU、GPU等のプロセッサ、即ち、処理回路によって構成され得る。演算部26には、制御部54が備えられ得る。制御部54は、サーバ装置14の全体の制御を司る。制御部54は、記憶部28に記憶されているプログラムが演算部26によって実行されることによって実現され得る。なお、演算部26には、制御部54以外の構成要素も備えられ得るが、ここでは説明を省略する。
 なお、制御部54の少なくとも一部が、ASIC、FPGA等の集積回路によって実現されるようにしてもよい。また、制御部54の少なくとも一部が、ディスクリートデバイスを含む電子回路によって構成されるようにしてもよい。
 上述したように、サーバ装置14には、記憶部28が備えられ得る。記憶部28は、不図示の揮発性メモリと、不図示の不揮発性メモリとを備え得る。記憶部28には、HDD、SSD等が更に備えられ得る。上述したように、サーバ装置14には、ウェブサイトが構築される。記憶部28には、ウェブページを構成するページデータが記憶され得る。ウェブページには、テキスト情報が含まれ得る。
 上述したように、情報処理装置10には、制御部32が備えられ得る。制御部32は、情報処理装置10の全体の制御を司る。
 上述したように、情報処理装置10には、情報取得部34が備えられ得る。情報取得部34は、ユーザによって予め指定されたウェブサイトである指定サイトから情報を取得する。より具体的には、情報取得部34は、指定サイトからテキスト情報を取得する。1つのウェブサイトのみが指定サイトとして指定されてもよいし、複数のウェブサイトが指定サイトとして指定されてもよい。
 指定サイトとしては、例えば、大衆的なウェブサイト、専門的なウェブサイト、国策に関するウェブサイト等が挙げられ得るが、これに限定されない。大衆的なウェブサイトとしては、例えば、ニュースサイト等が挙げられ得るが、これに限定されない。専門的なウェブサイトとしては、例えば、専門機関のウェブサイト等が挙げられ得るが、これに限定されない。国策に関するウェブサイトとしては、例えば、政党のウェブサイト、官公庁のウェブサイト等が挙げられ得るが、これに限定されない。なお、情報取得部34は、ユーザによって予め指定されたウェブサイト以外のウェブサイトである未指定サイトから情報を適宜取得してもよい。
 法規又は規格が制定又は改訂される一般的なプロセスは、以下の通りである。即ち、第1段階では、当該事案に対しての関心が生じる。第1段階では、当該事案が話題となる。第1段階においては、当該事案が一般的な情報源から報じられるのが一般的である。一般的な情報源としては、例えば報道機関等が挙げられ得るが、これに限定されない。第1段階においては、例えば、大衆的なウェブサイト等から当該事案が報じられ得る。即ち、第1段階においては、報道機関等のウェブサイト等から当該事案が報じられ得る。第1段階においては、当該事案が専門的な情報源からも報じられるようになる。即ち、第1段階においては、例えば専門機関からも当該事案が報告されるようになる。より具体的には、第1段階においては、例えば専門機関のウェブサイト等から当該事案が報告されるようになる。第2段階では、当該事案が社会問題となる。また、第2段階では、当該事案を解決するための技術の進歩が生ずる。第3段階では、当該物事が会議等の議題になる。第3段階では、政党、官公庁等からも当該事案が報告されるようになる。より具体的には、第3段階では、例えば、政党、官公庁等のウェブサイト等から当該事案が報告されるようになる。第4段階では、法規又は規格の制定又は改訂が行われる。より具体的には、第4段階では、法規情報、規格情報等のウェブサイト等から当該事案が報告されるようになる。上記のようなプロセスを経て法規又は規格が制定又は改訂されるため、上記のような特定サイトからの情報の取得は、法規又は規格の制定又は改訂の動向の予測に利用可能な後述する特定キーワードの取得に資する。本明細書中において、法規は、広義に解釈され、法令に限定されない。なお、法令は、法律(議会が制定する法規範)と命令(行政機関が制定する法規範)の総称である。
 情報取得部34は、かかる情報を、時間を隔てて取得する。情報取得部34は、かかる情報を例えば定期的に取得する。情報取得部34は、かかる情報を例えば1週間毎に取得するが、これに限定されない。情報取得部34は、かかる情報を、毎日取得してもよいし、1ヶ月毎に取得してもよい。また、情報取得部34は、かかる情報を不定期に取得してもよい。
 上述したように、情報処理装置10には、キーワード抽出部36が備えられ得る。キーワード抽出部36は、情報取得部34によって取得された情報である取得情報のうちからキーワードを抽出する。キーワードの抽出は、以下のようにして行われ得る。まず、キーワード抽出部36は、情報取得部34によって取得されたテキスト情報を単語に分割する。次に、キーワード抽出部36は、分割により得られた複数の単語のうちからキーワードを抽出する。キーワードの抽出は、例えば、以下のようにして行われ得る。即ち、キーワードの抽出においては、自立語をキーワードとして抽出する一方、付属語をキーワードとして抽出しない。自立語は、単独でも文節を構成することができる単語である。付属語は、単独では文節を構成することができず、自立語の後に付されて文節を構成する単語である。キーワードの抽出の手法は上記に限定されない。こうして、情報取得部34によって取得された情報のうちからキーワードが抽出される。なお、情報取得部34によって取得されたテキスト情報に対して翻訳を行うことを要する場合には、キーワード抽出部36は、当該テキスト情報を単語に分割する前の段階で、当該テキスト情報に対して翻訳を行う。キーワード抽出部36の少なくとも一部には、人工知能(AI:Artificial Intelligence)が用いられ得る。
 上述したように、情報処理装置10には、分類部37が備えられ得る。分類部37は、キーワード抽出部36によって抽出されたキーワードが、予め区分けされた複数の分野のうちのいずれかに属するかを判定する。かかる分野としては、例えば、政治、経済、業界、技術、娯楽等が挙げられ得るが、これに限定されない。分類部37は、当該キーワードが属する分野を示す情報を、当該キーワードに紐付ける。分類部37の少なくとも一部には、人工知能が用いられ得る。
 上述したように、情報処理装置10には、関連キーワード判定部38が備えられ得る。関連キーワード判定部38は、キーワードに関連する関連キーワードを判定する。関連キーワード判定部38は、一のキーワードに対して関連性が比較的高いキーワードを、当該一のキーワードの関連キーワードと判定する。関連キーワード判定部38は、一のキーワードに対して関連性が比較的低いキーワードを、当該一のキーワードの関連キーワードと判定しない。
 関連キーワード判定部38は、以下のようにして関連キーワードを判定する。即ち、ある文のうちに複数のキーワードが存在している場合、これらのキーワードは互いに紐付いた状態である。関連キーワード判定部38は、キーワード同士の関連性を、例えば、キーワード同士の紐付きが同一文書中において出現する回数に基づいて判定し得る。例えば、キーワード同士の紐付きの出現回数を、関連性の高さを示す値とすることができるが、これに限定されない。
 ある文書中に以下のような文(第1文)が存在する場合を例に説明する。第1文は、例えば、「私は犬が好きである。」という文である。第1文から抽出されるキーワードは、「私」、「犬」、「好き」である。「私」と「犬」と「好き」とは第1文中に存在しているため、「私」と「犬」と「好き」とは互いに紐付いている。第1文のみに着目した場合、これらのキーワード同士の紐付きの回数は1回である。
 当該文書中には、第1文のみならず、第2文も存在する。互いに共通するキーワードが第1文と第2文とに存在している場合、関連キーワード判定部38は、第1文と第2文の両方に着目する。第2文は、例えば、「私は猫も好きである。」という文である。第2文から抽出されるキーワードは、「私」、「猫」、「好き」である。第1文と第2文とは、「私」が含まれている点で共通している。また、第1文と第2文とには、「好き」が含まれている点で共通している。従って、関連キーワード判定部38は、第1文と第2文の両方に着目する。「私」、「猫」、「好き」は第2文中に存在しているため、「私」と「猫」と「好き」とは互いに紐付いている。第1文と第2文の両方に着目した場合、キーワード同士の紐付きの出現回数は以下の通りである。即ち、「私」と「好き」との紐付きの出現回数は全体として2回である。「私」と「犬」との紐付きの回数は全体として1回である。「私」と「猫」との紐付きの回数は1回である。「犬」と「好き」との紐付きの出現回数は全体として1回である。「猫」と「好き」との紐付きの出現回数は全体として1回である。「犬」と「猫」との紐付きの出現回数は全体として0回である。
 当該文書中には、多数の文が存在する。関連キーワード判定部38は、取得情報中に含まれる多数の文に着目してキーワード同士の関連性を判定する。関連キーワード判定部38は、一のキーワードに対する関連性が関連性閾値以上であるキーワードを、当該一のキーワードの関連キーワードと判定する。例えば、「私」と「好き」との紐付きの出現回数が例えば10であり、関連性閾値が例えば5である場合、「私」に対する「好き」の関連性は関連性閾値以上である。従って、このような場合には、関連キーワード判定部38は、「好き」を「私」の関連キーワードと判定する。このような場合、「好き」に対する「私」の関連性も関連性閾値以上である。従って、関連キーワード判定部38は、「私」を「好き」の関連キーワードと判定する。なお、ここでは、関連性閾値を設定する場合を例に説明したが、これに限定されない。関連性閾値を設定しなくてもよい。
 関連キーワード判定部38は、一のキーワードに対する関連性が関連性閾値未満であるキーワードを、当該一のキーワードの関連キーワードと判定しない。例えば、「私」と「犬」との紐付きの出現回数が3であり、関連性閾値が5である場合、「私」に対する「犬」の関連性は関連性閾値未満である。従って、このような場合には、関連キーワード判定部38は、「犬」を「私」の関連キーワードと判定しない。このような場合、「犬」に対する「私」の関連性も関連性閾値未満である。従って、関連キーワード判定部38は、「私」を「犬」の関連キーワードと判定しない。
 こうして、関連キーワード判定部38は、キーワードに関連する関連キーワードを判定する。関連キーワード判定部38の少なくとも一部には、人工知能が用いられ得る。
 関連キーワード判定部38は、キーワードと、当該キーワードの関連キーワードとを、互いに紐付けられて記憶部18に記憶する。
 上述したように、情報処理装置10には、分析対象動向データ生成部40が備えられ得る。分析対象動向データ生成部40は、分析対象キーワード(解析対象キーワード)の動向を、予め決められた観点(指標)で分析する。分析対象キーワードは、動向分析(動向解析)の対象となるキーワードである。分析対象動向データ生成部40は、分析対象キーワードの動向を予め決められた観点で分析することによって、分析対象キーワードの動向を定量的に示す分析対象動向データを生成し得る。
 かかる観点としては、以下のような第1観点、第2観点、第3観点、及び、第4観点が挙げられ得る。
 第1観点(第1指標)は、例えば、経過期間である。経過期間は、分析対象キーワードが取得情報中に出現し始めてからの期間である。即ち、経過期間は、指定サイトに当該分析対象キーワードが初めて出現したときからの期間である。
 第1観点は、連続出現期間であってもよい。連続出現期間は、分析対象キーワードが取得情報中に連続的に出現した期間である。
 第2観点(第2指標)は、例えば、出現数の時間変化である。出現数は、取得情報中に出現した分析対象キーワードの数である。出現数は、今回得られた取得情報中に含まれる当該分析対象キーワードの数である。前回以前に得られた取得情報中に含まれる当該分析対象キーワードの数は、今回の出現数には含まれない。出現数の時間変化は、広義に解釈され得る。即ち、出現数の増加率の時間変化も、出現数の時間変化に含まれ得る。
 第3観点(第3指標)は、例えば、関連キーワード数の時間変化である。関連キーワード数は、当該分析対象キーワードに関連する関連キーワードの数である。関連キーワード数の時間変化は、広義に解釈され得る。即ち、関連キーワード数の増加率の時間変化も、関連キーワード数の時間変化に含まれ得る。
 第3観点は、新規関連キーワード数の時間変化であってもよい。新規関連キーワード数は、当該分析対象キーワードに新たに関連するに至った関連キーワードである新規関連キーワードの数である。前回の段階で当該分析対象キーワードに関連するに至っていた関連キーワードの数は、新規関連キーワード数には含まれない。新規関連キーワード数の時間変化は、広義に解釈され得る。即ち、新規関連キーワード数の増加率の時間変化も、新規関連キーワード数の時間変化に含まれ得る。
 第4観点(第4指標)は、例えば、関連分野の時間変化である。関連分野は、分析対象キーワードに関連する関連キーワードが属する分野である。
 第4観点は、関連分野数の時間変化であってもよい。関連分野数は、関連キーワードが属する分野である関連分野の数である。関連分野数の時間変化は、広義に解釈され得る。即ち、関連分野数の増加率の時間変化も、関連分野数の時間変化に含まれ得る。
 分析対象動向データ生成部40は、上記のような分析の結果に基づいて、分析対象キーワードの動向を定量的に示す分析対象動向データを生成する。即ち、分析対象動向データ生成部40は、上記のような4つの観点の分析の結果に基づいて、分析対象動向データを生成する。分析対象動向データ生成部40は、こうして生成した分析対象動向データを記憶部18に記憶する。分析対象動向データ生成部40によって生成された分析対象動向データは、分析対象キーワードに紐付けられた状態で記憶部18に記憶される。
 上述したように、情報処理装置10には、特定キーワード判定部44が備えられ得る。特定キーワード判定部44は、分析対象キーワードが特定キーワードに該当するか否かを判定する。特定キーワードは、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである。分析対象キーワードが特定キーワードであるか否かの判定は、以下のようにして行われ得る。即ち、特定キーワード判定部44は、過去事案動向データと、分析対象動向データとの近似の程度を判定する。より具体的には、特定キーワード判定部44は、過去事案動向データの少なくとも一部と、分析対象動向データの少なくとも一部とを対比することによって、過去事案動向データと分析対象動向データとの近似の程度を判定する。過去事案動向データは、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが上記のような観点で分析されたことによって得られたデータである。より具体的には、過去事案動向データは、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが上記のような4つの観点で分析されたことによって得られたデータである。過去事案動向データは、過去事案動向データ記憶部50に予め記憶されている。過去事案動向データ記憶部50には、例えば、複数の過去事案動向データが記憶され得るが、これに限定されない。特定キーワード判定部44の少なくとも一部には、人工知能が用いられ得る。
 特定キーワード判定部44は、過去事案動向データと、分析対象動向データとの近似の程度が、予め決められた程度閾値以上であるか否かを判定する。過去事案動向データと分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合には、当該分析対象キーワードは、法規又は規格の制定又は改訂の動向の予測に利用できる可能性が比較的高いと考えられる。従って、このような場合、特定キーワード判定部44は、当該分析対象キーワードが特定キーワードに該当すると判定する。過去事案動向データと分析対象動向データとの近似の程度が予め決められた程度閾値未満である場合には、当該分析対象キーワードは、法規又は規格の制定又は改訂の動向の予測に利用できる可能性が比較的低いと考えられる。従って、このような場合には、特定キーワード判定部44は、当該分析対象キーワードが特定キーワードに該当すると判定しない。こうして、特定キーワード判定部44は、過去事案動向データと分析対象動向データとに基づいて、特定キーワードに分析対象キーワードが該当するか否かを判定する。
 上述したように、過去事案動向データ記憶部50には、複数の過去事案動向データが記憶され得る。特定キーワード判定部44は、複数の過去事案動向データのうちのいずれかと分析対象動向データとの近似の程度が程度閾値以上である場合、当該分析対象キーワードを特定キーワードに該当すると判定し得る。
 特定キーワード取得部45は、特定キーワード判定部44によって特定された特定キーワードを取得する。特定キーワード取得部45は、取得した特定キーワードを記憶部18に記憶する。特定キーワードは、分析対象動向データと紐付けられた状態で記憶部18に記憶される。記憶部18に記憶された特定キーワードは、法規又は規格の制定又は改訂の動向の予測に利用される。即ち、ユーザは、かかる特定キーワードを用いて情報の検索等を行うことにより、法規又は規格の制定又は改訂の動向を予測し得る。
 上述したように、情報処理装置10には、記憶処理部46が備えられ得る。記憶処理部46は、特定キーワード判定部44によって特定キーワードに該当すると判定された分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、以下のような処理を行う。即ち、記憶処理部46は、かかる場合に、当該分析対象キーワードに関する分析対象動向データを過去事案動向データとして過去事案動向データ記憶部50に追加する。
 上述したように、情報処理装置10には、表示制御部48が備えられ得る。表示制御部48は、表示部22の画面表示を制御し得る。表示制御部48の少なくとも一部には、人工知能が用いられ得る。
 次に、本実施形態による情報処理方法について図2を用いて説明する。図2は、本実施形態による情報処理方法を示すフローチャートである。
 ステップS1において、情報取得部34は、ユーザによって予め指定されたウェブサイトである指定サイトから情報を取得する。この後、ステップS2に遷移する。
 ステップS2において、キーワード抽出部36は、情報取得部34によって取得された情報である取得情報のうちからキーワードを抽出する。この後、ステップS3に遷移する。
 ステップS3において、分類部37は、キーワード抽出部36によって抽出されたキーワードが、予め区分けされた複数の分野のうちのいずれかに属するかを判定する。この後、ステップS4に遷移する。
 ステップS4において、関連キーワード判定部38は、キーワードに関連する関連キーワードを判定する。この後、ステップS5に遷移する。
 ステップS5において、分析対象動向データ生成部40は、分析対象キーワードの動向を、第1観点で分析する。第1観点は、上述したように、経過期間又は連続出現期間である。経過期間は、上述したように、当該分析対象キーワードが取得情報中に出現し始めてからの期間である。連続出現期間は、当該分析対象キーワードが取得情報中に連続的に出現した期間である。この後、ステップS6に遷移する。
 ステップS6において、分析対象動向データ生成部40は、分析対象キーワードの動向を、第2観点で分析する。第2観点は、上述したように、出現数の時間変化である。出現数は、上述したように、取得情報中に出現した分析対象キーワードの数である。この後、ステップS7に遷移する。
 ステップS7において、分析対象動向データ生成部40は、分析対象キーワードの動向を、第3観点で分析する。第3観点は、上述したように、関連キーワード数の時間変化、又は、新規関連キーワード数の時間変化である。関連キーワード数の時間変化は、上述したように、分析対象キーワードに関連する関連キーワードの数である。新規関連キーワード数は、上述したように、分析対象キーワードに新たに関連するに至った関連キーワードである新規関連キーワードの数である。この後、ステップS8に遷移する。
 ステップS8において、分析対象動向データ生成部40は、分析対象キーワードの動向を、第4観点で分析する。第4観点は、上述したように、関連分野の時間変化、又は、関連分野数の時間変化である。関連分野は、上述したように、関連キーワードが属する分野である。関連分野数は、上述したように、関連分野の数である。この後、ステップS9に遷移する。
 ステップS9において、分析対象動向データ生成部40は、上記のような分析の結果に基づいて、分析対象キーワードの動向を定量的に示す分析対象動向データを生成する。この後、ステップS10に遷移する。
 ステップS10において、特定キーワード判定部44は、分析対象動向データと過去事案動向データとの近似の程度を判定する。過去事案動向データは、上述したように、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが上記のような観点で分析されたことによって得られたデータである。上述したように、過去事案動向データ記憶部50には、複数の過去事案動向データが記憶され得る。特定キーワード判定部44は、複数の過去事案動向データの各々と分析対象動向データとの近似の程度を判定する。この後、ステップS11に遷移する。
 ステップS11において、特定キーワード判定部44は、分析対象動向データと過去事案動向データとの近似の程度が、予め決められた程度閾値以上であるか否かを判定する。分析対象動向データと過去事案動向データとの近似の程度が予め決められた程度閾値以上である場合(ステップS11においてYES)、ステップS12に遷移する。より具体的には、複数の過去事案動向データのうちの少なくともいずれかと分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合、ステップS12に遷移する。分析対象動向データと過去事案動向データとの近似の程度が予め決められた程度閾値未満である場合(ステップS11においてNO)、図2に示す処理が完了する。
 ステップS12において、特定キーワード判定部44は、当該分析対象キーワードが特定キーワードに該当すると判定する。こうして、図2に示す処理が完了する。
 複数の分析対象キーワードの各々に対してステップS5~S12に示す処理が行われる。ステップS5~S12に示す処理が複数の分析対象キーワードの各々に対して行われることによって、特定キーワードが複数の分析対象キーワードのうちから抽出され得る。
 次に、本実施形態による情報処理方法について図3を用いて説明する。図3は、本実施形態による情報処理方法を示すフローチャートである。
 ステップS21において、特定キーワード判定部44によって特定キーワードに該当すると判定された分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至ったか否かが判定される。当該分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至ったか否かは、ユーザによって把握されてもよいが、これに限定されない。当該事案についての法規又は規格が制定又は改訂されるに至った場合には(ステップS21においてYES)、ステップS22に遷移する。当該事案についての法規又は規格が制定又は改訂されるに至っていない場合には(ステップS21においてNO)、図3に示す処理が完了する。
 ステップS22において、記憶処理部46は、当該分析対象キーワードに関する分析対象動向データを過去事案動向データとして記憶部18に記憶する。より具体的には、記憶処理部46は、当該分析対象キーワードに関する分析対象動向データを過去事案動向データとして過去事案動向データ記憶部50に追加する。こうして、図3に示す処理が完了する。
 このように、本実施形態によれば、予め決められた観点で分析対象キーワードの動向を分析することによって、分析対象キーワードの動向を定量的に示す分析対象動向データが生成される。分析対象動向データと過去事案動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに分析対象キーワードが該当するか否かが判定される。過去事案動向データには、法規等の制定又は改訂の予兆が生じた段階のデータも含まれている。分析対象キーワードが特定キーワードに該当するか否かが判定される際に、このような過去事案動向データが用いられるため、法規等の制定又は改訂の予兆が生じた段階で特定キーワードが的確に特定され得る。法規等の制定又は改訂の予兆が生じた段階で特定キーワードが得られるため、本実施形態によれば、法規等の制定又は改訂を早期に予期することができる。このため、本実施形態によれば、法規等の制定又は改訂に良好に対応することが可能となる。
 [変形実施形態]
 本発明は、上述した実施形態に限らず、本発明の要旨を逸脱することなく、種々の構成を採り得る。
 例えば、上記実施形態では、分析対象キーワードの動向を第1観点、第2観点、第3観点、及び、第4観点で分析する場合を例に説明したが、これに限定されない。第2観点、第3観点、及び、第4観点のうちの少なくともいずれかで分析対象キーワードを分析することによって、分析対象動向データを生成してもよい。また、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかと、第1観点とで分析対象キーワードを分析することによって、分析対象動向データを生成してもよい。また、第2観点、第3観点、及び、第4観点のうちの2つと、第1観点とで分析対象キーワードを分析することによって、分析対象動向データを生成してもよい。また、第2観点、第3観点、及び、第4観点のうちの2つで分析対象キーワードを分析することによって、分析対象動向データを生成してもよい。また、第2観点、第3観点、及び、第4観点で分析対象キーワードを分析することによって、分析対象動向データを生成してもよい。
 また、上記実施形態では、法規又は規格の制定又は改訂の動向の予測に利用可能な特定キーワードの検出を例に説明したが、これに限定されない。本発明は、世の中の動向の予測に可能な特定キーワードの検出に広く適用可能である。例えば、商品化等の予測に可能な特定キーワードの検出に本発明を用いることも可能である。
 上記の実施形態から把握し得る発明について、以下に記載する。
 本発明の一観点による情報処理装置(10)は、期間を隔ててウェブサイトから情報を取得する情報取得部(34)と、前記情報取得部によって取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出部(36)と、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成部(40)と、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定部(44)と、を備える。このような構成によれば、予め決められた観点で分析対象キーワードの動向を分析することによって、分析対象キーワードの動向を定量的に示す分析対象動向データが生成される。分析対象動向データと過去事案動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに分析対象キーワードが該当するか否かが判定される。過去事案動向データには、法規等の改訂の予兆が生じた段階のデータも含まれている。分析対象キーワードが特定キーワードに該当するか否かが判定される際に、このような過去事案動向データが用いられるため、法規等の改訂の予兆が生じた段階で特定キーワードが的確に特定され得る。法規等の改訂の予兆が生じた段階で特定キーワードが得られるため、このような構成によれば、法規等の改訂を早期に予期することができる。このため、このような構成によれば、法規等の改訂に良好に対応することが可能となる。
 上記の情報処理装置において、前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化であってもよい。
 上記の情報処理装置において、前記分析対象動向データ生成部は、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、前記特定キーワード判定部は、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間であってもよい。
 上記の情報処理装置において、前記特定キーワード判定部は、前記過去事案動向データと前記判定対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定してもよい。
 上記の情報処理装置において、前記特定キーワード判定部によって前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部(18)に追加する記憶処理部(46)を更に備えてもよい。このような構成によれば、豊富な過去事案動向データが得られるため、分析対象キーワードが特定キーワードに該当するか否かを高い精度で判定し得る。
 本発明の他の観点による情報処理方法は、期間を隔ててウェブサイトから情報を取得する取得ステップ(S1)と、前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップ(S2)と、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップ(S9)と、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップ(S12)と、を有する。
 上記の情報処理方法において、前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化であってもよい。
 上記の情報処理方法において、前記分析対象動向データ生成ステップでは、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、前記特定キーワード判定ステップでは、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間であってもよい。
 上記の情報処理方法において、前記特定キーワード判定ステップでは、前記過去事案動向データと前記分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定してもよい。
 上記の情報処理方法において、前記特定キーワード判定ステップにおいて前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部に追加する記憶処理ステップ(S22)を更に備えてもよい。
 本発明の更に他の観点によるプログラムは、コンピュータに、期間を隔ててウェブサイトから情報を取得する取得ステップと、前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップと、動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップと、法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップと、を実行させる。
 上記のプログラムにおいて、前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化であってもよい。
 上記のプログラムにおいて、前記分析対象動向データ生成ステップでは、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、前記特定キーワード判定ステップでは、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間であってもよい。
 上記のプログラムにおいて、前記特定キーワード判定ステップでは、前記過去事案動向データと前記分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定してもよい。
 上記のプログラムにおいて、前記特定キーワード判定ステップにおいて前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部に追加する記憶処理ステップを更に前記コンピュータに実行させてもよい。
10:情報処理装置          12:ネットワーク
14:サーバ装置           16、26:演算部
18、28:記憶部          20:操作部
22:表示部             24、30:通信部
32、54:制御部          34:情報取得部
36:キーワード抽出部        37:分類部
38:関連キーワード判定部      
40:分析対象動向データ生成部
44:特定キーワード判定部      45:特定キーワード取得部
46:記憶処理部           48:表示制御部
50:過去事案動向データ記憶部

Claims (15)

  1.  期間を隔ててウェブサイトから情報を取得する情報取得部(34)と、
     前記情報取得部によって取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出部(36)と、
     動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成部(40)と、
     法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定部(44)と、
     を備える、情報処理装置(10)。
  2.  請求項1に記載の情報処理装置において、
     前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、
     前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、
     前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、
     前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化である、情報処理装置。
  3.  請求項2に記載の情報処理装置において、
     前記分析対象動向データ生成部は、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、
     前記特定キーワード判定部は、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、
     複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、
     前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間である、情報処理装置。
  4.  請求項1~3のいずれか1項に記載の情報処理装置において、
     前記特定キーワード判定部は、前記過去事案動向データと前記分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定する、情報処理装置。
  5.  請求項1~4のいずれか1項に記載の情報処理装置において、
     前記特定キーワード判定部によって前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部(18)に追加する記憶処理部(46)を更に備える、情報処理装置。
  6.  期間を隔ててウェブサイトから情報を取得する取得ステップ(S1)と、
     前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップ(S2)と、
     動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップ(S9)と、
     法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップ(S12)と、
     を有する、情報処理方法。
  7.  請求項6に記載の情報処理方法において、
     前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、
     前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、
     前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、
     前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化である、情報処理方法。
  8.  請求項7に記載の情報処理方法において、
     前記分析対象動向データ生成ステップでは、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、
     前記特定キーワード判定ステップでは、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、
     複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、
     前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間である、情報処理方法。
  9.  請求項6~8のいずれか1項に記載の情報処理方法において、
     前記特定キーワード判定ステップでは、前記過去事案動向データと前記分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定する、情報処理方法。
  10.  請求項6~9のいずれか1項に記載の情報処理方法において、
     前記特定キーワード判定ステップにおいて前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部に追加する記憶処理ステップ(S22)を更に備える、情報処理方法。
  11.  コンピュータに、
     期間を隔ててウェブサイトから情報を取得する取得ステップと、
     前記取得ステップにおいて取得された情報である取得情報のうちからキーワードを抽出するキーワード抽出ステップと、
     動向分析の対象となるキーワードである分析対象キーワードの動向を、予め決められた観点で分析することによって、前記分析対象キーワードの動向を定量的に示す分析対象動向データを生成する分析対象動向データ生成ステップと、
     法規又は規格が制定又は改訂されるに至った過去の事案に関するキーワードである過去事案キーワードが前記観点で分析されたことによって得られた過去事案動向データと、前記分析対象動向データとに基づいて、法規又は規格の制定又は改訂の動向の予測に利用可能なキーワードである特定キーワードに前記分析対象キーワードが該当するか否かを判定する特定キーワード判定ステップと、
     を実行させるためのプログラム。
  12.  請求項11に記載のプログラムにおいて、
     前記観点は、第2観点、第3観点、及び、第4観点のうちの少なくともいずれかであり、
     前記第2観点は、前記取得情報中に出現した前記分析対象キーワードの数である出現数の時間変化であり、
     前記第3観点は、前記分析対象キーワードに関連する関連キーワードの数である関連キーワード数の時間変化、又は、前記分析対象キーワードに新たに関連するに至った前記関連キーワードの数である新規関連キーワード数の時間変化であり、
     前記第4観点は、前記関連キーワードが属する分野である関連分野の時間変化、又は、前記関連分野の数である関連分野数の時間変化である、プログラム。
  13.  請求項12に記載のプログラムにおいて、
     前記分析対象動向データ生成ステップでは、前記分析対象キーワードの動向を、予め決められた複数の観点で分析することによって、前記分析対象動向データを生成し、
     前記特定キーワード判定ステップでは、前記過去事案キーワードが複数の前記観点で分析されたことによって得られた前記過去事案動向データと、前記分析対象動向データとに基づいて、前記特定キーワードに前記分析対象キーワードが該当するか否かを判定し、
     複数の前記観点は、前記第2観点、前記第3観点、及び、前記第4観点のうちの少なくともいずれかと、第1観点とを含み、
     前記第1観点は、前記分析対象キーワードが前記取得情報中に出現し始めてからの期間である経過期間、又は、前記分析対象キーワードが前記取得情報中に連続的に出現した期間である連続出現期間である、プログラム。
  14.  請求項11~13のいずれか1項に記載のプログラムにおいて、
     前記特定キーワード判定ステップでは、前記過去事案動向データと前記分析対象動向データとの近似の程度が予め決められた程度閾値以上である場合に、前記分析対象キーワードが前記特定キーワードに該当すると判定する、プログラム。
  15.  請求項11~14のいずれか1項に記載のプログラムにおいて、
     前記特定キーワード判定ステップにおいて前記特定キーワードに該当すると判定された一の前記分析対象キーワードに関する事案についての法規又は規格が制定又は改訂されるに至った場合に、前記一の分析対象キーワードに関する前記分析対象動向データを前記過去事案動向データとして記憶部に追加する記憶処理ステップを更に前記コンピュータに実行させる、プログラム。
PCT/JP2022/047069 2021-12-27 2022-12-21 情報処理装置、情報処理方法及びプログラム WO2023127631A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-212101 2021-12-27
JP2021212101A JP2023096385A (ja) 2021-12-27 2021-12-27 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2023127631A1 true WO2023127631A1 (ja) 2023-07-06

Family

ID=86999060

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/047069 WO2023127631A1 (ja) 2021-12-27 2022-12-21 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
JP (1) JP2023096385A (ja)
WO (1) WO2023127631A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225579A (ja) * 2007-03-08 2008-09-25 Internatl Business Mach Corp <Ibm> 事象の発生を決定付けるキーワードを検索する技術
JP2018067230A (ja) * 2016-10-21 2018-04-26 三菱電機株式会社 情報処理装置及び開発支援システム
WO2018230616A1 (ja) * 2017-06-13 2018-12-20 本田技研工業株式会社 法的情報処理システム、方法及びプログラム
US20190171706A1 (en) * 2017-12-02 2019-06-06 International Business Machines Corporation Leveraging word patterns in the language of popular influencers to predict popular trends
JP2019144905A (ja) * 2018-02-21 2019-08-29 富士通株式会社 情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225579A (ja) * 2007-03-08 2008-09-25 Internatl Business Mach Corp <Ibm> 事象の発生を決定付けるキーワードを検索する技術
JP2018067230A (ja) * 2016-10-21 2018-04-26 三菱電機株式会社 情報処理装置及び開発支援システム
WO2018230616A1 (ja) * 2017-06-13 2018-12-20 本田技研工業株式会社 法的情報処理システム、方法及びプログラム
US20190171706A1 (en) * 2017-12-02 2019-06-06 International Business Machines Corporation Leveraging word patterns in the language of popular influencers to predict popular trends
JP2019144905A (ja) * 2018-02-21 2019-08-29 富士通株式会社 情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
JP2023096385A (ja) 2023-07-07

Similar Documents

Publication Publication Date Title
US10558712B2 (en) Enhanced online user-interaction tracking and document rendition
CN109145215B (zh) 网络舆情分析方法、装置及存储介质
US7987417B2 (en) System and method for detecting a web page template
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
Ryfe et al. What is the meaning of a news link?
US10430713B2 (en) Predicting and enhancing document ingestion time
US20170004130A1 (en) Identifying word-senses based on linguistic variations
US20120072429A1 (en) Public relations and reputation mining via semantic analytics
US20180181609A1 (en) System for De-Duplicating Job Postings
US20160085389A1 (en) Knowledge automation system thumbnail image generation
Wang et al. Cyber threat intelligence entity extraction based on deep learning and field knowledge engineering
KR101667199B1 (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
US11321400B2 (en) System and method for crawling web-content
KR102124935B1 (ko) 크라우드 소싱을 활용한 재난 모니터링 시스템, 재난 모니터링 방법 및 이를 수행하기 위한 컴퓨터 프로그램
WO2023127631A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN116860311A (zh) 脚本分析方法、装置、计算机设备及存储介质
US9705972B2 (en) Managing a set of data
JP4853915B2 (ja) 検索システム
Naik et al. An adaptable scheme to enhance the sentiment classification of Telugu language
US20160260184A1 (en) Document investigation system, document investigation method, and document investigation program for providing prior information
US11115440B2 (en) Dynamic threat intelligence detection and control system
WO2016203230A1 (en) A method and system for locating regulatory information
CN104951869A (zh) 一种基于工作流的舆情监控方法及装置
US20190236462A1 (en) System and method for predicting future news coverage
Miller et al. Twenty years of building simulation trends: Text mining and topic modeling of the bldg-sim email list archive

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22915854

Country of ref document: EP

Kind code of ref document: A1