WO2023050652A1 - 基于文本识别的区域内esg指数确定方法及相关产品 - Google Patents

基于文本识别的区域内esg指数确定方法及相关产品 Download PDF

Info

Publication number
WO2023050652A1
WO2023050652A1 PCT/CN2022/071321 CN2022071321W WO2023050652A1 WO 2023050652 A1 WO2023050652 A1 WO 2023050652A1 CN 2022071321 W CN2022071321 W CN 2022071321W WO 2023050652 A1 WO2023050652 A1 WO 2023050652A1
Authority
WO
WIPO (PCT)
Prior art keywords
news
event
index
target
target news
Prior art date
Application number
PCT/CN2022/071321
Other languages
English (en)
French (fr)
Inventor
邵熹
诸世卓
陈廷豪
闻心远
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2023050652A1 publication Critical patent/WO2023050652A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Definitions

  • This application relates to the technical field of artificial intelligence, in particular to a text recognition-based method for determining an ESG index within a region and related products.
  • a company's ESG score is a comprehensive score for the company's environment (E), society (S), and governance (G).
  • E company's environment
  • S society
  • G governance
  • International and domestic companies have accumulated some successful experience in scoring ESG performance.
  • Internationally renowned rating agencies such as MSCI and FTSE have established their own scoring standards and conducted ESG evaluations on internationally renowned companies.
  • ESG scores for companies are mainly based on the number of news related to the company.
  • the embodiment of the present application provides a text recognition-based method for determining an ESG index in an area and related products, which realize ESG scoring for an area and make up for the gap in the prior art.
  • the embodiment of the present application provides a text recognition-based method for determining an ESG index in a region, including:
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • an ESG index determination device including: an acquisition unit and a processing unit;
  • the obtaining unit is used to obtain a plurality of news related to ESG evaluation within a preset time period
  • the processing unit is configured to perform text recognition on each of the plurality of news articles to obtain a plurality of news events, and an occurrence area of each news event in the plurality of news events;
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • an embodiment of the present application provides an electronic device, including: a processor, the processor is connected to a memory, the memory is used to store a computer program, and the processor is used to execute the computer program stored in the memory , so that the electronic device executes the method as described in the first aspect, the method includes:
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • an embodiment of the present application provides a computer-readable storage medium, the computer-readable storage medium stores a computer program, and the computer program causes a computer to execute the method as described in the first aspect, the method comprising:
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • the news events in the news and the occurrence area of the news event are obtained through text recognition; thus, based on the occurrence area of the news event, the target news event belonging to the preset area is screened out; finally, based on the clustering technology, it is determined
  • the heat index of each target news event based on the topic recognition model, determines the sentiment index of each target news event; based on the heat index and sentiment index of each target news event, determines the public opinion index of each target news event; finally, based on The public opinion index of each target news event determines the ESG index in the preset area, so as to realize the ESG evaluation of the preset area and make up for the gap in the existing technology.
  • Fig. 1 is a schematic flowchart of a method for determining an ESG index in a region based on text recognition provided by an embodiment of the present application;
  • FIG. 2 is a schematic flow diagram of another method for determining an ESG index in a region based on text recognition provided by an embodiment of the present application;
  • Fig. 3 is a block diagram of functional units of an ESG index determination device provided by the embodiment of the present application.
  • FIG. 4 is a schematic structural diagram of an electronic device provided by an embodiment of the present application.
  • the ESG index involved in the embodiment of this application is the ESG score, which can also be called ESG evaluation. They are essentially the same, and there is no need to distinguish them later. Correspondingly, performing ESG evaluation on preset areas, or ESG scoring on preset areas, are essentially the same, and they are both used to determine the ESG index of the preset area.
  • AI artificial intelligence
  • digital computers or machines controlled by digital computers to simulate, extend and expand human intelligence, perceive the environment, acquire knowledge and use knowledge to obtain the best results.
  • Artificial intelligence basic technologies generally include technologies such as sensors, dedicated artificial intelligence chips, cloud computing, distributed storage, big data processing technology, operation/interaction systems, and mechatronics.
  • Artificial intelligence software technology mainly includes computer vision technology, robotics technology, biometrics technology, speech processing technology, natural language processing technology, and machine learning/deep learning.
  • FIG. 1 is a schematic flowchart of a method for determining an ESG index in a region based on text recognition provided by an embodiment of the present application. This method is applied to the ESG index determination device. The method includes the following steps:
  • multiple news articles can be obtained from multiple third-party platforms, wherein the multiple third-party platforms can be websites or applications of news media; , to determine the multiple news articles belonging to the preset time period; finally, perform text processing on each of the multiple news articles within the preset time period, and obtain multiple news articles related to ESG evaluation within the preset time period, such as , carry out entity identification on each piece of news, obtain the entity of each piece of news, and regard the news containing ESG evaluation entities as news related to ESG evaluation.
  • the preset time period may be any time period, for example, last quarter, last month, last year, and so on.
  • entity recognition is performed on each of the multiple news articles to obtain the entity of each news article; entities related to news events are selected from the identified entities, and news events of each news article are determined based on the entities .
  • each news may contain one or more news events. For example, if the entity is "Fire safety is not up to standard", it is determined that the news events in the news are “Fire safety is not up to standard”; finally, the news events in each piece of news are combined to obtain the multiple news events.
  • the merging refers to merging the news events in each news article as different news events.
  • the location of the news event in each piece of news is identified, if the location of the news event in the piece of news is extracted from each piece of news, then the place of occurrence extracted from each piece of news is used as the location of each piece of news.
  • the occurrence area of the news event in the news can get the occurrence area of each news event; if the occurrence area of the news event in the news is not extracted from each news, the location For the involved enterprises, the location of the main business of the enterprise is regarded as the occurrence area of the news event in each news article, and the occurrence area of each news event can be obtained.
  • the preset area is pre-set.
  • the user can input the area where ESG scoring is desired on the visual interface of the ESG index determining device.
  • the target news events belonging to Nanshan District, Shenzhen were screened out from the events. Therefore, the preset area can be understood as an area waiting for ESG evaluation, which can be any area.
  • multiple target news events are clustered to obtain at least one target news event group, wherein each target news event group contains at least one target news event, and at least one of each target news event group
  • the target news event essentially reflects a news event, but each target news event may be in a different description form, for example, one target news event is "Enterprise A's fire protection is not up to standard”, another target news event is "Enterprise A's fire protection mechanism Unsound”, these two target news events essentially represent news event company A that has fire hazards.
  • At least one piece of news corresponding to at least one target news event in the first target news event group is clustered to obtain at least one news group, wherein the first target news event group is at least one news event group in the target news event group
  • Each news group in at least one news group includes an original news and H reprinted news corresponding to the original news, where H is an integer greater than or equal to 0.
  • semantic information is extracted from each news in at least one news, and a semantic vector corresponding to each news is obtained; at least one news is clustered based on the semantic vector of each news, and at least one first news is obtained Group, that is to determine the Euclidean distance between the semantic vectors of any two news in at least one news, and take the Euclidean distance between the semantic vectors of any two news as the similarity between any two news; then, the similarity Two news articles whose degree is greater than the first threshold are classified into one category, that is, they are classified into a newsgroup, and at least one newsgroup is obtained.
  • the similarity between the semantic vectors of the two news articles is greater than the first threshold, it means that this
  • the contents of the two news articles are relatively similar, that is to say, one of the news articles may be generated by reprinting the other news article, or both news articles are generated by reprinting the same news article.
  • each newsgroup includes one original news and H reprinted news.
  • H is greater than or equal to 1
  • the publication time must be the earliest, so the news with the earliest publication time in each newsgroup can be used as the original news in each newsgroup, and the rest of the news are reprinted news in each newsgroup.
  • each news group determines the heat index corresponding to each news group; the news to which each target news event in the first target news event group belongs
  • the popularity index corresponding to the group is used as the popularity index of the target news event, that is, to determine which news group the news of each target news event belongs to, and then, the popularity index corresponding to the news group is used as the popularity index of the target news event.
  • the popularity index of each newsgroup can be determined from the quantity of news. It should be understood that original news is independently created by journalists and has nothing to do with troll hype. Therefore, all original news under a news event should attract the same attention to this news event, that is to say, every The degree of contribution of each piece of original news to the attention of the society received by news events is the same. Therefore, a value is preset for each original news event, so that the contribution of original news in terms of attention is not affected by the number of reprinted news; according to the set value of original news in each news group and the The number H of reposted news included determines the popularity index of each newsgroup.
  • the popularity index of each newsgroup can be expressed by formula (1):
  • HeatEvent j log2(H j +1)+a formula (1)
  • HeatEvent j is the heat index of the jth newsgroup in at least one newsgroup
  • H j is the number of reprinted news contained in the jth newsgroup
  • a is the set value of the original news, which generally takes a value of 1 .
  • the scaling ratio of each newsgroup can also be expressed by formula (2):
  • 105 Based on the trained topic recognition model, determine the sentiment index of each target news event in the plurality of target news events, and the sentiment index is used to characterize the target news event to the enterprise related to the target news event degree of influence.
  • a news ESG event system is established first, that is, a mapping relationship between ESG events and sentiment levels is established.
  • ESG events include evaluation dimensions, topics, events, subdivided events, and sentiment levels.
  • Evaluation dimensions, topics, events, and subdivided events are sequential affiliations. Therefore, evaluation dimensions, topics, events, subdivided events, and The mapping relationship between emotion levels, where the evaluation dimension includes three dimensions: E, S, and G.
  • Table 1 Mapping relationship between ESG events and sentiment ratings.
  • each target news event determines the three-level event of each target news event based on the trained topic recognition model, that is, the event; then, obtain the keywords of each target news event; according to the above-mentioned mapping relationship, the three-level event of each target news event and keywords to determine the four-level events of each target news event, that is, subdivided events; then, according to the subdivided events of each target news event, the emotional level of each target news event is obtained.
  • the training process of the topic recognition model includes: selecting multiple news articles from historical news, and marking corresponding labels on the third-level and fourth-level events of each news.
  • the second-level event is directly identified, there are too many differences between the second-level event and the fourth-level event, which cannot be achieved through keyword matching. Therefore, identifying the third-level events can not only improve the convergence speed of the model, but also ensure the accuracy of the fourth-level event recognition.
  • the publishing media of news corresponding to each target news event is obtained; according to the mapping relationship between the publishing media and the adjustment amount, the adjustment amount of each target news event is determined; then, based on the adjustment amount of each target news event, Adjust the sentiment index of each target news event to obtain the final sentiment index of each target news event, and use the adjusted sentiment index as the sentiment index of each target news time.
  • the target news event is a general negative event and the publishing media of the target news event is a national media
  • the adjustment amount is -2
  • the final sentiment index of the target news event can be determined to be -3.
  • the public opinion index of each target news event can be expressed by formula (3):
  • EventScore j HeatEvent j * AdjScore j formula (3);
  • EventScore j is the public opinion index of the jth target news event among multiple target news events
  • HeatEvent j is the heat index of the jth target news event
  • AdjScore j is the sentiment index of the jth target news event.
  • the type of each target news event among the plurality of target news events is determined, wherein the type of each target news event includes one of a positive news event or a negative news event. Then, determine the sum of the public opinion index of the target news event that belongs to negative news event in a plurality of target news events, obtain the first total public opinion index; Determine the public opinion index of the target news event that belongs to positive news event in described a plurality of target news events and get the second total public opinion index.
  • a negative news event may be understood as a news event with a sentiment index less than zero
  • a positive news event may be understood as a news event with a sentiment index greater than zero
  • the first total public opinion index can be expressed by formula (4):
  • NegScore is the first total public opinion index
  • EventScore k is the kth negative news event.
  • the second total public opinion index can be expressed by formula (5):
  • PosScore is the second total public opinion index
  • EventScore i is the ith negative news event.
  • the ESG index in the preset area can be expressed by formula (6):
  • FinalScore is the ESG index in the preset area.
  • the news events in the news and the occurrence area of the news event are obtained through text recognition; thus, based on the occurrence area of the news event, the targets belonging to the preset area (ie, the area to be evaluated) are screened out.
  • the targets belonging to the preset area ie, the area to be evaluated
  • the ESG index in the preset area is determined, so as to realize the ESG evaluation of the preset area and make up for the gap in the existing technology.
  • FIG. 2 is a schematic flowchart of another method for determining an ESG index in a region based on text recognition provided by an embodiment of the present application. This method is applied to the ESG index determination device. The content of this implementation and that shown in FIG. 1 will not be repeated here. The method includes the following steps:
  • the ESG index of this application has the following application scenarios:
  • Scenario 1 When the target equipment is the equipment of an investment institution, the ESG index of the preset area is sent to the investment institution, and the investment institution can make a decision related to the preset area: investment related to the preset area decision making.
  • the investment decision can be to invest in the preset area amount and investment cycle, for example, select companies with higher credit ratings from the preset area, and add investment and investment cycle; Invest or reduce investment in a preset area, etc., for example, when there is currently an investment in a preset area, you can withdraw capital from the preset area.
  • sending the ESG index of the preset region to investment institutions can provide direction guidance for the investment decision-making of investment institutions and reduce investment risks.
  • Scenario 2 When the target device is the device of any company in the preset area, the ESG index of the preset area is sent to the company, and the company can make management decisions related to the company. For example, since the ESG index of a preset region reflects the value and sustainable development capability of the preset region, investors are more willing to invest in ESG indexes as their acceptance of ESG indexes deepens and they attach importance to corporate social responsibility. higher enterprises.
  • the management decision makes a decision for the company to strengthen corporate management and continue to maintain its excellent performance in ESG; when the ESG index in the preset area When the ESG index is low, the management decision is to adjust the company's development strategy, improve the company's sustainable development, and increase the ESG index.
  • sending the ESG index of the preset area to the enterprise will help promote the enterprise's efforts to improve its own ESG evaluation and guide the healthy development of the enterprise.
  • the news events in the news and the occurrence area of the news event are obtained through text recognition; thus, based on the occurrence area of the news event, the targets belonging to the preset area (ie, the area to be evaluated) are screened out.
  • the targets belonging to the preset area ie, the area to be evaluated
  • the ESG index in the preset area is determined, so as to realize the ESG evaluation of the preset area and make up for the gap in the existing technology.
  • the ESG index in the preset area is sent to the target device, so that the user of the target device can guide the healthy development of the enterprise in the preset area according to the ESG index, and improve the sustainable development capability of the enterprise.
  • FIG. 3 is a block diagram of functional units of an ESG index determination device provided in an embodiment of the present application.
  • the ESG index determination device 300 includes: an acquisition unit 301 and a processing unit 302;
  • An acquisition unit 301 configured to acquire multiple news articles related to ESG evaluation within a preset time period
  • a processing unit 302 configured to perform text recognition on each of the plurality of news articles to obtain a plurality of news events, and an occurrence area of each news event in the plurality of news events;
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • the processing unit 302 in terms of performing text recognition on each of the plurality of news articles to obtain a plurality of news events and the occurrence area of each news event in the plurality of news events, the processing unit 302, specifically for:
  • the location of the news event in the news is not extracted from each piece of news, the company involved in the news event in each piece of news is obtained, and the location of the main business of the company is used as the location of the main business of the company.
  • the occurrence area of the news event in each news article is described, and the occurrence area of each news event is obtained.
  • the public opinion index of each target news event satisfies the following formula:
  • EventScore j HeatEvent j * AdjScore j
  • EventScore j is the public opinion index of the jth target news event in the multiple target news events
  • HeatEvent j is the heat index of the jth target news event
  • AdjScore j is the jth target news event sentiment index.
  • the processing unit 302 is specifically configured to:
  • Each news group in the at least one news group includes an original news and H reprinted news corresponding to the original news, where H is an integer greater than or equal to 0;
  • each news group determines the popularity index corresponding to each news group
  • the popularity index of each target news event in the first target news event group is obtained.
  • the processing unit 302 is specifically configured to:
  • the multiple targets are determined according to the preset correspondence between segmented events and sentiment indices, and the segmented events of each target news event in the multiple target news events After the sentiment index of each target news event in the news event, the processing unit 302 is also used to:
  • the adjusted sentiment index of each target news event in the plurality of target news events is used as the sentiment index of each target news event in the plurality of target news events.
  • the processing unit 302 is specifically configured to:
  • each target news event includes a negative news event or a positive news event
  • the ESG index of the preset area satisfies the following formula:
  • FinalScore is the ESG index in the preset area
  • NegScore is the first total public opinion index
  • PosScore is the second total public opinion index.
  • FIG. 4 is a schematic structural diagram of an electronic device provided in an embodiment of the present application.
  • an electronic device 400 includes a transceiver 401 , a processor 402 and a memory 403 . They are connected through a bus 404 .
  • the memory 403 is used to store computer programs and data, and can transmit the data stored in the memory 403 to the processor 402 .
  • the processor 402 is used to read the computer program in the memory 403 to perform the following operations:
  • the public opinion index is used to characterize the ESG index of the target news event to the preset area degree of contribution
  • the ESG index of the preset area is determined.
  • the processor 402 in terms of performing text recognition on each of the plurality of news articles to obtain a plurality of news events and the occurrence area of each news event in the plurality of news events, the processor 402 is specifically used to do the following:
  • the location of the news event in the news is not extracted from each piece of news, the company involved in the news event in each piece of news is obtained, and the location of the main business of the company is used as the location of the main business of the company.
  • the occurrence area of the news event in each news article is described, and the occurrence area of each news event is obtained.
  • the public opinion index of each target news event satisfies the following formula:
  • EventScore j HeatEvent j * AdjScore j
  • EventScore j is the public opinion index of the jth target news event in the multiple target news events
  • HeatEvent j is the heat index of the jth target news event
  • AdjScore j is the jth target news event sentiment index.
  • the processor 402 is specifically configured to perform the following operations :
  • Each news group in the at least one news group includes an original news and H reprinted news corresponding to the original news, where H is an integer greater than or equal to 0;
  • each news group determines the popularity index corresponding to each news group
  • the popularity index of each target news event in the first target news event group is obtained.
  • the processor 402 in terms of determining the sentiment index of each target news event in the plurality of target news events based on the trained topic recognition model, is specifically configured to perform the following operations:
  • the multiple targets are determined according to the preset correspondence between segmented events and sentiment indices, and the segmented events of each target news event in the multiple target news events After the sentiment index of each target news event in the news event, the processor 402 is further configured to perform the following operations:
  • the adjusted sentiment index of each target news event in the plurality of target news events is used as the sentiment index of each target news event in the plurality of target news events.
  • the processor 402 in terms of determining the ESG index of the preset region according to the public opinion index of each target news event, is specifically configured to perform the following operations:
  • each target news event includes a negative news event or a positive news event
  • the ESG index of the preset area satisfies the following formula:
  • FinalScore is the ESG index in the preset area
  • NegScore is the first total public opinion index
  • PosScore is the second total public opinion index.
  • the above-mentioned transceiver 401 may be the acquiring unit 301 of the ESG index determining device 300 of the embodiment shown in FIG. 3
  • the above-mentioned processor 402 may be the processing unit 302 of the ESG index determining device 300 of the embodiment shown in FIG. 3 .
  • the electronic devices in this application may include smart phones (such as Android phones, iOS phones, Windows Phone phones, etc.), tablet computers, palmtop computers, notebook computers, mobile Internet devices MID (Mobile Internet Devices, referred to as: MID) or wearable devices, etc.
  • smart phones such as Android phones, iOS phones, Windows Phone phones, etc.
  • tablet computers palmtop computers
  • notebook computers mobile Internet devices MID (Mobile Internet Devices, referred to as: MID) or wearable devices, etc.
  • MID Mobile Internet Devices
  • wearable devices etc.
  • the above-mentioned electronic devices are only examples, not exhaustive, including but not limited to the above-mentioned electronic devices. In practical applications, the above-mentioned electronic devices may also include: smart vehicle-mounted terminals, computer equipment, and the like.
  • the embodiment of the present application also provides a computer-readable storage medium, the computer-readable storage medium stores a computer program, and the computer program is executed by a processor to realize any text-based recognition as described in the above-mentioned method embodiments Part or all of the steps in the ESG index determination method in the region.
  • the storage medium involved in this application such as a computer-readable storage medium, may be non-volatile or volatile.
  • the embodiment of the present application also provides a computer program product, the computer program product includes a non-transitory computer-readable storage medium storing a computer program, and the computer program is operable to enable the computer to execute the method described in the above method embodiments Part or all of the steps of any method for determining the ESG index in a region based on text recognition.
  • the disclosed device can be implemented in other ways.
  • the device embodiments described above are only illustrative.
  • the division of the units is only a logical function division. In actual implementation, there may be other division methods.
  • multiple units or components can be combined or can be Integrate into another system, or some features may be ignored, or not implemented.
  • the mutual coupling or direct coupling or communication connection shown or discussed may be through some interfaces, and the indirect coupling or communication connection of devices or units may be in electrical or other forms.
  • the units described as separate components may or may not be physically separated, and the components shown as units may or may not be physical units, that is, they may be located in one place, or may be distributed to multiple network units. Part or all of the units can be selected according to actual needs to achieve the purpose of the solution of this embodiment.
  • each functional unit in each embodiment of the present application may be integrated into one processing unit, each unit may exist separately physically, or two or more units may be integrated into one unit.
  • the above-mentioned integrated units can be implemented not only in the form of hardware, but also in the form of software program modules.
  • the integrated units may be stored in a computer-readable memory if implemented in the form of a software program module and sold or used as an independent product.
  • the technical solution of the present application is essentially or part of the contribution to the prior art, or all or part of the technical solution can be embodied in the form of a software product, and the computer software product is stored in a memory.
  • Several instructions are included to make a computer device (which may be a personal computer, server or network device, etc.) execute all or part of the steps of the methods described in the various embodiments of the present application.
  • the aforementioned memory includes: various media that can store program codes such as U disk, read-only memory (ROM, Read-Only Memory), random access memory (RAM, Random Access Memory), mobile hard disk, magnetic disk or optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Library & Information Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于文本识别的区域内ESG指数确定方法及相关产品。方法包括:对多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及发生区域;根据每个新闻事件的发生区域,从多个新闻事件中获取属于预设区域内的多个目标新闻事件;对多个目标新闻事件进行聚类,得到多个目标新闻事件中的每个目标新闻事件的热度指数;基于训练好的主题识别模型,确定多个目标新闻事件中的每个目标新闻事件的情感指数;根据每个目标新闻事件的热度指数以及情感指数,确定每个目标新闻事件的舆情指数;根据每个目标新闻事件的舆情指数,确定预设区域的ESG指数。

Description

基于文本识别的区域内ESG指数确定方法及相关产品
本申请要求于2021年9月28日提交中国专利局、申请号为202111147475.X,发明名称为“基于文本识别的区域内ESG指数确定方法及相关产品”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及人工智能技术领域,具体涉及一种基于文本识别的区域内ESG指数确定方法及相关产品。
背景技术
企业的ESG评分是对企业的环境(E)、社会(S)、治理(G)方面的综合评分。国际和国内在对企业ESG表现进行评分方面已经积累了一些成功的经验,国际上知名的评级机构比如MSCI、FTSE等都建立了各自的评分标准,并对国际上知名的企业进行了ESG评价。随着国际社会,比如各类投资机构和政府对企业责任的重视,特别是最近随着全球气候变化合作的进展,投资者和政府对企业在ESG方面的评分有着大量的需求。
发明人发现,在评价企业的ESG表现时,需要用到与企业相关的新闻来对企业做ESG评分。目前主要通过与企业相关的新闻的数量对企业进行ESG评分。
然而,发明人意识到,目前只是给出了对某个企业进行ESG评分的方案,如何对某个区域进行ESG评分仍然处于空白阶段。
发明内容
本申请实施例提供了一种基于文本识别的区域内ESG指数确定方法及相关产品,实现对区域进行ESG评分,弥补了现有技术的空白。
第一方面,本申请实施例提供一种基于文本识别的区域内ESG指数确定方法,包括:
获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
第二方面,本申请实施例提供一种ESG指数确定装置,包括:获取单元和处理单元;
所述获取单元,用于获取预设时间段内与ESG评价相关的多篇新闻;
所述处理单元,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情 感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法,该方法包括:
获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法,该方法包括:
获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
在本申请实施例中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域的目标新闻事件;最后,基于聚类技术确定每个目标新闻事件的热度指数,基于主题识别模型,确定每个目标新闻事件的情感指数;基于每个目标新闻事件的热度指数以及情感指数,确定每个目标新闻事件的舆情指数;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实 现对预设区域进行ESG评价,弥补了现有技术的空白。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于文本识别的区域内ESG指数确定方法的流程示意图;
图2为本申请实施例提供的另一种基于文本识别的区域内ESG指数确定方法的流程示意图;
图3为本申请实施例提供的一种ESG指数确定装置的功能单元组成框图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
首先说明,本申请实施例所涉及的ESG指数,即是ESG评分,也可以称为ESG评价,它们在本质上是一样的,后面不用再区分。相应的,对预设区域进行ESG评价,或者对预设区域进行ESG评分,它们在本质上也都是一样的,都是用于确定预设区域的ESG指数。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参阅图1,图1为本申请实施例提供的一种基于文本识别的区域内ESG指数确定方法的流程示意图。该方法应用于ESG指数确定装置。该方法包括以下步骤内容:
101:获取预设时间段内与ESG评价相关的多篇新闻。
示例性的,可以从多个第三方平台获取多篇新闻,其中,多个第三方平台可以为新闻媒体的网站或者应用程序;然后,获取每篇新闻的发表时间,根据每篇新闻的发表时间,确定属于预设时间段内的多篇新闻;最后,对预设时间段内的多篇新闻中的每篇新闻进行文本处理,得到预设时间段内与ESG评价相关的多篇新闻,比如,对每篇新闻进行实体识别,得到每篇新闻的实体,将包含有ESG评价实体的新闻作为与ESG评价相关的新闻。
其中,该预设时间段可以为任意一个时间段,比如,上一个季度,上一个月,去年,等等。
102:对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域。
示例性的,对多篇新闻中的每篇新闻进行实体识别,得到每篇新闻的实体;从识别出的实体中筛选出与新闻事件相关的实体,基于该实体确定出每篇新闻的新闻事件。其中,每篇新闻中可以包含有一个或多个新闻事件。比如,实体为“消防安全不达标”,则确定新闻中的新闻事件为“消防安全不达标”;最后,将每篇新闻中的新闻事件进行合并,得到该多个新闻事件。应说明的是,此处的合并是将每篇新闻中的新闻事件当做不同的新闻事件进行合并。
进一步的,对每篇新闻中的新闻事件进行地点识别,若从每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从每篇新闻中提取到的发生地,作为每篇新闻中的新闻事件的发生区域,即可得到每个新闻事件的发生区域;若从每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取每篇新闻中的新闻事件所涉及的企业,将该企业的主营业务的所在地作为每篇新闻中的新闻事件的发生区域,即可得到每个新闻事件的发生区域。
103:根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件。
其中,预设区域是预先设定的,比如,用户可以在ESG指数确定装置的可视化界面上输入想要进行ESG评分的区域,比如,用户输入的是深圳南山区,则会自动从多个新闻事件中筛选出属于深圳南山区的目标新闻事件。因此,该预设区域,可以理解为等待进行ESG评价的区域,可以为任意一个区域。
104:对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度。
示例性的,对多个目标新闻事件进行聚类,得到至少一个目标新闻事件组,其中,每个目标新闻事件组中包含有至少一个目标新闻事件,且每个目标新闻事件组中的至少一个目标新闻事件本质上反映的是一个新闻事件,只是每个目标新闻事件可能是不同的描述形式,比如,一个目标新闻事件是“企业A消防不达标”,另一个目标新闻事件“企业A消防机制不健全”,这两个目标新闻事件本质上表示的新闻事件企业A存在消防隐患。
进一步的,对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,第一目标新闻事件组为至少一个目标新闻事件组中的任意一个,至少一个新闻组中的每个新闻组包括一篇原创新闻以及与该原创新闻对应的H篇转载新闻,H为大于或者等于0的整数。
具体的,对至少一篇新闻中的每篇新闻进行语义信息提取,得到每篇新闻所对应的语义向量;基于每篇新闻的语义向量对至少一篇新闻进行聚类,得到至少一个第一新闻组,即确定至少一篇新闻中任意两篇新闻的语义向量之间的欧式距离,将任意两篇新闻的语义向量之间的欧式距离作为任意两篇新闻之间的相似度;然后,将相似度大于第一阈值的两篇新闻归为一类,即归类为到一个新闻组里面,得到至少一个新闻组,由于两篇新闻的语义向量之间的相似度大于第一阈值,则说明这两篇新闻内容是比较相似的,也就是说其中一篇新闻可能是转载另外一篇新闻生成的,或者,两篇新闻都是转载同一篇新闻生成的。
因此,每个新闻组下包括一篇原创新闻和H篇转载新闻。此外,当H大于或者等于1时,若想确定出每个新闻组中的原创新闻,则可以获取每个新闻组中的每篇新闻的发表时间。对于原创新闻来说,发表时间必然是最早的,因此可以将每个新闻组中发表时间最早的新闻作为每个新闻组中的原创新闻,剩余的新闻均为每个新闻组中的转载新闻。
进一步的,根据每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定每个新闻组对应的热度指数;将第一目标新闻事件组中的每个目标新闻事件所归属的新闻组对应的热度指数,作为该目标新闻事件的热度指数,即确定每个目标新闻事件的新闻归属于哪个新闻组,然后,将该新闻组对应的热度指数作为该目标新闻事件的热度指数。
示例性的,可以从新闻数量上确定每个新闻组的热度指数。应理解,原创新闻是由新闻工作者自主创作的,是与水军炒作无关的,因此,一个新闻事件下的所有原创新闻引起的对这个新闻事件的关注度应该是相同,也就是说,每篇原创新闻在新闻事件所受的社会的关注方面所作出的贡献度是相同。所以,为每篇原创新闻事件预先设定一个值,使原创新闻在关注度方面的贡献不受转载新闻数量的影响;根据每个新闻组中的原创新闻的设定值以及每个新闻组中所包含的转载新闻的数量H,确定每个新闻组的热度指数。
示例性的,每个新闻组的热度指数可以通过公式(1)表示:
HeatEvent j=log2(H j+1)+a    公式(1);
其中,HeatEvent j为至少一个新闻组中的第j个新闻组的热度指数,H j为第j个新闻组所包含的转载新闻的数量,a为原创新闻的设定值,一般取值为1。
可以看出,上述公式(1)在计算每个新闻组的热度指数时,随着转载新闻的数量增多,热度指数的增长幅度逐渐减弱,这样刻意转载或者炒作的行为就会被减弱,即通过公式(1)减弱了刻意转载或水军炒作的行为,使确定出的热度指数更加精确,即不容易受水军炒作的影响。
示例性的,每个新闻组的缩放比例还可以通过公式(2)表示:
Figure PCTCN2022071321-appb-000001
可以看出,H j=0时,也就是每个新闻组中的转载新闻的数量为零时,新闻组的热度指数为a,即热度指数只与原创新闻的数量相关;当H j无穷大时,新闻组的热度指数为1+a,即有上限。这样即使有水军炒作,也会将炒作的行为收敛在1+a处,不会无休止的受炒作行为的影响,不会让社会对新闻事件的关注度无限放大,由于社会对某个新闻事件的关注度本身就不会无限放大,从而使确定出的热度指数更加精确。
105:基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度。
示例性的,首先建立新闻ESG事件体系,即建立ESG事件与情感等级之间的映射关系。具体的,ESG事件包括评价维度、主题、事件、细分事件以及情感等级,评价维度、主题、事件、细分事件为依次的隶属关系,因此预先建立评价维度、主题、事件、细分事件以及情感等级之间的映射关系,其中,评价维度包括E、S、G三个维度。
表1:ESG事件与情感等级之间的映射关系。
Figure PCTCN2022071321-appb-000002
Figure PCTCN2022071321-appb-000003
然后,基于训练好的主题识别模型确定每个目标新闻事件的三级事件,即事件;然后,获取每个目标新闻事件的关键词;根据上述的映射关系,每个目标新闻事件的三级事件以及关键词,确定出每个目标新闻事件的四级事件,即细分事件;然后,根据每个目标新闻事件的细分事件,得到每个目标新闻事件的情感等级。
其中,该主题识别模型的训练过程包括:从历史新闻中选取多篇新闻,对于每篇新闻的三级和四级事件打上相应标签。利用打好标签的数据训练识别新闻三级事件的主题识别模型(文本分类);针对每个三级事件,开发基于关键字的规则来识别相应的四级事件。并用已经打好的标签数据对规则进行验证及优化,得到训练好的主题识别模型;之所以识别三级事件,不直接识别四级事件,是因为三级事件的类别相对来说少一些,如果识别四级事件,则需要设置多个分类结果,这样训练模型的收敛速度比较慢。如果直接识别二级事件,从二级事件到四级事件,之间差异过多,无法通过关键词匹配的方式实现。所以,识别出三级事件既可以提高模型收敛速度,又可以保证四级事件识别的精度。
最后,基于预先构建的情感等级与情感指数的映射关系,确定每个目标新闻事件的情感指数,其中,该映射关系可以通过表2表示:
表2:
情感等级 情感分数
重大负面 -2
一般负面 -1
中性 0
重大正面 1
一般正面 2
进一步地,获取每个目标新闻事件对应的新闻的发表媒体;根据发表媒体和调整量之间的映射关系,确定每个目标新闻事件的调整量;然后,基于每个目标新闻事件的调整量,调整每个目标新闻事件的情感指数,得到每个目标新闻事件最终的情感指数,将调整后的情感指数作为每个目标新闻时间的情感指数。比如,当目标新闻事件为一般负面事件,且该目标新闻事件的发表媒体为国家媒体时,调整量为-2,则可确定该目标新闻事件最终的情感指数为-3。
106:根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度。
示例性的,基于上述确定出的多个目标新闻事件中的每个目标新闻事件的热度指数,以及每个目标新闻事件的情感指数,确定多个目标新闻事件中的每个目标新闻事件的舆情指数。
其中,每个目标新闻事件的舆情指数可以通过公式(3)表示:
EventScore j=HeatEvent j*AdjScore j公式(3);
其中,EventScore j为多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为第j个目标新闻事件的热度指数,AdjScore j为第j个目标新闻事件的情感指数。
107:根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
示例性的,确定多个目标新闻事件中的每个目标新闻事件的类型,其中,每个目标新闻事件的类型包括正面新闻事件或负面新闻事件中的一种。然后,确定多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数。
示例性的,负面新闻事件可以理解为情感指数小于零的新闻事件,正面新闻事件可以理解为情感指数大于0的新闻事件。
可选的,第一总舆情指数可通过公式(4)表示:
NegScore=∑ kEventScore kif EventScore k<0公式(4)
NegScore为第一总舆情指数,EventScore k为第k个负面新闻事件。
可选的,第二总舆情指数可通过公式(5)表示:
PosScore=∑ iEventScore i if EventScore i>0公式(5)
PosScore为第二总舆情指数,EventScore i为第i个负面新闻事件。
最后,为有效去除区域间大小以及经济发达程度造成的企业数量、企业规模等差异性,这里先计算负面新闻事件的第一总舆情指数的绝对值和正面新闻的第二总舆情指数的比例。该比例可能在不同区域内数字相差很大,故再用对数函数将统一到相近范围。
因此,预设区域内的ESG指数可以通过公式(6)表示:
FinalScore=log10(|NegScore|/PosScore)公式(6);
其中,FinalScore为预设区域内的ESG指数。
可以看出,在本申请实施例中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域(即待评价区域)的目标新闻事件;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实现对预设区域进行ESG评价,弥补了现有技术的空白。
应说明,若只想获取该预设区域在ESG三个维度中任意一个维度下的评分,则可以在筛选目标新闻时只获取与该维度下的目标新闻,然后执行步骤101~105中的内容,即可得到该预设区域在该维度下的评分。
参阅图2,图2为本申请实施例提供的另外一种基于文本识别的区域内ESG指数确定方法的流程示意图。该方法应用于ESG指数确定装置。本实施与图1示出的重复内容,在此不再重复描述。该方法包括以下步骤内容:
201:获取预设时间段内与ESG评价相关的多篇新闻。
202:对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域。
203:根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件。
204:对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度。
205:基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度。
206:根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度。
207:根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
208:向目标设备发送所述预设区域的ESG指数,以便所述目标设备的用户根据所述预设区域的ESG指数制定与所述预设区域相关的政策。
示例性,实质上根据目标设备的角色不同,可以制定出与预设区域相关的决策也是不同的,本申请的ESG指数有以下应用场景:
场景1:当目标设备为投资机构的设备时,将预设区域的ESG指数发送给投资机构,则投资机构可以制定出的与该预设区域相关的决策为:与该预设区域相关的投资决策。例如,由于预设区域的ESG指数反映了该预设区域的价值以及可持续发展的能力,则当预设区域的ESG指数较高时,则该投资决策可以为在该预设区域内追加投资金额以及投资周期,比如,从该预设区域内筛选出信用度较高的企业,追加投资和投资周期;当预设区域的ESG指数较低时,则该投资决策可以为撤资对预设区域的投资或者减少对预设区域的投资,等等,比如,当前在预设区域内有投资时,则可以从该预设区域内撤资。总的来说,将预设区域的ESG指数发送给投资机构,则可以对投资机构的投资决策的制定提供方向指引,降低投资风险。
场景2:当目标设备为预设区域内的任意一个企业的设备时,将预设区域的ESG指数发送给该企业,则该企业可以制定与该企业相关的管理决策。示例性的,由于预设区域的ESG指数反映了该预设区域的价值以及可持续发展的能力,随着投资者对ESG指数的接受程度加深,对企业社会责任的看重,更愿意投资ESG指数的较高的企业。因此,当预设区域的ESG指数较高时,为了继续保持ESG指数的高涨趋势,则该管理决策为企业制定出加强企业管理的决策,继续保持在ESG方面的优异表现;当预设区域的ESG指数较低时,该管理决策为调整公司发展战略,提高公司的可持续发展性,提高ESG指数。总体来说,将预设区域的ESG指数发送给企业,则有利于促进企业努力提高自身ESG评价情况,引导企业的良性发展。
可以看出,在本申请实施方式中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域(即待评价区域)的目标新闻事件;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实现对预设区域进行ESG评价,弥补了现有技术的空白。而且,将预设区域内的ESG指数发送给目标设备,这样目标设备的用户就可以根据该ESG指数,引导预设区域的企业的良性发展,提高企业的可持续发展能力。
参阅图3,图3本申请实施例提供的一种ESG指数确定装置的功能单元组成框图。ESG指数确定装置300包括:获取单元301和处理单元302;
获取单元301,用于获取预设时间段内与ESG评价相关的多篇新闻
处理单元302,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
在一些可能的实施方式中,在对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域方面,处理单元302,具体用于:
对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
在一些可能的实施方式中,所述每个目标新闻事件的舆情指数满足以下公式:
EventScore j=HeatEvent j*AdjScore j
其中,EventScore j为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为所述第j个目标新闻事件的热度指数,AdjScore j为所述第j个目标新闻事件的情感指数。
在一些可能的实施方式中,在对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数方面,处理单元302,具体用于:
对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
在一些可能的实施方式中,在基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数方面,处理单元302,具体用于:
基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,根据预设的细分事件和情感指数之间的对应关系,以及所 述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,处理单元302,还用于:
获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,在根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数方面,处理单元302,具体用于:
确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
其中,所述预设区域的ESG指数满足以下公式:
FinalScore=log10(|NegScore|/PosScore);
其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
参阅图4,图4为本申请实施例提供的一种电子设备的结构示意图。如图4所示,电子设备400包括收发器401、处理器402和存储器403。它们之间通过总线404连接。存储器403用于存储计算机程序和数据,并可以将存储器403存储的数据传输给处理器402。
处理器402用于读取存储器403中的计算机程序执行以下操作:
控制收发器401获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
在一些可能的实施方式中,在对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域方面,处理器402具体用于执行以下操作:
对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
在一些可能的实施方式中,所述每个目标新闻事件的舆情指数满足以下公式:
EventScore j=HeatEvent j*AdjScore j
其中,EventScore j为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为所述第j个目标新闻事件的热度指数,AdjScore j为所述第j个目标新闻事件的情感指数。
在一些可能的实施方式中,在对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数方面,处理器402具体用于执行以下操作:
对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
在一些可能的实施方式中,在基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数方面,处理器402具体用于执行以下操作:
基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,处理器402还用于执行以下操作:
获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,在根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数方面,处理器402具体用于执行以下操作:
确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
其中,所述预设区域的ESG指数满足以下公式:
FinalScore=log10(|NegScore|/PosScore);
其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
具体地,上述收发器401可为图3所述的实施例的ESG指数确定装置300的获取单元301,上述处理器402可以为图3所述的实施例的ESG指数确定装置300的处理单元302。
应理解,本申请中的电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(Mobile Internet Devices,简称:MID)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种基于文本识别的区域内ESG指数确定方法的部分或全部步骤。
可选的,本申请涉及的存储介质如计算机可读存储介质可以是非易失性的,也可以是易失性的。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于文本识别的区域内ESG指数确定方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接, 可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (20)

  1. 一种基于文本识别的区域内ESG指数确定方法,包括:
    获取预设时间段内与ESG评价相关的多篇新闻;
    对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
    根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
    对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
    基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
    根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
    根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
  2. 根据权利要求1所述的方法,其中,所述对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域,包括:
    对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
    对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
    对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
    若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
  3. 根据权利要求1或2所述的方法,其中,所述每个目标新闻事件的舆情指数满足以下公式:
    EventScore j=HeatEvent j*AdjScore j
    其中,EventScore j为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为所述第j个目标新闻事件的热度指数,AdjScore j为所述第j个目标新闻事件的情感指数。
  4. 根据权利要求3所述的方法,其中,所述对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,包括:
    对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
    对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
    根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
    将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
    根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
  5. 根据权利要求3或4所述的方法,其中,所述基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,包括:
    基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
    获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
    根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
    根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  6. 根据权利要求5所述的方法,其中,所述根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,所述方法还包括:
    获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
    根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
    基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
    将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  7. 根据权利要求1-6中任一项所述的方法,其中,所述根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数,包括:
    确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
    确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
    确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
    根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
    其中,所述预设区域的ESG指数满足以下公式:
    FinalScore=log10(|NegScore|/PosScore);
    其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
  8. 一种ESG指数确定装置,包括:获取单元和处理单元;
    所述获取单元,用于获取预设时间段内与ESG评价相关的多篇新闻;
    所述处理单元,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
    根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
    对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事 件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
    基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
    根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
    根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
  9. 一种电子设备,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行以下方法:
    获取预设时间段内与ESG评价相关的多篇新闻;
    对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
    根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
    对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
    基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
    根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
    根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
  10. 根据权利要求9所述的电子设备,其中,所述每个目标新闻事件的舆情指数满足以下公式:
    EventScore j=HeatEvent j*AdjScore j
    其中,EventScore j为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为所述第j个目标新闻事件的热度指数,AdjScore j为所述第j个目标新闻事件的情感指数。
  11. 根据权利要求10所述的电子设备,其中,执行所述对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,包括:
    对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
    对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
    根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
    将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作 为该目标新闻事件的热度指数;
    根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
  12. 根据权利要求10或11所述的电子设备,其中,执行所述基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,包括:
    基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
    获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
    根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
    根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  13. 根据权利要求12所述的电子设备,其中,所述根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,所述处理器还用于执行:
    获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
    根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
    基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
    将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  14. 根据权利要求9-13中任一项所述的电子设备,其中,执行所述根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数,包括:
    确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
    确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
    确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
    根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
    其中,所述预设区域的ESG指数满足以下公式:
    FinalScore=log10(|NegScore|/PosScore);
    其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
  15. 一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现以下方法:
    获取预设时间段内与ESG评价相关的多篇新闻;
    对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
    根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
    对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事 件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
    基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
    根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
    根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
  16. 根据权利要求15所述的计算机可读存储介质,其中,所述每个目标新闻事件的舆情指数满足以下公式:
    EventScore j=HeatEvent j*AdjScore j
    其中,EventScore j为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEvent j为所述第j个目标新闻事件的热度指数,AdjScore j为所述第j个目标新闻事件的情感指数。
  17. 根据权利要求16所述的计算机可读存储介质,其中,执行所述对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,包括:
    对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
    对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
    根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
    将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
    根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
  18. 根据权利要求16或17所述的计算机可读存储介质,其中,执行所述基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,包括:
    基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
    获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
    根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
    根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  19. 根据权利要求18所述的计算机可读存储介质,其中,所述根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,所述计算机程序被处理器执行时还用于实现:
    获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
    根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
    基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
    将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
  20. 根据权利要求15-19中任一项所述的计算机可读存储介质,其中,执行所述根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数,包括:
    确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
    确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
    确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
    根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
    其中,所述预设区域的ESG指数满足以下公式:
    FinalScore=log10(|NegScore|/PosScore);
    其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
PCT/CN2022/071321 2021-09-28 2022-01-11 基于文本识别的区域内esg指数确定方法及相关产品 WO2023050652A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111147475.XA CN113837630A (zh) 2021-09-28 2021-09-28 基于文本识别的区域内esg指数确定方法及相关产品
CN202111147475.X 2021-09-28

Publications (1)

Publication Number Publication Date
WO2023050652A1 true WO2023050652A1 (zh) 2023-04-06

Family

ID=78967301

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/071321 WO2023050652A1 (zh) 2021-09-28 2022-01-11 基于文本识别的区域内esg指数确定方法及相关产品

Country Status (2)

Country Link
CN (1) CN113837630A (zh)
WO (1) WO2023050652A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076751A (zh) * 2023-10-10 2023-11-17 西安康奈网络科技有限公司 一种基于多维特征分析的舆情事件发展趋势判断系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837630A (zh) * 2021-09-28 2021-12-24 平安科技(深圳)有限公司 基于文本识别的区域内esg指数确定方法及相关产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508373A (zh) * 2018-11-13 2019-03-22 深圳前海微众银行股份有限公司 企业舆情指数的计算方法、设备及计算机可读存储介质
CN111143655A (zh) * 2019-12-30 2020-05-12 创新奇智(青岛)科技有限公司 一种新闻热度的计算方法
WO2020230147A1 (en) * 2019-05-15 2020-11-19 Telefonaktiebolaget Lm Ericsson (Publ) Managing network event data in a telecommunications network
WO2021004550A1 (zh) * 2019-09-04 2021-01-14 深圳前海微众银行股份有限公司 Esg评分体系的生成方法、装置、设备及可读存储介质
CN112613296A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 新闻的重要程度获取方法、装置、终端设备及存储介质
CN113190683A (zh) * 2021-07-02 2021-07-30 平安科技(深圳)有限公司 基于聚类技术的企业esg指数确定方法及相关产品
CN113837630A (zh) * 2021-09-28 2021-12-24 平安科技(深圳)有限公司 基于文本识别的区域内esg指数确定方法及相关产品

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6991554B2 (ja) * 2016-12-28 2022-01-12 株式会社グッドバンカー Esg情報を用いたポートフォリオ構築方法、esg情報を用いたポートフォリオ構築に関する情報処理を実行可能なコンピュータおよびプログラム
WO2019103183A1 (ko) * 2017-11-23 2019-05-31 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
CN113240272B (zh) * 2021-05-12 2024-04-12 平安科技(深圳)有限公司 企业esg指数确定方法及相关产品

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508373A (zh) * 2018-11-13 2019-03-22 深圳前海微众银行股份有限公司 企业舆情指数的计算方法、设备及计算机可读存储介质
WO2020230147A1 (en) * 2019-05-15 2020-11-19 Telefonaktiebolaget Lm Ericsson (Publ) Managing network event data in a telecommunications network
WO2021004550A1 (zh) * 2019-09-04 2021-01-14 深圳前海微众银行股份有限公司 Esg评分体系的生成方法、装置、设备及可读存储介质
CN111143655A (zh) * 2019-12-30 2020-05-12 创新奇智(青岛)科技有限公司 一种新闻热度的计算方法
CN112613296A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 新闻的重要程度获取方法、装置、终端设备及存储介质
CN113190683A (zh) * 2021-07-02 2021-07-30 平安科技(深圳)有限公司 基于聚类技术的企业esg指数确定方法及相关产品
CN113837630A (zh) * 2021-09-28 2021-12-24 平安科技(深圳)有限公司 基于文本识别的区域内esg指数确定方法及相关产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076751A (zh) * 2023-10-10 2023-11-17 西安康奈网络科技有限公司 一种基于多维特征分析的舆情事件发展趋势判断系统
CN117076751B (zh) * 2023-10-10 2024-01-16 西安康奈网络科技有限公司 一种基于多维特征分析的舆情事件发展趋势判断系统

Also Published As

Publication number Publication date
CN113837630A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
CN102929861B (zh) 一种文本情感指数计算方法和系统
WO2023050652A1 (zh) 基于文本识别的区域内esg指数确定方法及相关产品
CN110489523B (zh) 一种基于网购评价的细粒度情感分析方法
CN107169086B (zh) 一种文本分类方法
CN108920488B (zh) 多系统相结合的自然语言处理方法及装置
WO2023273295A1 (zh) 基于聚类技术的企业esg指数确定方法及相关产品
WO2023029356A1 (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN110457680A (zh) 实体消歧方法、装置、计算机设备和存储介质
CN108960574A (zh) 问答的质量确定方法、装置、服务器和存储介质
CN112579729B (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
WO2023071120A1 (zh) 数字资产中的绿色资产的占比的识别方法及相关产品
CN110825868A (zh) 一种基于话题热度的文本推送方法、终端设备及存储介质
Song Sentiment analysis of Japanese text and vocabulary learning based on natural language processing and SVM
CN109062977A (zh) 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和系统
WO2020147259A1 (zh) 一种用户画像方法、装置、可读存储介质及终端设备
CN113378090B (zh) 一种互联网网站相似度分析方法、装置以及可读存储介质
Wu et al. Detecting malicious social robots with generative adversarial networks
GB2572320A (en) Hate speech detection system for online media content
JP6426074B2 (ja) 関連文書検索装置、モデル作成装置、これらの方法及びプログラム
TWI734085B (zh) 使用意圖偵測集成學習之對話系統及其方法
CN108427769B (zh) 一种基于社交网络的人物兴趣标签提取方法
CN111858850A (zh) 一种在智能客服上实现问答的精确和快速评分的方法
WO2023071129A1 (zh) 绿色资产的占比的识别方法及相关产品
CN115964574A (zh) 一种基于数据挖掘的智慧交通安全舆情热度评估方法
CN113987536A (zh) 数据表中字段安全等级确定方法、装置、电子设备及介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22874055

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE