WO2024041275A1

WO2024041275A1 - 物种分布数据聚合方法、系统及存储介质

Info

Publication number: WO2024041275A1
Application number: PCT/CN2023/108385
Authority: WO
Inventors: 徐青松; 李青
Original assignee: 杭州睿胜软件有限公司
Priority date: 2022-08-23
Filing date: 2023-07-20
Publication date: 2024-02-29
Also published as: CN115344657A

Abstract

本发明提供一种物种分布数据聚合方法、系统及存储介质，所述方法包括：获取原始物种分布数据；确定物种分布显示的地图网格尺度，并获取各个网格范围内的原始物种分布数据；针对每个网格，以其作为中心网格，利用其周围设定范围内的多个其他网格的原始物种分布数据对该中心网格进行数据增强处理，从而获取每个网格的物种分布数据聚合结果。本发明提供的物种分布数据聚合方法能够对物种分布数据进行增强显示，以便提升数据显示效果。

Description

物种分布数据聚合方法、系统及存储介质

技术领域

本发明涉及计算机技术领域，特别涉及一种物种分布数据聚合方法、系统及存储介质。

背景技术

每个物种在全球各个地方的分布是不均匀的，每个地方都有不同的常见物种，可以建立一个物种数据库，根据地理位置获得该地附近常见物种的列表，同时还可以满足用户的个性化信息需求。然而物种观测获取的数据分布是不均匀的，同时一定范围内的物种数量一般不会很多，显示效果较差，因此需要对数据进行一定程度的增强。

发明内容

本公开的目的之一是提供一种物种分布数据聚合方法，包括下列步骤：

获取原始物种分布数据；

确定物种分布显示的地图网格尺度，并获取各个网格范围内的原始物种分布数据；

针对每个网格，以其作为中心网格，利用其周围设定范围内的多个其他网格的原始物种分布数据对该中心网格进行数据增强处理，从而获取每个网格的物种分布数据聚合结果。

在一些实施例中，所述原始物种分布数据通过物种分布数据源以及物种识别结果信息获取。

在一些实施例中，所述原始物种分布数据通过物种识别结果信息获取包括：获取用户的无线数据或移动数据并进行处理后得到原始物种分布数据。

在一些实施例中，该方法还包括：获取各个网格范围内的原始物种分布数据后根据物种常见度对所述原始物种分布数据进行处理以得到处理后的物种分布数据，并利用处理后的物种分布数据进行后续数据增强处理。

在一些实施例中，该方法还包括：获取每个网格的海拔数值，计算每个中心网格和周围设定范围内的多个其他网格之间的海拔数值差距，当任一其他网格和其中心网格的海拔数值差距超过设定阈值时，该其他网格的原始物种分布数据不参与所述中心网格的数据增强处理。

在一些实施例中，所述海拔数值差距的设定阈值根据不同区域分别设定调整。

在一些实施例中，所述地图网格尺度根据不同区域分别设定调整和/或对同一区域设定不同的地图网格尺度。

在一些实施例中，所述数据增强处理包括：根据设置的衰减系数得到所述中心网格周围设定范围内的每个其他网格的权重值，将其他网格的原始物种分布数据乘以权重值后累加到中心网格的数据中，最终得到所述中心网格的数据增强后的物种分布数据聚合结果。

在一些实施例中，所述衰减系数根据不同区域分别设定调整。

在一些实施例中，该方法还包括：根据时间维度对所述原始物种分布数据进行分类处理，获取各个网格范围内处于不同时间的原始物种分布数据，并根据不同时间的原始物种分布数据分别进行数据增强处理。

根据本公开的另一方面，提出了一种物种分布数据聚合系统，包括处理器和存储器，所述存储器上存储有程序，所述程序被所述处理器执行时，实现如上所述的物种分布数据聚合方法。

根据本公开的另一方面，提出了一种存储介质，其上存储有程序，所述程序被执行时实现如上所述的物种分布数据聚合方法。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得更为清楚。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1所示为本发明一实施例提供的物种分布数据聚合方法的流程示意图。

图2所示为本发明一实施例提供的某一中心网格周围设定范围内的每个其他网格的权重值示意图。

图3所示为本发明又一实施例提供的某一中心网格周围设定范围内的每个其他网格的权重值示意图。

图4所示为本发明一实施例提供的某一区域的物种分布数据聚合结果示意图。

图5所示为本发明一实施例提供的物种分布数据聚合系统的结构示意图。

注意，在以下说明的实施方式中，有时在不同的附图之间共同使用同一附图标记来表示相同部分或具有相同功能的部分，而省略其重复说明。在一些情况中，使用相似的标号和字母表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

为了便于理解，在附图等中所示的各结构的位置、尺寸及范围等有时不表示实际的位置、尺寸及范围等。因此，本公开并不限于附图等所公开的位置、尺寸及范围等。

具体实施方式

下面将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。也就是说，本文中的结构及方法是以示例性的方式示出，来说明本公开中的结构和方法的不同实施例。然而，本领域技术人员将会理解，它们仅仅说明可以用来实施的本公开的示例性方式，而不是穷尽的方式。此外，附图不必按比例绘制，一些特征可能被放大以示出具体组件的细节。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

图1所示为本发明一实施例提供的物种分布数据聚合方法的流程示意图，该方法可以在例如手机、平板电脑等智能终端上安装的应用程序(app)中实现。如图1所示，该方法包括：

步骤S100：获取原始物种分布数据；

步骤S200：确定物种分布显示的地图网格尺度，并获取各个网格范围内的原始物种分布数据；

步骤S300：针对每个网格，以其作为中心网格，利用其周围设定范围内的多个其他网格的原始物种分布数据对该中心网格进行数据增强处理，从而获取每个网格的物种分布数据聚合结果。

在一些实施例中，所述原始物种分布数据通过物种分布数据源以及物种识别结果信息获取。原始物种分布数据可以通过物种分布数据源来进行获取，例如通过各类公开的通用物种分布数据库(如GBIF：全球生物多样性信息网络)来获取原始物种分布数据，这类数据源包含大量野外观测数据,可以作为野外物种分布的数据来源。

在一些实施例中，所述原始物种分布数据通过物种识别结果信息获取包括：获取用户的无线数据或移动数据并进行处理后得到原始物种分布数据。用户通过物种识别软件进行物种识别的数据,可以根据用户无线WIFI的IP数据拟合处理，获取物种分布的位置信息，作为居民区或商业工业区等特定区域的物种数据的分布信息参考。同时在没有WIFI等无线信号的区域还可以根据用户的移动数据(例如3G、4G或5G)进行处理确定大致的物种分布区域范围，不过这种方式无法确定物种分布的精确位置。物种识别软件可以基于用户拍摄的影像识别植物的物种，并基于识别出的物种呈现该物种的分类信息和其他相关信息。

不同物种可以按照常见程度进行分级，物种常见度可以作为后续显示物种信息的扩展信息进行显示，此外用户还可以选择只显示特定常见程度等级或某等级以上的物种分布数据。物种常见度可以根据物种的位置信息在不同区域和尺度范围内的数据进行统计确认常见度和相应展示，物种常见度可以根据以下方式进行：首先在确认物种列表里面的物种在这个国家(州)或其他区域范围的物种清单里面，稀有物质以及保护物种(例如IUCN物种)默认设为少见，园艺物种需要根据数据确认其常见度，物种分布数据源的数据(例如GBIF数据)作为野外物种常见程度参考,按照设定的区域尺度范围(例如40*20km网格)进行统计，用户识别的物种数据例如WIFI无线数据或移动数据作为观赏植物常见程度参考,可以作为GBIF数据的补充，其也可以按照设定的区域尺度范围(例如40*20km网格)进行统计。

物种观测数据体现出物种的分布是不均匀的，如果某个物种在某个地区是常见物种,那么在它的周围地区应该也有该物种的一定分布，同时不同海拔高度的差值对于物种分布的区域范围也有一定影响，同时设定尺度的网格范围(例如40*20km)内的物种数量一般不会很多，显示效果较差，因此需要对数据进行一定程度的增强。

在海拔高度相差1000米以内(当然也可以不考虑海拔影响),各个网格范围内观测的物种分布数据需要向其周围的网格进行扩散(即物种分布数据的权重衰减的距离)，例如可以设定同维度在400公里内逐步衰减,同经度在100公里内逐步衰减。如果海拔高度相差超过1000米,则不继续扩散，因为海拔高度相差过大的不同区域物种分布也会有很大不同。

在一些实施例中，所述海拔数值差距的设定阈值根据不同区域分别设定调整，例如1500米，2000米等不同范围，可以统一设定为不同数值，也可以根据不同区域的物种分布情况的不同来分别设定不同的数值。

在一些实施例中，所述地图网格尺度根据不同区域分别设定调整和/或对同一区域设定不同的地图网格尺度。例如可以设置为40*20km或50*50km等不同的尺度范围，不同区域可以根据物种分布数据的情况确定不同的显示网格尺度，用户也可以选择显示不同的网格尺度。也就是说可以默认显示50km*50km的网格的数据，用户可以选择缩小到40*20网格，或者是默认就是40*20网格或者50*50网格不变。

同样的，也可以按照不同区域物种分布的情况来设定分布海拔的数值以及权重衰减的距离，因为不同区域的物种分布聚合程度不同，例如沙漠、荒原或戈壁等地区物种分布较少，温热带或热带雨林区域的物种分布较多，因此可以设置不同的数据来进行数据增强处理，以便提升数据显示效果，对于海拔以及权重衰减的距离的影响也是相同的原因。

进一步的，所述衰减系数根据不同区域分别设定调整。请参考图2和图3，其显示不同的实施例提供的某一中心网格周围设定范围内的每个其他网格的权重值示意图。如图2和图3所示，中心点的网格原始权重值设置为100(即其数据100％参与累加计算)，周围的其他网格按照图中设置的权重值进行衰减计算(90即90％参与累加，60即60％参与累加)，最终中心的网格的数据按照其周围设定范围内的各个网格的数据乘以权重值的百分比后进行累加获取。

图4所示为本发明一实施例提供的某一区域的物种分布数据聚合结果示意图。在最终显示156.5*156km网格范围的物种数据时，各个网格显示的数据都是经过以上处理的物种数据，其可以显示整体物种数据，以及各个分类物种的数据并按照数量进行排序显示。加载地图后按照网格数据，在合适的网格尺度范围的地图网格上显示物种分布数据，如图4所示，相应于用户的操作，例如当用户移动或点击到某一网格时，显示该网格所对应的物种分布数据。

可以根据时间例如按月划分不同月份的数据，从而将物种分布数据建模为w*h*t的三维坐标，例如：m50-j12-w13-t4:表示以50km作为地理刻度，经度方向第12个，纬度方向第13个，时间上按月划分，4月份的聚合数据。这个key下保存相关的物种分布聚合数据。加入时间维度后，可以定义更加丰富和细节的物种分布数据显示方式，例如某一时间段的物种分布数据或者全部时间段的物种分布数据来进行显示，物种的位置信息根据实际的经纬度分布范围或具体位置信息来进行记录，以便可以在不同的网格尺度下进行数据统计和后续根据需求区分显示。

此外，还可以通过物种分布坐标计算城市、省份或者国家的物种分别聚合数据进行显示。

主要城市数据聚合：

·提供城市列表

·对于每一个城市，计算聚合数据

·获取城市的坐标

·调用上面的物种分布数据

·获取该城市的物种分布数据

主要省份数据聚合：

·提供省份列表

·获取省份的城市列表，及每个城市的聚合数据

·汇总城市的聚合数据

主要国家数据聚合

·提供国家列表

·获取国家的省份列表，及每个省份的聚合数据

·汇总省份的聚合数据

基础城市数据服务

·根据经纬度，获取城市/省份/国家

·获取国家的省份列表

·获取省份的城市列表

·根据城市code，获取城市的基础信息

获取用户物种信息更新物种分布数据聚合数据库采取以下方式进行：

1.用户授权地理位置,或者根据用户IP信息推理出用户的所在地经纬度

2.根据经纬度算出用户所在地的地理位置算法(Geohash)的经纬度编码信息，并匹配到地理网格化数据库

3.获取该网格的数据

4.结合地理网格数据和用户动态信息(拍到的植物,当前的时间等)给出用户契合当地环境的建议和信息

地理位置算法Geohash是一种把整个地球用户网格切割的方式,比如切割成40km*20km的网格块,然后任何经纬度坐标都可以快速定位到这些网格。我们可以在Geohash网格块里面存储当地相关的信息，包含根据物种分布数据库,存储当地常见的植物列表，根据气象气候信息基础数据库,存储当地气象信息：

a.日最低温,最高温,平均温度

b.月平均气温

c.降水信息,至少有月平均降水量

d.湿度信息,至少有月平均湿度

e.光照信息

f.耐寒区信息Hardiness zone

其他还可以包括常见物种信息、海拔等地形信息、气候带分类信息、植被信息等等相关信息。将不同的物种数据集合物种分布数据关联存储，以便在物种分布数据聚合显示后，方便进行不同的交互显示和功能处理，例如可以根据地理位置获得该地附近常见物种的列表，物种分布地的气候气象信息，同时还可以满足用户的个性化信息需求，例如查看纽约附近常见的有毒植物，洛杉矶附近常见的杂草，各个钓点的常见鱼类等归类聚合信息。

基于同一发明构思，本发明还提供一种物种分布数据聚合系统，包括处理器和存储器，所述存储器上存储有程序，所述程序被所述处理器执行时，实现如上所述的物种分布数据聚合方法。请参考图5，图5所示为本发明一实施例提供的物种分布数据聚合系统的结构示意图，如图5所示，所述物种分布数据聚合系统包括处理器301、通信接口302、存储器303和通信总线304。

其中，所述处理器301、所述通信接口302、所述存储器303通过所述通信总线304完成相互间的通信。

所述存储器303，用于存放计算机程序。

所述处理器301，用于执行存储器303上所存放的程序时，实现如下步骤：

获取原始物种分布数据；

关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施方式，在此不做赘述。

另外，处理器301执行存储器303上所存放的程序而实现的物种分布数据聚合方法的其他实现方式，与前述方法实施方式部分所提及的实现方式相同，这里也不再赘述。

上述电子设备提到的通信总线304可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线304可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口302用于上述电子设备与其他设备之间的通信。

所述处理器301可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器301是所述电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分。

所述存储器303可用于存储所述计算机程序，所述处理器301通过运行或执行存储在所述存储器303内的计算机程序，以及调用存储在存储器303内的数据，实现所述电子设备的各种功能。

所述存储器303可以包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

根据本公开的另一方面，本发明还提出了一种存储介质，其上存储有程序，所述程序被执行时实现如下步骤：

获取原始物种分布数据；

本发明实施方式的计算机可读存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机硬盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其组合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

应当注意的是，在本文的实施方式中所揭露的装置和方法，也可以通过其他的方式实现。以上所描述的装置实施方式仅仅是示意性的，例如，附图中的流程图和框图显示了根据本文的多个实施方式的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用于执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本文各个实施方式中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

上述描述仅是对本发明较佳实施方式的描述，并非对本发明范围的任何限定，本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰，均属于权利要求书的保护范围。

Claims

一种物种分布数据聚合方法，其特征在于，包括下列步骤：

获取原始物种分布数据；

确定物种分布显示的地图网格尺度，并获取各个网格范围内的原始物种分布数据；

针对每个网格，以其作为中心网格，利用其周围设定范围内的多个其他网格的原始物种分布数据对该中心网格进行数据增强处理，从而获取每个网格的物种分布数据聚合结果。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，所述原始物种分布数据通过物种分布数据源以及物种识别结果信息获取。
根据权利要求2所述的物种分布数据聚合方法，其特征在于，所述原始物种分布数据通过物种识别结果信息获取包括：获取用户的无线数据或移动数据并进行处理后得到原始物种分布数据。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，该方法还包括：获取各个网格范围内的原始物种分布数据后根据物种常见度对所述原始物种分布数据进行处理以得到处理后的物种分布数据，并利用处理后的物种分布数据进行后续数据增强处理。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，该方法还包括：获取每个网格的海拔数值，计算每个中心网格和周围设定范围内的多个其他网格之间的海拔数值差距，当任一其他网格和其中心网格的海拔数值差距超过设定阈值时，该其他网格的原始物种分布数据不参与所述中心网格的数据增强处理。
根据权利要求5所述的物种分布数据聚合方法，其特征在于，所述海拔数值差距的设定阈值根据不同区域分别设定调整。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，所述地图网格尺度根据不同区域分别设定调整和/或对同一区域设定不同的地图网格尺度。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，所述数据增强处理包括：根据设置的衰减系数得到所述中心网格周围设定范围内的每个其他网格的权重值，将其他网格的原始物种分布数据乘以权重值后累加到中心网格的数据中，最终得到所述中心网格的数据增强后的物种分布数据聚合结果。
根据权利要求8所述的物种分布数据聚合方法，其特征在于，所述衰减系数根据不同区域分别设定调整。
根据权利要求1所述的物种分布数据聚合方法，其特征在于，该方法还包括：根据时间维度对所述原始物种分布数据进行分类处理，获取各个网格范围内处于不同时间的原始物种分布数据，并根据不同时间的原始物种分布数据分别进行数据增强处理。
一种物种分布数据聚合系统，其特征在于，包括处理器和存储器，所述存储器上存储有程序，所述程序被所述处理器执行时，实现根据权利要求1～10中任一项所述的物种分布数据聚合方法。
一种存储介质，其上存储有程序，其特征在于，所述程序被执行时实现根据权利要求1～10中任一项所述的物种分布数据聚合方法。