CN117999552A - 用于估算按区域调查完整性的损耗模型 - Google Patents
用于估算按区域调查完整性的损耗模型 Download PDFInfo
- Publication number
- CN117999552A CN117999552A CN202280064650.5A CN202280064650A CN117999552A CN 117999552 A CN117999552 A CN 117999552A CN 202280064650 A CN202280064650 A CN 202280064650A CN 117999552 A CN117999552 A CN 117999552A
- Authority
- CN
- China
- Prior art keywords
- capture
- record
- total number
- sites
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 56
- 238000012886 linear function Methods 0.000 claims abstract description 28
- 230000000737 periodic effect Effects 0.000 claims abstract description 18
- 230000001186 cumulative effect Effects 0.000 claims description 24
- 230000009471 action Effects 0.000 claims description 19
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000003860 storage Methods 0.000 description 10
- 239000008186 active pharmaceutical agent Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000003068 static effect Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000007620 mathematical function Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- KJLLKLRVCJAFRY-UHFFFAOYSA-N mebutizide Chemical compound ClC1=C(S(N)(=O)=O)C=C2S(=O)(=O)NC(C(C)C(C)CC)NC2=C1 KJLLKLRVCJAFRY-UHFFFAOYSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012358 sourcing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Remote Sensing (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于众包的实地报告在不参考地面实况数据的情况下预测区域中的场所或兴趣点数量的系统、设备、介质和方法。该方法包括根据区域和初始条件来标识所采集的实地报告的子集。子集是根据一系列记录和周期性的时间增量而进行布置的。应用损耗模型的过程包括,确定捕获量,确定努力量,以及基于捕获量与努力量之比较来计算捕获率。基于捕获率与累计捕获计数之比较来预测该区域的场所数量。应用损耗模型的过程包括生成线性函数来预测场所数量。该方法进一步生成该区域的估计完整性,该估计完整性可被用于建立市场价值。
Description
相关申请的交叉引用
本申请要求于2021年9月28日提交的美国申请序列号17/487,774的优先权,其内容通过引用并入本文。
技术领域
本公开中阐述的示例涉及电子记录和数据分析领域,包括用户提供的内容。更具体地,但不限于此,本公开描述了应用损耗模型来估计关于区域的调查的完整性。
背景技术
地图和与地图相关的应用包括有关兴趣点的数据。有关兴趣点的数据可以从用户提交的调查或实地报告中获得,这种做法被称为众包。
众包涉及庞大的、相对开放的、不断发展的用户池,他们可以在没有特殊技能或培训的情况下参与并收集实时数据。众包数据本质上是任意的。与用户较少的区域相比,活跃用户密集的区域可以生成相对较高数量的实地报告。
如今,用户可以使用许多类型的计算机和电子设备,诸如移动设备(例如,智能手机、平板电脑和笔记本电脑)和可穿戴设备(例如,智能眼镜、数字眼镜),其包括各种相机、传感器、无线收发器、输入系统和显示器。
附图说明
根据下面参考附图的详细描述中,将容易理解所描述的各种示例的特征。在描述和整个附图的若干个视图中,每个元件都使用参考数字。当存在多个相似元件时,单个参考数字可以被分配给类似的元件,其中附加的小写字母指代具体的元件。
图中显示的各个元件除非另有指示,否则不按比例绘制。为了清楚起见,各个元件的尺寸可以放大或缩小。这几幅图描绘了一个或多个实施方式,并仅通过示例的方式呈现,而不应被解释为限制性的。附图中包括以下各图:
图1是被分割成多个连续区域的示例地图;
图2是根据本文所述的损耗模型列出预测总场所数量和估计与区域相关联的完整性值的示例方法中的步骤的流程图;
图3是根据本文所述的损耗模型分析的用于预测区域中的总场所数量的示例数据序列;
图4A是示出与图3中所示的系列数据的第一部分相关联的第一示例线性函数的曲线图;
图4B是示出与图3中所示的系列数据的第二部分相关联的第二示例线性函数的曲线图;
图4C是示出与图3中所示的系列数据的第三部分相关联的第三示例线性函数的曲线图;
图5是根据本文描述的损耗模型分析的图3中所示的用于估计与所选区域相关联的完整性值的示例系列数据;
图6是根据一些示例的计算机系统形式的机器的图示,在该计算机系统内可以执行一组指令以使机器执行本文所述的方法或过程中的任何一个或多个;以及
图7是示出根据示例的其中可以实施本公开的软件架构的框图。
具体实施方式
参考用于基于众包的实地报告来预测区域中的场所总数的示例来描述各种实施方式和细节。例如,将损耗模型应用于实地报告的子集,以基于捕获量(catch quantity)与努力量(effort quantity)之比较来计算捕获率。基于捕获率与累计捕获计数之比较来预测该地区的总场所数量。应用损耗模型的过程包括生成线性函数来预测总场所数量。该方法进一步生成该区域的估计完整性,该估计完整性可被用于建立市场价值。
示例方法包括采集多个实地报告,其中每个实地报告包括用户标识符、场所标识符、提交时间戳和从由添加(Add)和编辑(Edit)组成的组中选择的动作类型。该方法包括根据区域和初始条件来标识所采集的实地报告的子集。使用损耗模型,该方法包括确定与根据周期性时间增量建立的一系列记录相关联的捕获量,其中每个捕获量表示以Add报告类型为特征的实地报告的数量。该方法还包括确定与每个记录相关联的努力量,其中每个努力量表示实地报告的总数。
使用损耗模型,该方法包括计算与每个记录相关联的捕获率,其中每个捕获率表示捕获量与努力量之比较。该方法还包括维护与每个记录相关联的累计捕获计数。该方法包括基于与预测记录相关联的捕获率和累计捕获计数来预测该区域的总场所数量。在一些实施方式中,损耗模型是线性回归模型,并且预测总捕获量的过程包括基于计算出的捕获率与所维护的累计捕获计数之比较来生成线性函数。所预测的总场所数量可被用于估计与该区域相关联的完整性值和市场价值。
尽管本文所述的各种系统和方法参考预测区域中的场所数量,但是所描述的技术可以被应用于利用数学或统计模型来评估任何一系列记录。
以下详细描述包括说明本公开中阐述的示例的系统、方法、技术、指令序列和计算机器程序产品。许多细节和示例被包括在内,出于提供对所公开主题及其相关教导的透彻理解的目的。然而,相关领域技术人员可以理解在没有这些细节的情况下如何应用相关教导。所公开主题的各方面不局限于所描述的具体设备、系统和方法,因为相关教导可以以各种方式应用或实践。本文中使用的术语和命名仅是出于描述特定方面的目的,并非旨在是限制性的。一般而言,众所周知的指令实例、协议、结构和技术不一定详细显示。
本文使用的术语“耦合”或“连接”是指任何逻辑、光学、物理或电连接,包括链路等,通过该链路,由一个系统元件产生或供应的电信号或磁信号被给予另一个耦合或连接的系统元件。除非另有描述,否则被耦合或被连接的元件或设备不一定直接彼此连接,并且可以由中间部件、元件或通信介质分隔开,其中的一个或多个可以修改、操纵或携带电信号。术语“在……之上”是指由一个元件直接支撑,或通过集成到该元件中或由该元件支撑的另一个元件间接由元件支撑。
示例的额外目的、优点和新颖特征将在以下描述中部分地阐述,并且在检查以下内容和附图时,部分地将对本领域技术人员而言变得显而易见,或者可以通过示例的生产或操作获知。本主题的目的和优点可以借助于所附权利要求中特别指出的方法、工具和组合来实现或达到。
在与地图相关的移动应用的示例上下文中,用户可以提交关于新场所(例如,Add动作类型)或关于现有场所(例如,Edit动作类型)的实地报告。在一些应用中,实地报告的格式包括仅限于一组预定义属性的场所数据,其中一些属性被期望会随着时间的推移相对静态(例如,姓名、地址、业务类型、电话号码),而另一些则会发生变化或动态(例如,准入政策、营业时间、便利性)。例如,由用户提交的实地报告包括与特定属性(例如,业务类型)相关联的数据提交或标签(例如,咖啡馆)。实地报告不需要针对每个属性都包含标签。例如,Edit动作可以包括与场所的一个属性相关联的单个标签。Add动作可以包括用于关于场所的大部分或全部属性的标签。
用户和参与企业想要反映出客观事实的场所数据;换句话说,准确、可靠并且是最新的场所数据。可以通过购买专有的第三方数据集或派遣专家调查人员进入实地来寻找地面实况场所数据。聘请专业的内容管理员进行调查需要时间并增加费用。
特别令人感兴趣的是关于特定地理地区或区域中的场所和兴趣点的数据是否完整。换句话说;我们的数据在多大程度上包括关于该区域每个场所的至少一份实地报告?众包数据本质上是任意的,并且因此难以使用有时适用于更结构化调查数据的抽样校正方法来进行分析。
地面实况场所数据可以包括区域中的场所总数;然而,随着时间的推移,场所总数会随着场所的开放和关闭而变化。在一个方面,本文所述的系统和方法在不依赖于外部或客观的地面实况场所数据来源的情况下估计众包场所数据的完整性。
图1是被划分为多个连续区域的示例地图。在一些实施方式中,地理空间索引模型包括六边形单元或区域的网格系统。六边形区域通常是连续的,这意味着它们紧密地配合在一起,几乎没有间隙或重叠。较大的六边形可被应用于偏远或人口较少的地区,而相对较小的六边形网格则被应用于人口较稠密的地区。适合在本文所述的基于区域的方法中使用的地理空间索引模型基于或包括优步科技股份有限公司开发的基于H3网格的空间索引系统。
如图所示,图1中所示的示例地图包括关于每个六边形区域40内的兴趣点或场所的一个或多个实地报告10。
图2是列出了根据本文所述的损耗模型来预测总场所数量和估计与区域相关联的完整性值的示例方法中的步骤的流程图210。尽管参考实地报告和场所数据描述了这些步骤,但是所描述的步骤的其他有益用途和实施方式将基于本文的描述被本领域技术人员理解。所示和所描述的步骤中的一个或多个可以同时、以系列的形式、以不同于所示和描述的顺序、或者结合附加步骤来执行。一些步骤可以被省略,或者在一些应用中可以被重复。
在一些示例实施方式中,实地报告10包括用户标识符15、场所标识符20、提交时间戳25和动作类型30。在一些实施方式中,动作类型30包括Add 31(例如,提交新场所的实地报告10)或Edit 32(例如,提交包括以下项的实地报告10:一个或多个建议的编辑、更改、纠正或关于与先前添加的场所相关联的一个或多个场所属性的其他数据),以及其他动作类型。
在一些实施方式中,用户标识符15包括用户名、设备标识符(例如,设备IP地址、设备元数据)、与用户设备相关联的地理位置数据(例如,EXIF格式的图像元数据)、以及与作为参与用户或注册用户的特定人员相关联的其他标记。在一些实施方式中,提交时间戳25表示当由用户提交实地报告10时的日期和时钟时间。在一些实施方式中,场所标识符20包括场所名称、唯一的场所编号(例如,参考号或序列号)、地理空间标识符(例如,地理元数据、GPS数据)以及与提交了实地报告10的地理场所相关联的其他标记。
实地报告10可被存储在一个或多个计算设备600(图6)的存储器604中(图6;例如,存储在实地报告数据库或一组关系数据库中),例如本文所述的那些计算设备。类似地,用户记录可以被存储在一个或多个计算设备600的存储器604中(例如,存储在用户数据库或一组关系数据库中)。在一些实施方式中,用户记录包括用户标识符15、用户可信度得分以及各种其他用户特定的数据和信息。
在一些实施方式中,实地报告10包括一个或多个用户提交的标签,包括一个或者多个字符(例如,字母、单词、数字、空格、标点符号)、值(例如,来自菜单中的选择、与特定变量相关联的值)、或者与场所属性20相关联或者表示场所属性20的任何其他标记。在一些实施方式中,场所属性20包括与场所或兴趣点相关联的各种属性中的任何一个,包括期望随着时间而保持相对静态的属性(例如,名称、地址、业务类型、电话号码)和相对动态、可变或随时间变化的其他属性(例如,准入政策、营业时间、便利性)。例如,用户提交的包括文本字符串“Acme银行”的标签可以被提交以表示标题为“企业名称”的场所属性20。另一示例用户提交的包括数值8的标签可以被提交以表示标题为“周一开放时间”的场所属性20。
图1中的框212描述了采集多个实地报告10的示例步骤,其中每个实地报告包括用户标识符15、场所标识符20、提交时间戳25和动作类型30(例如,Add 31或Edit 32)。在一些实施方式中,采集的步骤包括将多个实地报告10存储在一个或多个数据库中,或者存储在一个或多个计算设备的存储器元件中。
图1中的框214描述了根据区域40(例如,图1中所示的区域40之一)和初始条件45来标识所采集的实地报告的子集110的示例步骤。在一些实施方式中,标识子集的步骤包括从存储器或从一个或多个数据库检索实地报告10。
在一些实施方式中,区域40是基于初始条件45来标识或以其他方式选择的。在实践中,当候选区域已被选择并且一系列125的记录126已经根据本文所述的周期性时间增量127生成时,标识子集110的步骤包括确定是否满足(或不满足)初始条件45。在一些实施方式中,初始条件45包括以下要求:第一记录126包括实地报告10,其包括与特定候选区域相关联的场所的第一Add 31(例如,在其中尚未提交先前Add的区域40中提议第一Add 31)。在一些实施方式中,初始条件45可以基于后续记录126之间的捕获量120的最小增加量,如本文所述(例如,在区域40中提议Add 31的数量突然增加)。可以将最小增加量与预定阈值进行比较(例如,至少一个附加Add 31,Add 31增加10%)。
如果不满足初始条件45,则标识子集110的步骤可以包括选择不同的或后续的区域40进行分析,或者在一些实施方式中,选择应用于相同区域40的不同的或后续的初始条件45。在该方面,在一些实施方式中,当执行标识子集110的步骤时,区域40和初始条件45相对于彼此被选择和评估。
在一些实施方式中,本文描述的损耗模型100在评估添加的场所很少或为零的区域以及用户开始提交实地报告10的区域中特别有用。例如,位于新市场(例如,应用发布后的新城市)或偏远地区(例如,度假小镇或岛屿目的地)的候选地区可能几乎没有或根本没有兴趣点的场所数据。相比之下,活动用户密集的已建立区域通常将包括相对较少的关于新场所的Add类型动作(例如,当新的兴趣点或场所开放时)。
图1中的框216描述了用于已标识的子集110的示例步骤,该示例步骤确定与根据周期性时间增量127所建立的一系列125的记录126相关联的捕获量120。在一些实施方式中,周期性时间增量127是预定或所选择的时间值(例如,24小时、3天、7天)。每个所建立的记录126跨越一个周期性时间增量127(例如,24小时周期),并且根据提交时间戳25用接收到的实地报告10填充。
在一些实施方式中,周期性时间增量127是重复的并且是规则的(例如,对于一系列125中的所有记录126的增量是相同的)。在一些实施方式中,规则或一致的周期性时间增量127最适合于本文所述的损耗模型110。例如,线性回归模型通常需要根据规则的周期性时间增量127所建立的一系列125的记录126。
每个记录126包括与在关联于每个记录的时间增量127期间所接收的子集110中的所有实地报告10相关的数据。图3中示出了示例系列125的记录126。例如,系列125中的第一记录1包括在第一时间增量127(例如,一天)期间接收的子集110中关于所有实地报告10的数据。
在一些实施方式中,确定捕获量120的示例步骤包括,对于每个记录126,计数Add类型实地报告的数量(例如,以Add 31动作类型为特征的实地报告10的数量)。该方面中的捕获量120表示在与每个记录126相关联的时间段期间由区域40中的用户提交的新场所Add31的数量。Add 31的数量被称为捕获量120,因为提交关于新场所的Add类型实地报告在某些方面类似于在特定地区捕获或标识野生动物。随着捕获量120的增加,剩下的待捕获或标识的未报告的场所越来越少。
在一些实施方式中,建立根据周期性时间增量127所建立的一系列125的记录126的过程(在框216处)与根据区域40和初始条件45标识所采集的实地报告的子集110的步骤(在框214处)串联执行或以其他方式相关联。例如,如本文所述,第一周期性时间增量127(例如,24小时)可以产生不满足初始条件45的一系列125的记录126,而第二或替代的周期性时间增值127(例如,12小时)(当应用实地报告10的同一子集110时)可以产生满足初始条件45的一系列125的记录126。在此方面,图2中描述的一个或多个步骤可以重复进行或者与其他步骤一起执行;例如,通过选择替代的周期性时间增量127,确定是否满足初始条件45,并重复该过程(如需要)来进行。对于实地报告10的一些子集110,在根据任何所选的周期性时间增量127而建立的一系列215的记录126中,可能不满足初始条件45。对于其他子集110,初始条件45可以仅针对一个或相对较少的所选的周期性时间增量127来满足。
图1中的框218描述了确定与每个记录126相关联的努力量130的示例步骤,其中每个努力量130表示实地报告10的总数(例如,所有类型,包括Add31和Edit 32)。在这个方面中努力量130表示在与每个记录126相关联的时间段期间区域40中的用户对总实地报告活动的估计。通常,与地图相关的应用会收集和存储各种用户数据(例如,使用数据、地理元数据、事务日志),这些数据可以被用作用户努力的代理。然而,在该示例实施方式中,努力量130基于提交的实地报告10的总数(例如,Add和Edit)。在此方面,所估计的用户努力与提交为任何类型的实地报告10的任务相关联。
图1中的框220描述了计算与每个记录126相关联的捕获率140的示例步骤,其中每个捕获率140表示与每个记录126相关联的捕获量120(例如,Add31报告类型)与努力量130(例如,所有报告)之比较。在一些实施方式中,捕获率140通过捕获量120除以努力量130(例如,表示为比率或百分比)而进行计算。例如,对于图3中的记录126a,捕获率140是2,努力量130是5,并且捕获率140为二除以五;表示为0.40或40%。
图1中的框222描述了预测与系列125中的特定记录(例如,预测记录126a)相关联的总场所数量160的示例步骤。在一些实施方式中,所预测的总场所数量160基于与预测记录126a相关联的捕获率140和累计捕获计数150。在该方面,该示例步骤包括维护与系列125中的每个记录126相关联的累计捕获计数150,如图3所示。
随着越来越多的关于特定区域40的实地报告10被提交,添加的新场所的数量(即,捕获量120)随着时间的推移将接近零(例如,当要添加的附加场所很少或没有时)。因此,如图3所示,随着捕获量120的减少,计算出的捕获率40随着时间的推移将接近零。
图4A是与系列125中的预测记录126a相关联的图3中所示的示例数据的曲线图。如图所示,图4A是将图3中的每个数据点示为空心点的笛卡尔坐标系,其中沿x轴的横坐标值是累计捕获计数150,并且沿y轴的纵坐标值是计算出的捕获率40。在一些实施方式中,预测总场所数量160的示例步骤(图1中的框222)包括生成曲线图并绘制计算出的捕获率40随着时间的推移与累计捕获计数150的关系,如图4A所示。
与预测记录126a(图3)相关联的已知数据点被绘制在图4A中的曲线图上,并且示出了随着累计捕获计数150的增加,计算出的捕获量率40趋向于零。曲线拟合描述了构建曲线或找到最拟合一系列已知数据点的数学函数的过程。在统计学中,线性回归模型假定最拟合的数学函数是线性的。线性回归模型将线拟合到已知的数据点。最终得到的线性函数的形式为y=mx+b,其中m是直线的斜率,并且b是y截距值(即,直线与y轴相交(x等于零)时的y值)。对于给定的线性函数,可以通过将y设置为等于零并求解x来计算x截距值(即,线与x轴相交时的x值)。
在一些实施方式中,在框222处预测总场所数量160的示例步骤包括应用损耗模型100。在一些实施方式中,损耗模型100是线性回归模型,该模型在当应用于已建立的一系列125的记录126时,生成了基于计算出的捕获率140和所维护的累计捕获计数150的线性函数。如本文所述,在一些实施方式中,损耗模型100被应用为用于预测与区域40相关联的总场所数量160、估计完整性170以及建立与区域40相关联的市场价值的系统的一部分。
图4A中的曲线图包括根据第一示例线性函数绘制的线200a,该第一示例线性函数是通过将示例损耗模型100(例如,线性回归模型)应用于与图3中的预测记录126a相关联的已知数据点而生成的。如图所示,当计算出的捕获率140到达零(y等于零)时,线200a与x轴的截距的值为41.00,表示所预测的总场所数量160。在这个方面,将损耗模型100应用于已知数据点产生了线性函数和x截距值,该x截距值表示所预测的总场所数量160。图3的最后一列示出了与每个记录126相关联的所预测的总场所数量160。
图4B中的曲线图包括根据第二示例线性函数绘制的线200b,该第二示例性线性函数是通过将示例损耗模型100应用于与图3中的预测记录126b相关联的已知数据点而生成的。如图所示,对于导致并包括预测记录126b的总共四个记录,计算出的捕获率40等于0.20。这四个数据点如图4B所示。与记录126b相关联的所预测的总场所数量160等于37.00。此外,所估计的完整性170(如图5中记录126b所示)已增加到86.49%。
在另一个示例中,图4C中的曲线图包括根据第三示例线性函数绘制的线200c,该第三示例性线性函数是通过将示例损耗模型100应用于与图3中的预测记录126c相关联的已知数据点而生成的。如图所示,对于导致并包括预测记录126c的总共八(8)个记录,计算出的捕获率40等于零,并且累计捕获计数150等于32。这八个数据点是重叠的,并且因此如图4C所示作为同心点的集合,位于图上的x-y坐标(32,0)处。与记录126c相关联的所预测的总场所数量160等于33.32。此外,所估计的完整性170(如图5中记录126c所示)已增加到96.05%。
参照图4A、4B和4C中的曲线图,损耗模型100生成随时间变化的线性函数,每个线性函数具有不同的斜率和不同的x截距(即,不同的所预测的总场所数量160)。
在一些实施方式中,当所估计的完整性170接近阈值(例如,95%完整性)时,或者在其他实施方式中,当另一个所选的值或比率接近最小或最大阈值时,可以停止或中断对系列125中的记录126的生成或分析。
在相关方面中,在一些实施方式,预测总场所数量160的示例步骤(图1中的框222)包括计算与所预测的总场所数量160相关联的置信度值。在一些实施方式中,损耗模型100包括统计模型(例如,线性回归),其结果可以被分析以确定概率分布。例如,当损耗模型100产生线性函数时,当Y等于零时,存在与X的值相关联的概率分布。换句话说,可以使用统计分析来计算所预测的总场所数量160(即,x截距值)为正确的概率。在实践中,例如,所预测的总场所数量160可以表示为场所数量(例如,41.00)以及置信值,该置信值表示为比率或百分比(例如,60%)。
再次参考图3,对于记录126a,累计捕获计数150(基于关于该特定区域40提交的实际实地报告10)为28。所预测的总场所数量160是41.00,其表示当已经提交了关于区域40中的新场所的所有Add类型动作时对累计捕获计数150的预测。
图1中的框224描述了估计与每个记录126相关联的区域40的完整性170的示例步骤,其中所估计的完整性170是基于累计捕获计数150与所预测的总场所数量160之比较。在一些实施方式中,完整性170是通过累计捕获计数150除以所预测的总场所数量160(例如,表示为比率或百分比)来计算的。例如,对于图3中的记录126a,累计捕获计数150为28,所预测的总场所数量160为41.00,并且估计的完整性170为28除以41;表示为68.29%(针对图5中的几个示例记录126所列)。如图5所示,随着时间的推移,当计算出的捕获率40接近零时,完整性170增加,趋向于100%。
在相关方面中,在一些实施方式中,所估计的完整性170表示用于建立与区域40相关联的市场价值的全部或部分基础。如本文所使用的,市场价值可以表示或与广告费率(例如,对于希望向区域40中的用户做广告的商业合作伙伴)、投放优惠(例如,对策划或以其他方式提交关于区域40内的特定兴趣点或场所的Add类型实地报告10收取费用)、用户激励(例如,向提交关于区域40内的场所的Add类型实地报告10的用户提供的奖励积分、奖品、信用点或现金,以鼓励更高的捕获量120),或用于其他商业或战略目的。对于商业场所或其他兴趣点的所有者来说,在这种情况下,所估计的完整性170影响与联系区域40中的用户相关联的感知市场价值。例如,相对较高的估计完整性170表示区域40的活跃用户可能已经饱和,这可能与企业主的目标很好地匹配或可能不匹配。相对较低的估计完整性170可以表示刚刚开始吸引更多活跃用户的区域40,这可以是通过激励、优惠或促销来联系这些用户的机会。
图6是机器600的图解表示,其中可以执行用于使机器600执行本文所讨论的方法中的任何一个或多个的指令608(例如,软件、程序、应用程序、小程序、应用或其他可执行代码)。例如,指令608可以使机器600执行本文所描述的方法中的任何一个或多个。指令608将一般的、未编程的机器600转换为被编程为以所描述的方式执行所描述和所示的功能的特定机器600。机器600可以作为独立设备操作,或者可以被耦合(例如,联网)到其他机器。在联网部署中,机器600可以在服务器-客户端网络环境中以服务器机器或客户端机器的身份操作,或者作为对等(或分布式)网络环境中的对等机器操作。机器600可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、PDA、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能家电)、其他智能设备、网络设备、网络路由器、网络交换机、网桥或能够顺序地或以其他方式执行指令608的任何机器,该指令608指定机器600要采取的动作。此外,虽然仅示出了单个机器600,但术语“机器”也应被视为包括单独或联合执行指令608以执行本文所讨论的方法中的任何一个或多个方法的机器的集合。
机器600可以包括处理器602、存储器604和输入/输出(I/O)部件642,它们可以被配置为经由总线644彼此通信。在一个示例中,处理器602(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、ASIC、射频集成电路(RFIC)、另一处理器或其任何合适的组合)可以包括,例如,执行指令608的处理器606和处理器610。术语“处理器”旨在包括多核处理器,多核处理器可以包括可以同时执行指令的两个或更多个独立处理器(有时称为“核”)。尽管示出了多个处理器602,但是机器600可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单核的多个处理机、具有多核的多个处理器或其任意组合。
存储器604包括主存储器612、静态存储器614和存储单元616,两者都可经由总线644访问处理器602。主存储器604、静态存储器614和存储单元616存储体现本文所述的方法或功能中的任何一个或多个的指令608。指令608还可以完全或部分地驻留在主存储器612内、静态存储器614内、存储单元616内的机器可读介质618(例如,非暂时性机器可读存储介质)内、至少一个处理器602(例如,处理器的高速缓冲存储器内)内、或其任何适当组合内,在它们由机器600执行期间。
此外,机器可读介质618是非瞬态的(换句话说,不具有任何瞬态信号),因为它不包含传播信号。然而,将机器可读介质618标记为“非暂时性”不应被解释为该介质不能移动;介质应当被认为是可从一个物理位置传送到另一个物理位置的。此外,由于机器可读介质618是有形的,因此该介质可以是机器可读设备。
I/O部件642可以包括各种各样的部件以接收输入、提供输出、产生输出、传输信息、交换信息、采集测量等等。包括在特定机器中的特定I/O部件642将取决于机器的类型。例如,诸如移动电话的便携式机器可以包括触摸输入设备或其他这样的输入机制,而无头服务器机器可能不包括此类触摸输入设备。应当理解,I/O部件642可以包括许多未示出的其他部件。在各种示例中,I/O部件642可以包括输出部件628和输入部件630。输出部件628可以包括视觉部件(例如,诸如等离子体显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动电机、电阻反馈机构)、其他信号发生器等等。输入部件630可以包括字母数字输入部件(例如,键盘,被配置为接收字母数字输入的触摸屏,光-电键盘,或其他字母数字输入部件),基于点的输入部件(例如,鼠标,触摸板,轨迹球,操纵杆,运动传感器,或其他指向工具),触觉输入部件(例如,物理按钮、提供位置、触摸力或触摸手势的触摸屏或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
在进一步的示例中,I/O部件642可以包括生物测量部件632、运动部件634、环境部件636或位置部件638以及一系列其他部件。例如,生物特征部件632包括用于检测表情(例如,手部表情、面部表情、声音表情、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、汗液或脑电波)、标识人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等。运动部件634包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)等等。环境部件636包括,例如,照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或多个麦克风),接近传感器部件(例如,检测附近物体的红外传感器)、气体传感器(例如,为了安全检测危险气体浓度或测量大气中污染物的气体检测传感器),或可提供与周围物理环境相对应的指示、测量或信号的其他部件。位置部件638包括位置传感器部件(例如,GPS接收器部件)、高度传感器部件(例如,用于检测可导出高度的气压的高度计或气压计)、方位传感器部件(磁力计)等。
通信可以使用多种技术来实施。I/O部件642还包括通信部件640,通信部件640可操作以分别经由耦合器624和耦合器626将机器600耦合到网络620或设备622。例如,通信部件640可以包括网络接口部件或与网络620连接(interface)的另一合适设备。在进一步的示例中,通信部件640可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如,/>低能耗)、/>部件和其他通信部件,以经由其他形式提供通信。设备622可以是另一台机器或多种外围设备中的任何一种(例如,经由USB耦合的外围设备)。
此外,通信部件640可以检测标识符或者包括可操作用于检测标识符的部件。例如,通信部件640可以包括射频识别(RFID)标签读取器部件、NFC智能标签检测部件、光学读取器部件(例如,用于检测一维条形码(诸如通用产品代码(UPC)条形码)和多维条形码(诸如快速响应(QR)码、阿兹特克码、数据矩阵、数据字形(Dataglyph)、最大码(MaxiCode)、PDF417、超码(Ultra Code)、UCC RSS-2D条形码和其他光学代码)的光学传感器),或声学检测部件(例如,用于标识标记音频信号的麦克风)。此外,可以经由通信部件640导出各种信息,诸如经由互联网协议(IP)地理位置的位置、经由信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等等。
各种存储器(例如,存储器604,主存储器612,静态存储器614,处理器602的存储器),存储单元616可以存储体现或由本文所述的方法或功能中的任何一个或多个所使用的一组或多组指令和数据结构(例如,软件)。当由处理器602执行这些指令(例如,指令608)时,引起各种操作来实施所公开的示例。
指令608可以使用传输介质,经由网络接口设备(例如,包括在通信部件640中的网络接口部件),并使用许多众所周知的传输协议(例如,超文本传输协议(HTTP))中的任何一种,在网络620上传输或接收。类似地,指令608可以经由耦合器626(例如,对等耦合器)使用传输介质传输或接收到设备622。
图7是示出软件架构704的框图700,该软件架构704以安装在本文所描述的设备中的任何一个或多个设备上。软件架构704由诸如机器702之类的硬件支持,该机器702包括处理器720、存储器726和I/O部件738。在该示例中,软件架构704可以被概念化为层状堆集,其中每一层提供特定的功能。软件架构704包括诸如操作系统712、库710、框架708和应用706之类的层。在操作上,应用706通过软件堆栈调用API调用750,并接收响应于API调用750的消息752。
操作系统712管理硬件资源并提供通用服务。操作系统712包括例如内核714、服务716和驱动器722。内核714充当硬件层和其他软件层之间的抽象层。例如,内核714提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置等功能。服务716可以为其他软件层提供其他通用服务。驱动器722负责控制底层硬件或与底层硬件进行连接。例如,驱动器722可以包括显示器驱动器、相机驱动器、或/>低能耗(BLE)驱动器、闪存驱动器、串行通信驱动器(例如,通用串行总线(USB)驱动器)、/>驱动器、音频驱动器、电源管理驱动器等等。
库710提供由应用706使用的低级通用基础设施。库710可以包括提供诸如存储器分配函数、字符串操作函数、数学函数等功能的系统库718(例如,C标准库)。此外,库710可以包括API库724,诸如媒体库(例如,用于支持各种媒体格式的呈现和操作的库,媒体格式诸如移动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、移动图像专家组第3层(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形内容中以二维(2D)和三维(3D)渲染的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供网页浏览功能的引擎)等等。库710还可以包括各种各样的其他库728,以向应用706提供许多其他API。
框架708提供由应用706使用的高级通用基础设施。例如,框架708提供各种图形用户界面(GUI)功能、高级资源管理和高级位置服务。框架708可以提供可以由应用706使用的广泛的其他API,其中一些可以是特定操作系统或平台所特有的。
在一个示例中,应用706可以包括主页应用736、联系人应用730、浏览器应用732、图书阅读器应用734、位置应用742、媒体应用744、消息收发应用746、游戏应用748以及诸如第三方应用740之类的各种其他应用。第三方应用740是执行在程序中定义的功能的程序。
在特定示例中,第三方应用740(例如,由特定平台的供应商以外的实体使用Google Android或Apple iOS软件开发工具包(SDK)开发的应用)可以是在移动操作系统上运行的移动软件,诸如Google Android、Apple iOS(用于iPhone或iPad设备)、WindowsMobile、Amazon Fire OS、RIM BlackBerry OS或其他移动操作系统。在该示例中,第三方应用740可以调用由操作系统712提供的API调用750,以促进本文所描述的功能。
可以采用各种编程语言来创建一个或多个应用706,这些应用706以各种方式结构化,诸如面向对象编程语言(例如,Objective-C、Java、C++或R)或程序式编程语言(例如,C或汇编语言)。例如,R是一种特别适用于统计计算、数据分析和图形的编程语言。
本文描述的任何功能都可以体现在一个或多个计算机软件应用或编程指令集中。根据一些示例,“功能”、“多个功能”和“应用”、“多个应用、”指令、“多个指令”或“多个编程”是执行程序中定义的功能的一个或多个程序。能够采用各种编程语言来开发一个或多个应用,其结构各种各样,诸如面向对象编程语言(例如,Objective-C、Java或C++)或程序化编程语言(例如,C或汇编语言)。在具体示例中,第三方应用(例如,由除特定平台的供应商以外的实体使用ANDROIDTM或IOSTM软件开发工具包(software development kit,SDK)开发的应用)可以包括运行在移动操作系统(诸如IOSTM、ANDROIDTM、Phone或其他移动操作系统)上的移动软件。‘在本示例中,第三方应用可以调用由操作系统提供的API调用,以促进本文中描述的功能。
因此,机器可读介质可以采用多种形式的有形存储介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机设备中的任何存储设备等,诸如可被用于实施图中所示的客户端设备、媒体网关、代码转换器等。易失性存储介质包括动态存储器,诸如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括包含计算机系统内总线的电线。载波传输介质可以采用电信号或电磁信号的形式,或者声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间生成的那些。因此,计算机可读介质的常见形式包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡片纸带、任何其他带孔图案的物理存储介质、RAM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式存储器,传送数据或指令的载波、传送此类载波的电缆或链路,或者计算机可以从中读取编程代码或数据的任何其他介质。这些形式的计算机可读介质中的许多可以涉及将一个或多个指令的一个或更多序列携带到处理器以供执行。
除了上面刚刚陈述的,已经陈述或示出的任何内容都不旨在或不应该被解释为致使将任何部件、步骤、特征、目的、益处、优点或等同物奉献给公众,无论其是否在权利要求中被陈述。
将理解,本文中使用的术语和表述具有如这样的术语和表述相对于其对应的各自探究和研究领域所赋予的普通含义,除非本文中另外已经阐述了其中的具体含义。关系术语(诸如第一和第二等)可以仅用于将一个实体或动作与另一个实体或动作区分开,而不一定要求或暗示这样的实体或动作之间的任何实际的这种关系或顺序。术语“包括”、“包含”、“含有”、“涵盖”或其任何其他变型旨在涵盖非排他性的包含,使得包括或包含一系列元素或步骤的过程、方法、物品或装置不仅包括那些元素或步骤,还可以包括未明确列出的或这样的过程、方法、物品或装置固有的其他元素或步骤。在没有进一步约束的情况下,以“一”或“一个”开头的元素并不排除在包括该元素的过程、方法、物品或装置中存在额外的相同元素。
除非另有说明,否则本说明书(包括随后的权利要求)中阐述的任何及所有测量结果、值、额定值、位置、幅值、尺寸和其他规格都是近似的,而不是精确的。这些量旨在具有合理的范围,即与它们所涉及的功能以及它们所属领域的惯例一致。例如,除非另有明确规定,否则参数值等可以与规定的数量或范围相差多达正负百分之十。
此外,在前面的详细描述中,可以看到,出于精简本公开的目的,各个特征在各种示例中被组合在一起。这种公开的方法不应当被解释为反映这样的意图,即所要求保护的示例要求比每个权利要求中明确陈述的特征更多。相反,正如以下权利要求所反映的,要被保护的主题在于少于任何单个所公开示例的所有特征。因此,以下权利要求由此并入详细描述中,其中每项权利要求作为单独所要求保护的主题独立存在。
尽管前面已经描述了被认为是最佳模式和其他示例的内容,但是可以理解的是,可以在其中进行各种修改,并且本文中公开的主题可以以各种形式和示例实施,并且它们可以应用于众多应用中,本文中仅已经描述了其中的一些应用。以下权利要求旨在要求保护属于本概念的真实范围内的任何及所有修改和变型。
Claims (20)
1.一种方法,所述方法包括:
采集多个实地报告,其中每个实地报告包括用户标识符、场所标识符、提交时间戳和从由添加和编辑组成的组中选择的动作类型;
根据区域和初始条件来标识所采集的实地报告的子集;
确定与根据周期性时间增量而建立的一系列记录相关联的捕获量,其中每个捕获量表示以添加报告类型为特征的实地报告的数量;
确定与每个记录相关联的努力量,其中每个努力量表示实地报告的总数;
计算与每个记录相关联的捕获率,其中每个捕获率表示所述捕获量与所述努力量之比较;
维护与每个记录相关联的累计捕获计数;以及
基于与预测记录相关联的捕获率和所述累计捕获计数来预测针对所述区域的总场所数量。
2.根据权利要求1所述的方法,其中,标识子集的步骤还包括:
应用将感兴趣的映射区域划分为多个区域的地理空间索引模型;以及
基于所述初始条件选择区域,其中所述初始条件基于与预定阈值相比下的后续记录之间的捕获量的最小增加量。
3.根据权利要求1所述的方法,其中,计算捕获率的步骤还包括:
针对所述一系列中的每个记录将所述捕获量除以所述努力量。
4.根据权利要求1所述的方法,其中,预测总场所数量的步骤还包括:
基于被应用于所建立的一系列记录的损耗模型生成线性函数,其中与每个记录相关联的线性函数基于计算出的捕获率和所维护的累计捕获计数;以及
基于所生成的线性函数来计算所预测的总场所数量。
5.根据权利要求4所述的方法,其中,所述损耗模型包括线性回归模型,
其中当计算出的捕获率等于零时,所预测的总场所数量基于所生成的线性函数,并且
其中所述方法还包括基于与所预测的总场所数量相关联的概率分布来计算置信值。
6.根据权利要求1所述的方法,所述方法还包括:
估计与每个记录相关联的区域的完整性,其中所估计的完整性基于所述累计捕获计数与所预测的总场所数量之比较。
7.根据权利要求6所述的方法,所述方法还包括:
基于所估计的完整性来建立与每个区域相关联的市场价值。
8.一种用于预测与区域相关联的总场所数量的系统,所述系统包括:
存储指令的存储器;和
处理器,所述处理器由所存储的指令配置为执行包括以下步骤的操作:
采集多个实地报告,其中每个实地报告包括用户标识符、场所标识符、提交时间戳和从由添加和编辑组成的组中选择的动作类型;
根据区域和初始条件来标识所采集的实地报告的子集;
确定与根据周期性时间增量而建立的一系列记录相关联的捕获量,其中每个捕获量表示以添加报告类型为特征的实地报告的数量;
确定与每个记录相关联的努力量,其中每个努力量表示实地报告的总数;
计算与每个记录相关联的捕获率,其中每个捕获率表示所述捕获量与所述努力量之比较;
维护与每个记录相关联的累计捕获计数;以及
基于与预测记录相关联的捕获率和累计捕获计数来预测针对所述区域的总场所数量。
9.根据权利要求8所述的系统,其中,标识子集的步骤还包括:
应用将感兴趣的映射区域划分为多个区域的地理空间索引模型;以及
基于所述初始条件选择区域,其中所述初始条件基于与预定阈值相比下的后续记录之间的捕获量的最小增加量。
10.根据权利要求8所述的系统,其中,计算捕获率的步骤还包括:
针对所述一系列中的每个记录将所述捕获量除以所述努力量。
11.根据权利要求8所述的系统,其中,预测总场所数量的步骤还包括:
基于被应用于所建立的一系列记录的损耗模型生成线性函数,其中与每个记录相关联的线性函数基于计算出的捕获率和所维护的累计捕获计数;以及
基于所生成的线性函数来计算所预测的总场所数量。
12.根据权利要求11所述的系统,其中,所述损耗模型包括线性回归模型,
其中当计算出的捕获率等于零时,所预测的总场所数量基于所生成的线性函数,并且
其中所述步骤还包括基于与所预测的总场所数量相关联的概率分布来计算置信值。
13.根据权利要求8所述的系统,其中,所述处理器由所存储的指令配置以执行进一步的操作,所述进一步的操作包括:
估计与每个记录相关联的区域的完整性,其中所估计的完整性基于所述累计捕获计数与所预测的总场所数量之比较。
14.根据权利要求13所述的系统,所述系统还包括:
基于所估计的完整性来建立与每个区域相关联的市场价值。
15.一种存储程序代码的非暂时性计算机可读介质,所述程序代码在被执行时能操作以使电子处理器执行以下步骤:
采集多个实地报告,其中每个实地报告包括用户标识符、场所标识符、提交时间戳和从由添加和编辑组成的组中选择的动作类型;
根据区域和初始条件来标识所采集的实地报告的子集;
确定与根据周期性时间增量而建立的一系列记录相关联的捕获量,其中每个捕获量表示以添加报告类型为特征的实地报告的数量;
确定与每个记录相关联的努力量,其中每个努力量表示实地报告的总数;
计算与每个记录相关联的捕获率,其中每个捕获率表示与所述捕获量与所述努力量之比较;
维护与每个记录相关联的累计捕获计数;以及
基于与预测记录相关联的捕获率和累计捕获计数来预测针对所述区域的总场所数量。
16.根据权利要求15所述的非暂时性计算机可读介质,其中,标识子集的步骤还包括:
应用将感兴趣的映射区域划分为多个区域的地理空间索引模型;以及
基于所述初始条件选择所述区域,其中所述初始条件基于与预定阈值相比下的后续记录之间的捕获量的最小增加量。
17.根据权利要求15所述的非暂时性计算机可读介质,其中,预测总场所数量的步骤还包括:
基于被应用于所建立的一系列记录的损耗模型生成线性函数,其中与每个记录相关联的线性函数基于计算出的捕获率和所维护的累计捕获计数;以及
基于所生成的线性函数来计算所预测的总场所数量。
18.根据权利要求17所述的非瞬态计算机可读介质,其中,所述损耗模型包括线性回归模型,
其中当计算出的捕获率等于零时,所预测的总场所数量基于所生成的线性函数,并且
其中所述方法还包括基于与所预测的总场所数量相关联的概率分布来计算置信值。
19.根据权利要求15所述的非暂时性计算机可读介质,其中,所存储的程序代码在执行时能操作以使电子处理器执行以下进一步的步骤:
估计与每个记录相关联的区域的完整性,其中所估计的完整性基于所述累计捕获计数与所预测的总场所数量之比较。
20.根据权利要求19所述的非瞬态计算机可读介质,所述非瞬态计算机可读介质还包括:
基于所估计的完整性来建立与每个区域相关联的市场价值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/487,774 | 2021-09-28 | ||
US17/487,774 US20230108980A1 (en) | 2021-09-28 | 2021-09-28 | Depletion modeling for estimating survey completeness by region |
PCT/US2022/044127 WO2023055613A1 (en) | 2021-09-28 | 2022-09-20 | Depletion modeling for estimating survey completeness by region |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117999552A true CN117999552A (zh) | 2024-05-07 |
Family
ID=83691566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280064650.5A Pending CN117999552A (zh) | 2021-09-28 | 2022-09-20 | 用于估算按区域调查完整性的损耗模型 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230108980A1 (zh) |
EP (1) | EP4409431A1 (zh) |
KR (1) | KR20240089013A (zh) |
CN (1) | CN117999552A (zh) |
WO (1) | WO2023055613A1 (zh) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7130865B2 (en) * | 2001-12-19 | 2006-10-31 | First Data Corporation | Methods and systems for developing market intelligence |
US20080103873A1 (en) * | 2006-10-25 | 2008-05-01 | Keith Clarke | Method of stimulating business development of neighborhood communities |
US20150154560A1 (en) * | 2011-01-07 | 2015-06-04 | Google Inc. | Optimal prioritization of business listings for moderation |
US8832116B1 (en) * | 2012-01-11 | 2014-09-09 | Google Inc. | Using mobile application logs to measure and maintain accuracy of business information |
US9218420B1 (en) * | 2013-02-26 | 2015-12-22 | Google Inc. | Detecting new businesses with unrecognized query terms |
US9122710B1 (en) * | 2013-03-12 | 2015-09-01 | Groupon, Inc. | Discovery of new business openings using web content analysis |
US9230169B2 (en) * | 2013-08-29 | 2016-01-05 | Digitalglobe, Inc. | Generation of high resolution population density data sets through exploitation of high resolution overhead imagery data and low resolution population density data sets |
US9904932B2 (en) * | 2014-12-29 | 2018-02-27 | Google Llc | Analyzing semantic places and related data from a plurality of location data reports |
CN105825338A (zh) * | 2016-03-17 | 2016-08-03 | 武汉大学 | 一种社会调查数据的空间抽样方法 |
KR102206782B1 (ko) * | 2019-03-04 | 2021-01-25 | 엘지전자 주식회사 | 디스플레이 장치 |
-
2021
- 2021-09-28 US US17/487,774 patent/US20230108980A1/en active Pending
-
2022
- 2022-09-20 WO PCT/US2022/044127 patent/WO2023055613A1/en active Application Filing
- 2022-09-20 EP EP22789769.1A patent/EP4409431A1/en active Pending
- 2022-09-20 KR KR1020247013440A patent/KR20240089013A/ko unknown
- 2022-09-20 CN CN202280064650.5A patent/CN117999552A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230108980A1 (en) | 2023-04-06 |
WO2023055613A1 (en) | 2023-04-06 |
EP4409431A1 (en) | 2024-08-07 |
KR20240089013A (ko) | 2024-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11250340B2 (en) | Feature contributors and influencers in machine learned predictive models | |
US10678997B2 (en) | Machine learned models for contextual editing of social networking profiles | |
US12067463B2 (en) | Machine learning platform | |
US20200380309A1 (en) | Method and System of Correcting Data Imbalance in a Dataset Used in Machine-Learning | |
US11521115B2 (en) | Method and system of detecting data imbalance in a dataset used in machine-learning | |
US20230011686A1 (en) | Crowd sourced mapping system | |
US20180357321A1 (en) | Sequentialized behavior based user guidance | |
US10719626B2 (en) | Bayesian smoothing of confidential data values at organization level using peer organization group | |
US10872303B2 (en) | Generating semantic representations for organizations and computing peer organization groups | |
KR102632889B1 (ko) | 태그 분포 시각화 시스템 | |
US20210209425A1 (en) | Deep learning methods for event verification and image re-purposing detection | |
US11934926B2 (en) | Sensitivity in supervised machine learning with experience data | |
CN117795502A (zh) | 消息传递系统中主题的演进 | |
US11995670B2 (en) | User experience management system | |
US20240012701A1 (en) | Statistical significance of errors or insights | |
CN117882066A (zh) | 基于用户可信度验证众包现场报告 | |
US11928088B1 (en) | Machine-learned models for predicting database application table growth factor | |
US10915851B2 (en) | Generating a unified graphical user interface view from disparate sources | |
CN118435208A (zh) | 用于按区域估计调查完整性的卫星数据 | |
US20230108980A1 (en) | Depletion modeling for estimating survey completeness by region | |
CN116601961A (zh) | 视觉标签显露模式检测 | |
US20230056075A1 (en) | Random forest predictive spam detection | |
US11790031B1 (en) | Website change detection | |
US11803701B2 (en) | Machine learning optimization of machine user interfaces | |
US20240086298A1 (en) | Anomaly detection and subsegment analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |