CN113377885A - 数据补充系统以及数据补充方法 - Google Patents
数据补充系统以及数据补充方法 Download PDFInfo
- Publication number
- CN113377885A CN113377885A CN202110248709.3A CN202110248709A CN113377885A CN 113377885 A CN113377885 A CN 113377885A CN 202110248709 A CN202110248709 A CN 202110248709A CN 113377885 A CN113377885 A CN 113377885A
- Authority
- CN
- China
- Prior art keywords
- data
- unit
- supplementary
- region
- external
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013589 supplement Substances 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000001502 supplementing effect Effects 0.000 claims description 60
- 230000000153 supplemental effect Effects 0.000 claims description 38
- 230000009469 supplementation Effects 0.000 claims description 25
- 230000010365 information processing Effects 0.000 claims description 22
- 238000004891 communication Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 28
- 238000000611 regression analysis Methods 0.000 description 23
- 238000012937 correction Methods 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 18
- 238000012790 confirmation Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000001134 F-test Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012314 multivariate regression analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Remote Sensing (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Instructional Devices (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供一种数据补充系统以及数据补充方法,高效地补充在与地区有关的数据中缺失的数据。数据补充系统存储包括与作为通过将地区划分为网格状而得到的地区的单元地区有关的多个数据项目的值的单元地区特性数据、表示单元地区特性数据中的缺失数据项目的信息、包括与作为与地区不同的地区的外部地区有关的多个数据项目的值的外部地区特性数据以及包括与通过将外部地区划分为网格状而得到的外部单元地区有关的多个数据项目的值的外部单元地区特性数据,生成根据外部地区特性数据和外部单元地区特性数据而生成作为缺失数据项目的值的补充数据的补充模型,并根据补充模型生成补充数据。
Description
技术领域
本发明涉及数据补充系统以及数据补充方法。
背景技术
在专利文献1中记载了一种地图数据处理装置,自治团体、零售商以及配送商等事业团体在各种计划制定、事业评价等的各种业务中利用的包括地面物体的属性数据的地图数据中,补充属性数据缺失的数据缺失地区的地图数据。地图数据处理装置检索多个地区,取得与数据缺失地区类似的类似地区,根据类似地区的地图数据来生成对数据缺失地区的地图数据中的缺失数据进行了补充的补充完毕地图数据,根据包含补充完毕地图数据的上述地图数据进行数据分析,判定基于补充完毕地图数据的分析结果是否适当,如果判定结果适当则输出补充完毕地图数据。
现有技术文献
专利文献1:日本专利第6472589号公报
发明内容
专利文献1记载的地图数据处理装置根据与数据缺失地区类似的地区的数据,补充包括数据缺失地区的地面物体的属性数据的地图数据的缺失数据。因此,在不存在与数据缺失地区类似的地区的情况下,存在无法补充缺失数据的可能性。
本发明的目的在于,提供一种能够高效地补充在与地区有关的数据中缺失的数据的数据补充系统以及数据补充方法。
用于实现上述目的的本发明之一是一种数据补充系统,其中,使用信息处理装置来构成所述数据补充系统,所述数据补充系统具备存储部和补充模型生成部,所述存储部存储:地区特性数据,是包括与预定的地区有关的多个数据项目的值的数据;单元地区特性数据,是包括与作为通过将所述地区划分为网格状而得到的地区的单元地区有关的多个数据项目的值的数据;表示缺失数据项目的信息,其中,该缺失数据项目是作为在所述单元地区特性数据中缺失的数据的缺失数据的所述数据项目;外部地区特性数据,是包括与作为与所述地区不同的地区的外部地区有关的多个数据项目的值的数据;以及外部单元地区特性数据,是包括与通过将所述外部地区划分为网格状而得到的外部单元地区有关的多个数据项目的值的数据,所述补充模型生成部生成补充模型,该补充模型是根据所述外部地区特性数据和所述外部单元地区特性数据而生成作为对所述缺失数据进行补充的数据的补充数据的模型。
此外,本申请公开的课题及其解决方法通过具体实施方式以及附图而会变得清楚。
根据本发明,能够高效地补充在与地区有关的数据中缺失的数据。
附图说明
图1是示出作为一个实施方式示出的数据补充系统的概略性的结构的图。
图2A是示出地区的一个例子的图。
图2B是示出单元地区的一个例子的图。
图3A是示出地区特性数据的一个例子的图。
图3B是示出单元地区特性数据的一个例子的图。
图4是在数据补充系统的结构中使用的信息处理装置的硬件结构例。
图5是说明补充数据生成处理的一个例子的流程图。
图6是用户信息设定画面的一个例子。
图7是说明变量设定画面的一个例子。
图8是地区单位数据确认画面的一个例子。
图9是示出模型生成数据的一个例子的概略图。
图10是说明补充模型生成处理的一个例子的流程图。
图11A是外部单元地区特性数据的一个例子。
图11B是外部地区特性数据的一个例子。
图12是说明单元地区特性数据多元回归分析处理的一个例子的流程图。
图13是说明地区特性数据多元回归分析处理的一个例子的流程图。
图14A是示出单元地区特性偏回归信息的一个例子的图。
图14B是示出地区特性偏回归信息的一个例子的图。
图15是示出利用补充模型选择画面的一个例子的图。
图16是示出补充信息确认画面的一个例子的图。
图17是示出补充模型信息的一个例子的图。
图18是示出补充数据信息的一个例子的图。
(符号说明)
1:数据补充系统;20:用户终端;30:通信网络;40:用户信息设定画面;50:说明变量设定画面;60:地区单位数据确认画面;70:利用补充模型选择画面;80:补充信息确认画面;100:数据补充装置;101:通信部;102:画面数据生成部;103:用户设定信息取得部;104:数据取得部;105:补充模型生成部;106:数据补充部;107:补充模型选择部;108:补充数据校正部;110:地区特性数据;120:单元地区特性数据;130:模型生成数据;200:存储部;210:用户设定信息;220:外部单元地区特性数据;230:外部地区特性数据;240:单元地区特性偏回归信息;250:地区特性偏回归信息;260:补充模型信息;270:补充数据信息;300:地区;301:单元地区。
具体实施方式
以下,参照附图来说明实施方式。在以下的说明中,关于相同或者类似的结构,有时附加同一符号而省略重复的说明。在以下的说明中,在符号的前面附加的“s”的文字意味着处理步骤。
图1示出作为一个实施方式例示的信息处理系统(以下称为“数据补充系统1”)的概略性的结构。数据补充系统1的利用主体例如是自治团体、运营商。
自治团体、运营商在计划或实施以市、区、街区等地区为对象的服务时,收集包括与成为服务的对象的地区有关的各种信息(各种数据项目及其值)的数据即地区特性数据,并进行使用了收集到的地区特性数据的数据分析等作业。上述数据项目例如是地区中的面积、户数、人口、年龄分布、汽车登记台数等。
数据补充系统1在使用地区特性数据进行上述作业时,生成对作为在地区特性数据中缺失的数据的缺失数据进行补充的数据即补充数据。
自治团体、运营商以提供质量高的服务等为目的,将地区与地区特性数据一起划分为多个网格状(例如500m×500m)的地区(以下称为“单元地区”),处理作为与单元地区有关的各种信息(各种数据项目及其值)的单元地区特性数据。上述数据项目例如是地区中的面积、户数、人口、年龄分布等。
图2A以及图2B示出地区300和单元地区301的概念。图2A是示出市等地区300的整体的图,图2B是将图2A所示的矩形区域302进行了放大的图。
图3A示出地区特性数据110的一个例子。如该图所示,地区特性数据110是关于地区(地区的标识符)将地区的面积和多个数据项目(人口、年龄人口未满15岁、年龄人口65岁以上、汽车保有台数等)的值对应起来的数据。
图3B示出单元地区特性数据120的一个例子。如该图所示,单元地区特性数据120是关于单元地区(单元地区的标识符)将表示单元地区的面积的单元尺寸和多个数据项目(人口、年龄人口未满15岁、年龄人口65岁以上等)的值对应起来的数据。
此外,还存在虽然在地区特性数据110中有但在单元地区特性数据120中没有的数据项目(例如图3A例示的地区特性数据110中的汽车保有台数)。这样的在单元地区特性数据120中没有的数据项目即缺失数据项目的值是上述缺失数据。数据补充系统1关于这样的缺失数据,生成补充数据。
数据补充系统1根据外部地区特性数据、外部单元地区特性数据而生成补充数据,该外部地区特性数据是包含与成为服务对象的地区以外的地区即外部地区有关的各种信息(各种数据项目及其值)的数据,该外部单元地区特性数据是与将外部地区划分为网格状(例如500m×500m)而得到的地区即外部单元地区有关的各种信息(各种数据项目及其值)。
如图1所示,数据补充系统1包括用户终端20以及数据补充装置100。用户终端20以及数据补充装置100都使用信息处理装置(计算机)来构成,并经由有线或者无线的通信网络30可通信地连接。通信网络30例如是LAN(Local Area Network,局域网)、WAN(Wide AreaNetwork,广域网)、因特网、专用线、各种数据通信网等。
用户终端20例如由进行服务的计划、实施的自治团体、运营商等管理,并由进行上述作业的人员(以下称为“用户”)操作。数据补充装置100将与缺失数据的补充有关的各种服务提供给用户终端20。
图4是构成用户终端20、数据补充装置100的信息处理装置10的硬件结构的一个例子。如该图所示,信息处理装置10具备处理器11、主存储装置12、通信接口13以及辅助存储装置14。
处理器11例如使用CPU(Central Processing Unit,中央处理单元)、MPU(MicroProcessing Unit,微处理单元)、GPU(Graphics Processing Unit,图形处理单元)、AI(Artificial Intelligence,人工智能)芯片、FPGA(Field Programmable Gate Array,现场可编程门阵列)、SoC(System on Chip,片上系统)、ASIC(Application SpecificIntegrated Circuit,专用集成电路)等来构成。
主存储装置12是存储程序、数据的装置,例如是ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、非易失性存储器(NVRAM(NonVolatile RAM,非易失性RAM))等。
通信接口13是经由通信网络30而与其它信息处理装置之间进行通信的装置,是无线或者有线的通信模块(无线通信模块、通信网络适配器、USB模块等)。
辅助存储装置14是储存程序、数据的装置,例如是SSD(Solid State Drive,固态驱动器)、硬盘驱动器、光学式存储介质(CD(Compact Disc,高密度盘)、DVD(DigitalVersatile Disc,数字多功能盘)等)、IC卡、SD卡等。在辅助存储装置14中,储存有用于实现数据补充装置100的功能的程序以及数据。辅助存储装置14能够经由记录介质的读取装置、通信接口13而进行程序、数据的写入/读出。储存(存储)于辅助存储装置14的程序、数据被随时读出到主存储装置12。
输入装置15是受理来自外部的用户输入、数据输入的用户接口,例如是键盘、鼠标、触摸面板、读卡器、声音输入装置(例如麦克风)等。
输出装置16是向用户输出各种信息的用户接口,是显示各种信息的显示装置(液晶显示器、有机EL面板等)、通过声音来输出各种信息的声音输出装置(例如扬声器)、向纸介质进行印刷的打印机等。
信息处理装置10例如是个人计算机(台式或者笔记本式)、智能手机、平板、通用机等。信息处理装置10例如也可以如由云系统提供的云服务器那样使用虚拟的信息处理资源来实现。信息处理装置10也可以由在通信网络上分散配置的多个信息处理装置构成。在信息处理装置10中例如也可以导入实现操作系统、文件系统、DBMS(DataBase ManagementSystem,数据库管理系统)(关系型数据库、NoSQL等)、KVS(Key-Value Store,键值存储)等的软件。
用户终端20、数据补充装置100具备的各种功能通过由构成它们的信息处理装置10的处理器11读出并执行储存于主存储装置12的程序来实现、或者通过构成它们的信息处理装置10的硬件来实现。
如图1所示,用户终端20具备Web浏览器21、通信部22、用户接口部23以及存储部24的各功能。Web浏览器21进行从数据补充装置100传送过来的信息的显示、从用户处受理的信息向数据补充装置100的发送等。通信部22实现经由通信网络30而与数据补充装置100进行的通信。用户接口部23实现经由输入装置15、输出装置16(显示装置)而与用户进行的对话处理。
数据补充装置100具备存储部200、通信部101、画面数据生成部102、用户设定信息取得部103、数据取得部104、补充模型生成部105、数据补充部106、补充模型选择部107以及补充数据校正部108的各功能。
在上述功能之中,存储部200存储用户设定信息210、地区特性数据110、单元地区特性数据120、模型生成数据130、外部单元地区特性数据220、外部地区特性数据230、单元地区特性偏回归信息240、地区特性偏回归信息250、补充模型信息260以及补充数据信息270的各数据。此外,在存储部200中,例如作为DBMS提供的数据库的表格、文件系统提供的文件、KVS的数据而存储各数据。关于这些数据的详情,在后面叙述。
通信部101经由通信网络30而与用户终端20进行通信。
画面数据生成部102(输出部)作为Web服务器发挥功能,向用户终端20的Web浏览器21,例如经由通信部101发送以HTML(HyperText Markup Language,超文本标记语言)、XML(eXtensible Markup Language,可扩展标记语言)、JSON(JavaScript Object(日本注册商标)Notation,JavaScript对象注释)等格式来描述的数据(例如用于实现用户接口的图像数据、脚本)。
用户设定信息取得部103(受理部)取得从用户终端20发送过来的信息(以下称为“用户设定信息”)。用户设定信息取得部103也可以实现为上述Web服务器的功能。存储部200将用户设定信息取得部103取得的用户设定信息存储为用户设定信息210。另外,用户设定信息取得部103取得从用户终端20发送过来的地区特性数据和单元地区特性数据。存储部200将用户设定信息取得部103取得的这些数据分别存储为地区特性数据110、单元地区特性数据120。
数据取得部104从可访问的信息源(可经由通信网络30访问的数据库、Web服务器等),经由通信网络30取得外部地区特性数据、外部单元地区特性数据。存储部200将数据取得部104取得的这些数据分别存储为外部地区特性数据230、外部单元地区特性数据220。
补充模型生成部105、数据补充部106、补充模型选择部107以及补充数据校正部108根据用户设定信息取得部103、数据取得部104取得的数据而生成补充模型,并根据所生成的补充模型而生成补充数据,其中,该补充模型是生成用于补充(预测)上述缺失数据的信息的模型。关于这些功能的详情,在后面叙述。
图5是说明数据补充装置100生成补充数据的处理(以下称为“补充数据生成处理s5”)的流程图。以下,与该图一起说明补充数据生成处理s5。
首先,数据补充装置100的用户设定信息取得部103针对用户终端20,发送用于设定上述缺失数据项目等的画面(以下称为“用户信息设定画面40”),用户终端20接收并显示用户信息设定画面40。用户向用户信息设定画面40输入希望补充的缺失数据项目(以下还称为“补充数据项目”)(s11)。此外,关于用户信息设定画面40的详情,在后面叙述。
接下来,用户对用户信息设定画面40设定可用于生成补充数据的、自身持有的数据(单元地区特性数据、地区特性数据)(s12)。
接下来,数据补充装置100发送对在生成补充模型时用作说明变量的地区特性数据的数据项目群(以下称为“说明变量模式”)进行设定的画面(以下称为“说明变量设定画面50”),用户终端20接收并显示说明变量设定画面50。用户通过对说明变量设定画面50实施1次以上的将作为说明变量的一个以上的数据项目进行选择等预定的输入操作,从而设定一个以上的说明变量模式(s13)。此外,关于说明变量设定画面50的详情,在后面叙述。
接下来,用户终端20将在s11~s13中设定的信息(用户设定信息)、单元地区特性数据以及地区特性数据,经由通信网络30发送给数据补充装置100(s14)。此外,在该发送时,用户终端20显示对于是否持有(能否提供)包括缺失数据项目的值的地区特性数据即地区单位数据进行确认的画面(以下称为“地区单位数据确认画面60”),确认用户是否持有地区单位数据。用户终端20将上述确认的结果与上述信息一起发送给数据补充装置100。
数据补充装置100的用户设定信息取得部103接收从用户终端20送来的用户设定信息、单元地区特性数据、地区特性数据以及上述确认的结果(s21)。数据补充装置100判定上述确认的结果(s22),在用户持有地区单位数据的情况下(s22:“是”),从s24开始进行处理。另一方面,在用户未持有地区单位数据的情况下(s22:“否”),数据补充装置100从s23开始进行处理。
在s23中,数据补充装置100关于接收到的地区特性数据,生成以地区单位对缺失数据项目的值进行了补充的地区特性数据即地区单位补充数据。数据补充装置100例如通过使用用户持有的其它地区的地区特性数据110的项目之中的含义与缺失数据项目类似的数据来代替等方法,生成地区单位补充数据。此外,s23的处理也可以不一定执行(即,也可以不生成地区单位补充数据),在该情况下进入到接下来的s24的处理。作为不实施s23的处理的情况,例如有数据补充装置100判定为不存在缺失数据项目(补充数据项目)以外的数据项目的值类似的外部地区特性数据等、无法根据用户持有的地区特性数据的信息以必要的精度来生成地区单位补充数据的情况。
s24~s27的处理是依次选择说明变量模式并且反复执行的处理(循环处理)。在s24中,数据补充装置100从在s13中用户设定的一个以上的说明变量模式中,选择一个尚未成为循环处理s25~s26的对象的说明变量模式。
接下来,数据补充装置100的补充模型生成部105进行生成补充模型的处理(以下称为“补充模型生成处理s25”),即,使用与属于在s24中选择的说明变量模式的说明变量对应的单元地区特性数据120的项目、地区特性数据110的项目来生成补充模型。此外,存储部200将与通过补充模型生成处理s25生成的补充模型有关的信息存储为补充模型信息260。关于补充模型生成处理s25的详情,在后面叙述。
接下来,数据补充装置100的数据补充部106向通过补充模型生成处理s25生成的补充模型代入地区特性数据110、单元地区特性数据120的值而求出缺失数据项目的值,使用求出的值来生成单元地区单位的补充数据即单元单位补充数据(s26)。此外,存储部200将生成的单元单位补充数据存储为补充数据信息270。
另外,数据补充部106针对地区的所有单元地区的单元单位补充数据的值进行求出它们的总计、平均等的处理,生成换算为地区单位的值的数据即地区换算补充数据。另外,数据补充部106求出地区换算补充数据和地区单位数据(在s23中生成地区单位补充数据的情况下是地区单位补充数据)的偏差。数据补充部106例如根据下式求出上述偏差。
偏差=(地区换算补充数据的值-地区单位数据的值(地区单位补充数据的值))/地区单位数据的值(地区单位补充数据的值)
…式1
此外,在用户未持有地区单位数据并且未计算出地区单位补充数据的情况下,偏差成为“无值”。
接下来,数据补充装置100关于在s13中设定的所有说明变量模式,判定循环处理s25~s26是否完成。在关于所有说明变量模式未完成循环处理s25~s26的情况下(s27:“否”),处理返回到s24。在关于所有说明变量模式完成循环处理s25~s26的情况下(s27:“是”),处理进入到s28。
在s28中,数据补充装置100将在s25~s26中生成的补充模型所相关的信息和补充数据所相关的信息,经由通信网络30发送给用户终端20。
接下来,数据补充装置100将用于使用户选择利用补充模型的画面(以下称为“利用补充模型选择画面70”)发送给用户终端20。用户终端20接收并显示利用补充模型选择画面70,从用户处受理用户利用的补充模型(以下称为“利用补充模型”)的指定(s15)。在用户持有地区单位数据的情况下,针对利用补充模型选择画面70,选择是否使用利用补充模型对补充的“单元单位补充数据”进行校正。
接下来,用户终端20将在s15中选择的利用补充模型的信息以及表示是否使用所选择的利用补充模型对所补充的“单元单位补充数据”进行校正的信息(以下称为“校正与否信息”),经由通信网络30发送给数据补充装置100(s16)。
数据补充装置100在接收到从用户终端20送来的利用补充模型的信息以及校正与否信息时,根据接收到的信息而生成作为对单元单位补充数据的内容进行了确定的数据的“确定单元单位补充数据”(s29)。更详细而言,数据补充装置100首先确认校正与否信息。在校正与否信息对应于“不校正”、用户未持有地区单位数据、以及以意愿性为基准而选择了利用补充模型中的至少任一个的情况下,数据补充装置100将使用利用补充模型生成的“单元单位补充数据”直接作为确定单元单位补充数据。另一方面,在校正与否信息是“校正”的情况下,数据补充装置100的补充数据校正部108使用在s15中用户选择的利用补充模型对所生成的单元单位补充数据进行校正,从而生成确定单元单位补充数据。具体而言,补充数据校正部108例如根据在s26中求出的偏差来计算系数,对单元单位补充数据乘以计算出的系数等而生成确定单元单位补充数据。
接下来,数据补充装置100将在s29中生成的确定单元单位补充数据,经由通信网络30发送给用户终端20(s30)。
用户终端20在接收到从数据补充装置100送来的确定单元单位补充数据时,显示记载有接收到的确定单元单位补充数据、在s11中用户登记的缺失数据项目(补充数据项目)、与在s15中用户选择的利用补充模型有关的信息等的画面(以下称为“补充信息确认画面80”)(s17)。
<详细说明>
以下,更详细地说明图5的补充数据生成处理s5。
图6是在图5的s11~s13的处理中用户终端20显示的用户信息设定画面40的一个例子。如该图所示,用户信息设定画面40包括补充数据项目输入栏41、单元地区特性数据输入栏42、单元尺寸输入栏43、地区特性数据输入栏44以及补充模型意愿水准输入栏45。
在补充数据项目输入栏41中,输入对单元地区特性数据的缺失数据项目之中的用户想要补充的缺失数据的缺失数据项目(补充数据项目)进行确定的信息(在本例子中为缺失数据项目的名称)。
在单元地区特性数据输入栏42中,输入对用户持有的单元地区特性数据进行确定的信息(例如表示单元地区特性数据的文件名、所在地的信息)。
在单元尺寸输入栏43中,输入单元地区的尺寸(在本例子中为网格的网眼的一边的长度)。
在地区特性数据输入栏44中,输入对用户持有的地区特性数据进行指定的信息(例如表示单元地区特性数据的文件名、所在地的信息)。
在补充模型意愿水准输入栏45中,输入关于由数据补充装置100的补充模型生成部105生成的补充模型的成为意愿性的判断基准的意愿水准。
在用户操作登记按钮46时,用户终端20开始说明变量模式的受理(图5的s13)。
图7是在图5的s13中用户终端20显示的说明变量设定画面50的一个例子。如该图所示,说明变量设定画面50包括说明变量模式编号显示栏51、说明变量选择栏52、“下一步”按钮54、模式登记结束按钮55。
在说明变量模式编号显示栏51中,设定当前显示的说明变量模式的标识符(以下称为“模式编号”)。每当“下一步”按钮54被指示时,显示于说明变量模式编号显示栏51的模式编号按照1、2、3、…的顺序被更新。
在说明变量选择栏52中,以能够通过勾选框进行选择的状态,一览显示通过用户信息设定画面40输入的单元地区特性数据中所包含的数据项目53。此外,在说明变量选择栏52中用户所选择的数据项目53被用作后述的多元回归分析中的说明变量。
在用户操作模式登记结束按钮55时,用户终端20显示地区单位数据确认画面60(图5的s14)。地区单位数据确认画面60是如下画面:使用户确认通过用户信息设定画面40输入的缺失数据项目(补充数据项目)是否包含于地区特性数据,并且受理用户设定信息的发送指示。
图8示出在图5的s14的处理中用户终端20显示的地区单位数据确认画面60的例子。如该图所示,地区单位数据确认画面60包括:包含于地区特性数据的数据项目的一览61、表示在该一览61中指定为用户持有的补充数据项目的黑圈的标志62、以及显示用户以地区单位持有补充数据项目的意思(表示补充数据项目包含于地区特性数据的意思)的勾选标志63。用户终端20在用户操作确认按钮64时,将通过以上的处理而设定或者取得的用户设定信息发送给数据补充装置100。
图9是作为上述用户设定信息而由用户终端20发送给数据补充装置100的信息(以下称为“模型生成数据130”)的一个例子。如该图所示,模型生成数据130包括用户在说明变量设定画面50中设定的说明变量模式的内容(将模式编号和在该模式编号中作为说明变量的数据项目对应起来的内容)。此外,在例示的模型生成数据130中,在用户选择的数据项目中设定“○”,在用户未选择的数据项目中设定“×”。另外,在各说明变量模式中,一律将补充数据项目“汽车保有台数”和意愿水准“5%”对应起来。
图10是说明图5中的补充模型生成处理s25的详情的流程图。以下,与该图一起说明补充模型生成处理s25。
数据取得部104首先从可访问的信息源,取得包括通过所选择的一个说明变量模式来指定的数据项目和补充数据项目的外部地区特性数据230、以及外部单元地区特性数据220(s31)。存储部200存储数据取得部104取得的外部地区特性数据230和外部单元地区特性数据220。
图11A示出外部单元地区特性数据220的一个例子。外部单元地区特性数据220是将各种数据项目与外部单元地区(外部单元地区的标识符)对应起来的数据。外部单元地区特性数据220包括与单元地区特性数据的缺失数据项目之中的用户所指定的补充数据项目相应的数据项目。此外,例示的外部单元地区特性数据220包括补充模型生成部105所选择的说明变量模式的模式编号。
图11B示出外部地区特性数据230的一个例子。外部地区特性数据230是将数据项目与外部地区(外部地区的标识符)对应起来的数据。外部地区特性数据230包括与补充数据项目相应的数据项目。
返回到图10,补充模型生成部105关于由数据取得部104抽出的属于各外部地区的外部单元地区的外部单元地区特性数据220,进行多元回归分析(以下称为“单元地区特性数据多元回归分析处理s32”)。
图12是说明单元地区特性数据多元回归分析处理s32的流程图。首先,补充模型生成部105选择一个外部地区(s51),取得属于所选择的外部地区的外部单元地区的外部单元地区特性数据220作为多元回归分析的对象(s52)。
接下来,补充模型生成部105进行针对所取得的外部单元地区特性数据220的多元回归分析(以下称为“外部单元地区特性多元回归分析”)(s53)。外部单元地区特性多元回归分析的回归式(第1回归式)例如如下所述。
yA=b0A+x1Ab1A+x2Ab2A+…+xnAbnA…式2
在上式中,y、b、x的下标是外部地区的标识符。在上式中将外部地区A作为对象而进行多元回归分析。补充模型生成部105将目标变量设为yA,使用外部单元地区特性数据220中的与缺失数据项目相应的数据项目(例如汽车保有台数),将说明变量设为x1A、x2A、…,使用说明变量模式中的说明变量。例如,如果是图9所示的模型生成数据130中的模式编号为“p02”的说明变量模式,则使用的说明变量x1A、x2A、x3A、…成为人口、年龄人口未满15岁、年龄人口65岁以上、…。
补充模型生成部105使用外部地区A的所有外部单元地区特性数据220中的目标变量和说明变量,求出上述回归式中的b0(截矩)和作为各说明变量的偏回归系数的bi(i=1~n)。此外,以下将b0(截矩)和偏回归系数bi(i=1~n)总称为单元地区特性偏回归系数bi(i=0~n)。
返回到图10,接下来补充模型生成部105通过F检验等来检验针对上述回归式的意愿性(以下称为“单元分析意愿性检验”)。
补充模型生成部105针对所有单元地区特性偏回归系数bi,从i=0至n,逐个地依次检验意愿性。补充模型生成部105首先设为i→0(s33),关于从由数据取得部104取得的所有外部地区中选择的两个外部地区的全部组合,根据单元地区特性偏回归信息,通过下式来求出所有单元地区特性偏回归系数bi的差分(s34)。
Δb0AB=b0B–b0A…式3
上式是选择外部地区A和外部地区B作为两个外部地区的情况,将单元地区特性偏回归系数b0(截矩)作为差分的计算对象,求出差分Δb0AB。补充模型生成部105通过上式,关于两个外部地区的所有组合,求出所有单元地区特性偏回归系数bi彼此的差分Δbi。
另外,补充模型生成部105使用从所抽出的所有外部地区中选择两个外部地区的所有组合中的单元地区特性偏回归系数bi的差分Δbi,进行“单元地区特性偏回归系数的差分是0”这样的假设检验(s35)。补充模型生成部105如果判定为上述假设在统计性上为“有意愿”(s35:“是”),则求出单元地区特性偏回归系数bi的平均值(s36)。补充模型生成部105在该检验中使用包含于模型生成数据130的意愿水准的值。补充模型生成部105根据检验结果来判定意愿性。此外,将该意愿性的检验结果与图15一起反映到后述的利用补充模型选择画面70的“单元分析”的意愿率的数值。
另一方面,补充模型生成部105如果判定为上述假设在统计上为“无意愿”(s35:“否”),则进行基于单元地区特性偏回归系数bi的差分Δbi以及包含于外部地区特性数据230的信息的多元回归分析(以下称为“地区特性数据多元回归分析处理s37”)。
图13是说明地区特性数据多元回归分析处理s37的流程图。首先,补充模型生成部105关于从首先抽出的外部地区中选择两个外部地区的所有组合,根据下式来求出外部地区特性数据230的差分(s61)。
ΔD1AB=D1B–D1A…式4
上式是计算外部地区A和外部地区B的两个外部地区特性数据中的相同的数据项目D1的值D1A和D1B的差分ΔD1AB的式子。例如,在图11B所示的外部地区特性数据230的情况下,如果D1例如是面积,则D1A、D1B分别是“32.1”、“14.2”,ΔD1AB=D1B–D1A=17.9。
接下来,补充模型生成部105关于相同的数据项目,例如使用通过式3求出的单元地区特性偏回归系数的差分Δbi和通过式4求出的外部地区特性数据的差分ΔD1AB,进行多元回归分析(s62)。此时,补充模型生成部105关于从所抽出的外部地区中选择两个外部地区的所有组合,通过接下来的回归式(第2回归式)进行多元回归分析。
Δbi=g1ΔD1+g2ΔD2+…+gmΔDm…式5
在图11B所示的外部地区特性数据230的情况下,在式5中,例如使用单元地区特性偏回归系数的差分Δbi作为目标变量,例如使用面积的差分、综合商业设施数的差分等作为说明变量ΔDj(j=1~m)。
接下来,补充模型生成部105与图12所示的单元地区特性数据多元回归分析处理s32同样地,进行通过应用了模型生成数据130的意愿水准的F检验等来检验针对式5的回归式的意愿性的处理(以下称为“地区分析意愿性检验”)(s63)。此外,将通过上式来表现的回归式的意愿性反映到与图15一起后述的利用补充模型选择画面70中包含的“地区分析”的意愿率的数值。
返回到图10,接下来补充模型生成部105关于一个单元地区特性偏回归系数,在执行上述单元分析意愿性检验以及地区分析意愿性检验时,成为i→i+1(s38)。
补充模型生成部105重复s34~s38的循环处理(s39:“否”)直至执行关于所有单元地区特性偏回归系数bi的单元分析意愿性检验和地区特性数据多元回归分析处理s37。
补充模型生成部105在执行关于所有单元地区特性偏回归系数bi的单元分析意愿性检验和地区特性数据多元回归分析处理s37后(s39:“是”),接下来生成单元地区特性偏回归信息240和地区特性偏回归信息250(s40)。
图14A示出单元地区特性偏回归信息240的一个例子。如该图所示,例示的单元地区特性偏回归信息240是对多个外部地区分别对应关联了式1的回归式中的单元地区特性偏回归系数bi和单元分析意愿性检验的判定结果的数据表格。在判定结果中,在“有意愿”的情况下设定“〇”,在“无意愿”的情况下设定“×”。此外,与图15一起后述的利用补充模型选择画面70的意愿率显示栏76中显示的单元分析的意愿率是通过单元分析意愿性检验判定为有意愿的外部地区相对成为单元地区特性多元回归分析的对象的所有外部地区的比值。
图14B示出地区特性偏回归信息250的一个例子。如该图所示,例示的地区特性偏回归信息250是针对式1的回归式中的单元地区特性偏回归系数bi分别对应关联了式4的回归式中的偏回归系数(地区特性偏回归系数gi)和地区分析意愿性检验的判定结果的数据表格。此外,与图15一起后述的利用补充模型选择画面70的意愿率显示栏76中显示的地区分析的意愿率是通过地区特性多元回归分析判定为有意愿的单元地区特性偏回归系数相对成为该地区特性多元回归分析的对象的所有单元地区特性偏回归系数的比值。
返回到图10,补充模型生成部105生成使用包含于一个说明变量模式的数据项目、单元地区特性偏回归系数、地区特性偏回归系数以及外部地区特性信息来表现补充数据项目的补充模型(s41)。以下,示出表现补充模型的式子。
y=b0A+x1(b1A+Δb1)+x2(b2A+Δb2)+…+xn(bnA+Δbn)…式6
此外,式5中的Δbj(j=1~n)通过以下的式6来表示。
Δbj=g1j(D1–D1A)+g2j(D2-D2A)+……式7
上式中的b0A、b1A、b2A、…例如是地区A的单元地区特性偏回归系数,D1A、D2A、…例如是地区A的外部地区特性数据中的由说明变量模式指定的数据项目的值。
此外,在图5的s26中,数据补充部106通过在式6所示的补充模型的式子的xi中代入被指定为说明变量的单元地区特性数据120中的数据项目的值,并且在Dj中代入地区特性数据110中的数据项目的值,从而求出作为补充数据信息270的y。
图15是在图5的s15中用户终端20显示的利用补充模型选择画面70的一个例子。如该图所示,利用补充模型选择画面70包括补充数据项目显示栏71、推荐的利用补充模型信息显示栏72、意愿率显示栏76、利用模型编号登记栏77、补充数据校正登记栏78以及“进入下一步”按钮79。
在补充数据项目显示栏71中,显示用户设定信息210中的补充数据项目。
在推荐的利用补充模型信息显示栏72中,设定与补充模型选择部107从针对所有说明变量模式的补充模型选择的补充模型(例如偏差为最小的补充模型等)有关的信息。如该图所示,推荐的利用补充模型信息显示栏72包括说明变量模式的显示栏73、地区单位换算值的显示栏74以及偏差的显示栏75。其中,在说明变量模式的显示栏73中,显示在推荐的补充模型的生成中使用的说明变量模式的模式编号。另外,在地区单位换算值的显示栏74中,显示所生成的每个单元地区的单元单位补充数据的总计。在偏差的显示栏75中显示根据上述式1求出的差分的值。
意愿率显示栏76包括在补充模型的生成中使用的说明变量模式的模式编号的显示栏、说明变量的项目的显示栏、进行了回归分析时的各个补充模型是否为有意愿的意愿率的显示栏。在意愿率的显示栏中,有单元分析的意愿率的显示栏和地区分析的意愿率的显示栏。
在利用模型编号登记栏77中,用户通过说明变量的模式编号来指定想要利用的补充模型。
补充数据校正登记栏78包括勾选框,在地区特性数据中包含有补充数据项目的情况下,该勾选框用于使用户指定是否利用与在利用模型编号登记栏77中指定的模式编号对应的利用补充模型进行单元单位补充数据的校正。
在操作进入下一步的按钮79时,用户终端20将在利用模型编号登记栏77中指定的模式编号和输入到补充数据校正登记栏78的关于是否需要校正的信息,发送给数据补充装置100(s16)。
图16是在图5的s17中用户终端20显示的补充信息确认画面80的一个例子。如该图所示,补充信息确认画面80包括补充数据项目显示栏81、单元单位补充数据信息显示栏82、利用补充模型信息显示栏83等。
在补充数据项目显示栏81中显示补充数据项目,在单元单位补充数据信息显示栏82中,针对各个单元地区,显示基于利用补充模型的单元单位补充数据。
在利用补充模型信息显示栏83中,显示与利用补充模型有关的信息(为了生成利用补充模型而使用的说明变量84、选择利用补充模型的理由85等)。选择利用补充模型的理由85例如是使用户选择偏差小、模型的意愿性高等信息的栏。
此外,也可以在用户终端20中,在利用补充模型选择画面70的推荐的利用补充模型信息显示栏72所显示的说明变量模式以外的说明变量模式的模式编号被输入到利用模型编号登记栏77的情况下,数据补充装置100将其意思显示为选择利用补充模型的理由85。
图17示出通过补充模型生成处理s25生成的补充模型的信息被储存的补充模型信息260的一个例子。补充模型信息260包括针对每个说明变量模式(模式编号)将补充模型式子、地区换算值、偏差以及分别关于单元分析和地区分析的意愿率对应起来的信息。补充模型信息260被用作显示于利用补充模型选择画面70的信息。
图18示出与通过补充数据生成处理s5生成的补充数据有关的信息被储存的补充数据信息270的一个例子。如该图所示,补充数据信息270包括针对属于地区U的单元地区(U-001,U-002,…)分别将说明变量模式的模式编号(p01,p02,p03,…)和补充数据(例如汽车保有台数的值)对应起来的信息。例如,例示的补充数据信息270包括表示在与U-001对应的单元地区中使用通过p01说明变量模式生成的补充模型来计算出的补充数据是780的信息。
此外,在图15所示的利用补充模型选择画面70的补充数据校正登记栏78中指示了进行校正的意思的情况下,由补充数据校正部108校正补充数据信息270的补充数据(图5的s29)。例如,通过将地区换算值和地区特性数据中的实际的补充数据项目的值的偏差的比值等作为系数,对与各单元地区有关的补充数据乘以该系数,从而进行上述校正。补充数据校正部108依照校正内容来更新补充数据信息270。
<效果>
根据以上说明的实施方式的数据补充装置100,能够使用既存的信息,高效地补充在与地区有关的数据中缺失的数据。
另外,数据补充装置100根据外部地区的外部地区特性数据230,生成对将地区划分为网格状而得到的单元地区中的缺失数据项目的值进行补充的补充模型,根据所生成的补充模型而生成补充数据,所以即使不存在与地区类似的外部地区,也能够高精度地生成补充数据。
另外,数据补充装置100使用从用户处受理的意愿水准来检验回归式的意愿性,所以用户能够以与服务的目的等相应的必要的精度,高效地得到补充数据。
另外,数据补充装置100针对多个说明变量模式的每一个而生成补充模型,所以用户能够从根据说明变量模式不同的补充模型生成的多个补充数据中选择适合的数据。
另外,数据补充装置100根据多个补充模型,生成基于可靠性最高的补充模型的补充数据,所以用户无需比较研究多个补充数据,而能够得到最佳的补充数据。
另外,数据补充装置100在对地区的单元地区各自的补充数据进行合计得到的值、与在地区特性数据中相当于缺失数据项目的数据项目的值之间有偏差的情况下,能够根据偏差来适当地校正补充数据。
此外,以上说明的实施方式只不过是用于易于理解地说明本发明的一个例子,本发明的概念包括针对上述实施方式的各种变形方式、应用方式。另外,还能够将上述实施方式的结构的一部分置换为其它实施方式的结构,或者对某个实施方式的结构追加其它实施方式的结构。另外,关于各实施方式的结构的一部分,还能够追加、删除、置换其它结构。
例如,单元地区301不限于矩形的区域,只要是以相同的形状将地区300按照每预定的面积而无间隙地划分得到的区域,则也可以是正三角形等其它形状。
另外,例如数据补充装置100也可以构成为还作为用户终端20发挥功能。
在以上的实施方式中,数据补充装置100使用多元回归分析来生成用于计算单元单位补充数据的补充模型,但也可以使用数量化分析、聚类分析等其它分析手法来生成补充模型。
在以上的实施方式中,控制线、信息线只是示出在说明方面认为必要的线,在产品方面并未示出所有的控制线、信息线。也可以是所有的结构相互连接。另外,以上以表形式(表格)例示各种信息,但也可以按照表以外的形式来管理这些信息。
Claims (15)
1.一种数据补充系统,其中,
使用信息处理装置来构成所述数据补充系统,
所述数据补充系统具备存储部和补充模型生成部,
所述存储部存储:
地区特性数据,是包括与预定的地区有关的多个数据项目的值的数据;
单元地区特性数据,是包括与作为通过将所述地区划分为网格状而得到的地区的单元地区有关的多个数据项目的值的数据;
表示缺失数据项目的信息,其中,该缺失数据项目是作为在所述单元地区特性数据中缺失的数据的缺失数据的所述数据项目;
外部地区特性数据,是包括与作为与所述地区不同的地区的外部地区有关的多个数据项目的值的数据;以及
外部单元地区特性数据,是包括与通过将所述外部地区划分为网格状而得到的外部单元地区有关的多个数据项目的值的数据,
所述补充模型生成部生成补充模型,该补充模型是根据所述外部地区特性数据和所述外部单元地区特性数据而生成作为对所述缺失数据进行补充的数据的补充数据的模型。
2.根据权利要求1所述的数据补充系统,其中,
所述补充模型生成部关于多个所述外部地区中的各个所述外部地区,生成利用与所述数据项目相当的所述外部单元地区特性数据中的所述数据项目来表现所述缺失数据项目的第1回归式,
所述补充模型生成部关于选择多个所述外部地区之中的两个所述外部地区的所有组合,生成关于各个所述外部地区的、将所述第1回归式的偏回归系数的差分作为目标变量并将所选择的两个所述外部地区各自的所述外部地区特性数据中的相同的所述数据项目的差分作为说明变量的第2回归式,
所述补充模型生成部根据所述第1回归式和所述第2回归式,生成利用作为所述单元地区特性数据中的一个以上的所述数据项目的组合的说明变量的模式中包含的所述数据项目、所述第1回归式中的所述偏回归系数以及所述第2回归式中的偏回归系数来表现所述缺失数据项目的所述补充模型。
3.根据权利要求2所述的数据补充系统,其中,
所述存储部存储多个所述说明变量的模式,
所述补充模型生成部关于多个所述说明变量的模式分别生成所述补充模型。
4.根据权利要求3所述的数据补充系统,其中,
所述存储部存储在多个所述补充模型各自的意愿性的判定中使用的意愿水准,
所述补充模型生成部根据所述意愿水准,关于所述多个补充模型分别判定所述第1回归式的意愿性和所述第2回归式的意愿性,
所述补充模型生成部生成关于所述多个补充模型各自的作为所述第1回归式的意愿性的第1意愿性的判定结果和作为所述第2回归式的意愿性的第2意愿性的判定结果。
5.根据权利要求4所述的数据补充系统,其中,
所述数据补充系统还具备补充模型选择部,该补充模型选择部关于所述多个补充模型分别求出所述地区特性数据中的与所述缺失数据项目对应的所述数据项目的值、和关于属于所述预定的地区的所有所述单元地区的所述补充数据的值的总计之间的偏差,输出所述偏差、所述第1意愿性的判定结果以及所述第2意愿性的判定结果中的至少任一个,受理与多个所述说明变量的模式分别对应的所述补充模型的选择。
6.根据权利要求5所述的数据补充系统,其中,
所述数据补充系统还具备数据补充部,该数据补充部根据所选择的所述补充模型,生成所述补充数据。
7.根据权利要求6所述的数据补充系统,其中,
所述数据补充系统还具备补充数据校正部,该补充数据校正部根据所述偏差来校正所生成的补充数据。
8.根据权利要求6所述的数据补充系统,其中,
所述数据补充系统还具备输出部,该输出部输出所选择的所述补充模型的信息以及根据该补充模型生成的补充数据中的至少任一个。
9.根据权利要求1~5中的任意一项所述的数据补充系统,其中,
所述数据补充系统还具备受理部,该受理部受理所述地区特性数据、单元地区特性数据以及表示缺失数据项目的信息中的至少任一个的输入。
10.一种数据补充方法,其中,
所述数据补充方法使信息处理装置执行:
存储地区特性数据、单元地区特性数据、表示缺失数据项目的信息、外部地区特性数据以及外部单元地区特性数据的步骤;以及
生成补充模型的步骤,
所述地区特性数据是包括与预定的地区有关的多个数据项目的值的数据,
所述单元地区特性数据是包括与作为通过将所述地区划分为网格状而得到的地区的单元地区有关的多个数据项目的值的数据,
所述缺失数据项目是作为在所述单元地区特性数据中缺失的数据的缺失数据的所述数据项目,
所述外部地区特性数据是包括与作为与所述地区不同的地区的外部地区有关的多个数据项目的值的数据,
所述外部单元地区特性数据是包括与通过将所述外部地区划分为网格状而得到的外部单元地区有关的多个数据项目的值的数据,
所述补充模型是根据所述外部地区特性数据和所述外部单元地区特性数据而生成作为对所述缺失数据进行补充的数据的补充数据的模型。
11.根据权利要求10所述的数据补充方法,其中,
所述数据补充方法使信息处理装置还执行:
关于多个所述外部地区中的各个所述外部地区,生成利用与所述数据项目相当的所述外部单元地区特性数据中的所述数据项目来表现所述缺失数据项目的第1回归式的步骤;
关于选择多个所述外部地区之中的两个所述外部地区的所有组合,生成关于各个所述外部地区的、将所述第1回归式的偏回归系数的差分作为目标变量并将所选择的两个所述外部地区各自的所述外部地区特性数据中的相同的所述数据项目的差分作为说明变量的第2回归式的步骤;以及
根据所述第1回归式和所述第2回归式,生成利用作为所述单元地区特性数据中的一个以上的所述数据项目的组合的说明变量的模式中包含的所述数据项目、所述第1回归式中的所述偏回归系数以及所述第2回归式中的偏回归系数来表现所述缺失数据项目的所述补充模型的步骤。
12.根据权利要求11所述的数据补充方法,其中,
所述数据补充方法使所述信息处理装置还执行:
存储多个所述说明变量的模式的步骤;以及
关于多个所述说明变量的模式分别生成所述补充模型的步骤。
13.根据权利要求12所述的数据补充方法,其中,
所述数据补充方法使所述信息处理装置还执行:
存储在多个所述补充模型各自的意愿性的判定中使用的意愿水准的步骤;
根据所述意愿水准,关于所述多个补充模型分别判定所述第1回归式的意愿性和所述第2回归式的意愿性的步骤;以及
生成关于所述多个补充模型各自的作为所述第1回归式的意愿性的第1意愿性的判定结果和作为所述第2回归式的意愿性的第2意愿性的判定结果的步骤。
14.根据权利要求13所述的数据补充方法,其中,
所述数据补充方法使所述信息处理装置还执行如下步骤:
关于所述多个补充模型分别求出所述地区特性数据中的与所述缺失数据项目对应的所述数据项目的值、和关于属于所述预定的地区的所有所述单元地区的所述补充数据的值的总计之间的偏差,输出所述偏差、所述第1意愿性的判定结果以及所述第2意愿性的判定结果中的至少任一个,受理与多个所述说明变量的模式分别对应的所述补充模型的选择。
15.根据权利要求14所述的数据补充方法,其中,
所述数据补充方法使所述信息处理装置还执行:
根据所选择的所述补充模型而生成所述补充数据的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020-040800 | 2020-03-10 | ||
JP2020040800A JP7384713B2 (ja) | 2020-03-10 | 2020-03-10 | データ補完システム、およびデータ補完方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113377885A true CN113377885A (zh) | 2021-09-10 |
CN113377885B CN113377885B (zh) | 2024-05-24 |
Family
ID=
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009147563A (ja) * | 2007-12-12 | 2009-07-02 | Sharp Corp | 補完方法、データ送受信システム、送信装置、受信装置及びコンピュータプログラム |
CN102203813A (zh) * | 2008-11-04 | 2011-09-28 | 株式会社日立制作所 | 信息处理系统以及信息处理装置 |
CN105225486A (zh) * | 2015-10-09 | 2016-01-06 | 哈尔滨工业大学深圳研究生院 | 填补缺失浮动车数据的方法及系统 |
JP2017054432A (ja) * | 2015-09-11 | 2017-03-16 | 日本電信電話株式会社 | データ分析装置、データ分析方法およびデータ分析処理プログラム |
US20180181693A1 (en) * | 2016-12-23 | 2018-06-28 | Yahan Yang | Method and System for Stable and Efficient Reservoir Simulation Using Stability Proxies |
JP6472589B1 (ja) * | 2018-08-08 | 2019-02-20 | 三菱電機株式会社 | 地図データ処理装置 |
CN110462651A (zh) * | 2017-04-06 | 2019-11-15 | 天瑟咨询有限公司 | 模型变量候补生成装置及方法 |
CN110598243A (zh) * | 2019-07-26 | 2019-12-20 | 浙江大学 | 一种基于机械产品历史数据的虚拟样本扩容方法 |
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009147563A (ja) * | 2007-12-12 | 2009-07-02 | Sharp Corp | 補完方法、データ送受信システム、送信装置、受信装置及びコンピュータプログラム |
CN102203813A (zh) * | 2008-11-04 | 2011-09-28 | 株式会社日立制作所 | 信息处理系统以及信息处理装置 |
JP2017054432A (ja) * | 2015-09-11 | 2017-03-16 | 日本電信電話株式会社 | データ分析装置、データ分析方法およびデータ分析処理プログラム |
CN105225486A (zh) * | 2015-10-09 | 2016-01-06 | 哈尔滨工业大学深圳研究生院 | 填补缺失浮动车数据的方法及系统 |
US20180181693A1 (en) * | 2016-12-23 | 2018-06-28 | Yahan Yang | Method and System for Stable and Efficient Reservoir Simulation Using Stability Proxies |
CN110462651A (zh) * | 2017-04-06 | 2019-11-15 | 天瑟咨询有限公司 | 模型变量候补生成装置及方法 |
JP6472589B1 (ja) * | 2018-08-08 | 2019-02-20 | 三菱電機株式会社 | 地図データ処理装置 |
WO2020031296A1 (ja) * | 2018-08-08 | 2020-02-13 | 三菱電機株式会社 | 地図データ処理装置 |
CN110598243A (zh) * | 2019-07-26 | 2019-12-20 | 浙江大学 | 一种基于机械产品历史数据的虚拟样本扩容方法 |
Also Published As
Publication number | Publication date |
---|---|
SG10202102099XA (en) | 2021-10-28 |
US20210286782A1 (en) | 2021-09-16 |
JP7384713B2 (ja) | 2023-11-21 |
JP2021144294A (ja) | 2021-09-24 |
US11675756B2 (en) | 2023-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10810365B2 (en) | Workflow system and method for creating, distributing and publishing content | |
US20100332439A1 (en) | Apparatus and method for supporting cause analysis | |
US20110153388A1 (en) | System and method for collecting end user feedback for stationery designs | |
CN110659870A (zh) | 业务审核测试方法、装置、设备及存储介质 | |
US11675756B2 (en) | Data complementing system and data complementing method | |
CN113377885B (zh) | 数据补充系统以及数据补充方法 | |
CN109284154A (zh) | 桌面启动器模板更新方法及装置、服务器及存储介质 | |
US10846061B2 (en) | Development environment for real-time application development | |
US11403458B2 (en) | Information processing system, information processing device, information processing method, recording medium, and program | |
CN112667202B (zh) | Mda与bpmn相结合的软件设计方法和装置 | |
JP6552162B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US9601010B2 (en) | Assessment device, assessment system, assessment method, and computer-readable storage medium | |
US20080312985A1 (en) | Computerized evaluation of user impressions of product artifacts | |
CN113807878A (zh) | 资源展示位分配方法及装置、电子设备、存储介质 | |
CN112990995A (zh) | 商品对象的发布方法、装置及计算机系统 | |
JP2021026454A (ja) | 情報処理装置 | |
US20220383144A1 (en) | Apparatus and method for predicting status value of service module based on message delivery pattern | |
JP5600826B1 (ja) | 非構造化データ処理システム、非構造化データ処理方法およびプログラム | |
JP5932262B2 (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP2018180711A (ja) | テストケースを選択する計算機及びテストケースの選択方法 | |
KR102408325B1 (ko) | 콘텐츠를 제작 및 관리하는 시스템 및 그의 동작 방법 | |
US20220300269A1 (en) | Information processing apparatus, information processing system, and information processing method | |
US20230022500A1 (en) | Content determination device, content determination method, and storage medium | |
JP6610716B2 (ja) | 情報処理装置、その制御方法、およびプログラム | |
JP2008192006A (ja) | 適正入力支援装置及び適正入力支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |