CN102955823A - 一种对电视节目评估调研样本数据的处理方法 - Google Patents

一种对电视节目评估调研样本数据的处理方法 Download PDF

Info

Publication number
CN102955823A
CN102955823A CN2011102534071A CN201110253407A CN102955823A CN 102955823 A CN102955823 A CN 102955823A CN 2011102534071 A CN2011102534071 A CN 2011102534071A CN 201110253407 A CN201110253407 A CN 201110253407A CN 102955823 A CN102955823 A CN 102955823A
Authority
CN
China
Prior art keywords
resolver
predicate expression
sample
expression formula
predicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102534071A
Other languages
English (en)
Other versions
CN102955823B (zh
Inventor
方方
雷雯
黄昊天
季隽
叶海松
沙扬
Original Assignee
方方
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 方方 filed Critical 方方
Priority to CN201110253407.1A priority Critical patent/CN102955823B/zh
Publication of CN102955823A publication Critical patent/CN102955823A/zh
Application granted granted Critical
Publication of CN102955823B publication Critical patent/CN102955823B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种对电视节目评估调研样本数据的处理方法,该方法采用DSL领域语言描述样本筛选的条件,然后通过解析器将条件序列转换为复合谓词表达式树,接着将表达式树和原数据加载到执行器中进行限制运算,最后输出相应的关系数据子集。与现有技术相比,本发明能够实现根据任意多个条件筛选样本的功能,以及具有较好的完全性、易扩展性和可移植性等优点。

Description

一种对电视节目评估调研样本数据的处理方法
技术领域
本发明涉及一种数据的处理方法,尤其是涉及一种对电视节目评估调研样本数据的处理方法。
背景技术
在对电视节目评估的调研中,合理精确地对整体样本群进行样本筛选及管理是完成科学调研的基础和前提,也是实现调研数据有效的根本保障。
电视节目评估调研样本筛选及管理技术是一种可以实现多条件、多定义样本筛选;手动标签增设与软件自动筛选相结合;样本多级管理的技术应用,实现便捷、快速、高效的样本抽取工作。近年来,随着各类调研工作对分层样本精确管理需求的发展,样本筛选及管理技术的应用领域不断扩大,广泛应用于媒介调研、商业调研及各专业科研调研当中。
从电视节目评估样本抽取效果来看,样本筛选及管理技术经历了人工抽取、计算机辅助筛选抽取等发展阶段。人工抽取样本通过对样本人工排序和编号,形成样本抽样框,再按照一定规律及比例抽取样本,该方式耗时长、费人力,当对符合分层要求的样本进行筛选时核算样本在各分层中所占比例存在一定困难,对样本变动、调整及替补时难以进行适时跟踪,容易造成误差及疏漏;计算机辅助抽取,通常采用EXCEL电子表格软件设定公式及筛选条件对样本进行筛选及管理,辅助完成抽样工作,一般都提供固定个数的条件筛选,而且当条件取值发生变化或条件发生变化时都需要重新进行数据筛选的程序设计,若要从2000个有20个以上属性的样本数据,筛选出各种属性以及属性值相交的样本,并且还要考虑属性的变化,这样的筛选条件是无法穷尽的;虽然该技术相对于人工抽取样本更为简易、快捷,但无法实现对分层样本各元素的多重定义抽取,无法对样本进行跟踪、筛选、推送,从而达到有效管理。
发明内容
本发明的目的就是为了克服上述现有技术存在的不足而提供一种能够实现任意多条件的样本任意组合的筛选功能,具有较好的完全性、易扩展性和可移植性的对电视节目评估调研样本数据的处理方法。
本发明的目的可以通过以下技术方案来实现:一种对电视节目评估调研样本数据的处理方法,该方法包括以下步骤:(1)DSL生成器轮询设置在控制端的界面控件状态,生成条件序列,并将其发送给解析器;(2)解析器将第一个谓词表达式设为“真”;(3)解析器判断当前DSL条件是否为“空”,如果为是,则执行步骤(4);如果为否,则执行步骤(8);(4)解析器判断当前条件序列的连接符是否为“与”;如果为是,执行步骤(5);否则执行步骤(6);(5)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接,生成表达式树,然后转到步骤(7);(6)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“或”连接,生成谓词表达式树,然后转到步骤(7);(7)重复步骤(1)~(6),如果界面控件状态没有变化,解析器将最后生成的谓词表达式树发送给执行器;(8)执行器将谓词表达式树应用到限制运算的条件子句;(9)执行器输出源数据的相应子集,并通过呈现端显示出来。
所述的步骤(1)中的生成条件序列的每个条件都是一个四分量的元组:t=(C,P,V,O),C是连接符,支持AND、OR;P是属性,取自被筛选对象的筛选指标,V是值域,支持单值和多值,视运算符决定;O是运算符,支持:=,<>,>,>=,<,<=,in,not in。当使用in和not in时,值域V可以包含多个值,并以谓词OR连接,其他情况都只能使用单值。
与现有技术相比,本发明对电视节目评估调研样本数据采用计算机程序设定抽取技术进行处理,可根据不同分层元素设定样本取值,实现多条件多定义样本筛选,具有较好的完全性、易扩展性和可移植性,为样本选取工作提供了很大的自由度。对于样本调研,其查询需求无法穷尽,故采用DSL定义用户的查询需求,所谓DSL即本领域专用语言(Domain Specific Language/DSL),是采用结构化数据描述无歧义需求方法的通称,可让用户定义任意需求。
本发明通过计算机程序设定抽取技术进行处理,可根据不同分层元素设定样本取值,实现多条件多定义样本筛选、手动标签增设与计算机程序自动筛选相结合、样本多级管理等功能,依据科学人口数据进行分层比例数据计算,并根据调研需要设定样本规模,设置不同组别抽样数额,统计抽取人数及差额样本值。计算机程序抽取样本技术直观、科学地实现了对样本的抽取及管理工作,为确定、调整、替换样本创造了精确手段,具有更加广泛的适用性,可对于每个特定的项目,按照样本属性进行符合调查需求的抽样处理。
附图说明
图1为本发明的处理方法流程图;
图2为本发明处理方法中表达式树I的示意图;
图3为本发明处理方法中表达式树II的示意图;
图4为本发明的系统结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
本实施例先做如下设定:
设有任意数量和属性的样本集合——例如有2000条样本数据,每条数据均有编号、名称、学历、收入、联系方式等任意多个属性。调查人员希望找到其中居住在卢湾/徐汇两区且受过硕士教育的样本。类似这样的查询条件无法一一穷尽,因此采用DSL方法。原始数据的前7条如下:
如图1所示,一种对电视节目评估调研样本数据的处理方法,其采用DSL领域语言描述样本筛选的条件,然后通过解析器将条件序列转换为复合谓词表达式树,接着将表达式树和原数据加载到执行器中进行限制运算,最后输出相应的关系数据子集。
其涉及的方法步骤如下:
1)步骤101,DSL生成器轮询界面控件状态,生成条件序列;每个条件都是一个4分量的元组:t=(C,P,V,O),C是连接符,P是属性,V是值域,O是运算符。相应生成的DSL条件序列为{(AND,学历,”硕士及以上”,in),(AND,地区,{“徐汇区”,“卢湾区”},in)};
Figure BDA0000087510380000041
2)步骤102,解析器将第一个谓词表达式设为“真”,执行103;
3)步骤103,解析器判断当前DSL条件是否不为“空”,此时条件为(AND,学历,”硕士及以上”,=),结果为是,执行步骤104;
4)步骤104,解析器判断当前条件序列的连接符是否为“与”,此时连接符为“与”,执行步骤105;
5)步骤105,解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接;形成如图2所示的表达式树I,并执行107;
6)步骤107,解析器获取下一个条件,执行103;
7)步骤103,解析器判断当前DSL条件是否不为“空”,此时条件为(AND,地区,{”徐汇区”,”卢湾区”},in),结果为是,执行步骤104;
8)步骤104,解析器判断当前条件序列的连接符是否为“与”,此时连接符为“与”,执行步骤105;
9)步骤105,解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接;此条件中操作符为in,值域为{“徐汇区”,“卢湾区”},等价为谓词表达式:地区=“徐汇区”OR地区=“卢湾区”;形成如图3所示的表达式树II,并执行107;
10)步骤107,解析器获取下一个条件,执行103;
11)步骤103,解析器判断当前DSL条件是否不为“空”,此时已无条件,结果为否,执行步骤108;
12)步骤108,执行器将谓词表达式树应用到限制运算的条件子句;
13)步骤109,执行器输出源数据的相应子集,并通过呈现端显示出来。以下是部分输出结果。
如图2所示,表达式树I由AND(TRUE,A)组成,其中A:学历=硕士及以上。
如图3所示,表达式树II由AND(AND(TRUE,A),OR(B,C))组成,其中A:学历=硕士及以上;B:地区=“徐汇区”;C:地区=“卢湾区”。
如图4所示,本发明所涉及系统结构部分包括控制端1、DSL生成器2、解析器3、执行器4、呈现端5和数据源存储器6,控制端1、DSL生成器2、解析器3、执行器4、呈现端5依次连接,数据源存储器6与执行器4连接,呈现端5为显示器。

Claims (2)

1.一种对电视节目评估调研样本数据的处理方法,该方法包括以下步骤:
(1)DSL生成器轮询设置在控制端的界面控件状态,生成条件序列,并将其发送给解析器;
(2)解析器将第一个谓词表达式设为“真”;
(3)解析器判断当前DSL条件是否为“空”,如果为是,则执行步骤(4);如果为否,则执行步骤(8);
(4)解析器判断当前条件序列的连接符是否为“与”;如果为是,执行步骤(5);否则执行步骤(6);
(5)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接,生成表达式树,然后转到步骤(7);
(6)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“或”连接,生成谓词表达式树,然后转到步骤(7);
(7)重复步骤(1)~(6),如果界面控件状态没有变化,解析器将最后生成的谓词表达式树发送给执行器;
(8)执行器将谓词表达式树应用到限制运算的条件子句;
(9)执行器输出源数据的相应子集,并通过呈现端显示出来。
2.根据权利要求1所述的一种对电视节目评估调研样本数据的处理方法,其特征在于,所述的步骤(1)中的生成条件序列的每个条件都是一个四分量的元组:t=(C,P,V,O),C是连接符,支持AND、OR;P是属性,取自被筛选对象的筛选指标,V是值域,支持单值和多值,视运算符决定;O是运算符,支持:=,<>,>,>=,<,<=,in,not in。当使用in和not in时,值域V可以包含多个值,并以谓词OR连接,其他情况都只能使用单值。
CN201110253407.1A 2011-08-30 2011-08-30 一种对电视节目评估调研样本数据的处理方法 Expired - Fee Related CN102955823B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110253407.1A CN102955823B (zh) 2011-08-30 2011-08-30 一种对电视节目评估调研样本数据的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110253407.1A CN102955823B (zh) 2011-08-30 2011-08-30 一种对电视节目评估调研样本数据的处理方法

Publications (2)

Publication Number Publication Date
CN102955823A true CN102955823A (zh) 2013-03-06
CN102955823B CN102955823B (zh) 2016-01-20

Family

ID=47764634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110253407.1A Expired - Fee Related CN102955823B (zh) 2011-08-30 2011-08-30 一种对电视节目评估调研样本数据的处理方法

Country Status (1)

Country Link
CN (1) CN102955823B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105024870A (zh) * 2014-04-24 2015-11-04 中国移动通信集团公司 一种实现拨测的方法及系统
CN106156057A (zh) * 2015-03-27 2016-11-23 北京风行在线技术有限公司 一种查询视频数据结果的方法和设备
CN106951427A (zh) * 2016-01-07 2017-07-14 阿里巴巴集团控股有限公司 一种业务对象的数据抽取方法及装置
CN112115129A (zh) * 2020-09-16 2020-12-22 浪潮软件股份有限公司 一种基于机器学习的零售终端样本抽样方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952928A (zh) * 2005-10-20 2007-04-25 梁威 建立自然语言知识库及其自动问答检索的计算机系统
CN101548281A (zh) * 2006-06-01 2009-09-30 梅迪尔雷夫默斯特尔和雷夫通信与信息技术Oeg公司 控制关系数据库系统的方法
CN101706722A (zh) * 2009-12-01 2010-05-12 山东中创软件工程股份有限公司 一种生成报表的方法及系统
US20100306207A1 (en) * 2009-05-27 2010-12-02 Ibm Corporation Method and system for transforming xml data to rdf data
US20110119654A1 (en) * 2009-11-13 2011-05-19 Microsoft Corporation Debugging services for domain specific languages

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952928A (zh) * 2005-10-20 2007-04-25 梁威 建立自然语言知识库及其自动问答检索的计算机系统
CN101548281A (zh) * 2006-06-01 2009-09-30 梅迪尔雷夫默斯特尔和雷夫通信与信息技术Oeg公司 控制关系数据库系统的方法
US20100306207A1 (en) * 2009-05-27 2010-12-02 Ibm Corporation Method and system for transforming xml data to rdf data
US20110119654A1 (en) * 2009-11-13 2011-05-19 Microsoft Corporation Debugging services for domain specific languages
CN101706722A (zh) * 2009-12-01 2010-05-12 山东中创软件工程股份有限公司 一种生成报表的方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105024870A (zh) * 2014-04-24 2015-11-04 中国移动通信集团公司 一种实现拨测的方法及系统
CN106156057A (zh) * 2015-03-27 2016-11-23 北京风行在线技术有限公司 一种查询视频数据结果的方法和设备
CN106951427A (zh) * 2016-01-07 2017-07-14 阿里巴巴集团控股有限公司 一种业务对象的数据抽取方法及装置
CN106951427B (zh) * 2016-01-07 2020-08-18 阿里巴巴集团控股有限公司 一种业务对象的数据抽取方法及装置
CN112115129A (zh) * 2020-09-16 2020-12-22 浪潮软件股份有限公司 一种基于机器学习的零售终端样本抽样方法
CN112115129B (zh) * 2020-09-16 2024-05-10 浪潮软件股份有限公司 一种基于机器学习的零售终端样本抽样方法

Also Published As

Publication number Publication date
CN102955823B (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
EP3165984B1 (en) An event analysis apparatus, an event analysis method, and an event analysis program
CN110292775B (zh) 获取差异数据的方法及装置
Antonelli et al. Toward a self-updating platform for estimating rates of speciation and migration, ages, and relationships of taxa
CN107622103B (zh) 管理数据查询
WO2015176526A1 (zh) 基于关系叠加组合的文档的标识、关联、搜索及展现的系统
CN103136305B (zh) 用于试题资源的处理方法和装置
CN111611458B (zh) 大数据治理中基于元数据和数据分析技术实现系统数据架构梳理的方法
WO2015176525A1 (zh) 基于时间序列化的文档的标识、关联、搜索及展现的系统
CN105550241A (zh) 多维数据库查询方法及装置
CN102822819A (zh) 管理数据查询
US9619455B2 (en) Table format multi-dimensional data translation method and device
CN104268428A (zh) 一种用于指标计算的可视化配置方法
CN109101519B (zh) 信息采集系统和异构信息融合系统
CN111507076B (zh) 一种用于教学系统的共案课件制作方法、装置和终端
CN102955823A (zh) 一种对电视节目评估调研样本数据的处理方法
CN104298700A (zh) 用于由控制码图生成控制码的方法
Bakos KNIME essentials
US20130283233A1 (en) Multi-engine executable data-flow editor and translator
CN105718471A (zh) 用户偏好建模方法、系统及用户偏好评估方法、系统
CN105740365A (zh) 一种数据仓库快速查询方法和装置
Mannocci et al. The Europeana network of ancient Greek and Latin epigraphy data infrastructure
CN110580144A (zh) 一种通过给页面控件添加查询运算符实现的通用查询方法
KR101045850B1 (ko) 웹사이트를 통한 디지털 연표(年表) 제공장치
CN109358919A (zh) 通用页面的动态配置方法、装置、计算机设备及存储介质
CN109165155A (zh) 一种基于聚类分析的软件缺陷修复模板提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160120

Termination date: 20210830

CF01 Termination of patent right due to non-payment of annual fee