如何在综合数据库中反映统计指标间的内在关系

如题所述

统计指标间的内在关系非常复杂,是人们进行经济分析的基础,也是数据关联使用的依据。为了使数据库使用起来更加方便,并开发出一些智能化的分析功能,数据库的设计应尽可能地把这些关系反映出来。  一、统计指标间的常见关系  为了把统计指标间的内在关系在数据库中反映出来,首先应把这些关系搞清楚。在2005年设计《智能型中国经济数据库》时,我们对这些关系进行了一次系统的归纳,结果如下:  1.指标间的运算关系。即一个指标可通过其他指标计算出来,如出口增长率可由出口总额计算、名义收入除价格指数可得实际收入等。  2.分组汇总关系。即分组指标和汇总指标之间的关系。虽然分组汇总关系也是指标间的运算关系,但这种运算关系非常规范,并在分析中应用广泛,因此有单独出来的必要。  3.月度数、季度数和年度数间的转换关系。月度数、季度数和年度数是三种常见的数据类型,相互之间可以转换,由月度数可以生成季度数和年度数,由季度数可生成年度数。如财政收入,只要有各月的收入总额,就可以算出各季和全年的收入总额。  4.关联关系和集聚关系。关联关系是指在分析某一指标时经常需要了解一下其他指标的情况,并且这些“其他指标”是相对固定的,每一次都差不多。集聚关系是指统计指标的使用不是孤立的,经常是一些指标一起使用,这些一起使用的指标形成了一个一个的指标集合。如全国的指标主要是与全国指标一起使用,地区的指标主要与本地区的指标一起使用。  二、指标类型与数据间的运算关系  出口总额通常有当月绝对额、累计绝对额、当月增长率和累计增长率四项数据,这四项数据经常一起使用,并且相互之间可以换算,但在以往的数据库中,这四项数据一般作为四个独立的指标,因而难以反映数据之间的关系,使用起来更是极为不便。为了解决这一难题,就必须改变数据管理的模式,由一个指标对应一项数据调整为对应多项数据,从而把有紧密关系的数据进行集中管理,如出口总额对应着四项数据。一个指标对应多项数据,自然就需要明确各项数据的含义和数据项之间的关系。若每个指标都需要单独地作这种定义,那么一个指标对应多项数据的意义就不大。指标类型就是为简化这一定义过程而提出的。指标类型相同的指标,数据项之间的运算关系完全相同,因此只要指定某一指标所属的指标类型,就完成了所有运算关系的定义,定义过程就高度简化了。  1.常见的指标类型。指标类型是为了规范数据项间的运算关系而提出的,但指标类型的设定并不仅仅考虑这一因素,而是融入了更多的内容。设定指标类型应考虑的因素是:(1)数据中的信息含量;(2)数据项之间的内在关系;(3)分组汇总的性质;(4)数据的数量特征。这四个方面都相同的指标可看做是同一类型,当某一方面或几个方面不同时,则应看做是不同类型。  通过对大量统计指标的观察和分析,我们归纳出很多种指标类型,常见的类型是:绝对额类、准绝对额类、平均额类、准平均额类、时点类(余额类)、准时点类(准余额类)、时期平均类、价格指数类、定基价格指数类、比率类、差额类、差额增长率类、单指数类等。针对每一种类型,均需进行深入细致的研究,主要内容有:(1)类型的概念和主要特征;(2)原始数据的各种情况和数据标准化公式;(3)数据项之间的关系和可派生的数据项;(4)数据汇总函数和指标间的运算函数;⑸月度数、季度数和年度数的转换关系;⑹各数据项在分析中的作用;⑺标准文本的生成方法。  2.原始数据的多种情况。当月进口总额和累计进口总额是两个不同的指标,但相互之间可以转换,即从当月进口总额可以计算出累计进口总额,或反之。因此,从使用角度看,这两个指标是完全一样的。由于指标类型包含这种转换关系,因此,为解决这一问题提供了可能。当月进口总额和累计进口总额均为绝对额类指标,是原始数据的两种不同情况。绝对额类指标的原始数据情况还有很多,并且均可通过运算生成相同的数据项,可生成数据项有当月绝对额、累计绝对额、当季绝对额、当月增长率、累计增长率、当季增长率、当月同比增加额、累计同比增加额和当季同比增加额等。  3.逻辑检查。在原始数据中,有时包含一些重复信息,如绝对额类指标的有一种情况是当月绝对额和当月增长率,当月增长率是重复信息,可用于检测原始数据是否正确。当从绝对额计算出来的增长率与原始数据中的增长率不一致时,就说明原始数据有问题。  4.弥补缺损值。月度进口总额为绝对额类指标,假如有当月绝对额、累计绝对额、当月增长率和累计增长率四个原始数据项,第一种情况是缺某一个月的当月绝对额,依据当月绝对额等于累计绝对额减去上月累计绝对额可以把缺损值补上;第二种情况是累计绝对额也缺损,这时可根据上年绝对额和当年增长率进行推算;第三情况是当年增长率也缺损,这时可根据下年绝对额和增长率进行推算。  5.月度数、季度数和年度数的转换。月度数包含了季度数和年度数的信息,季度数包含了年度数的信息,因此月度数可以转化为季度数和年度数据,季度数可以转化年度数,但不能反过来。以绝对额类指标为例,月度数的标准数据项是当月绝对额、累计绝对额、当月增长率和累计增长率。并可以生成当季绝对额和当季增长率,转换为季度数的方法是:选定数据项当季绝对额、累计绝对额、当季增长率和累计增长率,然后指定输出月份为3、6、9和12;月度数和季度数转换成年度数的方法是:选取累计绝对额和累计增长率,并指定输出月份为12。  三、分组汇总关系  1.反映分组汇总关系的指标代码编码规则。为了叙述指标代码编码规则,必须先引入基本指标的概念。基本指标是相对于分组指标而言的。以工业增加值来说,本身有多种分组指标,如按行业分、按经济类型分、按地区分、按轻重工业分,每一种分组都有多个指标;然而其本身又可以看做是国内生产总值按行业分的分组指标。如果一个指标不是其他任何指标的分组指标,那么就是基本指标。  基本指标的编码基本上没有限制,不要使用符号“_”和“!”即可,因为这两个符号是分组码和附加码的联接符。为了指标编码管理的方便,基本指标编码按指标类别编制较好,每个类别用一个英文字母开头,然后是顺序号。  分组指标的编码由基本指标代码加分组码构成,两者之间用符号“_”联接。分组码由两部分构成,前两位是分组方式代码,后面的是分组项代码。当一个指标包括多种分组方式时,分组码之间用符号“_”联接,并按ASCII码的大小顺序排列,以确保编码的唯一性。如山西省城镇居民食品支出的代码为H001_0214_081,其中的H001为基本指标代码,表示城镇居民消费支出,0214表示按地区分组的山西省,081表示按消费支出用途分组的食品支出。  对于多级分组,分组项的级别差异可用分组项代码长度来区分,规则是:同级分组项的代码长度必须相同,下级分组项的代码是在上级分组项代码的后面加上本级编码,代码长度自然就比上级分组项长。  当指标代码按上述规则编制时,将可以方便地找出任一指标的分组指标、同级指标、下级指标、上级指标、同分组指标。这些关系对于数据查询、对比分析等功能的设计非常有用。  2.结构分析。当某一指标有分组指标时,就可以对该指标的构成情况和构成变动情况进行分析。以工业销售收入的分地区数据为例,可分析内容有:销售收入规模较大的地区有哪些、哪些地区发展速度快、哪些地区发展缓慢、哪些地区对增长的贡献最大、哪些地区对增长速度变化的影响最大、发展速度的均衡性如何、发展水平的均衡性如何、增长格局是否发生了变化等。  四、集聚关系  1.指标类别。指标类别是在对统计指标分类的基础上形成的。在中国统计年鉴中,统计指标分为自然资源、人口、就业、投资、能源、财政、价格、人民生活、农业、工业、建筑业、国内贸易、对外经济和金融等类别。但统计年鉴中的指标分类难以满足某些统计分析的需要,以研究制造业问题来说,需要把制造业的生产、价格、投资、进出口等数据集中起来使用,但这些数据分散在统计年鉴的多个部分,因此使用起来不太方便。在数据库中,统计指标可按多种不同方式进行分类,只要用户有需要的类别都可以添加到数据库中,可以解决统计年鉴存在的问题,使得各种集聚关系都能得到反映。  2.条件对象。某一行业的数据主要是与本行业的数据一起使用,即同分组的数据一起使用,这是一种很重要的集聚关系。这种集聚关系可用条件对象的方法来反映,即把带有某一种分组项的指标全部筛选出来,组成一个分析对象。例如,采矿业的统计指标均带有采矿业的行业编码,只要把查询条件设为采矿业,就可以把这些指标都找出来。  五、反映指标间关系的其他途径  1.派生指标。派生指标就是通过指标间的运算生成的指标,如进出口总额除以GDP生成贸易依存度,用于反映指标间的运算关系。指标间运算必须以指标类型为基础,同样是除法运算,但计算公式却多种多样。两个指标相除,可以生成比率类指标,也可以生成绝对额指标,但两者计算过程完全不同。现价居民可支配收入除以相应的价格指数可以生成不变价居民可支配收入,但价格指数有可能是当月指数、累计指数、当月涨幅、累计涨幅,可支配收入同样也有多种情况,只有借助指标类型的概念,才能使除法运算公式与这些具体情况相独立。  2.相近指标。含义相近但又略有不同的指标很多,如按人民币计价的进出口和按美元计价的进出口、由两个不同部门统计的同一指标、调整前后的GDP等等。相近指标可在指标代码中予以反映,方法是在指标代码的最后面添加附加码,附加码与其他编码之间用“!”分开。这样,相近指标就是附加码不同的指标。  3.关联指标。每个统计指标的关联指标都是不一样的,因此只能一个指标、一个指标地定义。这种定义可以在数据库指标体系设计阶段进行,也可以根据使用情况自动生成,即把经常一起使用的指标设为关联指标。
温馨提示:答案为网友推荐,仅供参考
相似回答