首页 公文范文 数据分析方向

数据分析方向汇编(三篇)

发布时间:2023-09-28 10:30:33

绪论:一篇引人入胜的数据分析方向,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

篇1

中图分类号:F01 文献标识码:A 文章编号:1006-0278(2013)02-024-01

在计量经济学中,我们一般应用的最多的数据分析是截面数据回归分析和时间序列分析,但截面数据分析和时间序列分析都有着一定的局限性。在实际经济研究当中,截面数据回归分析会遗漏掉数据的时间序列特征,例如在分析某年中国各省的GDP增长数据时,单纯的截面数据回归分析无法找出各省GDP随时间变化的特征,使得分析结果没有深度。而如果只用时间序列分析,则会遗漏掉不同截面间的联系与区别,例如在分析中国单个省市的GDP随时间增长的数据时,无法找出各个省市之间经济增长的联系与区别,因而同样无法满足我们的需要。而面板数据,是一种既包括了时间序列数据,也包括了相关截面数据的复合数据,是近年来用得较多的一种数据类型。

下面我们将基于2000-2009年中国各省GDP和财政收入的面板数据的实例来详细阐述面板数据的分析方法。

一、GDP与财政收入关系的经济学模型

财政收入是保证国家有效运转的经济基础,在一国经济建设中发挥着重要作用。随着中国经济发展速度的日益加快,财政收入不断扩大,而扩大的财政收入又以政府支出来调节和推动国民经济发展。正确认识财政收入与经济增长之间的长期关系,把握财政收入与经济增长之间的相互影响,发挥财政收入对经济发展的调节和促进功能,对于完善财税政策,深化财税体制改革,实现财政与经济之间的良性互动,具有重要的现实意义。文章就将从中国各省的面板数据出发研究,中国不同地域间财政收入和GDP之间的关系。

二、实证分析

(一)单位根检验

Eviews有两种单位根检验方法,一种在相同根的假设下的检验,包括LLC、Breintung、Hadri。另一种则是在不同根下的假设前提下,包括IPS,ADF-Fisher和PP-Fisher5。检验结果表明所有检验都拒绝原假设,因此序列GDP和CZSR均为一个2阶单整序列。

(二)协整检验

如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。

在最终的结果中,Pedroni方法中除了rho-Statistic、PP-Statistic项目外都拒绝GDP和CZSR不存在协整关系的原假设,同样Kao和Johansen检验方法也都拒绝原假设,因此,上述检验结果表明,我国各省2000-20009年的GDP和财政收入面板数据间存在着协整关系。既然通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的,因此可以在此基础上直接对进行回归分析,此时假设方程的回归结果是较精确的。

三、建立模型

混合模型:如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。

我们根据混合模型的回归结果,得到财政收入和GDP之间的回归方程为:

CZSR=227.3123+0.103224*GDP

(26.47637)(0.002839)

R2=0.810995 F=1321.587

显然从模型的回归结构来看,R2的值达到了0.81,有了比较好的回归解释力,同时,GDP的回归系数为0.103224,表明各省的财政收入平均占到了国民收入的10.3%左右。

变系数模型:显然,在中国各省之间由于处在不同的地区,因而拥有不同的区位优势,那么各省的发展水平显然就不一样。正是由于这种不同的地方政策、管理水平、文化差异等会导致经济变量间出现一些关联性的变化,此时在进行模型回归的时候,我们就有必要考虑变系数模型。

在回归结果中,R2的值达到了0.97,比混合模型拥有更好的回归解释力,而在变系数模型回归结果中,GDP的回归系数大于0.5的只有、青海、宁夏三个省份,也就是说这三个省份的财政收入占到了GDP的50%以上,他们同处于经济并不是很发达的西部地区,由此可以看出,处在经济发达地区的财政收入占GDP的比重要低,而不发达地区则要高。

四、结论

通过以上的分析检验,我们发现针对于中国财政收入和GDP的面板数据,我们应建立起变系数模型,并通过模型分析,我们可以得出这样的结论,中国各省间由于存在着地域经济发展水平不同、管理水平不同以及国家的相关政策等诸多不同,造成了各省之间在财政收入以及国民收入上面存在着一定的差异。而回归结果也告诉我们,我国西部地区的财政收入占GDP的比例要明显高于东部地区,地区发展落后地区的财政收入占GDP的比例也要明显高于东部地区。因此,这为我们改善我国落后地区的经济发展提供了一定的新思路,就是对一地区的税收征收可以适当放缓,而将GDP中以前政府占用的部分归还于民众和企业,因为,按照发达地区的经验表明,财政收入所占比重过高,经济发展的活力或者就不会很高,对于进一步刺激财政收入的增加也没有任何帮助。因此,我们应该适度降低财政收入占GDP的比重,从而增加经济活力,使西部地区以及落后地区及早的跟上东部发达地区的发展步伐,从而消除我国经济发展的地域不平衡。

参考文献:

[1]谢识予,朱洪鑫.高级计量经济学[M].复旦大学出版社,2005.

篇2

1.1对房屋建筑结构产生的误区

人们根据房屋建造用料情况和建筑结构不同,主观上把商品房分为砖混结构的和框架结构的。另外,对钢筋混凝土结构(简称钢混结构)的概念和前两个概念搅在一起。在建筑学上,按建筑结构的材料分类,把建筑物分为砖木结构、砖混结构、钢筋混凝土结构和钢结构。而框架结构是按建筑物承重方式分类中的一种,另外还有承重墙结构、排架结构等。砖混结构和框架结构虽然是按不同标准分类的,但建筑学上钢筋混凝土结构和框架结构是同一的。也就是说钢筋混凝土结构就是框架结构,两者可以同时使用。

1.2对房屋建筑高度的认识误区

人们普遍认为6层(不包括隔热层)以下的为多层,而把6层以上的统统称为多层。建筑学上有更明细的分类,一般把两层及两层以下叫做低层,把两层以上8层以下叫做多层,8层以上16层以下为中高层,16层以上24层以下为高层,24层以上称为超高层。

2.房屋建筑结构与居住舒适度关系分析

2.1房屋进深长度对居住舒适度的影响

大多数人喜欢购买开阔进深长的房屋,其实这样的房屋并不好。在建筑学中,住宅的进深是指一间独立的房屋或一幢居住建筑内从前墙的定位轴线到后墙的定位轴线之间的实际长度。为了保证住宅具有良好的天然采光和通风条件,从理论上进,住宅的进深不宜过大。在住宅的高度(层高)和宽度(开间)确定的前提下,住宅进深过大,就使住房成狭长型、距离门窗较远的室内空间自然光线不足;如果人为地将狭长空间分隔,则分隔出的一部分房间就成为无天然光的黑房间。黑房间当然不适于人们居住,补救的措施之一是将黑房间用于次要的生活功能和设施安置,如储藏室、走道等,用人工照明来弥补天然光的不足。 这样无形中增加了住户电力的消耗。

2.2楼层高度对居住舒适度的影响

人民根据生活经验和普通常识认为,住得越高离地面越远,噪音也越小。实际情况是,根据声音在多高层建筑群中的传播反射原理,对于中高层建筑,噪音最大的在6-13层,而其他层噪音则相对较小。实际中根据楼盘层高不同还有区别,购房者需要根据情况实地考察,以确定噪音的大小。

2.3光线方位对居住舒适度的影响

很多购房者买房的时候往往喜欢选择一单元中东边的房子,因为中国地理位置在北半球,夏季晴天西边太阳使人感觉屋里非常闷热。西晒是人们购房中首先回避的因素。其实,以建筑学的视角来看,西边的房屋反而更有优势,因为东边的房屋早上阳光虽好,但光线太强反而影响人的睡眠。西边的房子光照时间长,可以有效杀灭室内空气中的细菌,冬季温度也相对东边房子暖和。

2.4落地窗设计对居住舒适度的影响

现阶段,落地窗称为时尚,不仅美观漂亮,而且使室内光线也充足。但是,大面积的落地窗,很容易让房间变成“微波炉”,如果不使用隔热保温材料,将会使室内光线太强,夏季温度太高,浪费空调资源。所以,不宜将所有窗户都改为落地窗,适当保留带有墙面的窗户。

2.5房屋建筑结构对居住舒适度和安全度的影响

篇3

中图分类号V2 文献标识码 A 文章编号 1674-6708(2014)123-0164-02

当飞机处于某种特殊气动弹性耦合效应下的时候,就会出现抖振的随机振动现象,如果战斗机处于大攻角飞行姿态,通常需要承载一定量的抖振载荷,这会直接导致飞机内部部件的疲劳损伤,使得飞机发生飞行安全事故的概率大大增加,在目前的处理方式中,主要是在飞机制造之后,如果发现存在抖振问题,会对设计进行适当的修改,或者是采取抑制减缓措施,这会导致耗费大量的时间与经费,在飞机的研发周期中采取有效的措施减少其抖振问题非常的必要,这就需要在飞机设计、风洞模型试验、飞机试飞几个阶段做好抖振响应数据的处理工作,本文就主要对此予以简单分析探讨。

1 抖振响应数据的预处理工作

飞机在发生抖振时,其会产生抖振响应数据,对这些数据在处理的时候,为了防止发生静态响应影响数据处理的结果,需要对飞机各种飞行状态下的抖振响应数据进行去除均值的预处理,一般情况下,为了方便叙述,会将飞机不同飞行状态下的数据依据时间顺序依次进行存放,其中一个飞行状态之下的抖振响应数据称作数据仓,选随机选择一个飞行姿态喜爱的抖振响应数据仓,根据合理的时间间隔,将数据仓内的数据进行划分,可以分为多个子数据块,然后逐一进行编号,表示为:1,2,…,N,应用这种方法获取的数据块中包含n个数据点,为了使分辨率得到保证,临近的子数据块之间相互重叠的部分应该达到百分之五十以上。

首先对子数据块内的数据进行预处理,并简单进行分析,形成第i个子数据模块响应数据序列,即:yi1,yi2,…,yin,i=1,2,…,N,n表示的含义是:数据点的数量。然后对第i个子数据块中的数据平均方根值进行计算,将其表示为:RMSi(i=1,2,…,N),其计算公式如下式所示:

之所以要对其均方根值进行计算,主要是为了进行响应数据的无量纲化处理,对于定位样本的关键状态具有积极的作用。然后要对第i个子数据块的一组峰值进行搜索,并要获得第i个子数据块中第j个峰值与该子数据模块RMSi的比值,实现统计量的无量纲化。

其次对其给定飞行状态的样本数据预处理进行简单分析,其预处理流程主要表现为:(1)形成数据仓的RMS序列;(2)对数据仓中各个子数据块的RMS值的均方根进行计算,记做RSS;(3)获得给定飞行状态下第i个子数据块的RMSi与RSS的比值,实现其统计量的无量纲化。

2 子数据模块的数据统计方法

首先分析子数据块统计量的概率模型,由机抖动响应具有一定的随机性,尤其是具有明显的分散性,所以在对其响应数据进行处理的过程中,采用适当的统计学方法建立模型,在上文数据处理方法的基础上,建立概率分布表模型。因为得到的子数据块的时间很短,可以假设其中的数据来自于同一个总体,并且能够保持相互独立,那么可以选择总体Zi的样本为:Zi1,Zi2,…,Zin,在抖振响应峰值特性的概率分布模型的描述中,常用的有:Gumbel分布与威布尔分布,应用威尔分布对第i个子数据块Zi进行假设,那么其概率密度可以用下式来进行表示:

其中,f(Zi)表示的含义是:Zi的概率密度函数,Gi表示的含义是:威尔分布的大小尺度因子;Bi表示的含义是:威尔分布的形状因子。那么可以将其概率分布函数表示为:

其次,简单分析子数据模块统计学量分布参数,本次研究中,对于其分布参数估计应用最大似然估计,建立起威布尔分布的似然函数,并应用相关的参数估计方法,得到其简化之后的威布尔似然函数值为:

然后对似然函数取对数,并应用迭代法对相关数值进行求解,就能够得到最大似然参数估计量的值。

最后应用χ2拟合检验法来对子数据块中数据是否符合威布尔分布进行检验,根据上文中的样本观察值及最大似然参数等,来对总体分布假设进行检验。

3 数据仓RMS值的分布统计方法

为了分析给定飞行状态下的数据仓分布规律,依据上文研究的结果,进一步进行研究,在编制飞机抖振疲劳谱的时候,要得到对应的飞行状态,以此为基础获取疲劳荷载值及疲劳寿命,最后校核飞机抖振强度,在此过程中,还需要找到飞机的关键状态,尤其是其运行过程中的极限状态,在给定的飞行状态下,对其数据仓RMS分布进行分析主要是为了确对几个关键的RMS水平进行确定,并在相应的子数据模块中对其进行定位,再结合其响应模型进行响应分布的分析,这能够保证其很好的满足后续工作的需求,通过对给定飞行状态下数据仓RMS值分布进行统计分析,再结合飞机抖振应用背景及以往的工程实践经验,可以对其相应数据应用经验步进函数来进行描述,就能够很好的满足抖振寿命估计、抖振疲劳谱编制、抖振强度校核等工作要求,这对机抖振响应数据分析处理质量及工作效率的提升都具有非常重要的作用。

4 结论

飞机抖振响应数据具有随机分布的特点,并且具有鲜明的分散性,在对其进行处理时具有较大难度,飞机长期处于抖振载荷之下,会对其部件产生较大影响,容易导致安全事故的发生,本文就结合其抖振响应数据的实际特点,提出了一种统计模型分析法,并对其分析方法中的关键步骤进行了简单分析,对机抖振响应数据的处理分析具有一定的参考作用。

友情链接