首页 公文范文 统计学变量的定义

统计学变量的定义汇编(三篇)

发布时间:2023-09-26 14:44:20

绪论:一篇引人入胜的统计学变量的定义,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

统计学变量的定义

篇1

地质统计学是20世纪六七十年展起来的一门新兴的数学地质学科的分支,是随着采矿业的发展而兴起的一门交叉学科。地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。国内外地质统计学的理论、方法及应用均达到了成熟的阶段,并形成了具有较好应用价值的软件。具有代表性的有:法国巴黎高等矿院地质统计学研究中心研制的ISATIS;美国斯坦福大学应用地球科学系C.v.Deutsch和A.G.Journel共同编写的GSIJB程序包,等等;北京科技大学地质系也编写出地质统计学方法研究程序集。

近年来,克里金技术在石油勘探开发中的应用日益广泛深入,效果也越来越明显。主要应用包括:储层预测,即估计地层的埋深、层厚、孔隙度、渗透率和含油饱和度等地质和地球物理参数的空间分布,这些变量在空间既存在一定的空间分布规律(结构性),又存在局部的变异性(随机性),这些变量都属于区域化变量,因此可以用地质统计学方法对这些变量进行研究绘制各种地质图件;利用地质统计学的变差函数研究储层的非均质性及各向异性;数据整合,即整合地震、测井、钻井和露头等各种信息并进行建模。除此以外,随机模拟方法和油藏数值模拟相结合,可以预测油藏的动态特征,为制定和调整开发方案并提高采收率提供依据。

一、地质统计学研究方法的基本理论

(一)基本原理

当一个变量呈现为空间分布时,就称之为区域化变量。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为区域化现象。区域化变量,亦称区域化随机变量,G.Matheron(1963)将它定义为以空间点x的三个直角坐标为自变量的随机场。区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性。区域化随机变量之间的差异,可以用空间协方差来表示。

(二)变差函数

一维变差函数的定义:假设空间点x只在一维x轴上变化,把区域化变量Z(x)在x,x+h两点处的数值之差的方差之半定义为区域化变量Z(x)在x方向上的变差函数,记为:r表示变差函数;E表示数学期望;Var表示方差。也就是说变差函数依赖于x和h两个自变量。在本征假设条件下,变差函数仅依赖于分割它们的距离h和方向a。而与所考虑的点x在待估域内的位置无关,因此变差函数更明确定义为:变差函数是在任一方向a,相距h的两个区域化变量Z(x)和Z(x+h)的增量的方差之半。

变差函数是一个距离的函数,描述不同位置变量的相似性,r值越大,相关越差。通常情况下,r值随着距离矢量h的增大而增大,直到h到达一定值时,r达到极大值,而后保持这个常数值不变。

(三)克里金方法

当随机变量X的数学期望对整个区域都为已知时,采用的克里金方法就是简单克里金方法。在进行简单克里金估计时,我们假设整个区域的均值是已知的。然而储层物性的均值是随着局部区域的不同而变化的,上述假设在绝大部分的情况下是不成立的,普通克里金解决了这一问题。当随机变量X(u)的数学期望是一个和u无关的常数,但这个常数未知时,导出的克里金方法就是普通克里金方法。

(四)协克里金

1.协克里金方法的原理及其公式。协克里金方法要求主变量与二级变量之间具有良好的相关性。以整合两个变量为例,协克里金估计的主变量和二级变量的线性组合形式如下:协克里金有其不足之处,需要建立两个变差函数(主变量、二级变量的变差函数)和一个互变差函数(主变量与二级变量之间的互变差函数)。不仅运算的数据量显著增大了,而且拟合这些变差函数比较困难。在协克里金的计算过程中,相关性较好的数据对相关性较差的数据存在屏蔽效应。由于这些原因,这种完全协克里金在实际应用方面受到限制。于是,人们发展了配置协克里金,这种方法保留了协克里金的优点,又不用同时建立三个变差函数。

2.协克里金算法中几个关键的步骤。在使用协克里金方法时,要求两组数据之间具有良好的相关性。是工区井点处单位厚度旅行时差与孔隙度的交汇图,计算单位厚度旅行时差与孔隙度的相关系数为0.880655,具有良好的相关系数。

相关函数的计算与拟合。由于实际数据测量点个数的不足,我们需要对相关函数进行计算并拟合,绘制出完整的相关函数图形,通过变差函数计算方法和线性规划拟合方法,计算拟合相关函数。

选择合适的搜索半径。协克里金方法至少使用两种数据,一般叫做硬数据和软数据,通过实际资料处理,认为这两种数据不宜用相同的搜索半径。对于硬数据,应采用与硬数据的变程相当的搜索半径,原则是尽可能地应用精确的硬数据;对于软数据,搜索半径不宜过大,因为软数据本身不够精确,会把自身的偏差带到估计值中。

处理加权系数。最后一步是处理加权系数,由于负的加权系数会导致奇异的估计值,因此需要采用线性规划方法处理加权系数。

二、地质统计学方法的应用

(一)储层预测

对储层参数进行科学有效的预测,一直是石油地质学的热点和难点。最初采用传统的数理统计方法,但这种纯数学的方法不考虑储层参数之间的空间连续性和相关性,不带任何地质意义,对储层参数预测具有很大的局限性。而地质统计学方法以区域化变量理论为基础,充分考虑了地质参数空间变化的趋势、方向性及2样点参数的相互依赖性,利用克里金方法的插值和外推功能,求出比较符合地质规律的地质统计模型和方法,来表征各种储层参数的变化规律,然后用这种规律,对参数(如孔隙度和渗透率等)的空间展布进行比较合理而有效的预测。

(二)储层的非均质性及各向异性研究

储层非均质性研究是油藏描述的重要内容,其参数的空间分布不仅具有随机性,而且具有结构性。从地质统计学关于变差函数的基本理论出发,在综合分析的基础上,构造了一种定量表征储层平面非均质性的数学模型,计算结果所反映的各类储层的平面非均质特征符合沉积的基本规律,说明这一表征模型用于储层平面非均质性定量评价中是可行的。

(三)不确定性描述

静态、动态的确定性模型,很难反映油藏的复杂变化,只有通过不确定性描述,从地质统计观点概括和综合地质模型,才能真实地反映复杂的油藏模型。近几年来,地质统计学越来越广泛地用于储层表征,诸如估计孔隙度的空间分布,模拟渗透率的数值连续性,定量估计油藏模型的不确定性,取样设计,流动模拟过程中的敏感性分析和风险分析,等等。它的最大优点就在于能够方便地综合应用各种资料,如地质、地震、测井、生产等各方面的信息,这对岩心取样十分稀疏的油藏的准确描述是关键的。而且不确定性描述能为油藏工程师提供多个可选择的开发方案,有利于综合分析,获得合理的开发决策。

参考文献:

[1]何琰,殷军.储层非均质性描述的地质统计学方法[J].西南石油学院学报,2001,23(3).

[2]李黎,王永刚.地质统计学应用综述[J].勘探地球物理进展,2006,(6).

[3]王自高,何伟,高才坤,卢杰.工程勘察新技术应用与发展思路[J].水力发电,2006,(11).

篇2

SPSS又称为“统计产品与服务解决方案”软件,是IBM公司推出的用于统计学分析运算以及数据预测分析和数据挖掘的软件产品。SPSS所提供的相关分析方法主要包括:(1)Partial法,此方法多用于偏相关分析,当两个相关变量取值过程中容易受到其他变量的影响时,方可使用此方法;(2)Bivariate法,此方法多用于对两个及以上变量的参数以及非参数进行相关分析,当变量较多时,则通过给出各变量相关接管,从而使用户了解各变量之间的关系;(3)Distances法,此方法既可以对同一变量内部不同观察单位的数值进行相关分析,又可以对不同变量之间的距离进行相关分析,但此种方法在教育教学领域的应用相对较少。

二、基于SPSS的学生成绩关系的分析

本次研究主要以学生的语文和数学成绩作为SPSS软件的主要分析对象,随机选取某学校30名学生的数学与语文成绩进行分析,具体分析过程如下:

1.数据准备

在启动SPSS软件后可发现,在屏幕最下方存在两个标签切换按钮,分别为Variable View和Data View,当点击Variable时,可切换成变量视图,进而创建变量。而后点击Data View,则将现有的变量视图转变成数据视图,此时方可输入相关数据(学生成绩)。对SPSS的此种数据定义的方式进行分析可知,相较于Excel,其对数据和输入标准的定义更为严格,为后续的数据统计奠定了良好的基础。

2.数据分析

在数据输入的准备工完成后,则需要对数据的信度做出全面检查,并绘制出各个数据的散点图,以便直观地对两个变量之间的相关性进行观察和分析。在散点图的绘制工作结束后,SPSS即进入相关分析阶段,具体操作流程如下:首先,在SPSS软件菜单中点击Analyze(分析)Correlate(相互关系)Bivariate(两变量),将需要进行分析的变量,即语文(Chinese)与数学(Math)添加到Variabels列表当中。然后,选中“Pearson”,即皮尔森相关系数的计算命令,同时确认选中两变量检测按钮,即“Two-Tailed”,点击界面上的Flag键,当变量之间存在关联时,SPSS界面将显示出有关的标记。当全部按键设计完成后,点击“OK”键,SPSS将会计算得出语文与数学两变量的相关性结果。

3.结果分析

以上述学生语文、数学成绩两变量的相关分析结果为依据,利用Pearson对变量间关联的密切程度进行判断。此处,假定有随机变量(X,Y),其n对样本则可表示为(xi,yi)(i=1,2,…,n),而Pearson(皮尔森相关系数的计算命令)对相关系数的计算公式则可表示为如公式1所示的形式:

r=

篇3

2地质统计方法发展现状

地质统计学作为一个年轻的边缘学科,正处在蓬勃向前发展的阶段,目前地质统计方法的发展主要有以下几个方面:

2.1两大学派地质统计学发展至今,出现了两个学派。

一个是以A.G儒尔奈耳(A.GJourna1)为首的“斯坦福地质统计学派(非参数地质统计学派)”。这一学派研究了不需要对数据的分布做假设的快速条件模拟、概率克立格法和指示克立格法等方法,并且研究了软数据的使用问题。另一个学派以马特隆教授为首,他们开展了以正态的假设为基础的析取克立格法和条件模拟研究,把协同克立格法和主成分分析进行有效结合,形成简单克立格法、析取克立格法、泛克立格法和普通克立格法等一系列的方法和理论,这些方法都要用实际的样品数据为基础,所以也称“参数地质统计学”

2.2多学科的渗透形成新克立格法

目前,对于含有一些特异值,接近了高斯分布的具体数据,就要把稳健统计学思想应用到求变差函数当中,继而提出了稳健克立格法;把多元区域化的变量引到克立格法中,运用两个或两个以上有相关性的变量对某一个变量估值,继而产生了协同克立格法;把多元区域化的变量引到指示克立格法中,继而得到了协同指示克立格法。

2.3多领域应用地质统计学目前不断扩展其应用领域,深入到生活的各个方面。

3地质统计方法在地质工程中的重要作用

随着市场飞速发展,统计方法运用在地质工程是时代潮流发展的必然。以前我们在计算矿产资源的储量时,常用不同级别储量的工程密度,用稀密法得到相对误差来论证矿产资源储量的可靠程度,并将相对误差值作为衡量矿产资源储量精度的标准。然而,这种方法缺乏科学根据,被许多人置疑,地质统计方法的出现很好地解决了这类问题。地质统计工作是深化我国经济体制改革和加强经济发展的必然要求。地质统计不但可以整体估计,还能对局部进行估计,对原有的数学方法和理论进行选择创新,把更好地解决面临的地质问题作为目标。地质统计估计的克立格方差是一个很好的估计精度,其估计精度高较高。地质统计的随机模拟能很好的再现出地质变量变化,从而为定量研究地质体提供一个有利的基础和可靠的保障。

4一维变差函数

可以假设空间中一点只在一维数轴X上变化,把区域化变量z作者简介:常维(1990一),男,江苏泰兴人,本科生,研究方向为统计学。(x)在X,x+/两点处的数值的差的方差的一半定义成区域化变量z(x)在x方向上的变差函数,记为:‘P(x)=—1V(x)一Z(x+1)]=—1E[Z(x)一Z(x+/)】一{E[Z(x)卜E[Z(x+/)】}z公式中,‘P(x)表示变差函数;E表示期望值,V表示方差。变差函数的函数值仅依赖于x和Z两个自变量。在本假设条件下,变差函数仅依赖于分割它们的距离z和方向,因而变差函数可定义成:变差函数是在任一方向,相距f的两个区域化变量[z(x)和(x+/)的增量的方差的一半。变差函数是一个有关距离的函数,描述不同位置变量的相似性,‘p值越大,变量的相关性越差。通常情况下,‘p值随着距离矢量Z的增大而增大,直到到达一定值时‘p达到极大值,之后保持不变。

5统计方法在地质工程中的应用

1977年地质统计学正式引入我国,经过我国对地质统计方法的努力学习,地质统计方法在我国得到了飞快的发展,目前广泛应用于以下几个方面:

5.1用于储层的预测石油地质学研究中的一个重要的难点和热点,就是对储层的参数进行一个有效的科学的预测。我国原先利用的是传统数理统计的方法,这种方法是纯数学的方法,没有充分考虑到储层参数间相关性和空间连续性的问题,也不附带任何的地质意义,因此,对储层的参数预测有较大局限性。使用地质统计方法就可以有效解决这一问题,它以区域化的变量理论作为基础,对地质参数的空间变化方向性和趋势都有了充分的全面的考虑,再克里金方法的外推和插值的功能,算出了与地质规律吻合的统计方法和模型,继而表征储层参数的规律变化,利用这规律,针对渗透率和孔隙度等参数的空间展布开展有效又合理的预测。

5.2用于不确定性描述油藏的复杂变化,很难通过动态或静态的确定性模型来反映。只有运用地质统计方法,用不确定性的描述,才能反映出真实的复杂油藏模型。地质统计方法最大的一个优点就是可以很方便地把不同的资料有效整合应用,如生产、测井、地震、地质等方面信息,这些对于油藏;隹确的描述是非常关键的。这种不确定性的描述可以给油藏工程师一个可选择的参考,帮助他们全面分析,制定一个合理的科学的开发方案。

友情链接