勘查地球化学数据处理

如题所述

18.2.1 原始资料及质量评定

18.2.1.1 原始资料

原始资料中最主要的是分析结果,其次是采样记录本、地质观察记录、岩矿鉴定报告、山地工程编录等等。此外,还保存有一些辅助性的材料如送样单、外检记录等等。这些资料的宝贵之处在于,它包含了一切有用的信息,所有后续的工作只不过是尽可能地充分应用它们而已。往往因为其原始性而不被人们所重视,这是不对的。原始资料要由专人在日常工作中经常性地清理、审核、整饰、编排、装订,确保其原始性、系统性与完整性。

随着化探工作规模的扩大与分析项目的增多,原始数据的生产速度是惊人的。例如一幅1∶20万的图幅,按组合样计算也有1800个左右,分析30个元素,再加上坐标,总计就有58000个左右的数据。这么大量的数据要保管、储存、取用并不是简单的事情,国内外大力发展计算机的数据处理系统,这是不可少的基础性工作。

18.2.1.2 分析质量监控

目前,国内各省实验室已广泛使用的化探样品分析方法有:发射光谱方法、原子吸收分光光度方法、比色法、离子选择电极法、原子荧光法、射线荧光光谱法和等离子焰光量计法等。化探样品分析选用的方法应尽可能采用多元素同时测定的方法,而且必须具有较高的生产效率,以适应大量化探样品日常分析的需要。其检出下限应达到表18-5列出的要求。

表18-5 区域化探扫面样品汇总元素检出限要求(10-6

选择分析方法的准确度和精确度可用GSD标准样的方法进行检验。被选用的方法应对八个GSD标准样中的每一个样进行多次分析,作如下两种计算:① 平均值与该GSD标样的可用值之间的对数偏差Δlgc或平均值和可用值之间的相对误差εRE(%);② 相对标准偏差σRSD(%,GSD)。其结果应符合表18-6的要求。

表18-6 测定主要、次要、微量及痕量元素的准确度和精密度

18.2.1.3 分析质量监控的统计学基础

在化探样品分析中,即便用一种固定的方法,同一个熟练操作人员对同一个样品进行多次重复分析,他每次得到的拟测元素含量结果往往并不相同。之所以出现各种不同的分析结果,原因在于称重、加工、溶样、容量测定等步骤都会产生误差,而且全都综合在最终的分析结果之中。此外,化探样品的采集,即便在同一个采样点上采集两个样品,其分析结果也不会完全一样,这就是采样误差。特别是在区域化探中,往往在一个较大的面积内采集几个样品组合成一个样品,并利用该样品的组分来估量整个单位面积内的平均组分,这也难以避免存在采样误差。化探的数据处理是建立在采样与分析质量可靠的基础上进行的,因此我们必须对如何保证数据质量的可靠性有一个基本了解。

(1)基本概念

a.真值与平均值。真值是在无系统偏差条件下无穷多次测定值的平均值。由于实际工作中不可能对一个样品测定无穷多次,故严格说来,真值是无法确定的。

平均值是同一种测定方法对同一个样品进行多次测定所得结果进行统计计算求得的估计值。平均值可用如下公式计算:

算术平均值

勘查技术工程学

均方根平均值

勘查技术工程学

加权平均值

勘查技术工程学

几何平均值

勘查技术工程学

中位数(中位值)是将观测数据依数值大小次序排列时取其中间值(一般从小至大排列)。

上述式中xi为某次(i)的测定值,i=1,2,…,n;n为测定次数;wi为某次观测值对应的权系数。

可用值是对同一个样品分别用多种测试方法测得的估计值,同时对每种方法都赋予与其方法局限性的权而求得的平均值。这是目前勘查地球化学建立定标准样中每个元素含量时常采用的方法。

b.准确度和精密度。准确度是多次测定值的平均值与真值的符合程度。精密度是多次测定的重现性即它们之间的符合程度。

精密度可以用数据的方差来衡量,也可以用标准离差来衡量,还可以用变差系数百分数来衡量。

方差

勘查技术工程学

标准离差

勘查技术工程学

变差系数

勘查技术工程学

准确度和精密度是互不相倚的。一种测试方法或结果,可以既准确又精确,即每次测定的结果都比较接近,而它们的平均值又非常接近真值。也可以是准确的但不精密,即多次测定的平均值接近真值,但每次测定的数值之间相差较大。也可以是精密的但不准确,即多次测定的数值互相接近,但其平均值则远离真值。或者是既不准确又不精密。

当数据不是由一个样品多次测定的结果,而是多个样品的重复测定结果时,则准确度可用测定数值的总平均值与各个样品的平均值之间的偏倚来衡量,精密度可用下式计算:

勘查技术工程学

xi1为第i个样品第1次测定结果;xi2为第i个样品第2次测定结果;i=1,2,…,n。

c.检出限和识辨力。检出限通常称作灵敏度,是用一定分析测试方法能够测出的元素最低含量。采用不同分析方法分析不同元素,检出限会有很大差异。

识辨力指分析方法能表达分析元素的浓度级的数目。在一定的含量间隔范围内,表达浓度级数目越多,表明该分析方法识辨力越强。

以上介绍的一些统计参数是化探选择分析方法的评价依据,也是评价化探数据可靠性的重要依据。

(2)化探数据中的误差

误差即指某种分析测试方法的测定值与真值之差;偏差(偏倚)是指测定值与平均值之差,但习惯上两者混用,不加区别。

误差可以分为系统误差、偶然误差和过失误差。设误差(偏差)用下式表示:

勘查技术工程学

xi 为第i 次测量的数值;-x 为多次测定的平均值;Q1 i第i 次测量的误差;若

勘查技术工程学

则Q1i称作偶然误差。

勘查技术工程学

则Q2i称作系统误差。

过失误差是人为因素造成,如读数错误、看错谱线等引起。

在化探工作中,特别是区域化探中遇到的偏倚往往是可变的。这在以往应用的半定量光谱分析中特别严重。在当前使用较完善的分析方法时也难以完全避免。我国开展区域化探的初期,试验结果表明,除了随机误差之外,分析方法与方法之间,实验室与实验室之间,人与人之间,季节与季节之间,甚至月与月,日与日之间都有系统误差存在,这种误差称为可变偏倚。

可变偏倚在采样中也同样存在。不同地区岩石出露程度不同,或某些地区有厚的覆盖物分布,就可能带来采样偏倚,所采样品在某些地区代表性较好,能比较好地反映基岩中元素含量变化;另一些地区代表性较差,对基岩含量的估量就可能偏低或偏高。

不同地区水系密度小,水系沉积物样品反映上游汇水盆地中元素含量平均值时也会发生可变偏倚,特别是当汇水盆地中有几种不同岩石分布时更是这样。

采样偏倚还可能由于在不同采样地点岩土物质混入比例不同所造成。采样地点上局部环境的变动也会发生采样偏倚。例如土壤或水系沉积物中Fe、Mn、有机物及pH值的局部变化可以使金属含量变化无规律,甚至出现假异常。

不同性质或不同粒级的样品中金属富集粒度不同,如果没有规定统一的采样方法,不同采样人员的采样方法与习惯不同,所采集的样品性质变化太大,也会发生可变偏倚。

不同地点的岩石、土壤、水系沉积物等的均匀性是不同的。在一个采样地点,由于物质比较均匀,重复采样比较接近;在另一个物质很不均匀的采样地点,重复采样会得出相差较大的结果。这是在区域化探采样中经常遇到的可变偏倚。

在一个地区或图幅之内出现可变偏倚,对化探的解释推断会带来严重影响,它会在图上出现假的变化趋势和假的异常。

把野外采样操作尽量标准化,可以大大抑制采样人员之间的可变偏倚。不同采样点上,由于物质的差异、局部环境的变化所引起的采样偏倚是难以避免的,今后可以设法把它们在数据的处理中进行校正。岩石出露程度、覆盖物性质及水系密度不同所造成的可变偏倚也需解释推断阶段时给以估量。

不同采样地点局部环境的变化,以及不同地点物质均匀性不同所造成的可变偏倚,如果严重也会造成假异常。若在一个地点上采集几个样品混合成一个组合样,有助于抑制可变偏倚的起伏。以后的数据处理(网格化、移动平均等)还可以进一步压低可变偏倚。通过这些措施,可以使可变偏倚减少到不致危害解释推断的程度。

至于随机误差,它在任何采样与分析工作中总是存在的。分析实验室通常使用的检查方法(随机抽若干样品,进行重复分析,计算合格率)主要是为了控制这种误差。化探分析不同于一般矿石分析,在化探分析中对于合格率笼统地规定一种标准来对待不同地区的情况与不同要求显然是不够的。往往同等变化幅度的采样与分析的随机误差,在一个地区或图幅内足以影响或歪曲元素含量的真实变化,而在另一个地区并非如此。这就必须针对具体情况作具体分析。如果在数据中没有严重的可变偏倚,则可以使用方差分析方法来检验这一地区范围内随机误差起伏是否有可能掩盖了该地区元素含量变化的真实起伏。对随机误差的检验也可以纳入误差监控系统之中。此外,数据处理(网格化、移动平均等)也可以使随机误差有所降低。

18.2.1.4 分析质量的监控方法

(1)分析质量监控的目的

在化探分析中质量监控的主要目的如下。

第一,及时发现批样之内或批样之间的可变偏倚,以便采取措施,从仪器设备、工作环境、工作条件、操作人员及方法各方面查找原因。

第二,为发现不同图幅或不同实验室之间的恒定偏倚和校正提供依据。

第三,对采样中的随机误差进行估计。

(2)分析质量监控的内容

第一,用各省制备的二级标准样(GRD系列)监控本实验室内长期工作情况下的条件与仪器稳定性。

第二,用一级标准样(GSD系列)监控各省实验室及方法之间出现的系统偏倚。

第三,用重复采样、重复分析监控采样与分析误差是否干扰或掩盖了图幅内和图幅间地球化学变异。

第四,实验室的例行内检工作按5%~10%进行。

第五,外检工作对于已通过国家计量认证获得证书的实验室,可以免于外检。其他实验室要送1%~3%的样品进行外检。

18.2.1.5 采样与分析质量的评价方法

(1)分析质量的评价

为了评价分析数据质量的可靠性,应从以下统计数据进行误差衡量。

对于送实验室分析的全部样品和要求分析的所有元素,百分之百的都能报出数据,则认为测试方法完全满足化探工作要求。若数据报出率大于80%,则认为基本满足要求。

根据每批样品插入的二级标准样品,实验室内检的重复分析和重复取样的分析数据,计算相对误差εRE(%)和相对标准偏差σRSD(%),若符合表18-6的要求,合格率大于80%,则认为分析数据可靠。

(2)采样质量的评价

为了检查采样的质量,根据重复采样的重复分析数据,应用三层套合方差分析进行评价。其方法简要介绍如下。

设在某区选定a个地点,每个地点取b个重复样品,每个样品作c次重复分析,可得三维原始数据矩阵

勘查技术工程学

要问:① 地点间差异是否显著大于样品间差异?② 样品间差异是否显著大于样品分析间差异?

可见,其实质仍是单因素方差分析,只不过问题形式有所变化,将两个单因素方差分析问题套合在一起了。在问题①中样品差异被当作随机误差,在问题②中它则被当作系统误差,通过样品形成这种套合关系。

今设

勘查技术工程学

勘查技术工程学

分别为总均值、地点均值与样品均值,则

勘查技术工程学

其中:

勘查技术工程学

分别表示地点、样品与分析间的误差平方和,对应的自由度分别为:FA=a-1,FB=a(b-1),FC=ab(c-1),于是可构造以下两个统计量

勘查技术工程学

利用 FA 可检验地点间元素含量变化是否显著大于采样与分析误差,利用 FB 可检验采样误差是否大于分析误差。例,在三个地点各采二个样品,每个样品分析2 次,其分析结果见表18-7,问取样与分析误差是否能掩盖地点间差异?重复取样质量如何?计算结果列于表18-8,可见采样地点间差异是显著的,它不会被重复采样与重复分析所掩盖,而采样误差并不大于分析误差。

表18-7 分析结果表

表18-8 计算结果表

18.2.2 勘查地球化学数据处理方法

本部分只简要介绍几种常用的化探数据处理方法,有关这些方法的详细的数学描述和讨论请参阅数学地质方面的参考资料。

18.2.2.1 方差分析

方差分析是分析处理试验数据的一种方法。在地质科学与找矿勘探实践中,每种地质现象、地质过程、地质体都包含着许多相互制约、相互依存、相互矛盾的因素,如何分析这些复杂因素解决地质问题,这就是方差分析所要解决的问题。例如一套碳酸盐岩地层,肉眼是难以识别(分层)的,但可以用方差分析方法分析它们之间各种化学成分数据,找出分层的主要化学成分,从而达到分析的目的。又如岩性、蚀变与矿化的关系,沉积岩岩性的纵横变化与古地理环境的关系等方面的问题,都可以用方差分析方法解释。方差分析是两个总体参数检验的推广,是判断两个以上总体参数是否相等的问题。在化探数据处理中,常用两种方差分析方法,即固定方差分析和随机方差分析。

(1)固定方差分析

把单因素固定方差模型应用于两组数据,但该模型也可以推广到多组数据。在这一模型中,要将数据的组内变差与组间变差进行比较,如果组间变差大于组内变差,则认定两组的平均值不同。这种对比要通过F-检验来完成。

(2)随机方差分析

这种方法常用于对来源可辨的变差作对比。在勘查地球化学中,指的是分析误差、取样误差和区域变异的相对大小。在评价变化趋势时,总希望分析误差比区域变异小。为了做这种对比,首先把不同来源的变异分离开来,然后用F-检验做必要的对比。

18.2.2.2 回归分析

回归分析是处理相关关系的一种常用方法,它是以大量观测数据为基础,建立某一变量与另一变量(或几个变量)之间关系的数学表达式,是一种能从众多的变量(或预先尽可能多地考虑一些变量)中自动挑选重要变量(指标或因子),并确定其数学表达式的一种统计方法。它具有一定的统计意义和实际意义。利用这种方法可以自动地、大量地从众多可供选择的指标中,选择对建立回归方程式重要的指标。因此,它在勘查地球化学数据处理中有着广泛用途。例如:

① 圈定异常和成矿“靶区”进行矿产统计预测。

② 确定找矿标志,或用一种或几种元素的含量预测另一种难于分析的元素含量。

③ 对化探异常进行分类以便对其进行综合评价,综合解释。

④ 研究矿体产生的地球化学晕的幅度与取样地点距离矿体远近的相关关系,如在垂直方向上,它有助于推断矿体的埋深;研究矿体剥蚀深度;内生矿床分散晕的垂直分带序列等。在水平方向上,它能为评价异常或进行勘探设计提供依据。

⑤ 解决控制问题,即在一定程度下控制。变量的取值范围,应立足在指定的范围内取值。

⑥ 可用来建立各种找矿模式,发现新的找矿线索等。概括起来说,回归分析可以解决预测问题和控制问题。

18.2.2.3 移动平均分析

在区域地球化学和环境背景研究中,常常要进行大量的采样测试工作。人们发现,在不同采样位置上采样测试结果是不均一的,如果将一条观测线上采样的测试值顺序连接起来,则形成一条元素含量变化的折线,平面上元素含量值变化就更复杂了。在这种情况下,在数据图上主观勾绘元素等值线图或用线性插值方法勾绘等值线图来描述区域元素分布规律是困难的,往往得到的等值线图是粗略的、随意的,不能反映非线性变化的特点,对于这一类问题可以用移动平均分析方法来解决。移动平均分析方法是在矿山开采实践中产生的,最初是用该法降低品位方差进行矿床储量计算。现在人们通常用移动平均分析方法来光滑数据曲线,光滑平面数据曲面。它能消除采样测试误差,从而清晰地显示出元素区域性分布规律和变化趋势。实际上它是一种低通的滤波方法。由于这种方法运算简单,广泛地应用于区域地球化学数据处理及需要光滑曲线、曲面的研究与实践工作中。

18.2.2.4 趋势分析

趋势分析是一种研究随机变量在空间位置上变化规律的数理统计方法。它用某种数学模型去拟合实测模型。在地质工作中经常需要研究某种地质特征的空间分布特征与变化规律。例如,为了查明某一地区的地质构造,需要研究某些地层单位的厚度或某一标准层的高程在该地区内的系统变化;为了了解某一岩浆侵入体物质成分空间变化特征,需要研究其矿物成分或化学成分在该岩体内的变化规律;又如在化探工作中为了发现矿化异常,需要研究化学元素在测区内的“区域趋势”和“局部异常”。地质上的这些变量常常随空间位置的变化而改变,可以说它们是空间位置的函数。这种随机变量可借用地质统计学中的一个名词——区域化变量来称呼它们,或者简单地理解为空间变量。

趋势分析根据数学手段和方法的不同,可以分为滑动平均(或叫移动平均)、多项式拟合趋势分析和调和趋势分析。

趋势分析依空间的维数,又可分为一维、二维和三维。对于多项式趋势分析,不同维中按自变量的最高次数,又可分为一次、二次…六次,等等。一般说,多项式次数愈高,则趋势面与实测数据偏差愈小,但是还不能说它与实际情况最符合,这还要在实践中检验。一般说变化较为缓和资料配合较低次数的趋势面,就可以比较好地反映区域背景;而变化复杂起伏较多的资料,配合的趋势面可以适当高一些。

由于地球化学变量在空间上表现为既有随机性,又有结构性(受周围点的含量控制),因此可以采用趋势分析来进行研究。

趋势分析的任务主要是确定测区中地球化学变量空间分布的数学模型和区分测区中地球化学变量的“区域变化趋势”和“局部异常”。

18.2.2.5 判别分析

判别分析是对样品进行分类的一种多元统计方法,它在化探中的应用成效最为显著。它的工作过程大体可以分成两个阶段:第一阶段是选择已知归属的对照组(或叫培训组),并用对照组的分析数据建立判别方程式。第二阶段是把未知归属的样品的分析结果,代入判别方程,算出结果后就可以确定其归属。当然实际工作中需要根据多元素进行判别。

决定判别效果好坏的是对照组的精心挑选和判别变量的合理决定。前者不但要求有代表性,即每一类都有一定的数量,而且要求判别变量在同一组内的差异要小而在不同组内差别要大。所以需要通过对比不同的变量组合来选择最佳的判别方程。为了取得对照组样品,一方面可以选用已知的地质单元内的样品,如得不到足够的资料,则可以先在全体数据中选择部分有代表性的样品进行聚类分析,然后将其结果作为对照组。当然,决定判别成效的最终根据不在于判别对象确定是可判别的,这一点可以用统计检验来证实。

一旦判别方程建立后,就可以对样品进行逐个判别,因此它不受样品数目的限制,适用于大量常规化探样品。

18.2.2.6 聚类分析

聚类分析又称点群分析、群分析和丛分析。它是根据样品所具有的多种指标,定量地确定各种样品(或变量)相互间的亲疏组合关系的方法。按照它们亲疏的差异程度进行定量的分类,以谱系图形式直观地加以描述。聚类分析在勘查地球化学数据处理方面有广泛的应用。如了解成矿元素究竟和哪些因素有关;找出和成矿元素伴生的相关元素,以利用和成矿元素关系密切的其他元素为找矿标志;研究次生分散晕中异常元素究竟和哪些元素共生组合在一起;根据已知矿床(点)的成矿元素组合特征预测成矿远景区。根据分类对象,聚类分析可分为Q型和R型两种。

虽然聚类分析可以按测定项目分类(R式),也可以按样品分类(Q类)。Q式用途较大,因为经验证明,R式聚类分析往往只是证实一下元素的共生关系,这往往是众所周知的,没有增加新知。Q式树枝图却提供了宝贵的资料。

18.2.2.7 因子分析

因子分析是用来研究一组变量的相关性,或用来研究相关矩阵(或协方差矩阵)内部结构的一种多元统计分析方法。它将多个变量综合成为少数的“因子”,也就是在较少损失原始数据信息的前提下,用少量的因子去代替原始的变量,从而达到对原始变量的分类,揭露原始变量之间的内在联系。

因子分析从以下三个方面为地质工作中的成因推理提供重大帮助。

(1)压缩原始数据

地质人员在研究每一个地质问题时都希望获取尽可能多的数据,而在最终综合这些数据以形成地质成因概念则又会为面对这大量复杂的、通常又是相互矛盾的数据而深感苦恼。简单地说,地质人员在收集数据时总希望尽可能多,而在分析、综合数据时又希望尽可能少。因子分析恰恰提供了一条科学的、逻辑的途径,能把大量的原始数据大大精简,以利于地质人员进行综合分析。这种精简又以不影响主要地质结论的精确性为前提,或者说是在不损失地质成因信息的前提下进行的。

(2)指示成因推理的方向

在形成成因结论的过程中,人们的思维和推理是最重要的一环。从大量复杂的地质数据中理出一个成因的头绪并不是一件容易的事。不同的人对同一组地质数据,往往导出不同的成因结论,其原因是人们在推理过程中掺入了主观、片面的意见。因子分析有可能把庞杂的原始数据按成因上的联系进行归纳、整理、精炼和分类,理出几条比较客观的成因线索,为地质人员提供逻辑推理的方向,帮助他们导出正确的成因结论。

(3)分解叠加的地质过程

现在所看到的地质现象往往是多种成因过程叠加的产物,既有时间上不同过程的叠加,又有空间上不同过程的叠加,各个过程互相干扰,互相掩盖,造成了地质成因研究的复杂化。因子分析能提供从复合过程中弄清每个单一过程的性质和特征的途径。

因子分析在地质成因研究中,潜在的解决地质问题的能力是很大的,但是并非使用因子分析就能完全克服成因研究中的各种困难。

因子分析(广义)可以分为R型因子分析、Q型因子分析和R-Q型因子分析。R型因子分析用来研究变量之间的相关关系;Q型因子分析用来研究样品之间的相关关系;R-Q型因子分析用来研究变量与样品间的对应关系。

18.2.2.8 对应分析

在地质和化探数据的统计分析中,经常要处理三种关系:即变量之间的关系,样品之间的关系以及样品和变量之间的关系。因子分析中提出了R型分析和Q型分析,它们分别可以用来研究变量之间和样品之间的关系,两种因子分析通常是分别进行,甚至只作R型因子分析,不作Q型因子分析;或者只作Q型因子分析,不作R型因子分析。这样人为地把R型和Q型分析割裂开来,结果漏掉了许多有用的信息。地质成因问题是通过不同特征的样品表现出来的,因此,成因与样品是有联系的。R型分析和Q型分析之间不可分割,有一种对应关系。

另外,一般来说,在原始数据矩阵中,样品的数目远远超过变量数目,这样就给Q型分析的计算带来极大的困难。如果有100个样品,每个样品测定10个指标,这样R型分析只要计算一个(10×10)阶相关矩阵的特征值和特征向量,而进行Q型分析就要计算阶数大得多的矩阵的特征值和特征向量,这给计算带来极大的困难。于是人们就设法从R型分析的结果推导Q型分析的特征值和特征向量。

对应分析就是把R型分析与Q型分析统一起来,把变量和样品同时反映到相同坐标轴(因子轴)的一张图上,这样就便于地质解释与推断。对应分析点聚图中,变量点群表示了具有同一地质作用的元素组合,样品点群表示了相同类型的样品,而且样品点群的地质成因是由它们邻近的变量所表征。这就有助于对样品类型的地质解释,同时通过样品在空间的分布可以了解地质过程的空间关系。

18.2.2.9 相关分析

相关分析研究变量与变量之间的关系,这是整理化探资料一定要碰到的问题,例如各指示元素之间的消长关系,次生晕总金属量与矿床规模的依赖关系,铁帽中残存金属含量与原始品位的关系等等。如能灵活应用相关分析提供的方法,则可以在资料处理中发掘出很有价值的信息。相关分析还能帮助建立经验公式,一些更高一级的统计分析也往往是通过相关分析进行的,因此它是最常应用的一种方法。

相关分析的内容很多,理论与方法都比较成熟,按变量的性质可分为正态与非正态两类;按变量间关系的性质,可分线性与非线性二类;按涉及变量的多少,可分成二元及多元等。当然,最简单的是二元线性正态相关分析,其他各种类型的相关分析可以通过变量转换或取舍,转化成线性正态模型。

在作相关分析时,切忌盲目用公式,最好先作散点图。在图上看出有些关系明明很有规律,但算出的线性相关系数为零;有些相关关系只存在于一定的含量值以下,如某地超基性岩中Ni和Mg的相关关系,只在Ni含量低于1000×10-6时存在,超过1000×10-6时与Mg不相关。研究Fe、Mn对重金属吸附时也曾发现,异常的Cu、Zn就与Fe、Mn含量不相关,这都是由于存在形式改变所致。因为高含量时,Ni、Cu、Zn等有自己的独立矿物出现,故影响了同其他元素的相关性。

相关性的好坏由相关系数来度量。必须指出,相关系数受个别特高点的影响很大,有时,甚至只是因为包含了一个特高点,把相关系数由0.2“提高”到0.9。原始数据进行对数转换能缓和这种影响。参加计算的数据对越多越好,但不要把不同总体的样品混在一起。为了避免对分布型式的依赖,过去曾经引入过一些非参数性的相关系数,如秩相关系数、中位数四分法相关系数等。经验证明,只要对原始数据作适当的筛选,常用的相关系数(皮尔逊相关系数)仍是最稳健的统计量,相关系数的统计检验已有现成的表格可查,凡超过临界值者,表示相关显著。

温馨提示:答案为网友推荐,仅供参考
相似回答