1、样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率。
3、研究总体概率分布往往可以研究其样本的频数分布、频率分布。在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布。
扩展资料:
一、样本容量计算方法
确定样本容量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。
具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应。
如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。
二、累计频数
累积频数就是将各类别的频数逐级累加起来。其方法有两种:
一是从类别顺序的开始一方向类别顺序的最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变量值大的一方累加频数),称为向上累积。
二是从类别顺序的最后一方向类别顺序的开始一方累加频数(定距数据和定比数据则是从变量值大的一方向变量值小的一方累加频数),称为向下累积。通过累积频数,可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。
三、频率计算
随机事件在n次试验中发生m次的相对频次m/n。一般物理科学中频率指每秒中的振动次数,可以是随机的,也可以是确定性的。
在一定条件下,对所研究的对象进行观察或测验,每实现一次条件组,称为一次试验。其结果称为事件。在一次试验中,可能发生也可能不发生的事件称为随机事件。
随机事件 A发生的概率p(A)是该事件出现的可能性大小的度量。其数值在0与1之间。在一定条件下进行试验,如果事件A不可能发生,则p(A)=0;如果事件A必然发生,则p(A)=1。随着试验次数n的增大,频率接近于概率的可能性也越大,即:
式中δ是任意小数值。
水文现象是复杂的自然现象,其出现的概率无法确知,只能通过统计实测水文资料中出现的频率作出推断。由于受到所依据资料的限制,总会带有一定的误差。
参考资料来源:百度百科-样本容量
参考资料来源:百度百科-频数
参考资料来源:百度百科-频率