常用描述变量集中趋势的统计指标包括:算术均数,几何均数,中位数,算术均数算术均数适用于对称分布特别是正态分布的资料,几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分步资料常用于偏峰资料。
一、集中趋势描述
1.算术平均数 Arithmetic Mean:所有数值的和除以数值的个数。用于描述一组数据在数量上的平均水平。
计算公式:
优缺点:算术平均数是能够充分运用已有信息的代表性数值,每个数值大小的改变都会引起其变化。也因此容易受极值的影响,并且会掩盖数据的差异性。
示例:最近更新了2018年度深圳在岗职工的月平均工资,达到了9309元。这就是一个算术平均值的实际应用。还是要保持进步,争当排头兵而非吊车尾呀。
2.几何平均数 Geometric Mean:对各数值的连乘积开项数次方根。一般用于当总成果为各个阶段(环节)的连乘积时,求各个阶段(环节)的一般成果。
计算公式:
优缺点:几何平均数受极端值的影响比均值小。但仅适用于具有等比或近似等比关系的数据。
示例:连续作业的车间求产品的平均次品率。一个产品的生产由三个环节组成。每个环节都会产生一定的次品。次品率依次为5%、2%、6%,求这个产品的平均次品率。
因为每个环节依次发生,需要完成上一个环节的合格品才能进入下一个环节,所以每个环节的次品率之间是乘积关系。
依照上式结果可知,该产品整个生产环节的平均次品率为3.91%。
3.中位数 Median:将数值从小到大依次排列,最中间的数值为中位数。若数值个数为奇数个时,为中间位置的数值;若数值个数为偶数个时,为中间两个数的算术平均数。
优缺点:不受极端值影响,通过损失部分信息,来换取指标的稳定性 。但对极值缺乏敏感性,当样本量小时,中位数不稳定。
示例:毕业生小于获得了两个offer,分别是A、B两个公司。A公司该部门工资情况为甲400元,乙500元,丙600元,丁20000元,B公司该部门工资情况为戊1000元,己1500元,庚2000元,辛8000元。
A、B公司平均月薪为5375元、2675元。此时算术平均数受极值影响已失去代表作用,A、B公司月薪中位数550元、1750元能代表更多的数据。
4.众数 Mode:数据中出现次数最多的数值。如果有两个或两个以上的数值出现次数并列最多,那么这些数值都是该数据集的众数。如果所有数值出现的次数相同,这该数据集没有众数。
优缺点:可用于数值型数据,也可用于非数值型数据。数据量越多时越具有代表性,且不受极值影响。
示例:一家销售鞋的商铺,参照以往的消费数据,得出女鞋销售尺码的众数为37码,男鞋销售尺码的众数为42码,那么在商铺备货的时候,女鞋37码和男鞋42码就需要安排更多的备货。
5.截尾均数 Trimmed Mean :将数据进行排序后,按照一定比例去掉两端的数据,只用中部的数据来求均数。
若截尾均数与原均数相差不大,说明数据不存在极端值,或者两端极端值的影响正好抵消;若截尾均数与原均数相差较大,则说明数据存在极端值,此时截尾均数可以更好的反应数据的集中趋势。
优缺点:算术平均数较易受到极端值的影响,而截尾均数是其的一种改进,在一定程度上降低极端值给均数带来的影响。
示例:某次艺术比赛10个评委给出评分如下:47、56、74、42、83、75、69、71、76、69。若去掉一个最高分83和一个最低分42,则平均分为:
常用描述变量集中趋势的统计指标包括算术均数,几何均数,中位数,算术均数算术均数适用于对称分布特别是正态分布的资料,几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分步资料常用于偏峰资料
有趋向和反趋向等指标,其中还有多种趋势指标,如“BBIBOLL、MACD”等多种常用指标。
描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料医学,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
拓展资料
1.指标是说明总体数量特征的概念及其数值的综合,故又称为综合指标。在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。
2.指标是说明总体综合数量特征的概念。例如,在工业普查中,所有工业企业构成总体,工业企业总数、工业职工总数、工资总额、平均工资、固定资产总值、利润总额等就是指标,它们都从不同的方面反映总体的数量特征。 一个完整的指标一般由指标名称和指标数值两部分组成,它体现了事物质的规定性和量的规定性两个方面的特点。比如,经统计调查得知某企业固定资产原值为9.1亿元人民币,这就是指标,是说明总体综合数量特征的,它包括指标名称即固定资产原值、指标数值即9.1亿元人民币两个方面。
3.联系
(1)第一,有许多统计指标的数值是从总体单位的数量标志值汇总而来的。即可以是总体各单位标志的总和,也可指总体单位数的总和。例如,某地区工业增加值指标是该地区的每个企业的工业增加值汇总而来的。
(2)第二,两者存在着一定的变换关系。这主要是指标和数量标志之间存在着变换关系,即由于研究目标不同,原来的统计总体,原来的统计指标如果变成总体单位了,相应的统计指标也就变成数量标志,同时地,指标名称变成标志,指标数值变成标志值或变量值。
4.股票指标是属于统计学的范畴,一切以数据来论证股票趋向、买卖等。指标主要分为趋向类、强弱类和买卖类指标。最早起源于期货市场,由乔治·莱恩首创的,它在通过当日或最近几日最高价、最低价及收盘价等价格波动的波幅,反映价格趋势的强弱。