老黄Charlin 发表于 2022-8-24 19:04:10

小唐老师:不管哪里混,这些统计学要懂!(2022.6.2)

这年头,在公司里。
不管你是做质量的,还是搞生产的,又或者是负责研发工作的,甚至是财务或者物流的。
或多或少得遇上些统计学的知识。

然而,大多数朋友,在大学一毕业后,就将统计学的知识,统一打包还给老师了!
今天,就随小唐老师一起,回忆那让我们痛苦并快乐着的校园课堂。


先进一段小故事。
许多统计学家在第二次世界大战中发挥了重大的作用,沃德是其中之一。

他发明的一些统计方法,在战时被视为军事机密。
有次,美国军方咨询沃德,下一代飞机设计时,什么部位的钢板需要加强时。
他画出了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。

积累一段时间后,机身各部位几乎都被填满了。
于是沃德建议,把剩下少数几个没有弹孔的位置加强,因为这些部位被击中的飞机都没有返航。”

故事讲完了,我们发现几个有意思的信息。

[*]不知道是有意还是无意,很多情况下,统计学给出的结论和我们的直觉刚好相反。
[*]统计学研究的对象似乎都是过去已经发生的事情,而对于过去,我们根本无法改变。
[*]统计学热衷于“找规律”,并希望这个用这个“规律”来指导未来!

用一句很“红”的话来总结:吸取过去的经验教训,把握未来的前进方向。

那么问题来了,不造飞机大炮的我们,为什么也一样会用到统计学呢?

因为:变差(Variation)
世界上没有完全相同的两片树叶。

同样,也没有完全相同的两个零件。哪怕是在同一生产过程中。
零件之间的差异就是变差(Variation)。
变差在大自然中,赋予了生物多样性,让我们在感受千变万化世界的同时,也不由惊叹造物主的神奇。
然而,变差在工业生产中,却不受人待见,甚至觉得它是有害的。

因为,追求一致性的工业生产,要想方设法的去降低变差。
当变差大到一定程度,大到人们无法容忍的地步,就会产生不合格品。
这个对于某个特性能容忍的区间,就是所谓的公差范围。

对于公差范围,很多朋友会有这样的一种思路,某一特性,在公差要求范围内的就是合格的,比如长度、宽度、重量等等。
这好比足球比赛,只要足球进了球门,不管是在中间进了,还是擦着门柱进去的,都算得分!




当特性在要求的范围内,客户就应该是满意的
确实,这样的思路有一定的道理,也很容易理解。

不过,要学好工业生产中统计学,我们还得接受另一种变差理论:不管技术规格大小,任何偏离目标值的产品都会带来损失。



有朋友可能会思考一个问题,在公差范围内不是已经合格了吗?怎么还会有损失呢?

不妨,我们想象一下,刚从超市买回来的新鲜牛奶。
虽然有几天的有效期,现在趁新鲜喝和几天后临近有效期再喝,有差异吗?

当然有!这个差异,其实也是一种“损失”。
一大批牛奶,比如1000瓶,放得时间越长(离中心值越远),其中变质的牛奶数量越多。
那么问题又来了!
如果我仔细研究这1000瓶牛奶,统计每天之后变坏牛奶的数量,直到所有牛奶都变坏。

统计得到的这些数据到底有啥用呢?
如果接下来,我又买1000瓶新牛奶,还会遵循之前的规律吗?
这时候,我们要请出统计学的两块大石头了!对了,有人说他们是统计学的基石。

1. 大数定律
话说你喝了太多过期牛奶,意识有点模糊,仿佛穿越到17世纪的法国。
看到一大帮无聊透顶的贵族在皇宫玩掷硬币。



第一个人掷了10次,正面出现7次。于是他得出结论,任意掷一次硬币出现正面的概率是0.7。
第二个人掷了50次,正面出现30次。于是他得出结论,任意掷一次硬币出现正面的概率是0.6。
第三个人掷了100次,正面出现65次。于是他得出结论,任意掷一次硬币出现正面的概率是0.65。
第四个人掷了200次,正面出现110次。于是他得出结论,任意掷一次硬币出现正面的概率是0.55。
……
第一百个人掷了1000次,正面出现505次,于是他得出结论,任意掷一次硬币出现正面的概率是0.505。
这时候,在边上一直看着的你,终于忍耐不住,抬手推了一下隐形眼镜,大声地说:

女士们,先生们,大家别再抛了,安静一下,现在我来宣布一个重大发现:
当我们把掷的次数扩大到无限时,会发现出现正面的概率会趋向于0.5,这就是大数定律。
基于这个定理,再回想之前喝的过期牛奶。
你不由的福至心灵,脑洞一开,如果我买的不是1000瓶,而是10000瓶,甚至是一亿瓶,是不是得出的结论越来越接近真实值?
数据越来越可信,可以预测接下来的牛奶变坏的规律呢?
都说好事成双,善于思考的人更是如此,尤其是喝多了过期牛奶的时候。

发现了一个定理之后,你的思路愈发的停不下来了。
虽然抛硬币越多,正面朝上的概率越来越接近于0.5。
但是接下来,如果我只抛10次,在这10次内,正面朝上的概率也可能是0.4,0.3.,甚至运气比较差,一次正面朝上的都没有。
我继续这样10次一回的抛,抛了1000回。
把出现正面朝上的概率(0,0.1,0.2,……,1)的次数全部统计出来。发现出现0.5的次数最多,离0.5越远,出现的次数越少。
当把这些出现的次数的点全连接起来,你会发现一个有点像钟的形状。


这个形状有意思的地方在于,不仅最常出现的0.5(中心值)被找出来了。
0.5附近的其他值,比如0.4,0.3的出现几率,也被你发现了。

虽然喝了很多过期牛奶,可你觉得你的状态还相当正常。
所以给这图起了个名字叫正常状态的曲线,简称正态曲线。
后来,也不知道怎么地,可能看这图中心的地方最高,也被人称作中心极限定理。
就这样,两块基石,就被你成功发现了。
欲知后事如何,且听下回分解!
页: [1]
查看完整版本: 小唐老师:不管哪里混,这些统计学要懂!(2022.6.2)