


2008年07月27日 9:09 下午
由于此文不想写成口号式的,希望有一些讲理的过程(限于高中大学水平),所以文章不可避免地长了。拟分三次发:
一,引言:
二,科学的建立,及地震预报;
1.科学的建立,及地震预报;
2.如何建立地震科学(预报地震)(之一)
3.气象科学的建立
4.人类离建立地震科学还有多远?或说:人类离预报地震还有多远?(之二)
三,统计在科学(地震预报)中的应用与地位。(本文)
*****************************************
三,统计在科学(地震预报)中的应用与地位。
1.引言:
(1)什么是统计学;
在社会和自然界中,我们可以把事件发生的情况分为两类:在一定条件下必然发生的事件,叫做必然事件;在一定条件下可能发生也可能不发生的事件,叫做随机事件。
统计学是研究随机变量的一门学科。所谓随机变量,是说它的变化是无规律可循的。这又分为两种情况:
对于我们生活中,随机变量随处可见。比如:
对于第二种情况(被研究对象也许不是无规律的,但人们不知其规律),比如,我们知道现在人类已经能够比较准确地预报第二天的天气;但如果往前推300年,我们还不知道。或者说,当你看我这篇文字时,不看天气预报(相当于,你没有任何天气预报的知识),预报一下明天是否下雨?此时,这个自然界中确定的量,对于你来说,就是随机的。
当然,由于人类不知道地震的起因与规律,无论地震是否客观上依赖于某些物理过程,地震对于整个人类,仍是一个随机变量。
由于随机变量的不确定性,我们不可能做出确定的预报,所以,从这里我们就可以直接得到结论:地震不可预报。下面是进一步解释。
对于随机变量,尽管我们不能准确地知道,什么时间,什么地点,什么事件准确地发生,但是我们可以用统计方法知道其发生的分布规律。比如说, 知道这些随机变量分布,但不知道他们如何确切发生,有什么用呢?有用!举例如下: 再举地震,假如根据历史统计,我们知道美国加州,日本和中国四川为地震高发区,害怕地震的人们,也许就不选择这些区域为永久居住区了。而当地政府也应该会根据可能发生的地震等级与频率,制定相关的建房标准。 这个过程,是个推论的过程。研究这个过程的统计学分支(也是统计学的主要分支)叫做:推论统计学。它是把已知的样本资料的特征,应用于新的样本资料,以推论相关的统计特征量。 为什么叫推论,而不叫证明或导出呢?因为通常我们不知道所应用的新的样本资料是否和已知的样本资料具有相同的条件,只能假定他们具有相同条件,因而具有相同的统计分布。而这种假定,有时是不成立的(我们将在下面2.(3).中举例说明)。 于是,用统计学做推论,有两个要点: 2.证明推论统计方法不适用于事件的预报(如地震预报,气象预报,医学预报和社会预报等):
(2)为什么用统计学?
我们来看看如何应用统计学于地震或天气预报。
作为地震或天气预报,人们关心的不是它的分布(当制定地震或天气政策的时候,人们关心的是其分布),而是每一个具体事件的发生。比如,美国地震科学家预测在未来30年内,旧金山湾区发生一次重大地震的概率为67%,而南加利福尼亚的概率是60%。作为地震预报,人们关心的是哪一年,哪一月,哪一周,最好哪一天,哪一确切的地方(当然越准越好),有多大的震级(我们知道,三级和八极地震对人类的影响绝然不同)。
在此,我们顺便给出预测与预报的定义(通常意义):
那么,我们是否能够有效地应用统计学上对样本空间的预测于具体事件的预报呢?结论是:
让我们来证明这以上各点: (1).利用大数定理证明:统计预测仅仅适用于预知集合的宏观分布性,而不适于个别事件: 由于此文希望面对每一位受过高中或大学教育的网友,因此这里只是陈述概率论里面的所谓“大数定理”。 大数定理的表述: 当我们做统计时,所取的样本空间所含的样本数越大,事件发生的频率越趋向于其概率。 何谓概率?我们可以理解,它是事件发生频率的理论值。而概率论,是一门描述统计学的理论基础的数学分支。比如说,我们上面提到的“扔硬币”,在概率论中叫做0,1分布。其实我们不必去很多次地试验,以至于把胳膊甩肿,去得到这50%左右的频率。概率理论告诉我们,0,1分布的概率是50%。同样,“掷骰子”是均匀分布,其概率为1/6。而概率论的基础又是数学实变函数的一个分支,测度论。 好,回到我们的大数定理。以“扔硬币”为例,如我们仍100次,1000次,10000次,或10次,乃至1次,什么会发生呢?看下面的表格: 其中预报概率为50%,使我们从0,1分不中得到的。表中的百分比为分布预测准确率,我是这样定义和计算的:如果新样本观测值与预测值相等(50%),则准确率为100%, 如观测值与预测值之间距离最大(观测值为0或100%时),则准确率为0(如那位有兴趣,我们可以讨论)。 当样本空间取10000个事件时,其分布预测准确率为99.37%;而后递次下降。取10个事件时,其分布预测准确率为72%。取1个事件时,其分布预测准确率为0% for sure。 所以,当我们把适用于集合的宏观分布性的统计预测,用于个别事件时,是极不准确的。 (2).如果非要应用统计来预报个别事件,它只适用于“大概率”事件。
样本事件
10000
1000
100
10
1
预报概率:50%
99.37%
97.58%
92.20%
72.00%
0.00%
既然应用统计预测于个别事件时极不准确,为什么我们还要用呢?自然,原因之一是我们别无选择(因为因果或物理法不存在或不成熟)。另一个原因是,如果我们从已知样本得到的概率相当高,然后应用高概率统计预测于个别事件,我们发现仍旧可以得到相当高的准确率。见下表:
| 样本事件 |
10000 |
1000 |
100 |
10 |
1 |
| 预报概率:99.90% |
99.97% |
99.91% |
99.90% |
99.90% |
99.90% |
于是,我们可以应用统计预报于“大概率” 个别事件。然而,这对人类帮助并不是太大。因为,人类希望预报的现象(地震,气象,股票,社会等),全部是小概率事件。举例(此例为虚拟)来说,根据50年统计,奥运会但天北京的气温呈如下正态分布(一种最常用的概率分布):
| 气温
|
16-down
|
16-20
|
20-24
|
24-28
|
28-32
|
32-36
|
36-up
|
| 概率
|
5%
|
10%
|
20%
|
30%
|
20%
|
10%
|
5%
|
可以想见,许多统计预报热衷者,为了表示其统计模式可以预报(anything),其重要方法是设法提高其模式的预测概率,然而这往往都是以牺牲预测信息为代价的。
(3).如果相关性没有因果关系,即便大概率事件,其预报也是不可靠的。
如上所说,因为通常我们不知道所应用的新的样本资料是否和已知的样本资料具有相同的条件,只能假定他们具有相同条件,因而具有相同的统计分布。而这种假定,有时是不成立的,尤其是在我们不知道其因果关系时。
我们可以举例,诸如,马英九当选前,所有的民调(统计样本)都预测,马英九当选后,股票会大涨;而结果是股票大跌!
再举一个美国次贷例子:(由于文太长,这个例子在讨论中举)。
3.推论统计学在科学研究中的地位:
(1)。对于自然界的随机变量,利用统计(概率),可以了解其样本空间的统计分布,从而人们制定相应政策:如保险公司定价,赌场定价,国家制定农业政策(by干涝分布);注:随即变量的个别事件的预报是不可能的。
(2)。对于人们不了解其规律的确定现象(如地震,许多气象现象,许多医学问题,社会问题— 这个很复杂,也许其本身就是随机的),人们通常是用统计方法去找出各种现象之间的相关性,以求其之间的“物理”联系。当然,一旦这种“物理”联系获得发现,统计学的任务便告完成。
另一方面,正是因为人们不了解其内部规律,而不得已求助于统计学去做“预报”,尽管这种“预报”:
这种预报,比祈求神灵要好一些,但它不是科学,而只是科学方法的不得已的一个替代物。 (之一) (之二) 翰山
Popularity: 5%

这一次也讲点理。
伪科学的特征:
伪科学者喜欢跨越时空。例如,利用地震的先兆可以预报地震。这绝对是正确的。‘预报地震不一定靠知道地震的原因’,这句话就是伪科学的幌子了。地震的原因已经知道:是地壳运动造成板块断裂带的不稳定。目前地震之所以不能预报,就是因为找不到可靠的前兆。
Nile举出的那些事件不能称为地震的先兆,或者说暂时不能称为地震的先兆,因为还没有确切的证据证明它们可以作为地震的先兆:根据目前的地学知识,还不能确认它们与地震发生的可靠关系。它们也许只是简单发生在地震之前,其实地震之后还有很多,只不过你不care而已。干旱和蛤蟆迁移等动物异常是市井水平,地热,地磁,地电,地下水变化等观测则是探索水平,还没有一项指标直接指向地震,以至于可以肯定预示地震的发生。在这种不确定的情况下就说:这些指标可以预报地震,因为他们可能。可能性发生在将来,不能用于现在和过去。混淆时空正是伪科学的特征之一。你要说不对,就和你缠可能性问题。相关也有假相关和真相关,在你不能确定是真相关之前,你怎么可以用于生死攸关的地震预报?他们把一种可能性当成了阳光一样事实,这就是问题的关键所在。
因此才有了其他荒谬的假设:假设1000天内肯定有一次大震,我们又观察到了5个‘ 先兆’指标!我们根据中学的条件概率计算就能算出大概地震就要发生了。问题是现在的科学还作不到1000天或者10天内肯定有一次大震,我敢说,谁能每次都肯定地预测1000天内肯定有一次大震谁就可以得Noble奖。耿老师预测到了正负10天误差,也不去申请以下诺贝尔奖,真为他惋惜。自己的旱镇关系理论本来是用于中期预测的,突然也进行了一次临震准确预测,牛呀。
然后又假设:1000天里 连续100天干旱发生了多少回,占1000天的百分之something, 而连续地磁异常5天,发生了多少回,一共多少天,占1000天的百分之something,…..然后,连乘说是根据贝叶斯计算,算出它们同时发生的概率只有1。2%,并解释说在1000天中只有12天才可能同时发生5个事件。我的天哪,大象真的装进了冰箱!请问阳光Nile 连续100天的干旱怎么和连续5天的地磁异常同时发生在12天?就这种狗屁不同的被噎死计算,还害得大耳和翰山2搏和他掰扯了几十页讨论!
如果假设100天内有一次大地震,大干旱100天发生了一次,同时又发生了其他异常,这次地震
你准备在哪一天发生?

语重心长说Nile
现在,Nile改称三点式骗子了,比伪医学博士骗子BSH有了点长进。
吸收了点佚名游客的沙鸥灵气,也反思了一下。觉得自己对Nile确实不太厚道。尽管他愚昧,固执,自大,死不认错,但谁又能肯定地说这不是一种执著?尽管他虚荣心强,喜欢卖弄,不懂装懂,但我们身上谁能说完全没有这些倾向?尽管他出尔反尔,提起裤子不认账,还专找别人的漏洞进行个人攻击,把别人的语录摘抄一下,虚拟一个观点放在自己的博克上自娱自乐手银打炮,可人谁又没点自恋倾向?尽管他主要是为伪科学辩护,谁又能挡住他成为阳光和正义的化身?尽管他支持藏独追随达赖,怎么能妨碍它成为热爱中国文化的爱国者?人是要有点精神的,敢于和石头相碰的鸡蛋,天天抱着大树摇的蚍蜉,谁又能说这不是一种勇敢?尽管他随便拿个什么大旗胡乱身上一裹就成了虎皮时装,谁又能否定这不是现代人自我包装的精髓?
我的格言是: 尖刻但不要刻薄。我把你从文学城Kick 到万维,还追过来设圈下套羞辱你,是不是已经到了刻薄的程度?我反思我羞愧。仔细一琢磨,尽管你把我拿来‘万维’批倒骂臭,这里的人谁又知道勃事后二大爷贵姓?值得和你较真么?
一个伟人说的好:做人要厚道。这值得我们深思。中国人缺乏包容精神,尤其不能包容错误,自己何尝不是这样?
争论半天总得有点收获。在这里也真诚地和Nile说句知心话:如果你真有真知灼见,你就开搏发论,给人启迪,要不然搞笑潜水游戏人生。你把和你意见不同的人拿来游街示众其实是一种下策。这只能引起无谓的争端。比如,翰山博开搏宣扬‘地震不可预测的’伪科学异端邪说,你可以开播阐明地震可以预测的科学论断,以正压邪,用科学之剑斩断伪科学的魔爪。像你这样自开阳光浴场把和你意见不一致的统统拉来日光浴的做法,是一种为江湖所不齿的下流招式。事实上,确认自己论点完全正确本身就不是科学态度,比如,你很钟爱阳光,连反驳别人都用红外线,紫外线的光谱知识,但事实证明你错了。因此,阳光护体也不能保证正确。
另外,要正确区分幽默和陈述。别动不动就说我当众玩弄生殖器什么的,要仔细追究玩弄的是谁的生殖器,对你可不利。

我本天地一沙鸥,不留姓名在人间。
各位也不用猜了,我是谁并不重要,但有一两句话还能入各位的法耳,已经侥幸侥幸。

大耳贼,不胜惶恐,俺没有让您改签名的意思。我在这儿只是借用您的话,稍稍改动,以利于表达我的观点,不敢承先生之缪赏,惶恐惶恐。
多余说几句我对“信”和“疑”的感慨。
听说美国人教小学生地球是圆的这个知识点时,会先让小朋友列举自己知道的知识,说明地球是平的。然后,再根据小朋友所依赖的证据,更丰富的说明地球何以并非是平的。
而我们的教学模式是,地球就是圆的,证据一,二,三。这其实就是扼杀人的思维,只会让孩子变成一架记忆机器。为什么不让每个问题都变成开放式的一问一答,教学互长呢?

大耳贼,你的博客签名我还是很喜欢的,那就是“信者恒信,智者长思”。我觉得后面一句,可以改为“智者常疑”。
看过张中行先生写的关于他与杨沫的恩怨,老先生说得我不全取,但一句话还是很好的。他说,杨沫走的是一条“信”的路,我则不能,我不能无“疑”。
有些人就是凡事都要一个标准答案,而一个智者,是对所有已经有答案的问题依然存疑。耿庆国的理论不说没有得到主流学术界认可,就是这个理论已经成为主流观点,也不能不让人质疑,有疑才能有问,有问才能有学。
nile 博主走的是一条“信”的路,翰山和在下不过是遵循“无疑处亦当有疑”这条路。道不同,则不相与谋。能被nile说服,影响的人,是喜欢“信”的人,你不能让他不信,而我们只能说一句,“存疑”。

翰山博,
“所以,地震不可做实验,所以地震不可预报。看来双不博没有好好儿读我的正文。要下点功夫,读两遍不懂或还没抓住精髓,就读第三遍!这是建议哈!”
还真的读了你的正文. 感觉是地震是一个科学问题. 你的地震不能预报证明是哲学的. 虽然有些联系但并非完全相同. 相当于你诊断这是不治之症. 但其根据是中医偏方.

“惟上智与下愚不移”,翰山如果不能理解这句话,那就是下愚一族。个人浅见,一个人年过30,脑袋基本上就是铜铸铁浇的了,除非你有开山劈石的功力,不然你别想动他分毫。
俺有一个同事,铁杆“毛派”。俺苦口婆心的跟他说,“好的好的,俺承认毛主席英明盖世,每一句话都是真理,即使这么完美的人,他总有一天也得死,他死了怎么办?迷信个人的力量,但个人总有终结的一天,那时怎么办?”这哥们儿噎得半天说不出话来,转过头来,第二天依然眉飞色舞的跟我吹嘘,毛伯伯如何如何伟大,昨天的对话就好像没发生过。
所以说,妄图改变别人的想法,只会让自己口敝舌焦,而别人不动如山。如果翰山要做新时代的愚公,那我只能表达一下俺对你的敬意。
同时,俺也要表达一下对nile的敬意,一个人只要能始终如一的坚持自己的观点,无论对错,那也是一条好汉,总比那些城头变换大王旗的政治投机分子来的光明磊落。

本来就洗手了,一心一意看奥运,GRD 你又来了,得陪(不是三陪,尽管被别人‘幽默地’穿上三点式)。
看了你们计算机神经元模型就头疼。俺是从事神经营养因子与神经,精神疾病的关系研究。具体就是神经营养因子的转基因动物模型,偏重基础。呵呵,再说多了就把个人资料暴露在网上了。等着报仇的多着呐,我可不想做w$1000第二,勃事后的名声被骂臭了也就罢了,别把一个好好的神经科学家骂臭了。有何指教尽请明示。
看来你用‘勃事后’检索过了。草莽粗人不要见笑。不如你也去文学城,那里可以打悄悄话。

4楼,
“你要说您那一套是对的,ok,您做一个试验,重复几次,我保证听您的。不然,你说破天,那也就叫待验证理论。”
如果大地震每天发生一次, 你说的东西还有些意义. 美国上一次大地震是10年前Northridge地震. 而中国唐山地震则是30年前. 同一个地点发生2次大地震要万年左右. 想重复几次吗?
“各位在这儿为了一个所谓的“待验证理论”吵啊,叫啊,闹啊,还煞有介事的演算。my god,有空是不是去讨论一些能够有结果的论题。”
来博客就是来吵的. 你要结果根本就不应该来博客. 在这里什么东西吵出过结果?





〖alexwwoo〗回复:《看中国股市》
〖煽风点火〗回复:《看中国股市》
〖文揚〗回复:《看中国股市》
〖本欲观〗回复:《“麦克阿瑟”们的又一次历史性的误判与失败》
〖翰山〗回复:《“麦克阿瑟”们的又一次历史性的误判与失败》
〖匿名游客〗回复:《“麦克阿瑟”们的又一次历史性的误判与失败》
〖匿名游客〗回复:《“麦克阿瑟”们的又一次历史性的误判与失败》
〖匿名游客〗回复:《“麦克阿瑟”们的又一次历史性的误判与失败》

回复: 《又谈“六四”— 主要应该政府负责》
回复: 《又谈“六四”— 主要应该政府负责》
回复: 《又谈“六四”— 主要应该政府负责》
回复: 《又谈“六四”— 主要应该政府负责》
回复: 《盘点大饥荒中饿死的死魂灵》
回复: 《盘点大饥荒中饿死的死魂灵》
回复: 《请阅读在翰山博客里一位匿名先生的论民主》
回复: 《盘点大饥荒中饿死的死魂灵》

链接表
翰山的评论
August 4th, 2008 at 10:01 pm
此文讨论到此为止,一些无聊的已删去,并以两天前的结束语来结尾。
诸博:
感谢大家前来讨论,我感觉比较成功,因为
1。有大耳博,xueming博,等鼎力相助,还包括:双布博,不平则鸣博,勃事后博,老忽博等,...
2。有赖nile博的大力协助,既提供反面论点,文风又不十分出格;
在此,一并谢了。
成功在于,这是一个讨论,而非一个骂场!这是一个比较好的尝试!我想这个风气是可以在互联网络上传播的。
我还有一个感想,就是,在我提出这个讨论题目时,我不一定什么都知道,不一定深思熟虑,因为我不知道的,恰恰别人可以告诉我。