2008/10/8

關於t-test

上個禮拜的Biostat課,剛好老師提到了t-test,便回想起三年前在準備國考時寫的一篇舊文,不過當時是放在無名小站bbs上面,現在這個站好像消失了還是換ip,整個資料也隨著不見,把這個貼上來以資紀念....


關於t-test (student’s t-test)
前言:
大家在念公衛統計時,是不是被這些有的沒的檢定搞得快發瘋了呢?
其實,這些統計方法的背後,代表的是20世紀末開展的一場科學革命。
1962年,芝加哥大學的孔恩出版了《科學革命的結構》(中文版:遠流出版),他注意到現實世界是極為複雜的,永遠不可能用一個有組織的科學模型來完全描述,因此,隨著數據越收集越多,模型也必須配合一些新發現做修正,統計革命就是這種模型轉換的例子,如果要說起近代統計革命的起點,必須從卡爾‧皮爾森開始講起,而1935年,費雪寫的《實驗設計》則是這場革命的重要因素。

為什麼t-test會稱為student’s t-test(神秘的student)
20世紀初,位於愛爾蘭都柏林的一間老牌釀酒公司─吉尼斯釀造公司決定開發新的釀酒科學技術,於是雇用了一些劍橋和牛津畢業的優秀化學家,1899年,擁有牛津化學和數學雙學位的戈斯特(Gosset)被招募進去,並發揮了管理上的長才,負責整個大倫敦地區的業務,但是,他對公司啤酒釀造業務的貢獻,卻是來自數學。
啤酒的釀造過程中,最重要的是發酵。在麥芽漿預備發酵前,要仔細測量倒入酵母菌的量有多少。量太少發酵會不完全,量太多則會釀出苦啤酒,但酵母菌是活的有機體,在瓶子裡的菌落會不斷倍增,因此,很難算清楚確實數量,在當時,研究人員的做法是由瓶子中取出一些麥芽漿樣本,放在顯微鏡下計算酵母菌數目,但是這樣的測量方法準確度如何呢?
回到統計法……………
量測對象為樣本中的酵母菌數目,但大家想知道的是整個瓶子裡的酵母菌濃度。(以一個樣本的平均值推計母全體的平均值)
後來,戈斯特發現酵母菌的數目是卜瓦松(Poisson)分布,就設計出相關的規則和量測方法,更精確地估計酵母菌的濃度,因此,他想找一份適當的期刊發表自己的結果,但公司的政策是為避免商業機密公開,不准員工對外發表文章。在當時,戈斯特和《生物統計》期刊的主編皮爾生(近代統計之父)是好友,便決定以匿名方式發表這篇論文,因此戈斯特的第一項發現,就是以「學生」(student)的名義發表。
其後30年,「學生」寫了一系列極重要的論文,幾乎都發表在《生物統計》上,吉尼斯公司始終不知道「學生」的真實身份,直到他1937年意外死於心臟病時,他一干數學界的好友群聚在吉尼斯公司,想集資為他的論文出專書,公司才恍然大悟…

1 則留言:

  1. 原來t-test還有這樣的小故事阿
    雖然這裡不是笨版,但是看這裡也可以長知識喔~

    回覆刪除