當前位置:首頁 » 歷物理化 » 生物統計論文

生物統計論文

發布時間: 2025-05-06 11:03:39

⑴ 卡爾·皮爾遜卡爾·皮爾遜在統計領域的貢獻

在19世紀90年代以前,統計學的發展尚處於初級階段,數據收集、整理和分析面臨諸多限制。卡爾·皮爾遜在生物學家高爾登和韋爾頓等人的啟發下,於90年代初開始了對生物統計學的深入探索。他堅信,對生物現象進行定量研究至關重要,他致力於將進化論從定性描述提升到數量化和定量分析的層次。皮爾遜在概率論領域,特別是賭博機遇理論的基礎上,引入了新概念,將生物統計方法擴展為通用的統計資料處理方法,對統計方法論進行了發展,實現了概率論與統計學的融合,被譽為現代統計科學的奠基人。


皮爾遜的主要貢獻包括:


  1. 他開創了一般化的次數曲線體系,挑戰了正態分布的主導地位。他根據高爾登的優生學統計,發表了《關於不對稱曲線的剖析》等論文,提出了包括正態、矩形、J型、U型在內的13種曲線,打破了「唯正態」的觀念,推動了次數分布曲線理論的發展。

  2. 他提出了卡方檢驗,通過卡方統計量來檢驗實際值與理論值的差異,確認觀察數據與期望值的顯著性,這一方法在現代統計理論中占據重要位置。

  3. 發展了相關和回歸理論,推廣高爾登的相關結論,引入了皮爾遜積動差公式等,為解決復回歸問題提供了方法論基礎。

  4. 強調個體變異性和變異數據處理,提出「標准差」概念,深化了對生命變異性的理解。

  5. 他推導出統計學上的概差,即「頻率常數」,這是對統計抽樣變異性的重要改進。



皮爾遜還發明了二項分布的測量裝置,並研究了算術平均數、眾數和中位數的關系,發現它們在特定分布下的關系。在第一次世界大戰期間,他將統計應用於戰爭計算,戰後回歸學術研究,尤其是在倫敦大學學院講授統計學史。皮爾遜的貢獻深遠影響了整個西方統計學界,他獲得了皇家學會會員等眾多榮譽。




(1)生物統計論文擴展閱讀

卡爾·皮爾遜(Karl Pearson,1857-1936)——現代統計科學的創立者  

⑵ 生物統計學 | Fisher精確檢驗

最近論文吃緊,本來想搞搞群體多樣性的,無奈沒時間,為了保持上我這個號殘余的一點熱乎氣,今天晚上分享一篇8年前寫的舊文,主要講Fisher檢驗的,有些不盡如意的地方稍作了一點點修改,措辭、語句、參考文獻等等。

大約是2005年冬天,高中同學再寫給我的信中說他掛了一科,並且自我安慰道:「不掛科怎麼是完美的大學生涯呢?」
我那個時候還暗自慶幸自己,期末考試成績時常遊走於60-70分之間,但還沒掛過。
也許是註定要有一個「完美」的大學生涯。
就是第二個學期,即2006年夏天,我終於完美了一把,《生物統計學》掛了。
具體原因不再贅述,反正呢,你要是說是我笨我是肯定不同意的。
通過了那次補考之後,不禁暗自慶幸,終於啊,可惡的「生物統計學「與我,不僅僅是它走它的陽關道,我過我的獨木橋,而且兩者之間再也不會有任何交集,即獨立且互不相容。
然而,上天很會捉弄人,時至今日,我卻喜歡上了生物統計學,這其中原因說來話長,這里也不再贅述,總之一句話:」我是愛《生物統計學》的,可是我掛科了,難道非要自絕於社會不可了么?」

深夜的508,何其寂靜,沒有群蚊肆虐,沒有酷暑難當,真想在在整上一個通宵,無奈已經沒了本科時代的那種白天考研備戰,晚上浸淫世界盃的那種豪情,更無奈的是明天還要上班。
雖然快11點啦,但今天還是打算分享點東西再回窩睡覺。

首先介紹一種離散概率分布——超幾何分布:有N個樣本,其中m個是不合格的。超幾何分布描述了在該N個樣本中抽出n個,其中k個是不合格樣本的概率:

      

上式可如此理解: 表示所有在N個樣本中抽出n個的方式有多少; 表示在M個樣本中抽出k個的方式的總數;剩下來的樣本都是及格的,而及格的樣本有 個,剩下的抽法便有 種。兩者相乘就表示抽出k個是無效的有多少種抽法,而除以抽法總數即 就表示抽出的n個樣本中有k個不合格樣本的概率 。

1935年的一個實驗:偉大的Fisher得知一個女同事能夠從口味分辨出下午茶的調制順序,為了驗證女同事是否在吹牛,做了一個有趣的實驗:他調制了8杯茶,其中4杯先放牛奶,4杯先放茶,讓女同事分辨,分辨的結果如下表:

事實上,根據小學數學知識,在已知了 和 這兩個條件以後,b,c,d和n的值也就能求出來了,所以我們只需要計算在 已發生的情況下a=3的概率(事實上選擇a,b,c,d都可以得到同樣的效果):

接著我們可進一步的算出比表格中極端情況( 在此指Fisher的同事猜得更加准確時) 的概率:

如果全部推測對,瞎猜得到這種結果的可能是1.4%,由於此概率小於0.05,屬於小概率事件,而事實是小概率事件她都猜對了,說明她不是瞎猜的。
因此我們可以再計算出P值:

女同事如果是瞎猜的,那麼她瞎猜得到這種結果的概率為24.3%,這個概率依然很高,不屬於小概率事件,因此無法推測女同事不是胡亂猜的。
這個跟超幾何分布有什麼關系呢?哎,公式都一樣的,往裡代就是啦!
不過區別是,超幾何分布是隨機地抽取,但是本例的抽取是依據女同事的判斷抽取,但一件事情由隨機變成了有依據,那就需要利用P值來判斷這種依據的可靠性啦。

我們看一個實際的案例:
一般大眾的猜測是:大學生節食的比比男生高。因此我們設定的虛無假設為H0:大學生與男生節食的比相同,對假設為Ha:大學生節食的比比男生高。

計算P值。

這里我不再說什麼,因為P<0.01,所以大學生節食的比比男生高。

步入正題,涉及到基因組學的內容啦!
水稻項目統計了基因A位點變異與水稻是否易感稻瘟病的資料如下:

依上表,易感稻瘟病的樣本中野生型似乎遠比變異型為高,因此設定零假設為H0:基因型與稻瘟病易感性無關,備擇假設為Ha:野生型更易感染稻瘟病。則我們可依上表中的資算出單邊的p 值。

因為P<0.01,即基因A位點變異是有利突變。
業務線時代的我曾經想過下面幾條,
Fisher精確檢驗的應用如下:
1.研究基因型與基因表達的關系:如SNP與其臨近的基因表達上調/下調之間的關系
2.研究基因型與表型的關聯性:如變異位點與相關性狀的關系檢驗
3.研究表型與表型的關聯性:如男性手指的長度與前列腺癌發病率的關系

PS: 本文言語簡陋,比較粗糙,但是已盡述我的理解。
這正如上衣半截袖,下面三五七分褲,拖鞋,一身終極殺人王火雲邪神的裝備,並非華麗的西裝革履,——一看就知這是我們信息部的弟兄們的標准配置;也正如linux系統,一切皆為醜陋的命令行,雖然比不上windows那種高帥富的圖形界面,但比之醜陋的0,1似乎好看多了。
本為自用筆記,弟兄們如果喜歡,歡迎拍磚探討。

布萊特楊
2012年5月6日 22:49

備注
2012年5月6日首發於QQ空間 《我愛統計學之Fisher精確檢驗》
2020年5月18日 發表於e媛微生態 《生物統計學 | Fisher精確檢驗》

熱點內容
睿思語文 發布:2025-05-26 05:10:02 瀏覽:924
初音的歷史 發布:2025-05-25 21:37:34 瀏覽:870
女人做什麼生意好 發布:2025-05-25 19:48:13 瀏覽:643
教育部大綱 發布:2025-05-25 19:23:37 瀏覽:960
2014高考地理試題 發布:2025-05-25 18:48:51 瀏覽:712
畫角的教學反思 發布:2025-05-25 18:23:46 瀏覽:241
初三化學第一單元試題 發布:2025-05-25 17:18:36 瀏覽:173
英語地點單詞 發布:2025-05-25 16:47:05 瀏覽:848
中國地理順口溜大全 發布:2025-05-25 15:58:28 瀏覽:657
co化學式 發布:2025-05-25 15:35:28 瀏覽:825