中國人首獲國際統(tǒng)計大獎10月9日晚,2025世界統(tǒng)計大會在荷蘭海牙舉行,明尼蘇達大學統(tǒng)計學院教授鄒暉和斯坦福大學教授Trevor Hastie(特里瓦·哈斯蒂)共同獲頒2025年統(tǒng)計學奠基人獎。鄒暉也成為首位獲得統(tǒng)計奠基人獎的中國人。 統(tǒng)計學奠基人獎是國際統(tǒng)計學會(ISI)的最高獎之一,旨在表彰對統(tǒng)計理論、方法、實踐或應(yīng)用產(chǎn)生深遠影響的研究成果。獲獎論文或著作必須是近三十年內(nèi)發(fā)表的研究論文或書籍。評選委員會由來自世界各地的知名統(tǒng)計學家組成。 據(jù)了解,統(tǒng)計學奠基人獎每兩年評選一次。在2021年之前,該獎以統(tǒng)計學創(chuàng)始人之一卡爾皮爾遜的名字命名。首屆卡爾皮爾遜獎于2013年在香港召開的世界統(tǒng)計大會上頒發(fā)。2021,國際統(tǒng)計學會(ISI)決定重新命名該獎項,以紀念統(tǒng)計學的眾多奠基者。 鄒暉此次獲獎的主要原因,是其于2005年和Hastie教授在英國皇家統(tǒng)計學會會刊上刊發(fā)文章 《通過彈性網(wǎng)絡(luò)進行正則化和變量選擇》,該文被引23000余次。這也是英國皇家統(tǒng)計學會會刊創(chuàng)刊以來引用最多的五篇論文之一。 自2000年以來,隨著生物科技、通信技術(shù)以及互聯(lián)網(wǎng)的突破性發(fā)展,研究者能夠采集大量的研究對象的信息指標。統(tǒng)計學上將這些指標稱為“變量”。當變量的數(shù)量非常龐大時,得到的數(shù)據(jù)被稱為“高維數(shù)據(jù)”。 面對高維數(shù)據(jù),許多傳統(tǒng)的統(tǒng)計方法,包括經(jīng)典的回歸分析方法,不僅難以建立具有良好預(yù)測能力的模型,更無法解決高維數(shù)據(jù)中至關(guān)重要的可解釋性問題。舉例來說,研究者希望利用個體的上萬個基因表達信息,預(yù)測其是否患有某種疾病。一個理想的模型不僅要具有較高的預(yù)測準確率,還應(yīng)能識別出哪些基因與疾病的發(fā)生直接相關(guān)。 此外,高維數(shù)據(jù)統(tǒng)計建模面臨的一大挑戰(zhàn)是計算效率。因為模型參數(shù)通常通過優(yōu)化預(yù)測性能來估計,而高維數(shù)據(jù)優(yōu)化問題往往非常耗時。 2002年,作為博士生,鄒暉師從Trevor Hastie,敏感地關(guān)注到了高維數(shù)據(jù)遇到的困擾。當時套索法似乎是最好的方法。套索法是現(xiàn)代統(tǒng)計里的一個重要的發(fā)明,這項成果也在2021年獲得統(tǒng)計奠基人獎。但Trevor Hastie發(fā)現(xiàn),面對高維數(shù)據(jù),套索法預(yù)測效果不佳,而且選擇的變量很不穩(wěn)定,但當時也沒有找到好的解決方案,于是將這個任務(wù)布置給了鄒暉。經(jīng)過探索,鄒暉找到了套索法的問題癥結(jié),并給出了相應(yīng)的解決方案。Hastie第一時間肯定了鄒暉的方案,同時構(gòu)思了方法的名字——彈性網(wǎng)。 鄒暉介紹,彈性網(wǎng)同時兼顧三個目標:良好的預(yù)測性能、有效的變量篩選以及較低的計算復(fù)雜度,提供了一個高效的高維度數(shù)據(jù)回歸建模的解決方案。使用者可以快速地得到一個預(yù)測精度高且解釋性好的統(tǒng)計模型用于各種復(fù)雜數(shù)據(jù)建模分析。目前該方法已被廣泛應(yīng)用于高維數(shù)據(jù)分析。 鄒暉本科畢業(yè)于中國科學技術(shù)大學少年班,博士畢業(yè)于斯坦福大學統(tǒng)計系。 |




