首頁>資訊 >
清華姚班陳丹琦獲斯隆獎,與去年得主馬騰宇是同班同學(xué),博士畢業(yè)論文是近十年最熱之一 2022-02-16 14:53:20  來源:36氪

清華姚班大神陳丹琦,剛剛有了最新榮譽(yù)。

斯隆研究獎得主。

斯隆研究獎,素來有“諾獎風(fēng)向標(biāo)”的稱號。

獲得這個獎項的研究者,將得到為期兩年75000美元的獎金。

此前,與陳丹琦同為姚班畢業(yè)生的鬲融、馬騰宇,都曾因獲此獎項而引發(fā)關(guān)注。

說回到陳丹琦本人,正是計算機(jī)科學(xué)領(lǐng)域近來最受關(guān)注的華人青年學(xué)者之一。

她是08級清華姚班校友,也是信息學(xué)競賽圈內(nèi)頗具傳奇色彩的一位女選手——CDQ分治算法就是以她的名字命名。2008年,她代表中國隊斬獲一枚IOI金牌。

而她那篇長達(dá) 156 頁的博士畢業(yè)論文《Neural Reading Comprehension and Beyond》,更是一度火爆出圈。

不光獲得當(dāng)年斯坦福最佳博士論文獎,還成為了斯坦福大學(xué)近十年來最熱門畢業(yè)論文之一。

現(xiàn)在,她已前往普林斯頓大學(xué)從頭搭建NLP小組,成為該校計算機(jī)系的助理教授。

從零搭建NLP小組

此次獲獎的原因,正是基于陳丹琦在NLP領(lǐng)域的成就與潛力。

目前研究方向主要聚焦在兩方面。

一個是開發(fā)基本的方法來學(xué)習(xí)語言和知識表征,以及它們之間的相互作用。尤其是兩個問題:對人類知識(比如陳述性、常識性)如何從文本中獲得,以及智能系統(tǒng)如何表示、檢索、推理、使用這些知識。

另一個是建立實用的系統(tǒng),包括問題問答、信息提取和對話代理,尤其是如何將這些方法推廣到現(xiàn)實場景中去。

她的小組成員中,有一位也是清華畢業(yè)生,2019年清華特獎得主高天宇。

最新一篇研究,他也參與其中。

這篇研究提出了一種全新評估機(jī)制——基于預(yù)測歷史的問題重寫機(jī)制,該機(jī)制可以跟人類的判斷形成更好的關(guān)聯(lián),讓對話問答(CQA)效果更好。

來到普林斯頓大學(xué)之前,她曾是斯坦福大學(xué)的博士研究生,師從NLP大神Christopher Manning。

這可是位泰斗級別的人物,他是斯坦福NLP小組的創(chuàng)始人。

他寫的書籍《Foundations of Statistical Natural Language Processing》(統(tǒng)計自然語言處理)和《Introduction to Information Retrieval》(信息檢索導(dǎo)論),幾乎是每個NLPer的必讀入門書。

在Manning教授的指導(dǎo)和學(xué)習(xí)下,2014年她發(fā)表了一篇《A Fast and Accurate Dependency Parser using Neural Networks》,可以說是深度學(xué)習(xí)依存分析方法的“開山之作”。

他們的方法在保持精度的前提下,直接將解析速度提高了 60 倍。

而她在學(xué)術(shù)界的影響力還在繼續(xù),最典型的就是在博士畢業(yè)之際寫的那篇156頁論文,上線僅四天就獲得上千訪問量。

這篇論文主要聚焦于神經(jīng)閱讀理解,簡言之,就是構(gòu)建于深度神經(jīng)網(wǎng)絡(luò)之上的閱讀理解模型。包含了闡述原理構(gòu)建模型、以及結(jié)合現(xiàn)有成果構(gòu)建實際應(yīng)用場景兩個部分。

去斯坦福拜入NLP泰斗門下,之后再去普林斯頓搭建NLP小組,回想這兩段經(jīng)歷,陳丹琦曾這樣解釋她做出選擇的原因。

陳丹琦告訴叉院學(xué)姐公眾號:

我選斯坦福的時候其實不太知道自己要做什么,是后來選了research group才定的方向。

去普林斯頓是因為我認(rèn)為對我來說這是個機(jī)會,一個成長和承擔(dān)的機(jī)會。

因為普林之前沒有NLP,能在這邊能建立一個自己的group。

算法以她的名字命名

每次提到清華姚班,一定都少不了陳丹琦的名字。

事實上回顧她的整段經(jīng)歷,如今的成就少不了她自身的努力和周遭的支持。

她出生于湖南長沙,高中就讀于長沙市雅禮中學(xué)。

這所學(xué)校是信息學(xué)奧林匹克競賽強(qiáng)校,歷史上一共9名學(xué)生獲得過IOI(國際信息學(xué)奧林匹克競賽)金牌,比以“信息學(xué)競賽第一校”著稱的紹興一中還要多一名。

而陳丹琦就是在2008年——高三的時候拿下了第20屆IOI金牌,也成為了湖南省首位金牌女選手。

并以此保送到清華姚班,與馬騰宇、余佳俊等成了同學(xué)。

據(jù)雅禮中學(xué)報道,陳丹琦的父親陳擎是國防科技大學(xué)數(shù)學(xué)系的副教授。

他在陳丹琦很小的時候就發(fā)現(xiàn)女兒對數(shù)字很敏感,且做題速度、思考問題的全面性都比同齡孩子厲害。

于是,父親就對她進(jìn)行了有意識的培養(yǎng):她從三年級就開始練奧數(shù),初一參加全國數(shù)學(xué)聯(lián)賽就獲得了湖南賽區(qū)二等獎,初三獲得了特等獎,并開始接觸信息學(xué)。

奧賽圈耳熟能詳聞的“CDQ分治算法”就是這位學(xué)霸在集訓(xùn)期間提出來的,并以她的名字命名。

還有著名的插頭DP,也是她在集訓(xùn)隊時的成果。

基于這個工具,她還發(fā)表了篇論文《基于連通性狀態(tài)壓縮的動態(tài)規(guī)劃問題》。

據(jù)當(dāng)時報道,在學(xué)習(xí)之余,她也很會放松自己,最愛看《名偵探柯南》,還練得了一手好行書。

也正是在這一段奧賽征程中,她遇到了自己未來的丈夫——俞華程。還在博士畢業(yè)論文中狠狠秀了一波恩愛。(手動狗頭)

嗯,就是下圖最右邊這位帥小伙。

陳丹琦在致謝部分表示,她從15歲(上高一時)就認(rèn)識了他,從高中的競賽到清華的本科四年,再到一起去斯坦福讀計算機(jī)博士,最后在博士畢業(yè)前四個月結(jié)婚,俞華程一直都是他最好的朋友、最敬佩的人。

而俞華程本人,也很厲害,他在斯坦福大學(xué)讀博期間,因為發(fā)表多篇重要論文而提前2年畢了業(yè),隨后在哈佛大學(xué)做博士后研究,主要關(guān)于理論計算機(jī),最后也成為了普林斯頓大學(xué)的助理教授。

除了這些經(jīng)歷之外,陳丹琦還不止一次呼吁女性也要更多參與到理工、計算機(jī)學(xué)科建設(shè)當(dāng)中來。

她曾在“叉院學(xué)姐”采訪中表示:

不要刻意強(qiáng)調(diào)女生不擅長學(xué)工科、計算機(jī)這個事情。

男女之間的GAP會越來越不存在。

計算機(jī)領(lǐng)域還有多位華人獲獎

本次斯隆獎一共有118名來自化學(xué)、數(shù)學(xué)、物理、計算機(jī)等領(lǐng)域的科學(xué)家獲得。

其中,計算機(jī)領(lǐng)域一共頒給了20名全球科學(xué)家,其中包括5位華人,而華人獲獎?wù)咧校?strong>最多的是來自清華的校友,除了陳丹琦還有:

07級清華電子工程系本科、現(xiàn)CMU助理教授方飛。

她博士畢業(yè)于美國南加州大學(xué),主要研究方向為博弈論和機(jī)器學(xué)習(xí)。

03級清華自動化專業(yè)本科、控制科學(xué)與工程專業(yè)碩士畢業(yè)生、現(xiàn)UCLA助理教授顧全全。

他的研究方向為統(tǒng)計機(jī)器學(xué)習(xí),重點(diǎn)是開發(fā)和分析用于機(jī)器學(xué)習(xí)的非凸優(yōu)化算法,ICML 2021年他有8篇論文都被接收。

還有兩位華人獲獎?wù)邽椋?/p>

港科大校友宋舒然,現(xiàn)哥倫比亞大學(xué)助理教授,主要研究計算機(jī)視覺與機(jī)器人技術(shù)。

以及現(xiàn)UIUC教授Li Bo,她的研究方向為機(jī)器學(xué)習(xí)及其安全、隱私和博弈論。

而在計算機(jī)科學(xué)方向之外,本次斯隆獎有6名華人學(xué)者獲數(shù)學(xué)獎,其中2名來自北大數(shù)院,另有3名獲物理獎。

參考鏈接:

[1]https://sloan.org/fellowships/2022-Fellows

[2]https://antkillerfarm.github.io/dl/2018/01/17/Deep_Learning_31.html#%E6%A6%82%E5%86%B5

[3]https://stacks.stanford.edu/file/druid:gd576xb1833/thesis-augmented.pdf

[4]https://www.emnlp2014.org/papers/pdf/EMNLP2014082.pdfhttps://arxiv.org/abs/2112.08812

[5]https://mp.weixin.qq.com/s/q_IkEt3NhwtJIkKDr6OhNA

本文來自微信公眾號“量子位”(ID:QbitAI),作者:楊凈 豐色,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 畢業(yè)論文 同班同學(xué)

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片