用AI算法幫程序員寫AI算法?或許不少程序員“你已經(jīng)是一個成熟的AI了,該學會自己補全代碼了”的心愿就要實現(xiàn)。
在今年6月份,GitHub與Open AI一同合作,推出了一款名為“GitHub Copilot”的AI工具,Copilot可以根據(jù)上下文自動補全代碼,包括文檔字符串、注釋、函數(shù)名稱、代碼,只要編程者給出一定提示,這款A(yù)I工具就可以補全出完整的函數(shù)。
GitHub Copilot官網(wǎng)
令人震驚的是Copilot還在不斷進化。在近日舉行的GitHub Universe 2021開發(fā)者大會上,GitHub官方表示Copilot已開始支持Java、C、C++和C#等語言的多行代碼完成,并增加了Neovim和JetBrains IDE,包含開發(fā)者常用的IntelliJ IDEA、PyCharm等編輯器的支持。
Copilot運行范例;來源GitHub Copilot官網(wǎng)
GitHub表示,如今新寫的30%代碼都是在AI編程工具Copilot的幫助下完成的,Copilot真的如此強大嗎?在社交網(wǎng)絡(luò)中,已有不少早早拿到了Copilot試用資格的博主分享了他們使用Copilot的感受。
來源:微博截圖
當然,除了認真寫Copilot使用體驗的博主,還有偷偷摸魚被抓個現(xiàn)著的程序員……
來源:微博截圖
Copilot雖然強大,但就和大部分人工智能工具一樣,它仍是建立在OpenAI Codex算法的基礎(chǔ)上,需要通過海量的代碼來訓練其智能程度。這對同樣有著微軟血統(tǒng)的OpenAI以及Github來說不是問題,微軟在2018年斥資75億美元收購了全球約有5000萬用戶的代碼共享網(wǎng)站Github,這意味著Copilot所依托的Codex算法接受了數(shù)十億行公共代碼的訓練。
事實早在Copilot誕生之前,OpenAI就推出1750億參數(shù)的AI模型GPT-3,GPT-3耗費了千萬美元對人類的詩歌、小說、新聞等海量自然語言進行訓練(主要是英語),也因此GPT-3對自然語言具備了一定程度的理解能力。神經(jīng)網(wǎng)絡(luò)之父Geoffrey Hinton在GPT-3出現(xiàn)后,曾這樣感慨:“生命、宇宙和萬物的答案,其實只是4.398萬億個參數(shù)而已?!?/p>
Codex就是基于GPT-3進行訓練,OpenAI 的聯(lián)合創(chuàng)始人兼首席技術(shù)官Greg Brockman曾表示Codex是 GPT-3 的后代。因此Codex也具備了將部分指令清晰的英語翻譯成代碼的能力,甚至有部分媒體宣傳Codex已經(jīng)讓程序員門檻降低到了只要會英語就能寫代碼的地步。
在官方示例的Codex效果展示中,程序員只需要在編輯界面寫下“Make it be smallish”示例上圖中的大型飛船就會如下圖一般縮小,而在這個過程中程序員并不需要輸入一行代碼,Codex會自動編寫車程序。
如今,Codex經(jīng)過無數(shù)代碼與金錢訓練出來的強大能力應(yīng)用到了AI工具Copilot上,這雖然造就了Copilot神奇的代碼補全、給出函數(shù)建議等功能,但同時也使得Copilot陷入了系列輿論爭議風波。
當Copilot受到越來越多程序員的歡迎,GitHub的CEO Nat Friedman興奮地表示:“每天都有數(shù)百名GitHub的開發(fā)者在使用Copilot,如果預(yù)覽版進展順利的話,我們將計劃在未來某個時候?qū)⑵鋽U展為付費產(chǎn)品。”
Nat Friedman的這番話讓Copilot一下沒那么香了,這意味著經(jīng)過GitHub和OpenAI的一波神操作后,收費的Copilot白嫖了全球最大的代碼共享網(wǎng)站GitHub5000萬用戶的知識成果用來商業(yè)化。這其中引起爭議的焦點就在于Copilot的版權(quán)存在開源代碼衍生品商業(yè)化GPL版權(quán)問題。GPL(General Public License)即通用公共許可證,是一系列自由軟件許可證的統(tǒng)稱,它可以用來保證用戶運行、研究、共享和修改軟件的自由。與此對應(yīng)的是,任何復(fù)制、遷移GPL版權(quán)的衍生作品都必須遵循相同或等效的許可條款。
簡單來說就是,我是開源軟件、開源代碼你隨便用沒問題,但你只要用了就也得支持開源,其它任何人也可以免費使用你的代碼或軟件。Copilot引起GitHub社區(qū)人們公憤的關(guān)鍵就是其把開源代碼洗成商業(yè)產(chǎn)品,無視了早期促進程序語言世界豐富、開放的開源精神,已有不少程序員在社交媒體上公開表示未來將不再使用GitHub來托管自己的代碼。
GitHub官方則解釋Copilot“通常不會精確復(fù)制代碼塊”,也有人認為Copilot通過海量代碼AI訓練最后得出來的結(jié)果就如同人類一樣,人類前期也需要通過學習其他人的相關(guān)知識來內(nèi)化成為自己的,很難把AI模型訓練出來的代碼簡單的理解為復(fù)制粘貼。
然而已有不少人否定了這個說法,在通過Copilot解決程序中的一些經(jīng)典問題時,會發(fā)現(xiàn)Copilot幾乎一字不差的復(fù)制粘貼了GitHub上的某段經(jīng)典代碼。這意味著在Copilot成為商業(yè)產(chǎn)品后,使用Copilot的用戶在把其代碼應(yīng)用到自家產(chǎn)品時一不小心就會中招違反GPL協(xié)議,面臨被人起訴的風險,因此,已有一些科技公司已明確要求禁止員工使用Copilot。
Copilot在實際應(yīng)用中面臨的問題不止如此,隨著程序員們對Copilot了解的逐步加深,他們發(fā)現(xiàn)Copilot并不完美,仍然存在著不少缺陷。Copilot背后的Codex既經(jīng)過大量文本語言訓練,也吸收了網(wǎng)絡(luò)世界中魚龍混雜的海量代碼,因此Copilot輸出的部分代碼或許看出去沒有那么美好,有著隱私泄露、安全風險等問題。B站大佬陳睿就躺槍了一次,雖然立刻有網(wǎng)友表示其中出生年月日信息有誤。
也有網(wǎng)友表示“Copilot 一時爽,調(diào)試火葬場”,因為想要清楚、清晰的描述出目標函數(shù)想要實現(xiàn)的功能并不簡單,同時在使用Copilot的過程中,需要不斷去回顧檢查AI生成的代碼是否正確,這反而容易干擾到編程時的原有思路。
來源:微博截圖
目前,GitHub Copilot還處于未收取任何費用的申請試用階段,互聯(lián)網(wǎng)上關(guān)于它的爭論也還在繼續(xù),隨著AI工具日益強大,人類將來面對的類似問題只會越來越多。
本文來自微信公眾號“品玩”(ID:pinwancool),作者:洪雨晗,36氪經(jīng)授權(quán)發(fā)布。
- 濕地之美|廣州海珠濕地
- (熱點觀察 漫評)美國對歐洲盟友“下狠手”
- 全球微動態(tài)丨德媒文章:政治極化愈演愈烈,美國民主面臨墮落
- 每日觀察!海河觀津丨百萬候鳥來“息”,它們?yōu)楹纹珢郾贝蟾郏?/a>
- 焦點!一起來拍中國空間站!
- 焦點播報:北京新增本土感染者16例 詳情公布
- 天天快看點丨遼寧匯聚高校校友資源 引青年人才在遼創(chuàng)新創(chuàng)業(yè)
- 每日熱文:夢天成功發(fā)射!天空飄來一個字:6
- 環(huán)球最資訊丨長圖丨“院士天團”做優(yōu)“湖南飯”,該是什么味?
- 常益懷等5市州明早有大霧 出行請注意安全
- 環(huán)球動態(tài):11月全省溫高干旱持續(xù)發(fā)展
- 【全球獨家】10月制造業(yè)PMI為49.2% 建筑業(yè)景氣水平較高
- 環(huán)球今日訊!亞馬遜營業(yè)利潤率下降至2% 國內(nèi)頭部電商或進一步搶占海外市場
- 國家藥監(jiān)局:促進彩色隱形眼鏡生產(chǎn)經(jīng)營企業(yè)規(guī)范化發(fā)展
- 即時焦點:智慧芽升級科創(chuàng)力評估平臺 累計上線12條產(chǎn)業(yè)技術(shù)鏈
- 【世界熱聞】內(nèi)蒙古啟動人力資源誠信服務(wù)示范機構(gòu)評選
- 環(huán)球觀焦點:內(nèi)蒙古:這5項職業(yè)資格考試暫停
- 全球熱門:飛天圓夢|靜待夢天,中國空間站在軌建造收官在即
- 飛天圓夢|“夢天”已就位!楊利偉動情講述“初代”航天人故事
- 對標保時捷Taycan?大眾中國功勛蘇偉銘親自下場造車
- 北京石景山開展冬季供暖前特種設(shè)備安全專項檢查
- 陜西延安:開展兒童化妝品專項檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進網(wǎng)絡(luò)直播營銷治理顯成效 培育放心消費直
- 北京延慶對重點行業(yè)開展格式條款專項檢查 做好市
- 北京海淀開展電動自行車整治夜查行動 全力保障轄
- 江蘇昆山全力規(guī)范大閘蟹市場秩序 營造安全放心消
- 福建寧化開展“兩品一械”網(wǎng)絡(luò)銷售專項檢查 保障
- 北京懷柔:開展市場綜合執(zhí)法監(jiān)督檢查 督導(dǎo)各類經(jīng)
- 天津河東:多措并舉推進企業(yè)信用修復(fù)工作 助力轄