自動駕駛、圖像生成、2D轉(zhuǎn)3D……
2021年,哪些AI論文最火?又是哪些論文最具突破性?
最近一位éTS研究生、YouTube博主總結(jié)了今年AI最新突破列表,視頻、文章和代碼一應俱全。
我們從中梳理出八大類,就跟大家一起來康康~
視頻博主看過來
從中梳理最多的,當屬一些利好視頻博主的技術了。
比如,這個TimeLens,它可以制作慢動作視頻,最大范圍可從原有的30幀擴展成900幀。
再比如,這個編輯神器VGPNN——單個視頻幾秒內(nèi)多樣化生成。
像刪除或添加某人、改變背景、時間拉長、改變長寬比、分辨率等功能在它面前,都是基本操作。
還有像在不影響背景或其他對象情況下,移動圖像中的對象;使用AI分離真實世界中的聲音,語音、音樂和音效之類……
具體在畫質(zhì)處理上,今年英特爾就用英偉達顯卡做了畫質(zhì)增強補丁。今年6月,這個Demo在全網(wǎng)火了一把。
為了在GTA上效果更真實,研究人員改變了視頻中3點特征:增加汽車的光澤、改善植被的整體外觀、讓瀝青路面看起來更光滑。
對此,有網(wǎng)友表示,這比路徑追蹤便宜多了。
如果說肆掠的疫情讓視頻會議火了一把,那么視頻會議軟件讓背景替換技術搬到了臺前。
谷歌研究員就提出了一種重新光照的方法Total Relighting,來給人像做背景替換。
它能根據(jù)新添加的場景光線,重新點亮任何肖像,以此看起來更加真實。
這一方法還可進一步延伸至電影、專業(yè)視頻制作中,up主可以用起來。
此外,除了背景替換,還有文字替換,風格還保留的那種。
今年,F(xiàn)acebook提出了一種AI模型,它可以直接翻譯或編輯圖像中的文本,并且遵照同樣的風格。
類似這樣~
DALL·E領銜的圖像生成
圖像生成領域,最具突破性的當屬DALL·E——OpenAI在新年推出的“AI設計師”,吳恩達點贊的那種。
簡單來說就是,提出你的文本需求, 它來生成圖像。從原理上看,類似于GPT-3在文本合成圖像方向上的擴展版。
比如輸入“OpenAI公司門面”,它就能給出十幾張設計圖供你選擇。
還有像根據(jù)手繪草圖來生成圖像、使用隨機微分方程進行圖像合成和編輯等進展。
2D圖像生成3D模型
這是除圖像生成外,另一個2021 AI領域熱度極高的研究方向。
試想一下,如果只在現(xiàn)實生活中拍攝一張對象照片,就可創(chuàng)建3D格式將其插入視頻或者游戲中,會有多酷。
谷歌研究院提出的ShaRF就可以做到,比如隨意拍的一個椅子。
英偉達也提出了類似的解決方案GANverse3D,只需一張圖像,就可創(chuàng)建可自定義的3D動畫。
還有前段時間火爆外網(wǎng)的假3D場景,也是通過一組照片渲染出來的。
以及LASR模型——從短視頻中單拎出一個對象來,創(chuàng)建人類或動物的3D模型……類似的方法還有很多。
萬物皆可與Transformer結(jié)合
你是否想過把CNN與Transformer結(jié)合起來?
2021年,“跨界輸出”在AI領域掀起潮流。
基于CNN效率和Transformer的表達能力,德國海德堡大學的研究人員提出一種高分辨率圖像生成的方法——Tl;DR。
還不只是CNN和Transformer。
斯坦福和Facebook的研究人員提出GANsformers——基于StyleGAN2架構(gòu)中Transformer的注意力機制,來生成場景圖片。
應用層:試衣間、天氣預報
除此之外,還有原有模型基礎上應用層面的延伸。
就如谷歌提出了基于StyleGAN2架構(gòu)的改進版,創(chuàng)建了一個AI在線試衣間。
只需要提供一張你的圖像,就能自動試穿任何衣服。
還有像巴塞羅那大學的研究人員開發(fā)了一種基于深度學習,能從航拍圖像中自動檢測漂浮的垃圾,并計算數(shù)量。
為此,他們還制作了一個APP,用戶可在海面圖像中識別這些垃圾。
還有Apple提出應用在相冊的ML算法,在iOS 15上自動識別私人照片中的人;DeepMind提出了一個使用雷達深度生成模型,來更準確的預報天氣。
AI驅(qū)動的賽博朋克手臂
明尼蘇達大學的研究人員打造了一款賽博朋克手臂——AI驅(qū)動的神經(jīng)接口。
據(jù)介紹,截肢者可以像尋常人一樣靈巧的控制手臂。
編程神器:GitHub Copilot
對于開發(fā)者而言,今年最具突破性的進展莫過于編程神器——GitHub Copilot,由GitHub與openAI聯(lián)合開發(fā)。
只需描述出你想要執(zhí)行的命令,就能生成相應的代碼。
甚至程序員只要寫下一段注釋,Github Copilot就可以補全剩下的代碼、提出改進的建議,為程序員省去大量查找的時間。
特斯拉的自動駕駛
值得一提的是,這次還有特斯拉的自動駕駛?cè)脒x。
在特斯拉的AI day上,人工智能總監(jiān)Andrej Karpathy展示了特斯拉如何通過8個攝像頭來獲取圖像到道路導航的過程。
這當中包括壓縮數(shù)據(jù)、二維轉(zhuǎn)變?yōu)槿S輸出等操作。
……
除此之外,還有像面對第三次人工智能浪潮,研究人員對AI中快與慢思考;AI偽造類似“探探”個人檔案,來探討人類會不會向右滑動;Transformer是如何在CV領域取代CNN的?
感興趣的旁友,可戳下方鏈接了解更多詳情哦~
目前仍在更新當中。
GitHub鏈接:https://github.com/louisfb01/best_AI_papers_2021
本文來自微信公眾號“量子位”(ID:QbitAI),作者:楊凈,36氪經(jīng)授權發(fā)布。
- 濕地之美|廣州海珠濕地
- (熱點觀察 漫評)美國對歐洲盟友“下狠手”
- 全球微動態(tài)丨德媒文章:政治極化愈演愈烈,美國民主面臨墮落
- 每日觀察!海河觀津丨百萬候鳥來“息”,它們?yōu)楹纹珢郾贝蟾郏?/a>
- 焦點!一起來拍中國空間站!
- 焦點播報:北京新增本土感染者16例 詳情公布
- 天天快看點丨遼寧匯聚高校校友資源 引青年人才在遼創(chuàng)新創(chuàng)業(yè)
- 每日熱文:夢天成功發(fā)射!天空飄來一個字:6
- 環(huán)球最資訊丨長圖丨“院士天團”做優(yōu)“湖南飯”,該是什么味?
- 常益懷等5市州明早有大霧 出行請注意安全
- 環(huán)球動態(tài):11月全省溫高干旱持續(xù)發(fā)展
- 【全球獨家】10月制造業(yè)PMI為49.2% 建筑業(yè)景氣水平較高
- 環(huán)球今日訊!亞馬遜營業(yè)利潤率下降至2% 國內(nèi)頭部電商或進一步搶占海外市場
- 國家藥監(jiān)局:促進彩色隱形眼鏡生產(chǎn)經(jīng)營企業(yè)規(guī)范化發(fā)展
- 即時焦點:智慧芽升級科創(chuàng)力評估平臺 累計上線12條產(chǎn)業(yè)技術鏈
- 【世界熱聞】內(nèi)蒙古啟動人力資源誠信服務示范機構(gòu)評選
- 環(huán)球觀焦點:內(nèi)蒙古:這5項職業(yè)資格考試暫停
- 全球熱門:飛天圓夢|靜待夢天,中國空間站在軌建造收官在即
- 飛天圓夢|“夢天”已就位!楊利偉動情講述“初代”航天人故事
- 對標保時捷Taycan?大眾中國功勛蘇偉銘親自下場造車