首頁>資訊 >
全球速看:基于獨創(chuàng)的“數(shù)據(jù)克隆”技術(shù),南棲仙策專注通用智能決策 2023-03-15 06:01:23  來源:36氪

人工智能正在迎來新一輪的熱潮。自ChatGPT上線以來,自然語言處理的發(fā)展?jié)摿χ饾u被認可,人們開始相信人工智能具有像人類一樣智能的可能性,通往通用人工智能(AGI)的路程又近了一步。然而,深度學(xué)習(xí)泰斗、圖靈獎得主Yan LeCun認為,ChatGPT并不能做規(guī)劃決策,因此還沒有“真正的智能”,并認為通往“真正智能”的關(guān)鍵環(huán)節(jié)是“世界建?!?。有了世界模型,就可以在其中求解最優(yōu)決策。因此,在ChatGPT實現(xiàn)通用語言智能之后,進一步值得關(guān)注的人工智能領(lǐng)域是通用智能決策。

南棲仙策是一家專注研究通用智能決策的公司,由南京大學(xué)人工智能創(chuàng)新研究院技術(shù)孵化,自2019年起,基于自主探索的強化學(xué)習(xí)、環(huán)境模擬、策略遷移、深度學(xué)習(xí)等技術(shù),推動智能決策在現(xiàn)實場景落地。


(資料圖片)

在人工智能領(lǐng)域,視覺技術(shù)和自然語言處理技術(shù)都有了較大進展,但自AlphaGo在圍棋上戰(zhàn)勝人類后,決策領(lǐng)域人工智能的發(fā)展一直相對緩慢。在決策領(lǐng)域,落地的關(guān)鍵并不是決策本身,而是對任務(wù)的建模,即LeCun提到的“世界模型”,如圍棋世界就有著一套游戲規(guī)則,然而,現(xiàn)實世界很難找到直接的規(guī)則和模型。

這背后還有困擾工業(yè)場景的一個大問題——場景復(fù)雜、數(shù)據(jù)少、數(shù)據(jù)不全。工廠數(shù)字化是近幾年的產(chǎn)物,工業(yè)環(huán)境大多非常復(fù)雜,通過專家經(jīng)驗很難準確還原出真實環(huán)境模型,因此無法通過AI來真正實現(xiàn)決策控制,并且工業(yè)里的大量生產(chǎn)數(shù)據(jù)、歷史數(shù)據(jù)都是缺失的,這會影響人工智能算法訓(xùn)練所需的數(shù)據(jù)效果——有限的數(shù)據(jù)類型和范圍會影響信息處理能力,而數(shù)據(jù)量少則會限制人工智能算法的可演化空間。

南棲仙策研究了一種“數(shù)據(jù)克隆”的科技,可以實現(xiàn)從歷史數(shù)據(jù)完成環(huán)境建模的過程,它可以從有限的數(shù)據(jù)尋找出其底層的技術(shù)原理,再克隆出更多的數(shù)據(jù),幫助對決策引擎的訓(xùn)練,通過在虛擬世界中推演億萬種結(jié)果,找到通向未來的最優(yōu)決策,突破人類“有限理性”的局限,即只能基于有限信息推演出有限的決策方案。

當行業(yè)內(nèi)公司大都選擇做無模型訓(xùn)練的時候,南棲仙策選擇了一種基于“世界模型”的強化學(xué)習(xí)路線。南棲仙策創(chuàng)始人兼CEO俞揚告訴36氪,ChatGPT通過增加人工反饋的環(huán)節(jié),幫助模型學(xué)會對人價值觀的總結(jié),形成打分函數(shù),再通過最大化得分自動調(diào)整模型,使其符合人類的價值觀;與此相通的是,南棲仙策基于歷史數(shù)據(jù)抽象出系統(tǒng)背后的原理,形成打分函數(shù),再通過最大化得分自動生成大量符合原理的數(shù)據(jù),從而完成精確的建模。

當被問到?jīng)Q策引擎精準性時,俞揚表示,基于“數(shù)據(jù)克隆”的技術(shù),我們通過已收集數(shù)據(jù)生成更長時間維度的數(shù)據(jù),以此保證結(jié)果的相對精準性。而對于尚未收集到的數(shù)據(jù),如工廠高溫爆炸等極端情況下的數(shù)據(jù),則可以通過設(shè)置安全操作邊界等方式保障模型的安全性。

而這套技術(shù)也經(jīng)過了產(chǎn)業(yè)持續(xù)迭代過程中的工程積累。早在2017年,俞揚就通過該技術(shù)服務(wù)了淘寶搜索團隊,幫助其實現(xiàn)了數(shù)據(jù)驅(qū)動環(huán)境虛擬化和零試錯強化學(xué)習(xí)算法;2018年,該技術(shù)和滴滴出行合作,驗證了算法的通用性;在多年的產(chǎn)業(yè)迭代中,逐漸發(fā)現(xiàn)了融合因果反事實推斷等原理、提出環(huán)境模型因果建模等方法,核心技術(shù)完成了數(shù)十次的迭代升級。

這套通用AI決策能基于少量數(shù)據(jù)和主動學(xué)習(xí),滿足不同復(fù)雜度業(yè)務(wù)的需求;可以對億萬種結(jié)果自主推演,獲取最大效用策略, 進而提供現(xiàn)實世界自主決策;此外,落地時以低代碼設(shè)計形式存在,上手容易。

目前,南棲仙策提供的是一個軟硬件一體化的解決方案,「仙啟REVIVE」是南棲仙策基于數(shù)據(jù)驅(qū)動強化學(xué)習(xí)開發(fā)的智能決策軟件,通過導(dǎo)入歷史數(shù)據(jù),轉(zhuǎn)化為強大的決策引擎,能夠?qū)?fù)雜的決策過程梳理成可操作的業(yè)務(wù)流程,通過頂尖算法構(gòu)建“世界模型”,幫助實現(xiàn)通用性場景環(huán)境模型構(gòu)建及智能決策;硬件層面,南棲仙策的智能控制器已實現(xiàn)了和市面上常見裝備接口的連接,可以直接采集工廠已有數(shù)據(jù),也可通過安裝傳感器的方式,在不改變企業(yè)現(xiàn)有控制系統(tǒng)或單元基礎(chǔ)上實現(xiàn)不停產(chǎn)智能化改造升級。

基于環(huán)境虛擬的強化學(xué)習(xí)

在產(chǎn)品研發(fā)過程中,南棲仙策可以構(gòu)建動態(tài)虛擬環(huán)境,減少企業(yè)試驗設(shè)計中的迭代次數(shù),加快研發(fā)過程;在水務(wù)場景,南棲仙策通過強化學(xué)習(xí)的方式優(yōu)化了泵組壓力控制,能實現(xiàn)水廠泵房泵組的整體效用最大化,降低資源損耗超過10%;在資源配置場景,南棲仙策通過「仙啟」系統(tǒng)學(xué)習(xí)得到的配置策略,是候選技術(shù)中唯一超越人工配置的方案。

公司產(chǎn)品已進入成熟階段,且對焦了發(fā)力的主要場景——智慧城市的基礎(chǔ)設(shè)施,如水務(wù)、電網(wǎng)等場景,并在汽車底盤控制、藥物動力學(xué)等場景孕育新的應(yīng)用。其場景選擇的邏輯,一是尋找可復(fù)制、具有商業(yè)價值的場景;二是公司技術(shù)在該領(lǐng)域有著更好的解決效果。

由于驗證周期短,智慧水務(wù)是南棲仙策當下的主力場景,2023年,公司會朝著智慧電網(wǎng)、智慧工廠等場景拓展。以電網(wǎng)場景為例,隨著新能源加入,電網(wǎng)和電廠會有較大的波動,南棲仙策的產(chǎn)品可以幫助電網(wǎng)調(diào)度做更多智能決策。

在創(chuàng)始團隊上,公司創(chuàng)始人兼CEO俞揚是南京大學(xué)人工智能學(xué)院的教授,目前,南棲仙策共有七十多名員工,研發(fā)占比70%。在自主研發(fā)能力方面,南棲仙策的研究成果已發(fā)表在NeurIPS、ICLR等人工智能國際頂級會議,公司擁有40余項知識產(chǎn)權(quán)。公司在2023年會加大銷售團隊和業(yè)務(wù)團隊的拓展。

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片 圖片