日韩日韩日韩日韩无码,久久99蜜桃精品久久久久

盤古大模型3.0來了！華為重大發(fā)布：將重塑千行百業(yè) 2023-07-08 11:00:04　　來源：21世紀經濟報道

2023年，大模型的大競爭時代開啟，目前全球已經有數百個大模型亮相，而戰(zhàn)場上的主角們還在不斷進化。

7月7日，在華為開發(fā)者大會2023（Cloud）上，華為云發(fā)布了盤古大模型3.0版本。華為常務董事、華為云CEO張平安表示，盤古大模型“不作詩，只做事”，將重塑千行百業(yè)。

事實上，華為對大模型的探索很早就開啟，2019年~2020年，盤古大模型就已在華為云內部立項，并且完成了與合作伙伴、高校的合作搭建。2021年4月，華為云盤古大模型正式對外發(fā)布。

(資料圖)

從盤古大模型面世之初，就主要面向盤古大模型3.0是一個面向行業(yè)的大模型系列，包括“5+N+X”三層架構，分別是基礎大模型、行業(yè)大模型、專用大模型。

2021年，盤古的多模態(tài)大模型、科學計算大模型還在規(guī)劃中，如今的3.0版本，盤古的大模型體系已經頗為豐富。不僅從基礎通用大模型發(fā)展出行業(yè)大模型，還針對細分場景提供更細致的大模型服務。

張平安在會后接受21世紀經濟報道等媒體采訪時表示，對于盤古大模型的下一步計劃，內部有非常激進的roadmap（路線圖）。在盤古大模型的發(fā)展上，有團隊在研究有更多參數讓AI大模型發(fā)展更好，也有團隊在研究將參數通過量化，以更少的算力需求來滿足服務。另外更重要的是，現在華為云已經在鐵路、煤礦、金融等行業(yè)里做了模型，在行業(yè)的垂直深度還要更深一些。

盤古大模型3.0來了

張平安介紹道，最新版本的盤古大模型共有三層架構。其一為基礎大模型（L0層），主要提供通用技能，支撐企業(yè)各類應用，具體包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎大模型。

在參數方面，盤古3.0提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型，匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。

同時，大模型也提供一致的能力集，包括NLP大模型的知識問答、文案生成、代碼生成以及多模態(tài)大模型的圖像生成、圖像理解等能力，這些技能都可以直接調用。

對于基礎大模型的煉成，華為的技術專家在會上指出，盤古大模型的特色是可伸縮、高可擴展的稀疏-稠密語言大模型，在數據訓練方面，預訓練數據超過3萬億個token（AI大模型的數據單位），指令微調數據的規(guī)模在千萬級。

基礎大模型之外，第二層架構是N個行業(yè)大模型（L1層），華為云既可以提供使用行業(yè)公開數據訓練的行業(yè)通用大模型，包括政務，金融，制造，礦山，氣象等大模型；也可以基于行業(yè)客戶的自有數據，在盤古大模型的L0和L1層上，為客戶訓練自己的專有大模型。

在此基礎上，華為云還提供了大模型行業(yè)開發(fā)套件，通過對客戶自有數據的二次訓練，客戶就可以擁有自己的專屬行業(yè)大模型。同時，根據數據安全與合規(guī)訴求，盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。

華為云人工智能領域首席科學家、國際歐亞科學院院士、IEEE/CAAI Fellow田奇談道，通用大模型在落地行業(yè)上面臨三大挑戰(zhàn)，分別是知識雖多、價值挖掘快但數據安全難保障、通用性強但專業(yè)性弱。

而盤古大模型通過分層解耦架構從而更好應用到千行百業(yè)，從基礎大模型迭代出行業(yè)大模型。田奇表示，實現行業(yè)大模型有四大關鍵舉措，分別是沉淀行業(yè)知識、淬煉行業(yè)技能、對話專業(yè)工具和保障安全合規(guī)。

行業(yè)大模型之上就是N個專用大模型（L2層），提供了更多細化場景的模型。比如，更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景，提供“開箱即用”的模型服務。

而大模型的發(fā)展離不開算力，在大會上，華為云宣布推出昇騰AI云服務，并在烏蘭察布和貴安同時上線。據悉，昇騰AI云服務可以提供更長穩(wěn)的AI算力服務，達到每秒200億億次浮點運算能力，千卡訓練30天長穩(wěn)率達到90%，斷點恢復時長不超過10分鐘。

張平安表示，華為要構建AI算力的另一極，“現在有數百個項目在排隊，算力都來不及建設，GPU價格高、交貨周期很長，中國算力緊缺，滿足不了需求。華為首先在中國先立足和扎根，滿足中國行業(yè)客戶的需求，立志成為算力的另一極。”

行業(yè)大模型深入應用

事實上在OpenAI引爆熱潮之前，華為等大企業(yè)就已經在鉆研AI大模型，此前幾年大模型在學術界早就是熱門話題，2023年才徹底引燃大眾市場。

對于華為而言，人工智能自然是必爭之地，云、計算都是華為升級轉型的重要方向。一方面，華為云盤古大模型并非今年才進入市場，而是已經歷經迭代根據業(yè)務的需求發(fā)展而來，并且已經形成一個系列。

另一方面，需要指出的是，盤古大模型和ChatGPT并非在一個賽場，它們屬于兩個概念。ChatGPT是GPT系列大模型的一個應用場景，可以直接面向C用戶群體，而盤古大模型的應用場景更多聚焦在B端的千行百業(yè)，華為本身B端起家，在產業(yè)端有天然的優(yōu)勢和稟賦。

此前，田奇向21世紀經濟報道記者表示：“AI是華為云的核心競爭力之一，我們持續(xù)在AI領域投入研發(fā)，大模型是AI的重要技術方向。未來三年，我們認為將會是大模型是風起云涌的三年，AI將會和各行各業(yè)深度結合，AI for industries將是我們的主要方向?！?/p>

目前，盤古大模型已在政務、金融、制造、煤礦、鐵路、制藥、氣象等諸多領域進行深耕。比如在政務領域，華為云攜手深圳市福田區(qū)政務服務數據管理局，上線了基于盤古政務大模型的福田政務智慧助手。在煤礦領域，盤古礦山大模型已經在全國8個礦井規(guī)模使用，一個大模型可以覆蓋1000多個細分業(yè)務場景。

在制造領域，過去單產線制定器件分配計劃，往往要花費3個小時以上才能做齊1天的生產計劃。盤古制造大模型學習了華為產線上各種器件數據、業(yè)務流程及規(guī)則以后，能夠對業(yè)務需求進行準確的意圖理解，并調用天籌AI求解器插件，1分鐘即可做出未來3天的生產計劃。

在氣象領域，盤古氣象大模型是首個精度超過傳統(tǒng)數值預報方法的AI預測模型，同時預測速度也有大幅提升。原來預測一個臺風未來10天的路徑，需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真?，F在基于預訓練的盤古氣象大模型，通過AI推理的方式，研究者只需單臺服務器上單卡配置，10秒內就可以獲得更精確的預測結果。

7月6日，國際頂級學術期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團隊研究成果——《三維神經網絡用于精準中期全球天氣預報》（《Accurate medium-range global weather forecasting with 3D neural networks》）。數據顯示，這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文。

眼下，國內外的巨頭們都已經在大模型賽場上落子，隨著AI產業(yè)“iPhone時刻”的到來，AI如何融合產業(yè)進行升級變革、如何進行商用也將備受關注，產業(yè)界也更加期待中小開發(fā)者們也像雨后春筍一樣涌現，構建起更完善的AI生態(tài)。

大模型成為WAIC最火關鍵詞

7月6日至8日，2023世界人工智能大會（WAIC）在上海舉辦。本屆大會聚焦科學前沿和產業(yè)發(fā)展，首次設置“邁向通用人工智能”主題展區(qū)，集中展示國內外總計30多款大模型，大模型成為今年WAIC的最火關鍵詞。

（文章來源：21世紀經濟報道）

關鍵詞：