華為發布盤古大模型3.0:“不寫詩,只做事”
日期:2023-07-08 16:02:19 / 人氣:427
編輯|佘陳曉7月7日,華為開發者大會(云)期間,華為正式發布盤古大模型3.0。華為云CEO張平安表示,與現在流行的ChatGPT不同,盤古大模型3.0是一系列完全面向行業的大模型,包括“5+N+X”三層架構:L0層包括自然語言、視覺、多模態、預測、科學計算五大基礎大模型,提供行業場景下的多種技能需求;L1層是n個行業大模型,華為云可以提供利用行業開放數據訓練的通用行業大模型,包括政務、金融、制造、礦業、氣象等大模型。也可以根據自己的行業客戶數據,在盤古大模型的L0層和L1層上,為客戶訓練自己專有的大模型。L2層提供更詳細的場景模型,專注于政府熱線、網絡助手、試點藥物篩選、傳送帶異物檢測、臺風路徑預測等特定行業應用或特定業務場景,提供“開箱即用”的模型服務。張平安介紹,盤古3.0為客戶提供了100億參數、380億參數、710參數、1000億參數的一系列基礎大模型,同時提供了一套全新的能力,包括NLP大模型的知識問答、副本生成和代碼生成,以及多模態大模型的圖像生成和圖像理解,客戶和合作伙伴可以直接調用。根據華為現場展示的氣象行業案例,在3000臺服務器的高性能計算機集群中,模擬臺風未來10天的路徑用了5個小時。在預先訓練好的盤古氣象模型的支持下,只需要在單臺服務器上配置一張卡,就可以在10秒內得到更準確的預測結果。張平安在接受媒體采訪時表示,他不想將盤古模式與ChatGPT相提并論。“聊天就是聊天,但是我們沒有時間聊天。參數再多,對話能力再好,如果不能解決實際問題也沒什么用。AI最不應該取代的就是畫畫和畫畫。這才是人類應該呈現的。為什么要給機器?”華為之所以切入行業模式,一方面是基于其過去在To B領域的經驗,另一方面也將得益于華為在計算基礎設施方面的布局。計算力是大模型不可或缺的“引擎”,盤古大模型的計算力來自于華為上升的AI集群。根據華為公布的數據,目前基于Ascension AI洶涌澎湃的計算能力,研發和適配的原創大機型已經超過30款,占國內大機型的近一半。受制裁影響,華為無法使用業界主流的GPU架構,而是推出了基于其自研達芬奇架構的AI訓練芯片Ascension系列。2019年,華為宣布Ascent 910芯片正式商用。華為當時將其描述為業界“最強大”的AI處理器。在日前舉行的世界人工智能大會上,華為宣布全面升級盛騰AI集群。集群規模從最初的4000卡集群擴大到16000卡。據華為介紹,這是業內首個Wanka AI集群,訓練速度更快,訓練周期穩定在30天以上。發布會上,華為盛騰AI云服務正式上線。據介紹,盛騰AI云服務提供2000P FLOPS的計算能力,支持主流AI框架和90%以上的算子,訓練效率比業界主流GPU高1.1倍。華為提升計算業務總裁張在接受其他媒體采訪時表示,中國對計算能力的需求非常強烈,很多大廠商都能獲得計算能力,很多小企業卻做不到。張平安還提到,目前英偉達芯片交付周期長,價格高,華為希望為業界提供另一種選擇。華為在計算基礎設施上投入了大量資金。目前,華為基于盛騰ai在上海、武漢、Xi安等25個城市建設了人工智能計算中心,提供計算基礎設施服務。張平安表示,華為在計算能力方面投入了大量資金。“如果使用(計算能力)的人少了,我們就會虧損。但不能因為現在虧損,就不投資了。我相信在我們把AI算力生成做好之后,國內很多AI算力都會用我們。現在談論好處還為時過早。”


作者:杏耀注冊登錄測速平臺
新聞資訊 News
- 腦部藥物新突破:穿越 “不可逾越...12-14
- 在非洲(肯尼亞、坦桑尼亞),中...12-14
- 李海榮辭任綠城服務董事:28年創...12-14
- 傳奇落幕:GAINAX解散,一部...12-14

