蛇年首個交易日A股主要指數震盪走弱,截至收盤,滬指跌0.65%報3229點,深證成指漲0.08%,創業板指跌0.04%。全天成交1.3萬億元,較前一交易日增量1727億元,全市場超3400股上漲。
盤面上,DeepSeek“現象級”火爆全球,DeepSeek概念全線大漲,安恆信息、每日互動等多股漲停;數據安全、國產軟件及軟件開發板塊走高,中國軟件等十餘股漲停。
ETF方面,萬家軟件指數ETF、軟件ETF易方達漲超9%;嘉實軟件ETF、華夏信創ETF、匯添富信創50ETF、匯添富軟件50ETF、華安軟件ETF基金、國泰軟件ETF漲超8%;招商軟件龍頭ETF、華寶大數據產業ETF、華夏數據ETF、計算機ETF南方、國泰計算機ETF、天弘計算機ETF、富國大數據ETF漲超7%。
消息面上,DeepSeek出圈,在國內外熱度持續飆升。根據AI產品榜數據,2月3日,DeepSeek APP上線20天日活超2000萬。根據Appfigures的數據顯示(不包括中國的第三方應用商店),DeepSeek App於1月26日登上蘋果AppStore全球下載榜榜首。
根據Sensor Tower的研究,該應用在谷歌Play商店美國區下載排行榜中位居榜首。Sensor Tower數據顯示,DeepSeek在發佈的前18天內累計下載量達1600萬次。
浙商證券指出,DeepSeek是攪動全球模型市場的一條鮎魚,帶來性能、價格、開源三重衝擊。
1.性能比肩國際頂尖模型:DeepSeek R1在數學、代碼、自然語言推理等任務上的性能可比肩OpenAI o1模型正式版。在AIME 2024數學基準測試中,DeepSeek R1得分率為79.8%,OpenAI o1的得分率為79.2%;在MATH-500基準測試中,DeepSeek R1得分率為97.3%,OpenAI o1的得分率為96.4%。
2.低成本顛覆市場格局:DeepSeek V3整個訓練過程僅用了不到280萬個GPU小時,相比之下,Llama 3405B的訓練時長是3080萬GPU小時。DeepSeek-V3的訓練成本僅為約557.6萬美元,而GPT-4等模型的訓練成本則高達數億美元。DeepSeek API服務定價遠低於OpenAI,以輸出為例,每百萬輸出tokens 16元(約2.2美元),GPT - o1每百萬輸出tokens 60美元。
3.踐行開源理念:DeepSeek-V3和推理模型DeepSeek-R1均開源,R1同步開源了其模型權重,並允許用户利用模型輸出,通過模型蒸餾等方式訓練其他模型。Meta首席科學家楊立昆(Yann Lecun)對DeepSeek評論“開源模型正在超越專有模型”。
ToB端應用、AI端側應用將最受益於大模型的開源趨勢、成本降低、迭代加速。春節期間,華為雲、微軟、英偉達、AWS等廠商均已上線DeepSeek的模型服務。大模型是應用軟件的基礎設施之一,隨着基礎設施的能力提升和成本下降,我們將看到應用側的百花齊放。除了DeepSeek,豆包、Qwen、Kimi等近2月都在快速升級迭代,月活提升,成本降低。我們認為,首先現有的B端應用將最先迎來AIAgent,B端應用有成熟的數據、場景,例如客服、營銷類場景會較快佈局活躍有效的智能代理服務。其次,隨着低參數模型性能翻倍,將更適用於追求低能耗的端側AI創新產品。
招商證券認為,降本是科技發展的必由之路,融合不同的架構、工程優化以及硬件的迭代才能共同促進大模型降本和性能提升。DeepSeek-R1帶來的模型優化降本雖然短期來看是對訓練側算力需求增速產生一定影響,但從AI大模型推理和應用維度對產業鏈仍將帶來較多機遇:
1.自主可控系主動和被動的共同選擇:算力芯片渠道供應緊張,自主可控適配進行時。此外,基於集羣規模較小、算力精度降低以及後續推理側爆發,國產計算、存儲及網絡芯片迎來新的機遇,建議關注自主可控產業鏈;
2.推理將成為AI產業的主戰場:IDC有望迎來推理+訓練新一輪需求爆發,海外算力租賃價格持續回暖;建議關注數據中心及配套温控&電源供應商:;此外,推理側應用的爆發會加強不同數據中心之間的數據交互需求,DCI技術的升級和網絡建設持續投入;
3. AI端側應用落地星辰大海。
新聞來源 (不包括新聞圖片): 格隆匯