内媒报道,阿里云提出的计算池化解决方案「Aegaeon」近日成功入选顶级学术会议操作系统原理研讨会(SOSP) 2025,该方案可解决AI模型服务中普遍存在的GPU资源浪费问题,大幅提升GPU资源利用率,目前其核心技术已应用在阿里云百炼平台。
数据显示,在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的英伟达(NVDA.US) H20 GPU数量从1,192个减至213个,削减比例高达82%。GPU用量削减82%意味着公司硬件采购成本将显着降低,对於动辄使用成千上万张GPU的大型模型服务商至关重要。(jl/w)(美股为即时串流报价; OTC市场股票除外,资料延迟最少15分钟。)
AASTOCKS新闻