字节跳动基於云雀模型开发的AI工具豆包大模型团队宣布开源SuperGPQA,具备高区分度的知识推理基准测试。该数据集覆盖285个研究生级学科,包括26,529道专业问题,涵盖主流学科,并纳入轻工业、农业及服务科学等长尾学科,填补长尾知识评估领域的空白。(ta/a) 相关内容美国2月22日初次申领失业救济人数达24.2万,高於之前的22万,预测为22.1万。