DeepSeek会在农历新年期间再投下重磅炸弹吗?官方披露测试新模型结构

DeepSeek会在农历新年期间再投下重磅炸弹吗?官方披露测试新模型结构

2月13日,澎湃新闻记者获悉,DeepSeek网站/APP正在测试一种新的支持100万上下文的长文本模型结构。其API服务在V3.2中保持不变,仅支持128K上下文。官方透露,正在测试新的模型结构(数据图)。外界也认为,DeepSeek可能会在今年春节期间再次推出新机型,再现去年春节的现象。今年 1 月 12 日,DeepSeek 发表了一篇新论文,《Conditional Memory using Scalable Search: A New Sparsity Axis for Large Language Models》。作者之一是梁文峰。本文由北京大学和 DeepSeek 联合完成。根据分析,本文的核心直接指出了当前大规模语言模型的记忆“缺陷”,并提出了“条件记忆”的概念。当时,外界普遍猜测业内人士透露,DeepSeek的下一代型号V4将于今年春节前后正式推出。 12月1日,DeepSeek推出了该模型的两个正式版本:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。所有官方网站、应用程序和API均已更新至DeepSeek-V3.2正式版本。 Speciale 版本目前仅作为临时 API 服务提供,用于社区评估和研究。报告称,DeepSeek-V3.2的目标是平衡推理能力和输出持续时间,使其适合日常使用,例如问答场景和常见(智能)代理任务场景。在公开推理基准测试中,DeepSeek-V3.2达到了GPT-5的水平;仅比Gemini-3.0-Pro低一点点。与Kimi-K2-Thinking相比,V3.2的输出长度显着减少,从而显着降低了计算开销和用户延迟。作为大规模模型的天然基准,DeepSeek的一举一动都引起业界的关注。网易有道词典公布2025年度词汇,“deepseek”以8,672,940次年度搜索量入选。据有道词典工作人员介绍,“deepseek”在词典中的搜索曲线呈现出明显的爆发特征。自从今年早些时候“低成本”打破了计算能力锁定以来,几乎每一项重大进步都会推动搜索量的增加。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储系统服务。
请注意:以上内容(包括照片和图片,如有视频)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。
以“二次元”为主题的新版异世界是对MiHoYo“潮流”印象的回答”/> 主站 Shopping中心论坛 自由职业者登录 新注册 以“二次元”为主题的新版异世界,是对miHoYo“潮流”印象的答案……

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注