DeepSeek会在农历新年期间再投下重磅炸弹吗？官方披露测试新模型结构 – 51今日大瓜每日大赛暗黑爆料免费版震撼上线

2月13日，澎湃新闻记者获悉，DeepSeek网站/APP正在测试一种新的支持100万上下文的长文本模型结构。其API服务在V3.2中保持不变，仅支持128K上下文。官方透露，正在测试新的模型结构（数据图）。外界也认为，DeepSeek可能会在今年春节期间再次推出新机型，再现去年春节的现象。今年 1 月 12 日，DeepSeek 发表了一篇新论文，《Conditional Memory using Scalable Search: A New Sparsity Axis for Large Language Models》。作者之一是梁文峰。本文由北京大学和 DeepSeek 联合完成。根据分析，本文的核心直接指出了当前大规模语言模型的记忆“缺陷”，并提出了“条件记忆”的概念。当时，外界普遍猜测业内人士透露，DeepSeek的下一代型号V4将于今年春节前后正式推出。 12月1日，DeepSeek推出了该模型的两个正式版本：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。所有官方网站、应用程序和API均已更新至DeepSeek-V3.2正式版本。 Speciale 版本目前仅作为临时 API 服务提供，用于社区评估和研究。报告称，DeepSeek-V3.2的目标是平衡推理能力和输出持续时间，使其适合日常使用，例如问答场景和常见（智能）代理任务场景。在公开推理基准测试中，DeepSeek-V3.2达到了GPT-5的水平；仅比Gemini-3.0-Pro低一点点。与Kimi-K2-Thinking相比，V3.2的输出长度显着减少，从而显着降低了计算开销和用户延迟。作为大规模模型的天然基准，DeepSeek的一举一动都引起业界的关注。网易有道词典公布2025年度词汇，“deepseek”以8,672,940次年度搜索量入选。据有道词典工作人员介绍，“deepseek”在词典中的搜索曲线呈现出明显的爆发特征。自从今年早些时候“低成本”打破了计算能力锁定以来，几乎每一项重大进步都会推动搜索量的增加。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储系统服务。
请注意：以上内容（包括照片和图片，如有视频）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。
以“二次元”为主题的新版异世界是对MiHoYo“潮流”印象的回答”/> 主站 Shopping中心论坛自由职业者登录新注册以“二次元”为主题的新版异世界，是对miHoYo“潮流”印象的答案……

发表回复 取消回复

发表回复取消回复