![]()
从“知识顾问”到“执行合作伙伴”,大型中国模式在天气中迈出了一步。 01Deepseek-v3.1发行了。如今,中国人工智能研究公司DeepSeek已正式启动了最新的开放资源模型-DeepSeek -V3.1。这不仅是从6,710亿升至6850亿升的1个技术改进,也是迈向代理周期的第一步。新模型引入了理解的混合体系结构,支持首次考虑相同模型的思维模式和模式,从而使思维压缩链的效率提高了20%-50%,并显着增强了工具和代理活动的使用。 DeepSeek-v3.1是使用专家组合(MOE)的巨型模型,具有6850亿个参数。该设计使每个令牌只能激活370亿个参数,从而在效率和性能之间达到平衡。新模型支持变量OUS的男高音格式,包括BF16,FP8(F8_E4M3)和F321,它们在硬件维修方面具有灵活性。值得一提的是,v3.1使用EE8M0 FP8比例参数的准确性,这对模型性能产生了重大影响。主要模型继续以V3基础2训练840B令牌,而这种大型训练进一步扩大了模型环境的长期处理。 02 DeepSeek-V3.1 Revolution的现代技术,混合推理结构和卓越性首次引入了混合推理的建筑,允许相同的模型移动Freeelyan“ DeepSeek-Reaserer”和“非思维模式”(DeepSeek-Chat)。用户可以使用单击官方应用程序或网页中的“深思熟虑”按钮移动 - 而不是思考模式:有关简单查询(例如天气,百科全书),直接输出 - 流程的结果,并且响应速度提高了20%; ·思考模式:应对复杂的问题(例如数学证明,代码奉献),激活推理链的内部深度,并且输出逻辑更为严格,但响应稍慢。该设计以传统的“一定程度合适”推理逻辑的模型结束,并意识到了需求资源的提供。通过训练思维链的压缩,v3.1在维持工作绩效的同时,v3.1减少了20%-50%的输出令牌(例如AIME数学竞争中的87.5分,而GPQA科学测试中的81分)。 R1-0528一代的先前模型需要1,000个令牌活动,而v3.1仅需要500个令牌才能完成相同的输出质量,从而大大降低了计算成本成本和响应延迟的成本。此外,v3.1将上下文窗口扩展到128K令牌(约130,000个汉字),该窗口可以处理一次“红色大厦的梦想”梦想“ Dream”会议的前80章或3小时分钟。03Think Think Revolution革命,最令人兴奋造成DeepSeek-V3.1的恢复建筑是混合推理体系结构。该设计使一个模型能够支持思想和难以想象的模型,最初使与用户的AI联系。现在,用户可以通过官方应用程序和网页上的“深思熟虑”按钮在两种模式之间自由移动。在需要复杂推理的活动中,实现思维模式可以使模型更深入地思考并产生更准确的结果。 API接口也同时升级,DeepSeek-Chat对应于非思想模式,DeepSeek-Reasioner对应于心态,都支持128K上下文的长度。该设计为开发人员提供了更多的选项,并且可以根据应用程序方案的要求选择最合适的模型。同时,DeepSeek-V3.1在精神效率方面取得了重大突破。测试结果表明,在压缩链中进行思考之后,当输出令牌数量降低20%-50%时,每个任务的v3.1-思维的平均性能与R1-0528相同。在许多基准测试中(包括AIME 2015:87.5/88.4,GPQA:81/80.1,LiveCodeBench:73.3/74.8),v3.1-思想,可以显着降低令牌消耗,同时保持绩效的效果。提高此效率意味着更快的响应速度和降低计算成本。对于完成用户,它可以转化为更好的体验;对于那些发展的人,这意味着较低的API呼叫成本。由于V3/R1,该行业的重要性,代理商时期的“阻止机器”的重要性是“与顶级模型相当的小型计算能力”而闻名,并且v3.1进一步证明了能力NG代理不需要一大堆公路的计算机强度-10亿美元。 “轻巧和高性能”路径为世界各地提供了中小型开发人员,有可能参与T他的竞赛。根据Dongwu证券的预测,2028年的8520亿元人民币(每年的复合增长率为72.7%)将到达AI代理。 V3.1和MIT协议的开源和API接口协调降低了致电业务的成本(输入0.5元/百万个代币,输出12元/百万个代币),并加速了金融,医疗,办公室和其他情况下的代理商实施。重要的是v3.1促进了从“独家”到“低代码”的代理开发。例如,诸如Coze之类的平台结合了代理技术,以使普通用户能够开发出智能的身体。开放式DepSeek资源的方法使开发人员能够根据v3.1快速组织行业代理,以缩短开发周期。 05价格上涨,DeepSeek-V3.1的价格调整令公众感到惊讶。虽然v3.1模型正式发布了v3.1模型,但它宣布将对API C进行结构调整从9月6日起的所有价格:当错过缓存时,投入的价格从2元到4元/百万个令牌上涨,产出价格从8元到12元/百万个代币,而晚上则是纪律。价格上涨的直接原因是技术升级引起的成本增加。 v3.1 Train 840B在基本v3上的代币,UE8M0 FP8的准确性可用于适应下一代国内芯片,R&D投资是Tu Tuit的伟大。同时,即使扩展了128K上下文窗口可以提高长文本处理功能(例如审查代码基础和超级合同审查),它也促进了单个识别的计算强度的消耗。更深入的是业务策略的转移。以前,该行业的底线是0.5元/百万个令牌的库的价格,持续降价的空间有限。在每月活跃用户达到1.63亿(直到2025年6月)中,DeepSeek搬家d从用户扩展期到价值开发期。价格上涨实际上是用户筛选:通过窃取价格,它专注于愿意付款的开发人员和企业用户,并促进该行业从“争夺Mabpoor价格竞争”以“争夺能力”。在行业层面,这种配置可以以“损失货币损失并获得国内大型模型”结束。如果Baidu,Alibaba和其他制造商遵守,它可以促进市场以在技术溢价方面达成共识并促进行业的健康。该有效性“达到DeepSeek -V3.1价格的维修并不意味着商业测试,而是对技术价值和市场定位的校准。当大型模型从聊天工具到生产力工具推进时,合理的价格系统是维持生态的关键。-它的思维和快速反应是实用AI的未来。” - 未来值得。”从“知识顾问对“执行合作伙伴”,大型中国模式在天气中迈出了一步。