DeepSeek发布V3.1模型,升级混合推理架构与 Agent 能力
币圈,8月21日消息,DeepSeek宣布推出V3.1模型,模型采用混合推理架构,支持思考与非思考模式自由切换,提升思考效率及Agent任务表现。API接口同步升级,支持128K上下文及AnthropicAPI格式,FunctionCalling新增strict模式。Base模型扩展训练至840Btokens,已在HuggingFace与魔搭开源。官方宣布9月6日起调整API价格并取消夜间优惠。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...