DeepSeek发布V3.1模型,升级混合推理架构与 Agent 能力

News2mos agorelease Crypto Navigation
171 0

币圈,8月21日消息,DeepSeek宣布推出V3.1模型,模型采用混合推理架构,支持思考与非思考模式自由切换,提升思考效率及Agent任务表现。API接口同步升级,支持128K上下文及AnthropicAPI格式,FunctionCalling新增strict模式。Base模型扩展训练至840Btokens,已在HuggingFace与魔搭开源。官方宣布9月6日起调整API价格并取消夜间优惠。

© Copyright notes

Related posts

No comments

none
No comments...