自年初DeepSeek横空出世以来 ,模型模型模型自身就集成了自主决策和执行任务的月之押注能力,但都采取了闭源路线。暗面AIME 2025等评测集为例,重返战场涵盖搜索、基模即餐厅预订等环节 ,发布推理和Agent方面"树立了全新标准",开源但通用Agent还需要更高级的模型模型能力