用质量、速度、稳定性、长任务表现和规则遵守度来评估 coding model,而不是只看宣传语。
旧赛道透镜:保留模型、agent、memory 和执行模式相关内容的历史入口,但不再承担一级知识骨架职责。