眼看着春节假期近在咫尺,心早已飞回了老家,但这“春节前的最后一班岗”却往往最难熬——尤其是当老板突然还要你再交一份年度总结或项目汇报时。 为了帮大家守住这最后一道防线,用最快的速度搞定工作,前不久熊猫介绍过一款基于Gemini ...
前天,距离阶跃星辰发布开源基座模型 Step 3.5 Flash 仅过去两天,Datawhale 联合阶跃星辰团队带来了全网第一手深度揭秘。 这是一场关于“如何打造真正为 Agent 而生的极速模型”的技术分享,由阶跃星辰算法专家、Coding Agent 基座研发团队的吴鑫主讲。 当行业还在卷参数规模时,Step 3.5 Flash 选择了一条“高智能密度+极速推理”的非典型路径。 以下内容基于 ...
1.26-2.1 TOP10TOP1:Kilo Code Reviewer一句话描述:Kilocode(Kilo Code Reviewer)是一款自动化代码评审工具。图片来源:Product Hunt简介:Kilocode 定位为“面向工程团队的 AI 代码审查代理”,在 PR 打开或更新时自动调用你选定的模型分析 diff 和相关文件,从性能、安全、风格到测试覆盖给出结构化反馈,在人工 rev ...
在全网翘首以盼的等了两天之后,在凌晨2点。 Anthropic的新模型Cluade Opus 4.6正式更新了。 我说实话,我是真的最近因为AI圈这些模型和产品,熬夜熬的有点扛不住了。 但其实最颠最绝望的是,20分钟之后,OpenAI也发了新模型。。
在知识工作能力的评测GDPval-AA 上,Opus 4.6比OpenAI的GPT-5.2高出约144Elo分,比自己的前代Opus 4.5高出190分。这个测试涵盖了金融、法律等领域的实际工作任务,比如制作财务分析报告、起草法律文件、做市场调研等。