研究者发布SWE-chat数据集,含6000个真实开发者会话、超63,000条用户提示词,发现41%为 vibe coding ,但仅44% Agent代码最终进入提交,且引入了更多安全漏洞。揭示AI编程助手在真实场景中的真实效果与局限,而非benchmark上的漂亮数字。
← 返回文章列表
AI
SWE-chat:首个真实用户Coding Agent行为数据集
研究者发布SWE-chat数据集,含6000个真实开发者会话、超63,000条用户提示词,发现41%为 vibe coding ,但仅44% Agent代码最终进入提交,且引入了更多安全漏洞。揭示AI编程助手在真实场景中的真实效果与局限,而...





