让每个人都能编写GPU内核
像Claude Code这样的编码助手在被告知性能瓶颈时,能够出色地生成GPU内核代码。但它们自身难以诊断这些性能瓶颈。nCompass智能体填补了这一空白,它能识别代码中的关键性能瓶颈并提供解决方案。通过将我们的智能体与Claude Code结合,我们在单次会话中生成的矩阵乘法内核代码,其运行速度比英伟达的CUTLASS内核还要快3%。现在轮到您来体验了。