AI资讯新闻榜单内容搜索-大模型

AITNT
未登录
搜索: 大模型

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
6666 AI技术研报
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!
9174 AI资讯
医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能
10548 AI技术研报
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习

X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习
7329 AI技术研报
X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习

如果中国大模型不再开源

如果中国大模型不再开源
8512 AI资讯
如果中国大模型不再开源

长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速

长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速
7357 AI技术研报
长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速

比人类网瘾更可怕,AI患上“脑腐”后彻底没救

比人类网瘾更可怕,AI患上“脑腐”后彻底没救
8101 AI技术研报
比人类网瘾更可怕,AI患上“脑腐”后彻底没救

清华、快手提出AttnRL:让大模型用「注意力」探索

清华、快手提出AttnRL:让大模型用「注意力」探索
8135 AI技术研报
清华、快手提出AttnRL:让大模型用「注意力」探索

喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好

喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好
6364 AI技术研报
喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward
6865 AI技术研报
RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward
上一页 当前第56页,共507页 下一页
沪ICP备2023015588号