AI技术研报-这里有最前沿的人工智能技术解读

AITNT
未登录

人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制
8715 AI技术研报
人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

MiniMax海螺首次开源 VTP,打通了 Visual Tokenizer 的 Scaling Law

MiniMax海螺首次开源 VTP,打通了 Visual Tokenizer 的 Scaling Law
8730 AI技术研报
MiniMax海螺首次开源 VTP,打通了 Visual Tokenizer 的 Scaling Law

最近很火的Hindsight,基于图谱的「Agent记忆栈」解耦事实与信念

最近很火的Hindsight,基于图谱的「Agent记忆栈」解耦事实与信念
8595 AI技术研报
最近很火的Hindsight,基于图谱的「Agent记忆栈」解耦事实与信念

北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵

北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵
9737 AI技术研报
北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵

这10个n8n工作流,直接干死了90%的Tiktok视频生产,一键直出100条

这10个n8n工作流,直接干死了90%的Tiktok视频生产,一键直出100条
11443 AI技术研报
这10个n8n工作流,直接干死了90%的Tiktok视频生产,一键直出100条

SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人

SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人
7604 AI技术研报
SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人

分割一切、3D重建一切还不够,Meta开源SAM Audio分割一切声音

分割一切、3D重建一切还不够,Meta开源SAM Audio分割一切声音
8808 AI技术研报
分割一切、3D重建一切还不够,Meta开源SAM Audio分割一切声音

具身智能的数据难题,终于有了可规模化的解法

具身智能的数据难题,终于有了可规模化的解法
7208 AI技术研报
具身智能的数据难题,终于有了可规模化的解法

腾讯混元最新世界模型开源!支持实时生成交互,突破长期空间记忆

腾讯混元最新世界模型开源!支持实时生成交互,突破长期空间记忆
9173 AI技术研报
腾讯混元最新世界模型开源!支持实时生成交互,突破长期空间记忆

挖掘注意力中的运动线索:无需训练,解锁4D场景重建能力

挖掘注意力中的运动线索:无需训练,解锁4D场景重建能力
10658 AI技术研报
挖掘注意力中的运动线索:无需训练,解锁4D场景重建能力
上一页 当前第73页,共595页 下一页
沪ICP备2023015588号