AI技术研报-这里有最前沿的人工智能技术解读

AITNT
未登录

Sora没做到的,LongVie框架给解决了,超长视频生成SOTA

Sora没做到的,LongVie框架给解决了,超长视频生成SOTA
8023 AI技术研报
Sora没做到的,LongVie框架给解决了,超长视频生成SOTA

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
8711 AI技术研报
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学

DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
8472 AI技术研报
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
7509 AI技术研报
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测
7624 AI技术研报
ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed开源长线记忆多模态Agent,像人一样能听会看
7293 AI技术研报
字节Seed开源长线记忆多模态Agent,像人一样能听会看

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
8014 AI技术研报
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

NextStep-1:一次在图像生成上自回归范式的探索

NextStep-1:一次在图像生成上自回归范式的探索
8192 AI技术研报
NextStep-1:一次在图像生成上自回归范式的探索

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
8448 AI技术研报
开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来
8018 AI技术研报
一张图,开启四维时空:4DNeX让动态世界 「活」起来
上一页 当前第177页,共597页 下一页
沪ICP备2023015588号