AI技术研报-这里有最前沿的人工智能技术解读

AITNT

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测
5736 AI技术研报
ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed开源长线记忆多模态Agent,像人一样能听会看
5221 AI技术研报
字节Seed开源长线记忆多模态Agent,像人一样能听会看

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
5808 AI技术研报
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

NextStep-1:一次在图像生成上自回归范式的探索

NextStep-1:一次在图像生成上自回归范式的探索
5485 AI技术研报
NextStep-1:一次在图像生成上自回归范式的探索

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
6090 AI技术研报
开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来
7045 AI技术研报
一张图,开启四维时空:4DNeX让动态世界 「活」起来

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务
5895 AI技术研报
KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?
6878 AI技术研报
400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
6095 AI技术研报
CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

AI产品们,有哪些“反常识”趋势?

AI产品们,有哪些“反常识”趋势?
7555 AI技术研报
AI产品们,有哪些“反常识”趋势?
上一页 当前第3页,共423页 下一页
沪ICP备2023015588号