一种基于局部风格编码器的语音驱动三维人体运动方法

正文

推荐专利

申请号：CN202511414903

申请日期：2025-09-30

公开号：CN120894473A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于局部风格编码器的语音驱动三维人体运动方法，涉及一般的图像数据处理或产生，包括语音驱动风格化三维人体运动整体模型构建步骤和具有参考风格的三维人体运动网络输出步骤，语音驱动风格化三维人体运动整体模型通过局部风格编码器提取局部感知风格特征，并从语音中提取语义、韵律和情感特征。将这些多种条件注入到部分感知扩散模型中，通过参考运动风格和语音信息，合成具有参考风格的三维人体运动。本发明能够合成具有参考风格的三维人体运动，显著提升生成的三维运动序列的自然性和表现力。

技术关键词

三维人体运动运动特征风格情感特征韵律特征语义特征运动编码器样本序列梯度下降法图像数据处理网格注意力语音编码网络表达式