摘要
本发明公开了一种基于局部风格编码器的语音驱动三维人体运动方法,涉及一般的图像数据处理或产生,包括语音驱动风格化三维人体运动整体模型构建步骤和具有参考风格的三维人体运动网络输出步骤,语音驱动风格化三维人体运动整体模型通过局部风格编码器提取局部感知风格特征,并从语音中提取语义、韵律和情感特征。将这些多种条件注入到部分感知扩散模型中,通过参考运动风格和语音信息,合成具有参考风格的三维人体运动。本发明能够合成具有参考风格的三维人体运动,显著提升生成的三维运动序列的自然性和表现力。
技术关键词
三维人体运动
运动特征
风格
情感特征
韵律特征
语义特征
运动编码器
样本
序列
梯度下降法
图像数据处理
网格
注意力
语音编码
网络
表达式