摘要
本申请公开了一种文档分类方法和电子设备,涉及计算机技术领域,文档分类方法,包括:从多个维度提取到待分类文档的多维度信息,针对不同的维度信息通过不同的特征提取方法提取出多维度特征向量,采用基于注意力机制的加权融合方法,构建全面的文档特征向量,同时动态调整各维度特征向量的重要性权重,以使对分类贡献较大的特征获得更高的权重,提升特征融合的有效性,最后基于预先训练好的分类模型基于文档特征向量实现精准分类,有效解决了文档分类准确率和鲁棒性严重不足的技术问题,达到了提高文档分类准确率的技术效果。
技术关键词
词语
文档分类方法
训练主题模型
预训练语言模型
语义
词典
预测类别
注意力机制
文本
摘要
特征提取方法
术语
电子设备
存储计算机程序
训练集
参数