摘要
本发明涉及数据处理领域,具体涉及一种大模型的张量数据库构建方法及系统,该方法捕获张量并按语义聚类成簇,再用高斯混合模型(GMM)挖掘簇内子模式并构建共享基。在线处理时,通过多基投影将新张量分解为由模式概率和核心张量构成的复合表示。此表示在极大压缩数据的同时保留了结构信息,实现了高效的结构化查询与分析。本发明通过采用高斯混合模型挖掘张量簇内的多结构子模式,并构建共享基进行多基投影,生成复合核心表示以实现压缩与分析。
技术关键词
数据库构建方法
高斯混合模型
协方差矩阵
中间层
计算机程序指令
数据库构建系统
贝叶斯信息准则
核心
大语言模型
标识符
特征值
语义向量
后验概率
存储器
处理器
层级
聚类
指针