摘要
本申请提供了基于大模型的数据模型自动化提取方法及系统,涉及医疗信息技术领域,该方法包括:首先获取初始提示词和样本数据,对样本数据进行低秩稀疏联合分解得到稀疏残差及稀疏先验向量;将稀疏先验向量插入初始提示词形成增强提示词,利用大模型进行结构化提取得到样本结构化结果;基于稀疏残差与参考数据集生成核验结果,若存在错误则确定提示词调整方案,生成已调整提示词;迭代执行结构化提取、核验和调整步骤直至满足预设阈值。本申请能够自动完成数据模型的结构化定义,减少人工干预,提高数据提取准确性,实现数据的高效二次利用。
技术关键词
自动化提取方法
稀疏先验
样本
自动化提取系统
数据分类
上下文特征
医疗信息技术
指标
语义向量
条码
参数
数据格式
优化器
模块
频率
定义