摘要
本发明提供一种基于非结构化数据的检索增强方法和系统,该方法包括:基于自然资源非结构化数据进行文档分类,得到各类文档信息,并基于各类文档信息中的各个语义单元的逻辑关系,构建向量知识库;基于向量知识库对查询问题进行语义理解和向量嵌入处理,得到查询问题对应的语义向量,并基于语义向量采用问题分类模型对查询问题进行分类,得到查询问题的类别信息;基于类别信息和向量知识库采用基于检索增强的检索策略进行检索操作,得到初步检索结果;基于初步检索结果分别进行内容完整性校验、内容合法性校验、内容一致性校验和提交文件规范性检验,得到检索增强结果。本发明实现了自然资源非结构化报件数据的高效、精准检索增强。
技术关键词
检索信息内容
自然资源
结构模块
图片
语义向量
结构框架
数据字
字段
格式
检索策略
文档分类
分辨率
缺失结构
列表
非暂态计算机可读存储介质
识别结构
信息查询系统
业务系统