基于文档布局分析的多层级文本矫正方法、系统

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
基于文档布局分析的多层级文本矫正方法、系统
申请号:CN202511461255
申请日期:2025-10-14
公开号:CN120932245B
公开日期:2025-12-26
类型:发明专利
摘要
本发明涉及人工智能在文档图像处理中的应用技术领域,公开了一种基于文档布局分析的多层级文本矫正方法、系统,包括:结合多尺度自相似性特征算法与方向性频域峰值特征算法判别待校正图像的类型,并进行适应性预处理得到标准化图像;提取标准化图像中的文本连通域,利用无监督聚类技术对文本连通域中的每个符号进行聚类得到若干词簇,合并词簇形成文本块,获取每个文本块的最小外接四边形得到对应的文本框;分别获取每个文本框的中心点坐标,判定两个文本框是否为同一行文本;对文本框执行水平对齐和倾斜修正;对旋转后的文本框中的字符进行形态规整处理;输出校正后的图像以及结构化的JSON数据。本发明具备了极强的适应性。
技术关键词
矫正方法 无监督聚类 文本行 层级 校正 布局 符号 字符 抗锯齿 坐标 顶点 像素 多尺度 文档图像处理 四边形 间距 算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号