基于手写识别的表格提取系统文献综述

 2023-05-17 09:15:58

文献综述

一、选题背景 手写表格在日常工作生活场景中的应用十分常见,如会议签到、选票登记等。

随着数据系统化、信息化的发展,将手写表格录入为电子表格更加便于存储、统计、管理数据信息,将手写表格电子化是企业、单位的必要选择。

然而传统人工方式录入表格数据较为繁琐,耗费大量人力,且出错率较高,尤其是在所需录入的表格的数量较大时,采用人工方式录入将占用大量的时间精力,且效率低下,靠人工击键输入计算机一秒钟输入1~4个字已趋于人类能力的极限[1]。

虽然如今已有许多自动表格录入系统,但是这些系统仍存在着限制条件,如对表格格式、形状有要求,且多用于对手写数字识别,难以在更多的场景中进行应用。

因而我们需要寻求一种应用范围更广且识别率较高的手写表格识别提取系统。

图像文本识别主要利用机器学习算法对图像上出现的印刷体或者手写体进行识别,然后转录为计算机能读取识别的文字[2]。

出现在手写表格中的手写字以数字、英文字母、汉字为主。

其中,手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支[3]。

手写数字识别难点在于数字相似性大,字形相差不大,但是数字识别的类别数较少(只有0到9十个类别)。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。