一种基于OCR技术的纸质文档关键信息提取系统设计文献综述

 2023-04-15 09:09:19

文献综述

1. 选题依据随着现代工业生产技术的不断发展和信息技术的飞跃进步,人类已经进入了工业 4.0 时代[1],传统模式下的工业生产方式也正在逐步向智能工业[2]生产过渡,创新打造智能工厂已经成为了工业生产领域发展的重点方向。

光学字符识别(Optical Character Recognition,OCR)最初指对扫描的图像文档分析处理并识别出该图像中的文本的过程。

早在 20 世纪 60 年代 F.Rosenblatt提出能自动识别印刷体英文字母的人工神经元感知器[3]。

现如今社会上存在着各种各样不同的手机操作系统,比如 Android、IOS、WP(WindowsPhone)以及Firefox等等,在这些手机软件操作系统中,Android 系统的使用率最高范围最广,因为其具有开放性和便捷性等特点,所以在现如今社会的各个领域都有了广泛的应用[4]。

随着信息时代以及网络时代的到来,图像文字识别技术在深度学习、机器视觉、书面信息快速录入、票据自动实时处理以及识别并自动翻译异国文字等方面得到了广泛的应用[5],是图像文字信息检索与分析的重要环节。

光学字符识别技术是一个比较狭义的概念,其研究的内容是利用电子计算机等人工智能(计算)设备来识别各种形式的文字及符号的图像所包含的信息。

在学科分类上,字符识别技术属于模式识别和人工智能的范畴,他涉及模式识别、光电子技术、计算机图像处理、人工智能、模糊数学、组合数学、信息论、自然语言理解[6]等技术,它是一门介于基础理论研究和应用研究之间的综合性学科。

在具体的落地应用层面,目前卡证识别、票据识别[7]等标准场景文字识别已经相对成熟,手写文字识别在教育、物流等行业的应用也在不断扩大。

复杂动态场景下的OCR技术和应用成为近两年的热门研究方向,比如在无人驾驶、机器人[8]等场景利用OCR对视场中出现的文字进行识别等。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。