一、扩展Hough变换在图像识别中的应用(英文)(论文文献综述)
刁明皓[1](2021)在《基于注意力机制的图像文字识别研究》文中进行了进一步梳理随着互联网的发展,世界逐渐信息化和数据化。各类网络平台搭建使传输的数据信息日渐剧增,数据信息的表现方式不仅可以通过文字形式,还可以通过图像形式。为维护网络健康安全,避免色情、暴力、反动的语言文字以图像形式在网络上传播。识别图像中的文字对于促进网络发展、维护网络安全具有重要的理论和现实意义。图像文字识别领域中,传统图像文字识别方法适用于所需识别图像中文字较少且字体规范的印刷体文字,识别速度较慢。随着深度学习的迅速发展,大量学者逐渐将深度学习应用到图像文字识别任务中,并取得了突破性进展。目前,图像文字识别的主流深度学习网络模型有卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)和CRNN网络。在图像文字识别中,CNN网络可以有效提取图像空间结构的特征信息。RNN网络能够学习图像像素间的关联性信息。CRNN则综合了CNN+LSTM网络优点进行文字整体识别。虽然上述三个模型在图像文字识别中各有优势,但同时各自也存有缺陷。例如,CNN网络缺乏学习长距离图像像素间关联信息的能力。针对以上模型所存在的问题,本文提出基于注意力机制的图像文字识别模型。本文在分析图像文字识别方法以及深度学习网络模型的基础上,对如何精准有效的对图像文字进行识别以及合理构建图像文字识别模型进行了深入研究。主要研究工作如下:(1)改进图像特征提取方法目前,以CNN+编码解码器(sequence-to-sequence)为主要框架的图像文字识别模型存在模型参数过多,模型训练时间过长的问题。多头注意力机制具有捕捉长距离依赖关系和速度快等优点,可以改善模型训练过慢的问题。基于此,本文提出采用多头注意力机制(Multi-Head Attention)来改进CNN+seq2seq图像文字识别模型的方法。改进模型采用多头注意力机制提取图像文字生成特征。模型改进后,在不影响模型提取图像特征性能的同时缩短了模型训练时间,提高了模型训练效率。(2)引入图像文字语义信息基于编码解码器的图像文字识别模型可以处理透视失真和曲线形状的图像文字,但对于图像模糊、照明不均和字符不完整的图像文字并不能做到较好的识别。原因在于低质量图像无法为图像文字识别模型提供优质的图像文字视觉信息。图像文字不同于普通图像,图像文字在包含视觉信息的同时还包含丰富的语义信息。对此,本文构建了包含语义抽取和语义矫正功能的语义抽取模块,以提取图像中文字语义信息。采用交互注意力机制使文字视觉信息特征和文字语义信息特征相互影响关注,以提取语义信息特征与视觉信息特征间的关联信息,增强语义信息特征在图像文字识别模型中的作用。(3)引入定时采样机制在编码解码器(sequence-to-sequence)中,训练时解码器输入为真实序列标记,但在测试时解码器的输入为上一时间步的预测值。本文对编码解码器中加入定时采样。在训练过程中,加入定时采样的改进模型将以一定概率选择真实序列标记或上一时间步计算值作为输入,以缓解训练过程与测试过程的输入差异。
张瑞[2](2021)在《基于改进飞蛾扑火算法及Hough变换的榛子仁缺陷检测》文中认为榛子是常见的坚果树种之一,果壳坚硬,果仁酥香可口,气香味甜,生食、炒食均可,深受大家的喜爱,由于榛子仁富含蛋白质、维生素和钙、铁、磷等微量元素以及大量油脂,因此在烘焙、油料等食品加工行业中需求量日益增加。受生长环境、保存条件等影响,榛子仁中常有干瘪、虫蛀、发霉、腐烂等缺陷。传统的分类识别主要依靠人工分拣,效率低,且评判标准不一,很容易出错而使榛子仁质量层次无法得到有效保障。且榛子仁个体间形状大致相近,肉眼可见差别不大,由于产地、种类及采摘期不同等原因,对于榛子仁的识别、分类难度会进一步加大,采用传统的阈值分割难以清晰的将样本与背景分开。针对此类问题,本文引入仿生算法—飞蛾扑火算法,将其与传统阈值分割算法相结合以求取最佳阈值。首先对榛子仁样本的整体图像和单独个体图像分别进行采集,并对获取到的原始图像进行小波降噪处理,去除干扰。通过飞蛾扑火算法对图像进行阈值分割,融合PSO算法,并加入自适应权重,以避免迭代导致局部极小值化,使飞蛾在前期全局寻优和后期局部寻优中均取得较好效果,减少时间损耗并有效提高运算效率。由此实现将榛子样本细小边缘从整体图像中的良好分离。通过三类衡量指标,对比传统OTSU法、改进前和改进后的飞蛾扑火算法。由实验结果可知,改进后算法的分割效果更好且识别效率更高。最后通过形态学分析,对榛子仁个体样本边缘提取并标记边缘拐点位置。同时计算拐点个数,进而通过判断榛子仁表面光滑程度,标记缺陷籽粒。采用Hough变换对榛子仁样本图像边缘进行椭圆曲线拟合,标记并输出饱满籽粒个数,从而实现榛子仁的缺陷检测。实验结果表明,该方法可以准确、快速的对5种(饱满、干瘪、霉斑、虫蛀、腐烂)榛子仁中的缺陷粒进行检测筛选,准确率达到了 95%以上,有效提高榛子仁加工过程中的分拣效率。
吴冰航[3](2021)在《基于机器视觉的工业OCR识别系统的设计与实现》文中认为伴随着现代工业生产规模的不断扩大,工业生产已经进入了大数据时代,在日常的工业生产流程中,每一个作业环节都会产生许多需要记录的生产数据值,以此作为衡量产品是否合格的标准。对于许多机器较为陈旧的工厂而言,其设备并不具备相应的数据接口,大多数时候都必须依靠人工识别手动抄录的方式来完成对生产数据的记录,这样高度重复枯燥乏味的工作无疑是对人力资源一种极大的浪费,使得工厂的生产效率大打折扣。为解决这一问题,迫切需要一套能够自主完成对工业信息图像识别的OCR系统。尽管对OCR识别技术的应用已经扩展到了办公、交通、金融等多个领域,但其在工业生产领域的应用还尚不充分。本文针对一类工业信息图像展开研究,结合其特点创新地将OCR识别技术应用到工业生产领域,设计实现了一种针对工业信息图像的OCR自动识别系统,具体工作内容如下:(1)对工业信息图像进行预处理。除了一些基本的预处理操作之外,为进一步获得理想的处理效果,本文还充分考虑到在工业生产环境中可能存在的影响图像质量的因素,对亮度分布不均匀的工业信息图像进行光照补偿改善其灰度分布情况,对角度存在一定倾斜的图像则是基于传统Hough变换的改进方法进行处理,在成功校正倾斜角度的同时缩短了处理时间。(2)通过分析对比工业信息图像和普通文本类图像的不同之处,根据工业信息图像的特点,结合SSD目标检测、色彩空间转换和边缘检测等设计了一种新的方法实现对该类图像信息区域的精准定位和基本识别单元的精确分割。(3)为提高对生产数据识别的准确率,针对不同类型的字符特点采取不同的方法进行识别。对标签文本类字符通过字库的自主训练成功提高了识别准确率,对数字仪表类字符采用不同方法进行测试比较后,最终使用穿线法进行识别,在提高识别准确率的同时进一步减少了识别过程的时间消耗。(4)进行系统测试,从不同的数据集中随机选取相同数量的图片对系统性能进行对比测试,根据测试结果对系统整体性能做出相应评价,改进其中存在的问题和不足之处。
高照[4](2020)在《基于无人机航拍影像的高压输电线识别的研究》文中认为输电线路是电力网络的重要组成部分,在电能传输的过程中起到了重要的作用,关乎着电网的安全稳定性。我国电网规模大、结构复杂,以传统的人工方式巡检,效率低,局限性大,而目前信息技术及民用无人机行业的迅速发展,为无人机巡检输电线路提供了便利条件。以无人机进行巡检的技术及方式也符合当下越来越高的智能化、信息化的要求。本文针对无人机巡检采集的视频图像序列,结合机器视觉,进行了输电线路识别、跟踪的研究。本文首先对无人机航拍输电线影像进行预处理操作,结合输电线在影像中的特征,将图像从色彩空间转换为灰度化图像后进行非线性变换,实现对比度的调整、增强;分析及对比去噪方法,以改进维纳滤波对航拍影像进行平滑降噪处理。然后介绍分析了 Hough类直线检测和基于梯度方法的LSD直线检测方法,针对Hough变换法检测输电线及LSD算法检测的漏检等缺陷,研究了一种基于主曲率和主方向的输电线检测算法,利用背景像素与直线像素主曲率差异较大的特性筛选潜在直线像素,以像素方向构建直线支撑区域,实现对输电线的检测。该算法不依赖于图像梯度边缘的分割,可有效的避免基于梯度方检测到的输电线双侧阶跃边缘特征给相近输电线带来的干扰。在检测到影像中潜在输电线后,进行输电线筛选,然后完成输电线的拟合输出。最后分析了无人机自动巡线时,输电线在图像中的运动情况,尝试构建了输电线目标的简化模型,研究了卡尔曼滤波的跟踪方法,通过无损卡尔曼滤波跟踪输电线目标的感兴趣区域,实现对视频图像序列中输电线的识别跟踪。本文在MATLAB平台上进行了算法的仿真验证。经实验验证,本文所提供的方法能有效的实现对视频图像序列中输电线的识别与跟踪。
张啸[5](2020)在《基于计算机视觉的装备方队辅助训练系统开发》文中研究指明我国于2019年10月1日举行的国庆阅兵仪式受到了全世界的瞩目,为了保证阅兵式的规范性与纪律性,受阅方队人员往往需要进行长期艰苦的训练。有些阅兵方队为了解决传统训练方式无法标准化的缺点,采用了信息化手段获取装备方队的实时训练信息来进行分析。但是该方式的所涉及到的训练科目少,并且在精准性和实时性方面需要进一步提高。鉴于以上原因,本文通过优化相关的图像处理算法,运用数据库技术以及开发相应的界面程序来进行理论和应用层面上的研究,希望能够为装备方队横纵向行驶科目的训练提供一种相对科学合理、客观公正的评估系统。本文主要研究内容如下:(1)快速准确识别车道线:通过计算车辆中心线与车道线中心线在水平方向的偏移距离来监测车辆在行驶中的横向偏移情况。在图像预处理方面,对采集到的图像提取ROI区域并进行灰度化处理,使用自适应中值滤波算法以及形态学闭操作代替高斯滤波平滑图像以防止边缘信息减弱;在边缘检测方面,对传统的Canny算法进行了改进:使用改进的Sobel算子通过四个方向计算梯度幅值来防止伪边缘的产生,提出了基于最小误差法的交点迭代法改进OSTU自适应算法来快速确定Canny算法的高低阈值;在边缘拟合方面,对Hough变换中的一些参数进行约束来弥补算法的实时性,同时使用最小二乘法拟合车道线中心线来计算车辆相对于车道线的偏移距离。(2)快速准确识别标识物:通过计算图像中心与采集到的标识物中心的水平距离来监测阅兵车辆在行驶中的纵向偏移情况。首先对采集到的图像提取ROI区域,并将图像由RGB色彩空间转换到HSV色彩空间中;接下来根据不同颜色在HSV色彩空间的参数范围进行了特定颜色的区域提取;最后使用轮廓绘制算法连接区域轮廓,并对区域面积以及形状加以限定找到相应的标识物,通过计算质心坐标来计算车辆相对于基准车的偏移距离。(3)数据处理与界面程序开发:通过设计MySQL数据库对采集到的数据进行存储,选用Qt开发平台编写可视化界面实现人机交互,并对设计的前后端界面程序进行了功能性的介绍。综合实验表明,本文所设计的系统可以快速准确地计算车道线与标识物中心点坐标,能够有效的提高检测的精准度、速度以及抗干扰能力,设计的可视化程序能够实现良好的人机交互功能。并且该系统也成功应用于70周年大阅兵训练中,能够有效地提高阅兵训练效果。
尹子豪[6](2020)在《热连轧钢坯编码字符识别与测温系统研究与实现》文中研究说明在推进制造业转型升级过程中,钢铁行业作为传统制造业的典型,其良好的信息采集基础和落后的人工管理模式之间的矛盾亟待解决。引入自动化和智能化的软件模型,对其进行逐步改造,成为钢铁行业推进智能制造的突破点。为实现热连轧产线钢坯入炉统计自动化以及钢坯温度的自动测量,替代现有模式下人工统计入炉钢坯信息的落后管理方式,提高原料管理效率,达成钢坯入炉管控调度的精细化管理,研发实现热连轧钢坯编码字符识别与测温系统。本文的主要工作和创新点:(1)论文以热连轧入炉钢坯编码字符识别为研究对象,对传统字符识别方法进行了大量的理论研究,通过实验对传统字符识别各环节的图像处理算法进行了分析选择。对比模板匹配方法和BP网络算法,优化BP算法在钢坯字符识别中的应用。在此基础上,利用Halcon图像处理算子实现了系统的初步快速搭建。(2)为提高钢坯编码识别准确率,对基于深度学习的目标检测方法进行了研究。结合基于候选框的Faster R-CNN系列方法,以及端到端YOLO方法的特点,应用并改进SSD网络模型,利用TextBoxes的针对字符识别的思想,提高了钢坯编码的识别准确率,且实时性高,满足了热连轧入炉区域的钢坯自动统计需求。(3)在图像获取和温度检测设计中,创新性地将二者结合,灵活运用相机动态检测功能,通过对图片文件的监听,利用socket通信方式,实现钢坯温度的自动测量,并经过现场应用的有效验证。(4)结合生产工艺,测温方法设计以及高准确率的深度学习字符识别方法,通过硬件和软件的选型设计和搭建,实现了热连轧钢坯编码字符的在线识别和温度的快速检测。系统输出的钢坯编码识别和测温结果对于产线MES系统的实时生产跟踪和激光打码信息的对应实时生成具有重要意义,推进了热连轧产线智能化改造。
吴岛[7](2020)在《基于滑移率辨识的汽车制动时序视觉检测系统研究》文中认为近年来,随着我国经济的稳健增长和交通运输业的快速发展,道路网络和交通设施得到了前所未有的改善和提高,促使汽车行业迅猛发展,汽车保有量不断增加,随之而来的行车安全问题成为全社会关注的焦点。对在用汽车的各项指标进行定期安全检测是保障汽车行车安全的主要途径,其中制动性能又是所有指标中最重要的一项。尤其是半挂汽车列车,作为当前公路货运的主体,正在向多轴化、重型化方向发展,其车体较长、结构复杂,制动性能各项指标都具有重要意义。目前,针对汽车制动性能检测的方法主要有两种:路试检验法和台架检验法。路试法须有特定的场地,受气候条件影响较大且重复性差,一般作为辅助检测手段。台式检验法占地小,不受气候条件影响,重复性较好,是目前汽车检测站和科研机构进行制动性能检测的常用方法。台架检验法主要通过滚筒反力式制动检验台或平板式制动检验台进行检测,可以检测出整车制动力和、制动不平衡及阻滞力,满足多数车型的检测。然而,半挂汽车列车由于轴数较多,不同的制动时序会对列车的制动稳定性造成直接影响,前轴制动快制动瞬间列车易发生折叠,后轴制动快制动瞬间列车易发生拖拽。台式检验法受台体结构的限制,无法实现半挂汽车列车制动时序的检测,从而难以反映整车的制动性能。虽然国家标准GB 18565-2016对汽车列车的制动时序检测方法做出了要求,但受检测设备的成本和结构制约,目前并无相关可行的制动时序检测设备,所以检测方法不具现实意义。因此,研发出一套高精度、智能化的汽车制动时序检测系统势在必行。随着中国制造2025战略部署的不断推进,在以机器视觉为核心的工业4.0大趋势推动下,汽车检测领域也正朝着信息化、自动化、智能化的方向迈进。因此,本文以此为契机,立足国家标准和现有技术手段,将视觉技术引入汽车制动时序检测,提出了基于立体视觉的汽车制动时序检测方法,设计和研发了汽车制动时序视觉检测系统。本文根据半挂汽车列车制动失稳机理及制动时序对制动稳定性的影响,明确了引起不同制动时序的因果关系。通过分析汽车制动时序检测技术的研究现状,确定了本文的研究内容和技术路线,主要包括以下四个方面:(1)汽车制动时序视觉检测系统方案设计分析车轮滑移率与路面附着系数间的变化关系,提出视觉检测系统的测量目标:即以制动踏板开关的触发时刻为起始时标,各车轮滑移率分别达到20%的时间次序作为制动时序的检测结果,并分析影响滑移率辨识的关键因素。为准确识别车轮滑移率,以白色圆形标识物作为间接测量物,建立基于视觉测量的车轮滑移率测量模型及列车曲线行驶矫正模型。基于平行双目立体视觉测量原理,推导系统结构模型,对影响系统综合测量误差的关键因素进行讨论分析。最后从检测系统整体布置、检测流程和控制方案三个方面对汽车制动时序视觉检测系统进行方案设计。(2)图像处理关键算法研究为得到图像中圆形标识的中心坐标,根据圆形标识的图像特点对相关图像处理算法的适用性进行改进和优化。首先对采集的原始图像进行预处理操作,包括图像对比度增强、图像去模糊、图像去噪和图像锐化。然后对归一化后的左右图像进行边缘提取,为改善Canny算法对圆形标识的边缘提取效果,对传统Canny算法在梯度方向和自适应阈值方面进行改进研究。为准确提取圆形标识,分析现有椭圆检测理论提出适用于本文的椭圆检测方法,设计边界清除算法清除冗余边缘,以及融合最小二乘理论和Hough变换实现对圆形标识的准确识别和提取。考虑到序列图像进行立体匹配计算量大的问题,基于对极几何约束关系,提出一种归一化互相关(Normalized Cross Correlation,NCC)快速匹配算法。最后,根据三维重建模型和相机标定参数,对圆形标识中心坐标进行三维重建。(3)视觉检测系统标定与精度检定试验研究根据摄像机坐标系间转换关系,对线性成像模型和非线性成像模型进行论述,以建立本文的摄像机成像模型。分析张正友平面模板标定法的算法原理及不足之处,提出一种基于PSO-LM(Particle Swarm Optimization与Levenberg-Marquardt)组合优化策略的改进张正友标定方法,实现对标定参数的非线性全局优化,并通过标定对比试验对所提方法的有效性进行验证。为验证视觉检测系统对圆形标识的动态识别精度,设计一种模拟车轮制动的精度检定装置及方法,在多个目标速度下分类进行多工况试验,分析每种工况下的试验误差。(4)汽车制动时序视觉检测系统实车试验研究为验证检测系统整体方案设计的可行性以及图像处理算法和标定算法的有效性,选取同一辆在用半挂汽车列车进行重复性试验和九辆在用半挂汽车列车进行普适性试验。为分析视觉检测系统的测量误差,利用车轮上的轮速传感器设计一套轮速测量装置,结合非接触式速度测量仪构成校准装置,对比分析两组试验数据的示值误差和重复性误差,对本检测系统的准确性、稳定性及适用性进行验证。同时,在重复性试验中,鉴于测量结果误差存在不确定性,为科学评价本检测系统,对测量结果误差的不确定度进行评定。最后,分析和总结视觉检测系统相比于校准装置的试验误差。
李峤[8](2020)在《基于卷积神经网络的名片识别研究》文中研究说明光学字符识别(OCR)目前在证件识别以及文档识别上有广泛的应用,通过将文字的图片数字化,从中快速提取出有用信息。传统的光学字符识别算法大多依赖于人工设计特征,通过模板匹配的方法实现特定场景的识别,因此,适用场景比较单一,泛化能力较差,处理名片识别的任务时效果不佳。此外,在处理文字间存在噪声干扰的图像上,传统的卷积递归神经网络(CRNN)的检测效果也不理想。因此针对上述问题,文本重点研究了基于深度学习的OCR名片识别从而弥补传统识别系统的不足。本文从信息提取的角度出发,利用OCR技术识别名片信息,进而将名片信息电子化,实现名片数据的结构化存储。基于传统方法以及当今主流方法的分析,文本进行了适当的改进与优化,实现了一种全新的基于卷积神经网络的OCR识别系统。在图像预处理方面,本文设计了一套针对于名片图像的预处理流程,如边缘检测,倾斜矫正等,以消除图片干扰因素的影响,并且,针对相机抖动造成的图像模糊情况,本文提出并实现了一种基于编码器/解码器网络的去模糊模型,以提高后续字符识别的效果;在文本区域检测方面,本文提出并实现了针对名片识别的文本区域检测方法,基于YOLO网络,使用固定宽度的文本图像,最终检测准确率提高了0.6%;在文本识别方面,为提高中英文混排情况下的识别率,进行了针对性的训练,使文本识别的准确率提高了1.6%。最后,在系统实现上,设计了系统的人机交互模式,采用B/S架构,在前端Web服务器上采用了高效的Flask框架。在后台服务器上,将OCR的各流程进行了模块化的设计,最终返回结构化的输出结果。
王琳[9](2020)在《直读式仪表读数的图像识别方法研究》文中进行了进一步梳理随着计算机技术的快速发展,图像识别技术也在不断的发展与完善。图像自动识别技术早已应用在了生产生活中的各个领域,将人从一些重复、机械的工作环境中解放出来,大大提高了生产的效率,给人们的生活带来极大的便利。例如已经投入使用的车牌自动识别、手写数字字符识别和人脸识别等,这些无一不给人们的日常生活带来方便。直读式仪表读数识别就是运用图像处理技术,可以对仪表图像进行增强,增强图像的视觉效果,可以挖掘出人类视觉中无法捕捉到的特征信息,进而提取到仪表图像的特征信息,再应用数字字符识别技术,自动准确的读取仪表图像的读数,将人从单一重复的读表工作中解放出来,不仅可以解放了劳动力,同时也提高了读数的准确性,这在直读式仪表被广泛应用的当今社会无疑是具有十分重要的意义。本文旨在设计一款简单、快速并且识别率比较高的识别系统,可以应用于各种工业现场,甚至某些工作人员无法出入的特殊工作场地。针对这个目的,本文主要做了如下工作:(1)仪表读数图像预处理。在图像采集阶段,考虑到各种复杂环境对图像的影响,对质量较差的仪表读数图像进行图像增强,对过亮或过暗的图像采用直方图均衡化处理,对光照不均的仪表读数图像实行局部阈值处理,对倾斜的仪表读数图进行倾斜矫正。(2)仪表读数图像数字字符分割及特征提取。为了后续可以更好的识别仪表读数,需要对经过预处理的图像进行分割处理,将仪表读数区域的数字字符分割成单一的数字字符并对其归一化处理。同时,对归一化后的数字字符进行特征提取,将提取到的特征作为数字字符的特征量,利于之后的读数识别。(3)仪表读数图像数字字符识别。本文分别选取了模版匹配、支持向量机、卷积神经网络三种不同的识别方法对仪表读数进行识别,将识别后的结果进行对比分析,从而设计出一款简单、快速并且识别率比较高的识别系统。
徐毓凯[10](2020)在《基于机器视觉的汽车零件字符识别算法研究》文中研究指明在过去的几十年中,字符识别已经有了广泛的研究。目前成熟的字符识别主要有文本文档的字符识别、手写字符的识别和车牌识别等。然而,还有一类特殊的字符识别,涉及从工业和工程部件读取和提取有用信息。但是,此类字符识别在过去的这些年并未得到充分利用。忽略的原因可能是工业自动化字符识别系统的高成本或者是识别的性能低下。但是,随着图像算法技术的不断开发和工业自动化水平的不断提升,这种情况正在逐渐改变。本次研究的主题就是该字符识别方向的应用,文章主要研究了汽车零件上字符的读取与识别。这些字符包含了一些零件型号和零件尺寸等信息,例如有些包含了曲柄轴承直径和滑块孔直径信息的字符,可以确保在发动机的组装过程中选择正确的轴承。针对汽车零件字符识别问题,本文主要展开以下四个部分的研究:首先,针对汽车零件大多是具有三维立体特征的凹凸字符的特点,提出了基于光度立体法的汽车零件字符预处理方法。该方法首先从四个不同方向对物体进行照明收集图片,利用四张采集的图片计算物体三维表面的局部梯度,然后继续计算物体表面的旋度、散度、平均曲率和高斯曲率,最终得到对比度高的灰度图片,提高后面字符识别过程的效率。然后进行的是图像的预处理操作。首先通过二值化处理来获取背景信息较少的图像;然后运用形态学开运算消除图像中的小面积干扰区域;接着利用中值滤波继续减少图像中的干扰噪点;最后结合连通域面积标记法去除图中字符以外的大部分干扰区域。接着,对预处理后的图像进行字符定位与字符分割。第一步进行字符分割前的字符定位操作。目标区域边缘检测利用sobel算子替代canny算子;在目标区域边缘检测完成后,找到目标区域的轮廓且在原图像中画出轮廓;在轮廓获取后再计算其外接矩形,且将外接矩形放缩到合适的大小最终实现字符定位。第二步进行的是字符的粗分割和倾斜校正工作。字符的粗分割主要采用了灰度投影的方法来实现;对图像进行字符的倾斜校正则主要采用中点直线拟合的方法。第三步完成的是单一字符分割和字符归一化的工作。单一字符进行分割主要利用基于列方向的灰度投影法。单一字符分割后实现了字符的归一化,使得字符图像大小变为15×25像素。最后对字符进行了特征提取、识别算法选取和实验与分析。特征提取选取了基于灰度直方图特征和4组不同参数的方向梯度直方图特征共5个不同特征。识别算法则选择了模板匹配算法和BP神经网络算法。实验结果发现BP神经网络算法的识别准确率更高,且在使用同一个识别算法时,特征向量的维度越大,识别准确率越高。最后,将本次实验的结果与其他工业字符识别的实验结果作了比较。实验结果表明本文的识别算法准确率较高。
二、扩展Hough变换在图像识别中的应用(英文)(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、扩展Hough变换在图像识别中的应用(英文)(论文提纲范文)
(1)基于注意力机制的图像文字识别研究(论文提纲范文)
中文摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 相关研究现状 |
1.3.1 基于字符的图像文字识别 |
1.3.2 基于整词的图像文字 |
1.4 本文工作 |
1.5 论文结构安排 |
第2章 图像文字识别相关理论 |
2.1 图像预处理 |
2.1.1 降噪 |
2.1.2 增强 |
2.1.3 倾斜校正 |
2.1.4 二值化 |
2.2 Attention机制 |
2.2.1 自注意力机制 |
2.2.2 多头注意力机制 |
2.2.3 交互式注意力机制 |
2.3 图像文字识别技术 |
2.3.1 基于CNN的图像文字识别 |
2.3.2 基于RNN的图像文字识别 |
2.3.3 基于CRNN+CTC的图像文字识别 |
2.4 本章小结 |
第3章 基于注意力机制的文字识别 |
3.1 算法模型 |
3.2 图像预处理 |
3.3 图像特征提取 |
3.3.1 多头注意力机制 |
3.3.2 视觉特征表示 |
3.4 文字特征提取 |
3.4.1 语义信息抽取 |
3.4.2 语义特征表示 |
3.5 特征融合 |
3.5.1 add并行特征融合 |
3.5.2 concat系列特征融合 |
3.5.3 交互注意力机制特征融合 |
3.6 定时采样 |
3.7 本章小结 |
第4章 实验设计与结果分析 |
4.1 实验环境 |
4.2 实验数据集 |
4.2.1 常见数据集 |
4.2.2 本文数据集 |
4.3 图像文字识别性能评价 |
4.4 实验设计 |
4.4.1 基于语义的图像文字识别模型 |
4.4.2 基于多头注意力和语义的图像文字识别模型 |
4.4.3 基于交互注意力的图像文字识别模型 |
4.4.4 基于交互注意力和定时采样的图像文字识别模型 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的论文及参与的项目 |
(2)基于改进飞蛾扑火算法及Hough变换的榛子仁缺陷检测(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 本文研究背景及意义 |
1.2 国内外研究现状及发展趋势 |
1.2.1 坚果分类检测的研究现状 |
1.2.2 阈值分割在坚果品质检测的应用 |
1.3 本文的研究内容及方法 |
1.3.1 本文的主要研究内容 |
1.3.2 本文的研究方法 |
1.4 论文结构安排 |
2 榛子仁样本采集及图像预处理 |
2.1 榛子仁等级划分及样本选取 |
2.1.1 榛子仁样本的等级划分 |
2.1.2 榛子仁样本的选取 |
2.2 实验仪器设备与图像采集 |
2.2.1 主要仪器与设备 |
2.2.2 榛子仁样本图像的采集 |
2.2.3 榛子仁样本图像预处理 |
2.3 本章小结 |
3 图像分割与飞蛾扑火算法基本原理 |
3.1 图像分割 |
3.1.1 图像分割分类 |
3.1.2 图像阈值分割 |
3.2 飞蛾扑火算法 |
3.2.1 基于群体智能的优化算法 |
3.2.2 飞蛾扑火算法基本原理 |
3.3 本章小结 |
4 改进飞蛾扑火算法的榛子仁图像阈值分割 |
4.1 飞蛾扑火算法流程及优缺点 |
4.1.1 飞蛾扑火算法的流程 |
4.1.2 飞蛾扑火算法的优缺点分析 |
4.1.3 粒子群优化算法 |
4.2 飞蛾扑火算法的改进 |
4.3 改进飞蛾扑火算法的榛子仁图像阈值分割 |
4.3.1 榛子仁样本分割图像评价指标 |
4.3.2 实验结果与分析 |
4.3.3 榛子仁个体图像的获取 |
4.4 本章小结 |
5 榛子仁样本图像的分类识别 |
5.1 传统边缘检测算法 |
5.2 榛子仁样本图像的边缘提取 |
5.3 榛子仁样本图像的拐点标记 |
5.4 榛子仁样本图像边缘曲线拟合 |
5.4.1 Hough变换基本原理 |
5.4.2 基于Hough变换的榛子仁边缘曲线拟合 |
5.5 本章小结 |
结论 |
参考文献 |
攻读学位期间发表的学术论文 |
致谢 |
东北林业大学 硕士学位论文修改情况确认表 |
(3)基于机器视觉的工业OCR识别系统的设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 光学字符识别技术发展历程及国内外研究现状 |
1.3 本文主要研究内容 |
1.4 本文的结构安排 |
第二章 相关技术基础知识 |
2.1 卷积神经网络 |
2.1.1 卷积神经网络概念 |
2.1.2 卷积神经网络结构 |
2.2 主要技术工具 |
2.2.1 Tesseract |
2.2.2 TensorFlow |
2.3 本章小结 |
第三章 图像预处理 |
3.1 基本预处理操作 |
3.1.1 灰度化 |
3.1.2 二值化 |
3.1.3 噪声过滤 |
3.2 图像光照补偿 |
3.3 图像倾斜校正 |
3.3.1 Hough变换原理 |
3.3.2 Hough变换倾斜校正 |
3.4 本章小结 |
第四章 信息区域定位与分割 |
4.1 信息区域定位 |
4.1.1 基于SSD算法的目标检测 |
4.1.2 TensorFlow训练实现目标检测 |
4.2 基本识别单元分割 |
4.2.1 基于色彩空间转换的分割方法 |
4.2.2 基于边缘检测的分割方法 |
4.3 本章小结 |
第五章 字符分割与识别 |
5.1 字符分类 |
5.2 字符串分割 |
5.2.1 连通域分析法 |
5.2.2 投影法 |
5.3 字符识别 |
5.3.1 标签文本类字符识别 |
5.3.2 数字仪表类字符识别 |
5.4 本章小结 |
第六章 系统测试 |
6.1 系统简介 |
6.2 测试结果 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 全文总结 |
7.2 后续展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(4)基于无人机航拍影像的高压输电线识别的研究(论文提纲范文)
摘要 |
Abstract |
变量注释表 |
1 绪论 |
1.1 选题背景及意义 |
1.2 输电线识别的主要研究动态 |
1.3 本文研究内容及章节安排 |
2 航拍输电线影像预处理 |
2.1 航拍图像中输电线特征分析 |
2.2 图像灰度化处理 |
2.3 基于改进维纳滤波的图像去噪 |
2.4 本章小结 |
3 基于主曲率和主方向的输电线检测 |
3.1 经典直线检测算法 |
3.2 基于主曲率的直线检测 |
3.3 输电线的筛选拟合 |
3.4 实验结果与分析 |
3.5 本章小结 |
4 输电线路跟踪算法的研究 |
4.1 视频序列图像跟踪的主要方法 |
4.2 输电线路跟踪 |
4.3 实验结果与分析 |
4.4 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
附录 |
作者简历 |
致谢 |
学位论文数据集 |
(5)基于计算机视觉的装备方队辅助训练系统开发(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 课题背景和意义 |
1.1.1 车道线识别技术发展概况 |
1.1.2 标识物图像识别技术发展概况 |
1.1.3 阅兵装备方队简述 |
1.2 基于计算机视觉的装备方队辅助训练系统简述 |
1.2.1 横向车道线偏移识别 |
1.2.2 纵向标识物偏移识别 |
1.2.3 后端数据存储与计算 |
1.3 本文主要研究内容及论文架构安排 |
2 算法改进 |
2.1 原始图像采集 |
2.2 图像预处理 |
2.2.1 提取ROI区域 |
2.2.2 灰度化处理 |
2.3 图像降噪 |
2.3.1 高斯滤波 |
2.3.2 自适应中值滤波 |
2.3.3 形态学闭操作 |
2.4 边缘检测 |
2.4.1 基于一阶微分的边缘检测 |
2.4.2 基于二阶微分的边缘检测 |
2.4.3 Canny边缘检测算法的改进 |
2.5 边缘拟合与偏移距离计算 |
2.5.1 Hough直线变换 |
2.5.2 LSD直线检测算法 |
2.5.3 拟合算法的选用与偏移距离的计算 |
2.6 本章小结 |
3 标识物偏移识别方法设计 |
3.1 标识物设计与原始图像采集 |
3.1.1 标识物设计 |
3.1.2 原始图像采集 |
3.2 图像预处理 |
3.2.1 提取ROI区域 |
3.2.2 图像降噪 |
3.3 颜色检测 |
3.3.1 色彩空间与转换 |
3.3.2 HSV色彩空间的颜色检测 |
3.4 标识物筛选 |
3.4.1 连接轮廓 |
3.4.2 轮廓包围面积筛选 |
3.4.3 轮廓形状筛选 |
3.5 偏移距离计算 |
3.6 本章小结 |
4 数据库与界面程序设计 |
4.1 数据库设计 |
4.1.1 数据库选择 |
4.1.2 系统数据库的设计 |
4.2 界面程序设计 |
4.2.1 开发平台选择 |
4.2.2 系统界面程序设计 |
4.3 本章小结 |
5 实验与讨论 |
5.1 实验准备 |
5.1.1 摄像头的标定 |
5.1.2 像素距离与物理距离转换标定 |
5.2 算法性能实验 |
5.2.1 算法评价标准 |
5.2.2 降噪算法实验 |
5.2.3 边缘检测算子实验 |
5.2.4 自适应求取高低阈值实验 |
5.2.5 边缘拟合速度实验 |
5.3 综合实验 |
5.3.1 车道线偏移识别综合实验 |
5.3.2 标识物偏移识别综合实验 |
5.4 本章小结 |
6 结论 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(6)热连轧钢坯编码字符识别与测温系统研究与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景 |
1.2 课题研究内容及意义 |
1.3 字符识别识别国内外研究现状 |
1.3.1 传统字符识别方法的研究现状 |
1.3.2 基于深度学习的字符识别研究现状 |
1.4 主要研究内容和结构安排 |
第2章 钢坯编码图片获取与预处理 |
2.1 钢坯编码图片及获取 |
2.2 钢坯编码字符图片预处理 |
2.2.1 图像滤波 |
2.2.2 钢坯端面图像滤波效果分析 |
2.2.3 图像的灰度化和二值化 |
2.2.4 图像倾斜校正 |
2.3 钢坯编码字符区域定位 |
2.3.1 基于颜色特征的字符定位方法 |
2.3.2 基于结构特征和模板匹配的字符定位方法 |
2.4 本章小结 |
第3章 钢坯编码字符分割与识别 |
3.1 钢坯编码字符分割提取 |
3.1.1 投影分割方法 |
3.1.2 形态学分割方法 |
3.1.3 实验结果分析 |
3.2 钢坯编码字符识别 |
3.2.1 基于模板匹配的字符识别方法 |
3.2.2 基于BP神经网络的字符识别方法 |
3.2.3 实验结果分析 |
3.3 本章小结 |
第4章 钢坯编码字符识别模块软件实现 |
4.1 基于Halcon的钢坯字符识别 |
4.1.1 Halcon钢坯编码字符识别流程设计 |
4.1.2 结果分析 |
4.2 基于深度学习的钢坯编码字符识别 |
4.2.1 基于区域候选的目标检测方法 |
4.2.2 端到端的目标检测方法 |
4.2.3 实验结果分析 |
4.3 本章小结 |
第5章 钢坯编码字符识别与测温系统实现 |
5.1 钢坯测温模块实现 |
5.2 系统硬件搭建 |
5.2.1 相机及补光灯选取 |
5.2.2 红外测温装置 |
5.2.3 服务器和工控机 |
5.3 系统软件设计 |
5.3.1 ftp服务器和图片监听 |
5.3.2 钢坯端面匹配和温度采集 |
5.3.3 图像预处理和字符识别模块 |
5.3.4 数据库对比和信息查询模块 |
5.3.5 人工操作选择模块 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士期间的学术论文 |
致谢 |
(7)基于滑移率辨识的汽车制动时序视觉检测系统研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 论文研究的背景及意义 |
1.1.1 论文研究的背景 |
1.1.2 论文研究的意义 |
1.2 半挂汽车列车制动时序的国内外研究现状 |
1.2.1 国外制动时序研究现状 |
1.2.2 国内制动时序研究现状 |
1.3 半挂汽车列车制动时序检测技术的研究现状 |
1.3.1 制动时序国家标准的制定和实施 |
1.3.2 制动时序检测技术国外研究现状 |
1.3.3 制动时序检测技术国内研究现状 |
1.4 立体视觉汽车检测技术的研究现状 |
1.4.1 立体视觉概述 |
1.4.2 立体视觉在汽车检测技术领域的应用和进展 |
1.5 论文的主要研究内容及技术路线 |
1.5.1 主要研究内容 |
1.5.2 技术路线 |
第2章 汽车制动时序检测理论及方案研究 |
2.1 制动时序测量目标的确定 |
2.1.1 滑移率与路面附着系数的关系 |
2.1.2 基于车轮滑移率的制动时序测量目标 |
2.1.3 影响车轮滑移率识别的关键因素 |
2.2 基于视觉测量的车轮滑移率测量模型建立 |
2.2.1 车轮滑移率计算模型 |
2.2.2 圆形标识运动轨迹拟合 |
2.2.3 汽车列车曲线行驶矫正模型 |
2.3 双目立体视觉测量模型 |
2.3.1 平行双目立体视觉测量原理 |
2.3.2 平行双目视觉系统精度分析 |
2.4 制动时序视觉检测系统方案设计 |
2.4.1 制动时序视觉检测系统整体布局 |
2.4.2 制动时序视觉检测系统检测流程 |
2.4.3 制动时序视觉检测系统控制方案 |
2.5 本章小结 |
第3章 制动时序视觉检测系统图像处理算法研究 |
3.1 图像预处理 |
3.1.1 图像对比度增强 |
3.1.2 基于维纳滤波的圆形标识运动模糊复原 |
3.1.3 图像伪中值双边滤波去噪 |
3.1.4 图像拉普拉斯锐化 |
3.2 基于改进Canny算法的圆形标识边缘检测 |
3.2.1 传统Canny边缘检测 |
3.2.2 拓展梯度方向与Otsu自适应阈值的改进Canny算法 |
3.3 基于Hough变换的圆形标识特征提取 |
3.3.1 基于Hough变换的椭圆检测研究进展 |
3.3.2 最小二乘与Hough变换融合的圆形标识特征提取 |
3.4 基于对极几何约束的圆形标识归一化互相关立体匹配 |
3.4.1 立体匹配方法概述 |
3.4.2 对极几何约束 |
3.4.3 基本矩阵和极线方程 |
3.4.4 基于对极几何约束关系的NCC立体匹配算法 |
3.5 圆形标识中心坐标三维重建 |
3.5.1 三维重建模型 |
3.5.2 三维重建过程 |
3.6 本章小结 |
第4章 制动时序视觉检测系统标定与精度检定试验研究 |
4.1 非线性成像模型建立 |
4.1.1 参考坐标系 |
4.1.2 线性成像模型 |
4.1.3 非线性成像模型 |
4.2 视觉检测系统摄像机标定理论及优化 |
4.2.1 张正友平面模板标定法 |
4.2.2 张正友标定法优化理论分析 |
4.2.3 基于PSO-LM组合优化策略的改进张正友标定法 |
4.3 摄像机标定试验及结果对比分析 |
4.3.1 标定试验设备安装及调试 |
4.3.2 标定试验过程及参数误差对比分析 |
4.4 基于车轮动态模拟的视觉系统精度检定试验研究 |
4.4.1 硬件结构组成 |
4.4.2 检定方法及流程 |
4.4.3 动态检定试验及误差分析 |
4.5 本章小结 |
第5章 汽车制动时序视觉检测系统开发及实车试验 |
5.1 汽车制动时序视觉检测系统结构组成 |
5.1.1 检测系统的硬件部分 |
5.1.2 汽车制动时序检测系统软件设计 |
5.2 汽车制动时序视觉检测系统实车试验研究 |
5.2.1 实车试验目的及试验条件 |
5.2.2 实车试验内容及步骤 |
5.2.3 同一车型重复性试验 |
5.2.4 测量结果标准不确定度评定 |
5.2.5 多种车型普适性试验 |
5.2.6 试验误差因素分析 |
5.3 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简介及科研成果 |
致谢 |
(8)基于卷积神经网络的名片识别研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状 |
1.2.1 OCR发展历史 |
1.2.2 OCR研究现状 |
1.3 研究内容 |
1.4 章节安排 |
2 OCR相关技术及深度学习理论 |
2.1 OCR识别的一般流程 |
2.2 图像预处理 |
2.2.1 边缘检测 |
2.2.2 倾斜矫正 |
2.3 MSER文本区域检测 |
2.4 深度学习理论 |
2.4.1 深度学习的基本概念 |
2.4.2 卷积神经网络 |
2.5 深度学习在OCR中的应用 |
2.5.1 区域卷积神经网络 |
2.5.2 YOLO模型简介 |
2.5.3 CRNN模型简介 |
2.6 本章小结 |
3 基于卷积神经网络的模糊图像处理 |
3.1 基本退化模型 |
3.2 图像去模糊 |
3.2.1 传统去模糊算法 |
3.2.2 深度学习去模糊 |
3.3 基于编码器/解码器网络的去模糊算法 |
3.3.1 去模糊网络的网络结构 |
3.3.2 去模糊网络的训练过程 |
3.3.3 去模糊网络的测试指标 |
3.4 实验结果与分析 |
3.5 本章小结 |
4 基于YOLO网络的文本区域检测 |
4.1 YOLO目标检测 |
4.1.1 YOLO模型的检测流程 |
4.1.2 改进的YOLOv3 模型研究 |
4.2 YOLO模型的训练 |
4.2.1 训练损失函数 |
4.2.2 实验数据准备 |
4.3 文本区域检测实验对比与分析 |
4.3.1 实验环境 |
4.3.2 评价指标 |
4.3.3 实验结果分析 |
4.4 本章小结 |
5 基于卷积神经网络的字符识别系统实现 |
5.1 系统需求及架构设计 |
5.1.1 系统需求 |
5.1.2 架构设计 |
5.2 字符识别模块设计 |
5.2.1 识别模型架构设计 |
5.2.2 模型的训练与分析 |
5.3 系统结果展示 |
5.4 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 不足与展望 |
参考文献 |
致谢 |
附录1 攻读硕士学位期间参与的项目和发表论文 |
(9)直读式仪表读数的图像识别方法研究(论文提纲范文)
中文摘要 |
ABSTRACT |
1.绪论 |
1.1 课题研究的背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 课题研究的工作及内容安排 |
1.3.1 课题研究的工作 |
1.3.2 本文内容的安排 |
2.直读式仪表图像的采集和预处理 |
2.1 仪表图像的采集 |
2.2 仪表图像的预处理 |
2.2.1 仪表图像的灰度化处理 |
2.2.2 仪表图像的增强处理 |
2.2.3 仪表图像的去噪处理 |
2.2.4 仪表图像的阈值分割处理 |
2.3 直读式仪表图像的倾斜矫正 |
2.3.1 倾斜矫正的基本原理 |
2.3.2 边缘检测 |
2.3.3 矫正方法 |
2.4 本章小结 |
3.直读式仪表图像的数字分割 |
3.1 连通区域法 |
3.2 投影法 |
3.2.1 垂直投影法 |
3.2.2 水平投影法 |
3.3 数字字符的归一化 |
3.4 本章小结 |
4.模版匹配与支持向量机识别方法研究 |
4.1 特征提取 |
4.2 数字字符特征的提取方法 |
4.2.1 结构特征提取法 |
4.2.2 统计特征提取法 |
4.3 数字识别中的结构特征提取 |
4.4 模版匹配 |
4.4.1 模版匹配原理 |
4.4.2 模版匹配识别模版 |
4.4.3 改进的标准模版制作 |
4.4.4 模版匹配识别结果 |
4.5 支持向量机(SVM) |
4.5.1 支持向量机简介 |
4.5.2 支持向量机基本算法 |
4.5.3 支持向量机优势 |
4.5.4 支持向量机识别数字方法 |
4.5.5 支持向量机识别数字结果 |
4.6 本章小结 |
5.卷积神经网络识别方法研究 |
5.1 卷积神经网络 |
5.1.1 卷积层 |
5.1.2 子采样层 |
5.1.3 全连接层 |
5.2 LeNet-5神经网络模型 |
5.3 LeNet-5模型的改进 |
5.3.1 输入层与输出层改进 |
5.3.2 中间层的改进 |
5.3.3 网络训练和实现 |
5.4 识别过程及结果分析 |
5.5 本章小结 |
6.总结和展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
作者简介 |
(10)基于机器视觉的汽车零件字符识别算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 本课题研究的背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 字符识别的国内外研究现状 |
1.3 汽车零件字符图像的特点 |
1.4 本课题研究的内容 |
第二章 基于光度立体法的汽车零件字符预处理 |
2.1 光度立体法简介 |
2.2 系统检测原理 |
2.2.1 光度立体法 |
2.2.2 表面曲率 |
2.3 基于光度立体法的预处理实验 |
2.3.1 汽车变速器外壳实验 |
2.3.2 汽车轮胎实验 |
2.4 本章小结 |
第三章 字符图像预处理 |
3.1 图像预处理相关算法 |
3.1.1 灰度处理 |
3.1.2 二值化 |
3.1.3 图像形态学处理 |
3.1.4 图像滤波 |
3.1.5 连通区域标记 |
3.2 预处理的实现 |
3.2.1 二值化 |
3.2.2 图像形态学运算 |
3.2.3 图像滤波 |
3.2.4 连通域标记 |
3.3 本章小结 |
第四章 字符定位与字符分割 |
4.1 字符定位 |
4.1.1 字符边缘检测 |
4.1.2 字符轮廓和外接矩形 |
4.2 字符粗分割 |
4.3 字符倾斜校正 |
4.4 单一字符分割 |
4.5 字符归一化 |
4.6 本章小结 |
第五章 字符识别 |
5.1 字符特征的提取 |
5.1.1 投影直方图特征 |
5.1.2 梯度方向直方图特征 |
5.2 模板匹配法 |
5.3 BP神经网络算法 |
5.3.1 神经网络模型 |
5.3.2 误差传播算法 |
5.3.3 算法识别流程 |
5.4 实验与分析 |
5.4.1 实验准备 |
5.4.2 实验设计 |
5.4.3 结果与分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的学术论文及取得的相关科研成果 |
致谢 |
四、扩展Hough变换在图像识别中的应用(英文)(论文参考文献)
- [1]基于注意力机制的图像文字识别研究[D]. 刁明皓. 内蒙古师范大学, 2021(08)
- [2]基于改进飞蛾扑火算法及Hough变换的榛子仁缺陷检测[D]. 张瑞. 东北林业大学, 2021(08)
- [3]基于机器视觉的工业OCR识别系统的设计与实现[D]. 吴冰航. 电子科技大学, 2021(01)
- [4]基于无人机航拍影像的高压输电线识别的研究[D]. 高照. 山东科技大学, 2020(06)
- [5]基于计算机视觉的装备方队辅助训练系统开发[D]. 张啸. 北京交通大学, 2020(03)
- [6]热连轧钢坯编码字符识别与测温系统研究与实现[D]. 尹子豪. 冶金自动化研究设计院, 2020(10)
- [7]基于滑移率辨识的汽车制动时序视觉检测系统研究[D]. 吴岛. 吉林大学, 2020(08)
- [8]基于卷积神经网络的名片识别研究[D]. 李峤. 武汉邮电科学研究院, 2020(12)
- [9]直读式仪表读数的图像识别方法研究[D]. 王琳. 辽宁科技大学, 2020(01)
- [10]基于机器视觉的汽车零件字符识别算法研究[D]. 徐毓凯. 上海工程技术大学, 2020(04)