一、基于内容检索的图像系统及其应用(论文文献综述)
姚亮[1](2020)在《哈希学习算法及其应用技术研究》文中提出随着互联网技术的发展,数据呈现出爆炸性的增长,这标志着我们进入了大数据时代。哈希学习算法能够将冗杂度高、数量级大、特征维度高的数据映射成紧凑的二进制哈希码。作为当前机器学习领域的一个研究热点,哈希学习在众多领域都得到了广泛应用。本文主要探讨哈希学习在图像内容完整性认证和运动捕捉数据检索方面的应用,主要研究内容及贡献如下:(1)全面综述了各类典型的哈希学习的研究现状、应用领域。(2)现有图像内容完整性认证方法普遍侧重于设计各种新的图像特征提取算法。然而,无论是何种类型的特征描述子,它们的原始特征表达能力始终有限。针对此问题,本文提出了一种基于哈希学习的图像内容完整性认证算法。本文首先设计了一种加权大间隔度量学习算法(Weighted Large Margin for Manipulation Classification,WLMMC),实现了图像恶意和非恶意操作的分类;然后本文采用个性化的监督量化策略(Supervised Personalized Quantization,SPQ)以区分每个维数对分类性能的影响。该策略针对不同类型的图片可以生成不同位数的哈希码。实验结果表明,WLMMC算法和SPQ算法相结合,可以有效地提高现有图像认证算法的性能。(3)传统的运动特征提取方法大多数采用手工设计特征,在检索过程中,计算复杂度高。针对此问题,本文提出了一种基于深度哈希学习的运动捕捉数据检索算法。在特征提取阶段,本文改进了一种层次化的独立循环神经网络(Independently Recurrent Neural Network,Ind RNN)模型,实现了高质量人体行为的语义特征信息提取。该模型不仅能够保留运动捕捉数据的时间信息,还能保留运动捕捉数据的空间信息。同时本文将深度学习和哈希学习相结合,实现了在大规模运动捕捉序列中相似序列的快速检索。实验结果表明,所提出的算法不仅可以有效地提高运动捕捉数据的检索效率和准确率,还能缩短检索时间。
徐丽娟[2](2019)在《基于图结构的视觉场景表达及其应用研究》文中认为作为计算机视觉领域的一项基础性研究工作,视觉场景表达的主要目标是通过综合利用视觉心理学、场景空间布局和上下文内容,以及图像处理技术等挖掘场景中潜在的结构模式,刻画视觉数据之间的内部联系,最终形成对场景良好和简明的抽象表示。目前已广泛应用到智能交通、自动导航、环境监测、医疗诊断、遥感分析和智能购物等工业生产、军事安全和生活实际领域中,具有重要的科研和应用价值。研究表明:视觉数据的结构化描述对于场景的有效表达发挥着至关重要的作用。但是由于自然场景的多样性、复杂性和可变性,目前建立在图结构模型之上的视觉数据关系模式挖掘的研究成果在准确率、效率和鲁棒性等方面仍然面临较大挑战。因此,本文首先围绕图模型中路径优化和距离度量两个角度展开对场景数据之间关系描述的研究,然后着眼于结构保护图像滤波和视觉注意力建模这两个热点应用进行算法设计和实验验证。主要的研究工作如下:(1)图结构中基于路径优化的视觉数据关系表达方法研究。针对图结构表达中路径生成方法通常面临的视觉相似区域内描述不一致和噪声敏感问题,本文提出了一种基于格式塔分组准则的最平滑路径和平滑短路径优化方法。为实现场景内容的有效表达,文中首先引入人类视觉感知的格式塔分组准则来构造最平滑路径。但是受自然场景区域分布的任意性和噪声影响,空间位置相近、特征相似并且相互连通的图像单元之间的最平滑路径可能出现节点冗余问题,因此文中通过进一步构建平滑短路径方法来有效感知视觉场景内容。实验结果表明:复杂场景条件下,最平滑路径和平滑短路径优化算法在学习数据中潜藏的结构信息和描述场景内容方面的可靠性较强。(2)图结构中基于路径距离度量分析的视觉数据关系表达方法研究。针对场景表达中距离估计方法通常面临由数据结构非线性、光照变化或边缘不清晰等因素造成的视觉数据之间关系度量偏差问题,本文提出了一种基于路径瓶颈分析的图结构距离度量方法。该方法在综合考虑任意路径顶点之间上下文语义内容和拓扑结构信息的前提下,通过引入基于随机游走模型的路径瓶颈检测和分析方法形成场景中视觉单元之间的关系描述。实验结果表明:路径瓶颈检测距离方法不仅能够在最小化视觉场景类内差异的同时最大化视觉场景类间差异,还能够有效保留部分描述同一场景类内数据之间的关键信息差异。(3)自然场景条件下的结构保护图像滤波算法研究。针对图像滤波中场景结构和高对比度纹理细节在梯度大小方面的相似性造成的边缘模糊问题,本文提出了一种基于结构尺度自动感知的结构保护图像滤波算法。该方法首先引入能够高度聚集语义一致性视觉单元的聚类距离变换方法,然后通过综合利用邻居视觉单元的决策信息和信任机制设计将聚类距离变换和双边滤波器融合起来的协同滤波模型。实验结果表明:协同边缘保护图像滤波模型在结构保护和纹理、噪声细节平滑方面的鲁棒性较强。(4)自然场景条件下的视觉注意力建模方法研究。针对显着区域检测算法受场景目标尺度任意性和分布不确定性、光照不均匀性和背景杂乱性等条件影响产生的显着目标非一致高亮现象,本文提出了一种基于场景结构化表达的显着区域检测算法。该方法首先利用格式塔分组准则建立关于场景全局拓扑结构的路径描述,然后通过路径拉普拉斯分析方法估计结构连通度,最后将背景连通先验和外观对比度线索融合起来定义显着度。实验结果表明:本文提出的显着目标检测模型有效提高了均匀一致高亮显着区域和抑制非显着区域方面的整体性能。
刘恬[3](2019)在《结合方向增强型LBP与Gabor小波特征的图像检索算法研究》文中提出本文研究和讨论了一种基于纹理特征的图像检索算法。为了实现纹理特征的高效提取,选择结合空间域与频域特征的提取方式对纹理特征进行综合描述。在对多种纹理特征提取方法优缺点进行分析后,选择将方向增强型局部二值模式(Local Binary Pattern,LBP)和Gabor小波变换特征相结合的算法作为对纹理特征的描述算法。LBP算法作为图像空间域纹理特征提取中的经典算法,具有灰度不变性、运算速度快等优点,但却存在抗噪声能力、灵活性、稳定性较差,缺少方向识别等不足。经过研究算法模式,对多种改进算法进行分析并对改进方向进行归纳,选择一种稳定性更强的方向增强型LBP算法作为纹理特征提取的重要算法。该算法不仅包括中心点与邻域点灰度值大小的比较,还包括邻域点之间的灰度值比较,可以在增强对方向的识别基础上提高算法的抗噪声能力。Gabor小波变换作为频域信号处理的经典算法,具有较强的稳定性和去噪声能力,可以对图像进行有效的多尺度和多方向变换。但作为单一的特征提取算法时,却存在容易忽略图像局部纹理特征的问题。将方向增强型LBP与Gabor小波变换结合可以实现两种算法的互补,在增加多方向多尺度的全局特征提取的同时增加局部细节特征的提取,从多个角度提高对纹理描述的质量。通过使用Corel-1k数据库对本文采用的结合算法进行对比实验,将查准率作为衡量算法性能的标准。经实验验证,在同等条件下,本文所采用的图像检索算法具有良好的图像检索效果。
杨贞[4](2016)在《图像特征编码及其应用研究》文中认为随着图像特征编码在目标显着性计算、图像分类和人体再识别技术领域的快速发展,使得计算机在真实场景中理解和分析图像内容的能力越来越智能化。目标显着性计算核心思想是利用算法模仿人眼视觉显着性功能,目的是检测图像中吸引人视觉系统的感兴趣区域。图像分类是图像理解重要研究方向,任务是按照图像的内容把图像分成不同类别。人体再识别技术在视频监控领域中起着重要的作用,目的是在多个不同的摄像头中识别特定的人。近年来,基于图像特征编码的方法广泛应用在图像分类、显着性目标检测和人体再识别方向,然而,经典的特征编码方法未有效利用每类目标的码本信息且码本中码字之间是独立的。针对以上问题,本文提出了利用类码本的方法学习特征的显着度并利用条件随机场(CRF)优化每类码本,可以有效地关联码本中码字之间的上下文信息。为了验证本文方法有效性及准确度,其应用在图像分类、目标显着性计算和人体再识别三个领域。本论文的主要贡献由以下几部分组成。1.本文利用每一类的码本计算相应类的显着性特征并采用局部约束线性编码(LLC)方法对得到的类显着特征进行编码。由于经典的图像特征编码方法仅仅学习一个全局码本,缺乏每类码本的信息。针对此问题,本文提出了一种新的特征编码方式用于解决图像分类任务,其中每类的码本由对应的指定类的训练样本获得,且本文提出的字典生成和特征编码方法简单便于实现,不需要优化计算。与模式识别领域已报导的算法相比,本文算法在图像分类精度方面呈现明显优势。例如:与KSVD和LC-KSVD方法相比,本文算法在Caltech101公共数据集上得到了更为出色的实验结果,图像分类精度达到79.8%。2.本文在局部约束线性编码(LLC)和条件随机场模型(CRF)基础上,提出了自顶向下(top-down)目标显着性计算模型。由于经典的稀疏编码方法采用的是稀疏约束项条件,需要复杂的优化算法且未有效利用近邻的局部特征信息。LLC编码方法采用的是局部约束项条件,充分考虑了码本中码字之间的近邻信息。在此基础上,本文提出了利用LLC编码和CRF模型的方法用于解决目标显着性检测任务。在训练阶段,本文把LLC编码响应作为CRF模型的隐变量,同时利用CRF模型优化调节学习的指定类码本。在测试阶段,本文提出的方法采用已学习到的显着性目标模型来计算图像中目标显着性区域。为了验证本文方法的性能,在公共数据集MSRA-B,Graz-02,Weizmann Horse及Plane数据集上开展实验,结果表明,本文提出的方法相较于已有方法,不仅能提高目标显着性检测准确度而且能减少计算复杂性。3.在目标显着性计算领域,已报导的算法多是利用目标的信息而忽略了背景信息对算法的干扰,造成在复杂背景图片中,无法有效检测显着性目标的位置。为了降低背景的干扰,本文提出了一种新的方法用于计算目标显着性的区域,将背景信息度量方法与top-down视觉显着性模型相结合,可以在复杂场景中,有效地寻找到指定目标类的具体位置。首先,本文所提方法用鲁棒的背景度量算法计算真实场景中前景显着性区域;其次,通过LLC和CRF方法学习指定类的显着性目标模型;最后,融合两种显着性目标映射图用以计算最终精确的指定类目标显着性区域。在Graz-02和PASCAL VOC2007数据集上的实验结果表明本文的方法可以取得较好的实验结果。4.人体再识别作为机器学习与模式识别领域的重要分支,其技术的研究自2012年以来一直是该领域的研究热点。经典的人体再识别方法采用计算人体图像原始特征的距离,通过距离远近决定识别的结果。由于图像原始特征包含大量的噪声干扰,直接计算图像特征之间的距离往往效果不理想。为了解决此问题,本文提出了一种新的人体再识别算法,即利用局部约束线性编码对提取到的图像原始特征进行再加工,获得更深层次的图像表示,可有效地避免噪声的干扰,并利用对原始图像重构误差大小进行识别。经典的LLC方法是利用K-means聚类算法来学习码本,与其不同的是本文把每幅图像的特征向量看作一个码字,由多个码字组成一个码本,不需要K-means聚类算法来学习码本,可有效减少计算时间。在工程测试中,大多数经典人体再识别方法测试时间较长,无法在真实场景中应用。大量实验结果表明,本文提出的方法有效解决了工程应用中的瓶颈问题,即:在保证人体再识别精度的前提下,提高了算法的时效性。
李媛媛[5](2016)在《云计算环境下的并行Skyline算法及其应用研究》文中研究说明随着互联网飞速发展,数据呈爆炸式增长,海量数据的处理需求越来越大。然而,由于数据量过大,使得海量数据处理对软硬件要求高、系统资源占用多,因此海量数据的处理技术面临着巨大挑战。目前,以MapReduce为代表的云计算技术越来越受到学术界和商业界的关注,并且在海量数据处理上得到了普遍的应用和推广。Skylin e算法作为一种有效的海量数据处理算法,可以帮助人们从数据中提取最感兴趣或最关心的信息,有效地剪枝掉无用数据,避免数据分析时的干扰。本文以云计算技术为依托,研究海量数据的Skyline算法,重点研究海量数据的静态Skyline算法、动态Skyline算法和图像数据的度量空间Skyline算法,以及这些算法在MapReduce架构下的优化和应用问题。论文完成的主要研究工作如下:针对海量数据静态Skyline查询时通信开销大及其计算量大的问题,本文提出了高效的基于用户喜好的子空间Skyline算法。针对海量数据计算量和通信开销问题,该算法利用了基于网格的剪枝策略来减少参与运算的数据点。针对海量数据Skyline计算返回用户终端的结果集庞大、不利于用户决策,并且用户终端的存储及网络通信资源有限的问题,该算法采用基于用户需求的SQM-filtering和ε-filtering过滤方法来返回Skyline结果的子集。最后利用MapReduce实现了基于用户喜好的子空间Skyline算法,并在不同分布的数据集上进行实验分析,实验结果表明这些方法有效提高了子空间Skyline算法在处理海量数据时的效率。针对海量数据动态Skyline查询时,一方面被查询对象的属性值随着查询对象的变化而变化,另一方面云计算环境的分布式存储、并行处理情况复杂,因此动态Skyline算法处理海量数据时存在计算开销大、实时性差等问题。针对这些问题,本文提出了一种基于MapReduce的动态Skyline算法,它利用基于网格的粗粒度全局Skyline格来实现快速查询,通过全局Skyline格计算获得候选结果集。这样有效地剪枝掉一些非结果点,节省了大量的计算开销,提高了动态Skyline算法处理海量数据的运行效率。最后为了验证该算法的效率和实用性,我们将该方法应用到网络监控流数据的异常情况检测中。在图像大数据的度量空间Skyline查询中,针对基于语义度量空间选择带来的计算复杂度高等问题,本文提出了一种基于图像多特征融合的度量空间Skyline算法,其核心是采用多特征融合图像检索方法(SKFF)。它在度量空间上采用图像的底层特征来描述图像,基于词袋模型生成相似度向量,并将Skyline操作应用到新的度量空间中进行图像检索。其特点是不需要针对不同图像库为每个特征设置权值,采用这种方法得到的结果不仅与查询图像在多个特征上都比较相似,而且还可以返回在某一特征上与查询图像相似的候选图像。该算法克服了传统多特征融合方法参数多、自适应性差的问题。同时,利用MapReduce能提高算法的效率和可扩展性。最后通过一系列实验验证了该算法的有效性和可扩展性。
刘勍[6](2011)在《基于脉冲耦合神经网络的图像处理若干问题研究》文中指出脉冲耦合神经网络(Pulse Coupled Neural Networks, PCNN)是基于生物视觉系统机理形成的具有模数混合处理、串并联混合处理及动态自适应处理的一种空时编码新型人工神经网络。由于PCNN模型的动态变阈值、非线性调制耦合、同步脉冲发放、动态脉冲发放及时空总和等特性,使其在图像处理、自动目标识别、组合优化、人工生命等领域的研究和应用得到国内外的广泛重视。本文围绕图像处理中脉冲噪声滤除、高斯噪声滤除、弱小目标检测、二值图像自动分割、多值图像自动分割及基于内容的图像检索等若干关键问题,针对脉冲耦合神经元结构复杂性及其在图像信号处理中存在阈值反复衰减、自适应性能差和无法自动选择最佳处理结果等一些不足,研究了PCNN模型的机理,并提出改进思路与方法。论文主要内容如下:1.为有效滤除图像中严重脉冲噪声的干扰,提出了基于脉冲耦合神经网络噪声检测的两级脉冲噪声滤波算法。首先在改进自适应单位连接PCNN(AULPCNN)模型的基础上,利用其同步脉冲发放特性区分定位脉冲噪声点和信号像素点位置,其次根据噪声点局部邻域信息对噪声点进行第1级自适应滤波,然后再对前一级的滤波输出利用具有保护边缘细节特点的多方向信息中值第2级细微辅助滤波。该算法在噪声检测中无需设定检测阈值,噪声检测精度较高;在去噪过程中不但有效滤除噪声干扰,而且能很好地保护图像边缘细节等信息,具有较好的主观视觉效果和客观评价指标,去噪能力强、信噪比高和适应性好,特别是对受严重噪声污染的图像,显示了更大的优越性。2.针对图像高斯噪声的去除,提出了一种基于改进型脉冲耦合神经网络的双边滤波算法。在考虑图像高斯噪声特征的前提下,引入平滑抑制因子和自适应链接强度,并与相似神经元同步激活特性相结合,形成平滑抑制自适应连接PCNN(SIAL-PCNN)模型,然后应用在含噪图像预滤波迭代处理中,在滤除极值噪声的同时形成反映图像空时信息的赋时矩阵,最后将生成的赋时矩阵信息运用在双边滤波中,并对其进行了自适应性改进与滤除高斯噪声的处理。该算法在较好保护图像边缘细节等信息的情况下,能有效地滤除平滑区域噪声,在信噪比和去噪能力方面都有一定的提高。3.从含单一弱小目标图像特征出发,提出了结合灰度熵变换的脉冲耦合神经网络小目标图像检测算法。该方法在对含随机噪声和有复杂背景的图像进行非线性灰度熵变换滤波的基础上,考虑灰度熵值映射图在满足目标背景比先验概率的条件下,利用局部最小交叉熵判据,自动选取包含单一小目标局部窗口作为处理图像区域,并进行改进型PCNN迭代检测处理。该算法能自动可靠地检测出复杂背景及随机噪声干扰下的弱小目标。4.为自动对图像进行二值分割,提出了一种新的自适应迭代全局阈值图像自动分割算法。首先对二维超模糊集隶属函数进行自适应修正,并将其引入到图像超模糊熵概念中,然后从适应图像分割角度考虑,将传统脉冲耦合神经网络模型改进为具有单调指数上升阈值函数的单位链接脉冲耦合神经网络(ULPCNN)抑制捕获模型,最后把ULPCNN与最大超模糊熵判据相结合对图像进行自动分割。该算法能自动确定最佳分割阈值,对图像目标划分清晰、细节保持较好,改善了图像的分割性能。5.考虑原始图像与分割图像之间的相互关系,以最大互信息为分割目标,以互信息熵差作为一种新的分类判据,在对传统脉冲耦合神经网络模型改进的基础上,提出了一种基于最大互信息改进型PCNN多值图像自动分割算法。该算法能够自动确定最佳分割迭代次数及最佳分割灰度类数,对分割图像具有良好的特征划分能力,且在分割类数较少的情况下,能较好地保持图像细节、纹理及边缘等信息,对图像分割精度高,具有较强的适用性。6.为简单有效地提取图像重要特征信息,从而更好地提高检索图像的精度,提出了一种基于脉冲耦合神经网络的图像归一化转动惯量(NMI)特征提取及检索算法。首先利用改进简化PCNN模型相似神经元同步时空特性及指数衰降机制,将图像分解为一系列具有相关性的二值图像,然后提取能反映原图像目标形状、结构分布的系列二值图像的一维NMI特征矢量信号,并将其应用在图像检索中。同时,考虑到系列二值图像间的相关性及不同图像间NMI序列值的差异性,引入了马氏距离结合Pearson积矩相关法的综合相似性度量方法。所提算法对图像特征矢量序列具有良好抗几何畸变不变特性及对图像表述的唯一性,且有较好的图像检索效果。
孙晶[7](2009)在《图像局部不变特征提取技术研究及其应用》文中研究说明目标上局部不变特征的提取是图像处理、数字水印、拷贝检测、视频检索等众多计算机视觉领域的研究基础。由于大部分目标之间均存在视角、尺度、旋转以及模糊、局部遮挡、复杂背景等广义仿射变换,因此如何使提取的局部不变特征具有良好的稳定性、可重复性和可匹配性成为视觉领域的一个重点研究问题。针对原始最大稳定极值区域算法的时间复杂度高、区域被覆盖以及形状不规则等缺点,构建了一种并行使用优化的邻域四叉树数据结构、基于成分树的最大稳定判定条件和基于向量的二阶中心矩调形通式的检测子,提取出加速的椭圆形最大稳定极值区域(Elliptical Maximally Stable Extremal Regions-Accelerative,EMSER-A)。在图像像素点排序的基础之上,根据使用按秩合并和路径压缩优化的邻域四叉树数据结构提取基于灰度阈值变化的极值区域,有效恢复了最终变成一个像素值和灰度阈值的区域的全部信息。使用极值区域作为结点构建成分树,并得到最大稳定判定条件。为了便于后续的特征描述,构建了基于向量的二阶中心矩调形通式,并将该通式降维为二维协方差矩阵,把不规则形状区域调整为椭圆形。EMSER-A检测子在保证可重复性的前提下,将时间复杂度由O(nloglogn)降低到O(Na(N))。特征提取和匹配实验表明:当存在广义仿射变换时,该检测子仍能提取数量较多且具有一定独特性的局部特征。可重复性比较实验证明:EMSER-A具有较为理想的视角、尺度、旋转、光照和模糊不变性。为了解决特征点的定位精度不高、区域仿射形状的难以调整以及特征的弱仿射不变性等问题,论文还构建了基于点区域的仿射不变性检测子。证明了规范化LoG图像导数的尺度不变性,为特征尺度的确定提供了理论基础。提出了特征尺度的定性和定量定义,完善和发展了特征尺度的性质。系统地证明了仿射高斯尺度空间内形状自适应矩阵的仿射不变性以及基于该矩阵的规范化区域之间的旋转关系。给出了迭代过程中积分尺度和微分尺度的确定准则以及微分尺度对提高检测子抗噪性的影响。建立了基于仿射形状自适应矩阵的空间位置迭代矩阵,并使用该矩阵完成了从规范化区域到图像域的转换。在上述理论支撑下,构建了联合规范化LoG方程、多尺度Harris度量、仿射形状自适应矩阵以及空间位置迭代矩阵的仿射不变性检测子(Location/Scale/Shape-Iterative,LS2-I),同步迭代出点区域的空间位置、特征尺度以及仿射邻域形状。特征提取和匹配实验表明:在存在广义仿射变换的同一个场景的两幅图像上提取特征区域,经过位置、尺度和形状的同步迭代,收敛的特征点邻域形状在规范化图像域内显示一致,实现了对特征点的精确定位和特征区域形状的仿射调整,并取得了理想的匹配结果。可重复性比较实验证明:在视角、尺度、旋转、光照变化以及存在模糊的情况下,LS2-I具有较为理想的可重复性。为了验证EMSER-A和LS2-I的可匹配性及稳定性,论文构建了相应的图像检索机制。论文首先以EMSER-A和LS2-I为底层局部特征区域,生成SIFT描述子并聚类成基于矢量量化的视觉关键词表,结合标准加权思想和衡量不变特征的相似性准则,提出了基于框选目标区域的检索方法,依据相似度得分对检索结果进行一次排序。为了更有效的发挥特征区域的不变性,论文提出了基于搜索单元区域匹配法和基于簇的空间一致性度量准则。前者根据EMSER-A和LS2-I椭圆形特征区域的仿射协变性,在目标区域和被检图像上分别以某两个已匹配的椭圆形特征区域作为搜索单元,在该搜索单元内进行基于原匹配和新匹配之间关系的区域匹配,并删除零分匹配区域,最后根据得分情况对图像进行二次排序。后者根据正确匹配对空间角之间的关系,提出一种有效去除误匹配的基于簇的空间一致性滤波方法。论文构建了四种不同的检索机制,检索实验证明了特征区域EMSER-A和LS2-I的可匹配性及基于目标区域和空间一致性检索机制的正确性。同时,增大图像库容量的对比实验和广义检索实验证明了特征区域及检索机制的稳定性和正确性。
李清勇[8](2006)在《视觉感知的稀疏编码理论及其应用研究》文中研究表明在大脑接收的来自外部世界的感知信息中,80%以上是通过视觉系统进行加工处理的。最近二十多年来,视觉信息加工的机制是心理学、神经科学、计算机科学等学科研究的重大课题之一。人们广泛认为,生物视觉系统在长期进化和发展中,自适应于自然环境中输入刺激的统计特性,但是生物视觉系统是怎样对外界环境的刺激模式做出响应?Attneave,Barlow和Olshausen & Field等从信息论出发,发展了稀疏编码理论,认为在视觉系统V1区神经细胞的处理过程中,一个重要的约束就是编码的稀疏性,从而利用较少的资源尽可能有效地编码更多的信息。稀疏编码理论在视神经细胞的响应特性和外部环境刺激的统计特性之间建立一种科学的数量联系,逐渐成为了一种有效理解人类神经系统信息加工机制的理论工具,是国际神经计算,神经网络和人工智能方面的一个研究热点。本论文以稀疏编码模型和理论为基础,从模拟大脑信息处理方式出发,在理论上进行创新性的探索,并将模型和理论成功地应用于计算机视觉的图像检索领域中。取得的主要成果包括:第一,面向知觉任务的稀疏编码模型最近的心理学和生理学研究成果表明,简单细胞的信息处理过程并不仅仅是一个数据驱动的过程,它还受知觉任务的影响,本文在Olshausen和Field提出的数据驱动的稀疏编码模型基础上,设计了面向知觉任务的稀疏编码模型(简称TOSC),TOSC模型探索了什么信息应该被编码的问题,也就是What-问题。在从输入空间到系数空间的编码过程中,为了提高编码系数空间的可分性,我们引入了模式分类任务的监督信息-判别距离,结合稀疏编码的约束条件形成新的代价函数(Cost function),然后,优化学习得到面向模式分类任务的稀疏编码模型;通过二分类任务(自然风景和建筑物的分类)的实验,我们验证了面向知觉任务稀疏编码模型的有效性。第二,双层反馈稀疏编码模型最近的研究成果表明,初级视皮层的加工过程远非简单的局部特征抽取,相反,它的加工是动态的、交互的和可塑的,它的加工过程受高级皮层的视觉推理和任务以及行为经验的影响。本文扩展了单层的基于ICA算法的稀疏编码模型,在多层感知机的基础上,我们提出了一个带反馈机制的双层稀疏编码模型(简称TLF-SC),在TLF-SC模型中,神经细胞的响应除了受稀疏编码准则的影响,即保持神经细胞响应的统计独立性,同时它还受到反馈信号的调节,使得神经细胞的编码能更加适应于高层的知觉任务。我们的仿真结果表明,TLF-SC模型的ICL神经元既表现出类似V1区简单细胞感受野的特性,也表现出对知觉任务的自适应性,同时TLF-SC模型还能取得比较好的分类性能。第三,基于注意机制的稀疏编码模型我们研究发现对作用于同一个输入刺激的简单
彭晶[9](2021)在《基于Faster R-CNN的场景相似性计算与标注方法研究》文中指出随着科研人员的不断探索,研究的问题越来越复杂,目标检测只获取了场景中目标的类别信息和位置信息,而忽视了场景中各目标的内在联系。在实际生活中,需要处理的场景更为复杂,目标间的依赖更为紧密,如何高效解析复杂场景中各目标的空间布局及语义联系,并计算复杂场景间的相似性将变得越来越重要。为了解决上述问题,本文基于Faster R-CNN目标检测网络,提出了一种复杂场景相似性计算方法,并制作和标注了一个复杂场景数据集,即CSBOGM(Complex Scene Based On Graph Model)数据集,主要研究工作如下:(1)提出一种基于Faster R-CNN的场景相似性计算方法。主要包含五部分:a)提出一种基于Faster R-CNN的数据预处理方法,其目的是为了实现对图像的目标检测、目标检测框去冗余以及目标检测框唯一编号;b)提出一种场景目标树构建方法,实现复杂场景下不同尺寸目标的划分与归并,同时,为构建场景图模型提供节点属性信息;c)提出一种目标间相对位置关系解析算法,用于处理复杂场景中各目标之间的语义联系,并为构建场景图模型提供边属性信息;d)基于上述b和c的方法,提出了两种场景图模型的构建方法,将其图模型分别命名为OT(Object Tree)图模型和PGAOT(Primary Goal And Object Tree)图模型;e)基于OT场景图模型和PGAOT场景图模型,提出了两种场景相似性计算方法。在Corel-1K数据集和Caltech101数据集上的实验结果表明:本文提出的方法在视觉感受和客观评价上取得了不错的效果,证明了本文提出方法的有效性和实用性。(2)制作和标注了一个复杂场景数据集,将其命名为CSBOGM数据集。考虑到真实场景往往更为复杂,已有的图像检索数据集场景目标单一,这些数据集不能有效代替真实场景,并不能证明已有的图像检索方法在复杂场景中的效果。因此,本文制作了CSBOGM数据集,包含10个复杂场景,共6200张图像。CSBOGM数据集上的实验结果进一步证明了本文提出方法的有效性,同时,两种对比方法在CSBOGM数据集上也取得了令人满意的效果,这从侧面反映出本文制作的CSBOGM数据集的合理性。综上所述,本文基于深度学习目标检测方法,提出了适用于复杂场景解析和场景相似性计算的方法,同时,本文制作的CSBOGM数据集相对于已有图像检索数据集的场景更为复杂,实验表明:本文提出的方法具有较高的可解释性和实用性,制作数据集的相对合理性。
陈丹阳[10](2021)在《面向可见光通信的CDMA技术及其应用研究》文中指出随着移动互联网和物联网技术的飞速发展,传统的射频通信已无法满足日益增长的通信容量需求,下一代移动通信面临着频谱资源短缺的巨大挑战。可见光通信(Visible Light Communication,VLC)是一种以可见光为信息载体的光无线通信技术,具有宽频谱、大容量、广覆盖、高安全和低能耗等优势,有潜力成为下一代移动通信架构中的关键技术之一。然而,和传统无线通信技术一样,多用户接入带来的多址干扰和同步问题会直接影响VLC系统的性能和实用化进程。码分多址接入(Code Division Multiple Access,CDMA)技术通过在码域对用户进行区分,能有效减少多址干扰,也可以通过增加扩频码集零相关区长度增强对用户信号同步的容忍度,是多用户接入应用的绝佳选择。此外,针对VLC系统兼容照明的情形,在考虑通信性能的同时,还需要考虑系统照明性能、传输效率、复杂度等多方面因素。因此如何能够有效地减少多址干扰,同时满足其它各种系统性能需求,是VLC系统亟待解决的问题之一。本文立足于理想同步、准同步和多速率的多用户VLC系统的性能提升,探索了多种新型CDMA扩频码集,并成功进行系统验证和应用拓展,主要研究内容和创新点概括如下:(1)针对多用户系统通信和照明复用的问题,本文研究了一种面向VLC系统的调光控制CDMA方案,并进行了系统验证。该方案通过引入映射模块和调光模块对传统的CDMA方案进行改进,在保证系统传输效率的同时,实现调光控制。基于该CDMA方案,本文进一步采用现场可编程门阵列(Field Programmable Gate Array,FPGA)搭建了实时多用户VLC系统,结果表明该方案能够以低复杂度实现多用户传输,并使系统具有较优的照明性能。(2)针对多用户系统多径效应引起的同步破坏问题,本文构造了两种适用于准同步(Quasi-synchronous,QS)CDMA-VLC系统的新型扩频码集,并进行了系统验证。两种新型码集分别为基于交织迭代的OZCZ(Optical Zero Correlation Zone)码集和基于迭代扩展的OZCZ码集,它们在零相关区内保持良好的相关特性,系统发送端和接收端分别采用不同极性的码集进行扩频和解扩。结合新构造的码集,本文进一步搭建了单通道和双通道QS-CDMA-VLC系统,结果表明,系统在调光值、总比特率、传输时延容忍度和误码性能方面均能得到较大提升。(3)针对多用户系统中多样化流量需求的问题,本文首次建立了多速率QS-CDMA-VLC系统模型,并提出了一种适用于该系统模型的OVSF-OZCZ(Orthogonal Variable Spreading Factor OZCZ)码集。该码集具有可变扩频因子和零相关区特性,可同时满足多用户传输的多速率和准同步需求。通过数值仿真分析,新构造的码集可作为多速率QS-CDMA-VLC系统的候选码集,支持未来大规模异构设备的多业务需求。(4)本文进一步采用ARM和FPGA一体化开发平台,实现了基于CDMA技术的可见光通信定位一体化系统,该系统同时具备照明、通信和定位功能。结果表明,通过应用基于交织迭代的OZCZ码集,系统在减少多址干扰、提升定位精度、保证照明性能等方面均表现出色。
二、基于内容检索的图像系统及其应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于内容检索的图像系统及其应用(论文提纲范文)
(1)哈希学习算法及其应用技术研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和意义 |
1.2 哈希学习的主要应用领域 |
1.2.1 多媒体检索 |
1.2.2 安全性验证 |
1.2.3 多示例多标记分类 |
1.2.4 推荐系统 |
1.3 本文的研究内容 |
1.4 章节安排 |
2 哈希学习 |
2.1 哈希学习的研究内容 |
2.1.1 哈希函数的设计 |
2.1.2 相似性度量 |
2.1.3 损失函数 |
2.1.4 优化方法 |
2.2 哈希学习算法的分类 |
2.2.1 传统的哈希算法 |
2.2.1.1 局部敏感哈希 |
2.2.1.2 半监督哈希算法 |
2.2.1.3 迭代量化哈希 |
2.2.1.4 乘积量化哈希 |
2.2.1.5 合成量化哈希 |
2.2.2 基于神经网络的哈希算法 |
2.2.2.1 深度卷积神经网络哈希CNNH |
2.2.2.2 深度神经网络哈希DNNH |
2.2.2.3 深度监督哈希DSH |
2.3 本章小结 |
3 基于哈希学习的图像内容完整性认证算法 |
3.1 背景介绍 |
3.1.1 图像认证技术 |
3.1.2 度量学习 |
3.1.3 量化技术 |
3.2 研究现状 |
3.2.1 图像认证算法 |
3.2.2 度量学习算法 |
3.2.3 量化算法 |
3.3 研究动机 |
3.4 算法流程 |
3.5 WLMMC算法 |
3.5.1 LMNN 算法和PFLMNN 算法 |
3.5.1.1 LMNN算法 |
3.5.1.2 PFLMNN算法 |
3.5.2 数据集的生成 |
3.5.3 目标函数的设计 |
3.5.4 目标函数的求解 |
3.6 SPQ算法 |
3.6.1 维数的选择 |
3.6.2 监督量化 |
3.7 实验结果与性能分析 |
3.7.1 实验数据集 |
3.7.2 实验设置 |
3.7.3 评判标准 |
3.7.4 实验结果和实验分析 |
3.7.4.1 WLMMC算法性能分析 |
3.7.4.2 整体哈希算法的性能分析 |
3.7.4.3 数据子集的大小对算法性能的影响 |
3.8 本章小结 |
4 基于深度哈希学习的运动捕捉数据检索方法 |
4.1 背景介绍 |
4.1.1 运动检索技术 |
4.1.2 人体骨架结构 |
4.1.3 循环神经网络 |
4.2 相关研究 |
4.2.1 传统的运动检索算法 |
4.2.2 基于神经网络的人体特征表示算法 |
4.2.3 神经网络与传统算法对比分析 |
4.3 研究动机 |
4.4 算法流程 |
4.5 基于深度哈希学习的网络框架 |
4.5.1 数据预处理 |
4.5.2 独立循环神经网络 |
4.5.3 基于层次化的Ind RNN网络特征提取 |
4.5.4 损失函数的设计 |
4.5.5 网络参数的更新 |
4.6 实验结果与分析 |
4.6.1 数据集与实验环境 |
4.6.2 神经网络模型的训练和相关参数设置 |
4.6.3 评价指标和对比方法 |
4.6.4 实验结果分析 |
4.7 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 工作展望 |
致谢 |
参考文献 |
附录 |
(2)基于图结构的视觉场景表达及其应用研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号表 |
1 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外相关工作研究进展 |
1.2.1 面向特征分析的视觉场景表达 |
1.2.2 面向图结构分析的视觉场景表达 |
1.3 主要评价准则 |
1.3.1 可视化方法 |
1.3.2 定量评价方法 |
1.4 本文主要研究内容和章节安排 |
1.4.1 主要研究内容 |
1.4.2 章节安排 |
2 基于格式塔分组准则和路径优化的场景表达方法 |
2.1 问题描述和分析 |
2.2 格式塔原理 |
2.2.1 格式塔心理学 |
2.2.2 格式塔分组准则 |
2.3 基于格式塔分组准则的路径优化方法 |
2.3.1 图模型建立 |
2.3.2 格式塔分组路径优化 |
2.3.3 路径距离度量 |
2.4 实验结果与分析 |
2.4.1 聚类和流形学习分析 |
2.4.2 显着度检测分析 |
2.5 本章小结 |
3 基于瓶颈检测和随机游走的场景表达方法 |
3.1 问题描述和分析 |
3.2 路径瓶颈和随机游走 |
3.2.1 路径瓶颈 |
3.2.2 随机游走 |
3.3 基于随机游走的路径瓶颈分析方法 |
3.3.1 无向图生成 |
3.3.2 路径瓶颈检测和距离度量 |
3.3.3 基于随机游走的瓶颈检测算法 |
3.4 实验结果与分析 |
3.4.1 数据集 |
3.4.2 可视化方法 |
3.4.3 距离比较与分析 |
3.5 本章小结 |
4 基于无向图模型分析的结构保护图像滤波 |
4.1 引言 |
4.1.1 结构保护图像滤波 |
4.1.2 问题描述 |
4.2 距离变换和场景表达分析 |
4.2.1 距离变换 |
4.2.2 性能比较和分析 |
4.3 结构保护滤波模型 |
4.3.1 模型定义 |
4.3.2 模型解释 |
4.3.3 复杂度分析 |
4.4 实验结果与分析 |
4.4.1 参数设置 |
4.4.2 算法比较与分析 |
4.4.3 应用分析 |
4.5 本章小结 |
5 基于无向图模型分析的视觉注意力建模 |
5.1 引言 |
5.1.1 视觉注意力选择机制和显着度检测 |
5.1.2 问题描述 |
5.2 拉普拉斯路径距离和场景表达分析 |
5.2.1 无向加权图 |
5.2.2 路径拉普拉斯分析和距离定义 |
5.2.3 降维和可视化 |
5.3 视觉注意力模型建立 |
5.3.1 格式塔结构连通度GC |
5.3.2 外观对比度AC |
5.3.3 PBS显着度模型 |
5.3.4 模型复杂度分析 |
5.4 实验结果与分析 |
5.4.1 数据集 |
5.4.2 评价方法 |
5.4.3 性能比较 |
5.5 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 创新点 |
6.3 展望 |
参考文献 |
攻读博士学位期间科研项目及科研成果 |
致谢 |
作者简介 |
(3)结合方向增强型LBP与Gabor小波特征的图像检索算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究目的及其意义 |
1.2 图像检索技术的发展 |
1.3 基于内容的图像检索技术应用状况 |
1.3.1 国外应用状况 |
1.3.2 国内应用现状 |
1.4 本文主要内容安排及创新 |
第二章 图像特征的分类及纹理特征的提取方法 |
2.1 图像特征的分类 |
2.2 纹理概念与分类 |
2.2.1 纹理的概念 |
2.2.2 纹理的分类 |
2.3 纹理的特征提取方法 |
2.3.1 统计法 |
2.3.2 模型法 |
2.3.3 结构法 |
2.3.4 信号处理法 |
2.3.5 提取方法分析比较 |
2.4 本章小结 |
第三章 LBP原理及其应用 |
3.1 LBP概述 |
3.1.1 圆形LBP |
3.1.2 旋转不变的LBP |
3.1.3 统一模式的LBP |
3.2 LBP的改进方向和改进算法 |
3.2.1 LBP算法的改进方向 |
3.2.2 LBP改进算法 |
3.3 本章小结 |
第四章 结合方向增强型LBP与Gabor小波特征的图像检索算法 |
4.1 方向增强型LBP算法 |
4.2 Gabor小波的概述 |
4.2.1 二维Gabor小波 |
4.2.2 图像的Gabor小波特征提取 |
4.3 结合方向增强型LBP与Gabor小波特征的提取算法 |
4.4 相似性度量与特征结合 |
4.4.1 曼哈顿距离 |
4.4.2 切比雪夫距离 |
4.4.3 欧氏距离 |
4.4.4 特征结合 |
4.5 实验及分析 |
4.5.1 方向增强型LBP特征提取 |
4.5.2 Gabor小波纹理特征提取 |
4.5.3 图像检索结果 |
4.6 本章小结 |
总结与展望 |
参考文献 |
攻读学位期间获得的研究成果 |
致谢 |
(4)图像特征编码及其应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 课题研究现状及发展趋势 |
1.3 课题研究相关内容 |
1.3.1 图像分类识别 |
1.3.2 显着性目标检测 |
1.3.3 人体再识别 |
1.4 本文主要工作与创新点 |
1.5 文章结构安排 |
第二章 图像特征提取及特征编码 |
2.1 图像特征 |
2.1.1 图像局部特征 |
2.1.2 颜色特征 |
2.1.3 纹理特征与协方差描述子 |
2.2 特征编码 |
2.2.1 基于表示的分类 |
2.2.2 基于约束项的分类 |
2.2.3 局部特征编码算法数学模型 |
2.2.4 编码方法性能评价 |
2.3 常用的公共数据集 |
2.3.1 图像分类数据集 |
2.3.2 显着性目标检测数据集 |
2.3.3 人体再识别数据集 |
2.4 本章小结 |
第三章 基于特征编码及类码本学习的图像分类 |
3.1 引言 |
3.2 特征编码相关工作 |
3.2.1 矢量量化 |
3.2.2 稀疏编码 |
3.2.3 局部性约束的线性编码 |
3.2.4 码本学习方法 |
3.3 基于特征编码及类码本学习的方法 |
3.4 基于特征编码及类码本学习的实验结果 |
3.4.1 Caltech101实验结果分析 |
3.4.2 Scene15和UIUC8实验结果 |
3.4.3 实验分析和讨论 |
3.5 本章小结 |
第四章 基于局部性编码和条件随机场的目标显着性计算 |
4.1 引言 |
4.2 显着性计算方法相关工作 |
4.2.1 Top-down显着性方法 |
4.2.2 特征编码方法 |
4.2.3 CRF模型 |
4.3 基于局部性编码和CRF模型的目标显着性计算方法 |
4.3.1 编码 |
4.3.2 学习显着性目标模型 |
4.4 基于局部性编码和CRF模型的实验结果 |
4.4.1 MSRA-B dataset |
4.4.2 Graz-02 dataset |
4.4.3 The Weizmann Horse and Plane datasets |
4.5 本章小结 |
第五章 融合背景信息和top-down模型的目标显着性计算 |
5.1 引言 |
5.2 目标显着性计算相关工作 |
5.2.1 背景度量方法 |
5.2.2 Top-down方法 |
5.2.3 编码方法 |
5.3 融合背景信息和top-down模型的目标显着性计算方法 |
5.3.1 鲁棒背景度量显着性计算 |
5.3.2 基于LLC编码和条件随机场的显着性目标模型 |
5.4 目标显着性计算实验结果 |
5.4.1 Graz-02 |
5.4.2 PASCAL VOC 2007 |
5.5 本章小结 |
第六章 基于图像特征编码的人体再识别 |
6.1 引言 |
6.2 人体再识别相关工作 |
6.2.1 人体再识别流程 |
6.2.2 人体再识别方法 |
6.2.3 特征表示模块 |
6.2.4 模型学习 |
6.3 人体再识别系统框架 |
6.3.1 人体再识别系统框架图 |
6.3.2 行人检测 |
6.3.3 图像特征提取 |
6.3.4 局部性约束的线性编码 |
6.3.5 人体再识别匹配准则 |
6.4 人体再识别实验结果 |
6.4.1 行人检测实验结果 |
6.4.2 VIPe R |
6.4.3 CAVIAR4REID |
6.4.4 ETHZ数据集 |
6.4.5 i-LIDS |
6.4.6 校园采集数据集 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 本文总结 |
7.2 未来展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(5)云计算环境下的并行Skyline算法及其应用研究(论文提纲范文)
创新点摘要 |
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
第2章 云计算和Skyline查询算法简介 |
2.1 云计算 |
2.1.1 云计算概述 |
2.1.2 云计算关键技术 |
2.2 Hadoop核心技术 |
2.2.1 分布式文件系统 |
2.2.2 MapReduce编程模型 |
2.3 Skyline查询算法 |
2.3.1 Skyline概述 |
2.3.2 传统的Skyline算法 |
2.3.3 基于MapReduce的Skyline算法 |
2.3.4 基于MapReduce的Skyline算法存在的问题 |
2.4 本章小结 |
第3章 基于用户喜好的子空间Skyline算法 |
3.1 引言 |
3.2 子空间Skyline查询的系统模型 |
3.3 子空间Skyline算法 |
3.3.1 网格剪枝策略 |
3.3.2 利用MapReduce构建索引文件 |
3.3.3 两种过滤方法 |
3.3.4 子空间Skyline查询过程 |
3.4 实验及结果分析 |
3.4.1 实验环境设置 |
3.4.2 实验结果及分析 |
3.5 本章小结 |
第4章 基于MapReduce的动态Skyline算法 |
4.1 引言 |
4.2 基于MapReduce的动态Skyline查询的系统模型 |
4.3 基于MapReduce的动态Skyline算法 |
4.3.1 倒排网格索引结构 |
4.3.2 全局Skyline格的计算 |
4.3.3 动态Skyline的计算 |
4.4 动态Skyline查询在流数据中的应用 |
4.4.1 基于时序的划分模块 |
4.4.2 索引数据结构 |
4.4.3 全局Skyline格计算的应用 |
4.5 实验及结果分析 |
4.5.1 实验环境设置 |
4.5.2 动态Skyline算法实验结果及分析 |
4.5.3 数据流应用实验结果及分析 |
4.6 本章小结 |
第5章 基于图像多特征融合的度量空间Skyline算法 |
5.1 引言 |
5.2 预备知识 |
5.2.1 基于内容的图像检索 |
5.2.2 传统的多特征的融合方法 |
5.3 基于图像多特征融合的度量空间Skyline算法 |
5.3.1 算法的系统模型 |
5.3.2 特征提取 |
5.3.3 特征匹配 |
5.3.4 多特征融合 |
5.4 实验及结果分析 |
5.4.1 实验环境设置 |
5.4.2 实验及结果分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
攻读学位期间公开发表论文 |
攻读学位期间主持和参与的主要科研项目 |
致谢 |
作者简介 |
(6)基于脉冲耦合神经网络的图像处理若干问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 人工神经网络与图像处理 |
1.1.1 人工神经网络生物学基础 |
1.1.2 人工神经网络技术与发展 |
1.1.3 人工神经网络在图像处理中的应用 |
1.2 脉冲耦合神经网络的研究现状 |
1.2.1 脉冲耦合神经网络的理论研究 |
1.2.2 脉冲耦合神经网络的应用研究 |
1.3 论文的研究背景和主要内容 |
第二章 脉冲耦合神经网络的理论基础 |
2.1 视觉系统及其模型 |
2.1.1 视觉系统的定性描述 |
2.1.2 视觉系统的数学模型 |
2.2 脉冲耦合神经网络基本模型 |
2.2.1 Eckhorn神经元模型 |
2.2.2 脉冲耦合神经网络模型 |
2.3 脉冲耦合神经网络的运行机理 |
2.3.1 无耦合链接的PCNN |
2.3.2 耦合链接的PCNN |
2.4 脉冲耦合神经网络的基本特性 |
2.5 本章小结 |
第三章 基于脉冲耦合神经网络的图像噪声滤除 |
3.1 图像噪声及其滤除 |
3.1.1 图像噪声特点及模型 |
3.1.2 图像噪声滤除方法 |
3.2 基于自适应ULPCNN噪声检测的两级脉冲噪声滤波算法 |
3.2.1 AULPCNN模型 |
3.2.2 滤波算法描述 |
3.2.3 实验结果与分析 |
3.3 基于平滑抑制的自适应链接PCNN图像高斯噪声双边滤波算法 |
3.3.1 SIAL-PCNN模型 |
3.3.2 SIAL-PCNN双边滤波算法 |
3.3.3 实验结果与分析 |
3.4 本章小结 |
第四章 结合灰度熵变换的脉冲耦合神经网络小目标检测 |
4.1 小目标图像检测概述 |
4.1.1 空域检测 |
4.1.2 时域检测 |
4.1.3 空时混合检测 |
4.2 图像灰度熵变换 |
4.3 结合灰度熵变换的脉冲耦合神经网络小目标检测算法 |
4.3.1 脉冲耦合神经网络改进模型 |
4.3.2 交叉熵及其阈值检测 |
4.3.3 小目标图像自动检测算法 |
4.3.4 实验结果与分析 |
4.4 本章小结 |
第五章 脉冲耦合神经网络在图像自动分割中的应用 |
5.1 图像分割及其方法 |
5.1.1 图像分割基本概念 |
5.1.2 图像分割主要方法 |
5.1.3 图像分割领域存在的问题 |
5.2 基于超模糊熵ULPCNN二值图像自动分割新算法 |
5.2.1 超模糊理论 |
5.2.2 改进ULPCNN模型及二值图像分割 |
5.2.3 实验结果与分析 |
5.3 基于互信息改进型脉冲耦合神经网络多值图像自动分割算法 |
5.3.1 互信息与互信息熵差 |
5.3.2 改进型PCNN模型及其最大互信息图像分割算法 |
5.3.3 实验结果与分析 |
5.4 本章小结 |
第六章 基于脉冲耦合神经网络的图像NMI特征提取及检索 |
6.1 图像检索技术概述 |
6.1.1 基于文本图像检索方法 |
6.1.2 基于内容图像检索方法 |
6.1.3 图像检索研究面临的问题 |
6.2 基于脉冲耦合神经网络的图像NMI特征提取及检索方法 |
6.2.1 PCNN改进简化模型及图像二值序列分解 |
6.2.2 图像NMI特征描述 |
6.2.3 相似性度量 |
6.2.4 实验结果与分析 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
致谢 |
参考文献 |
研究成果 |
(7)图像局部不变特征提取技术研究及其应用(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文的研究背景 |
1.2 局部不变特征提取方法的国内外研究现状 |
1.2.1 局部不变特征提取方法分类 |
1.2.2 角点检测子的研究现状分析 |
1.2.3 角点检测子性能比较 |
1.2.4 区域检测子的研究现状分析 |
1.2.5 区域检测子性能比较 |
1.3 论文的研究意义和目的 |
1.4 论文的研究思路和主要研究内容 |
2 不变特征相关理论 |
2.1 尺度空间理论 |
2.1.1 尺度空间发展历程 |
2.1.2 尺度空间的数学定义和基本思想 |
2.1.3 线性尺度空间 |
2.1.4 图像的多尺度表达 |
2.1.5 尺度空间应用于仿射不变特征检测的意义 |
2.2 图像特征及其仿射不变性 |
2.2.1 图像的特征 |
2.2.2 不变特征 |
2.2.3 仿射变换 |
2.2.4 仿射不变特征 |
2.3 本章小结 |
3 加速的椭圆形最大稳定极值区域仿射不变性检测子 |
3.1 最大稳定极值区域 |
3.1.1 最大稳定极值区域的数学定义 |
3.1.2 最大稳定极值区域的性质 |
3.2 加速的椭圆形最大稳定极值区域的提取算法 |
3.2.1 算法流程 |
3.2.2 像素点排序 |
3.2.3 邻域四叉树 |
3.2.4 极值区域的提取 |
3.2.5 成分树 |
3.2.6 最大稳定判定条件 |
3.2.7 区域的最终确定 |
3.2.8 区域的椭圆形调整 |
3.3 实验及结果分析 |
3.3.1 广义仿射不变性的实验验证和分析 |
3.3.2 可重复性实验验证和分析 |
3.4 本章小结 |
4 基于点区域的仿射不变性检测子 |
4.1 基于规范化LoG方程的尺度不变性检测子 |
4.1.1 尺度自适应的Harris角点检测子 |
4.1.2 基于尺度规范化LoG方程的自动尺度选择 |
4.1.3 尺度不变性特征的迭代检测 |
4.1.4 实验结果 |
4.2 位置/尺度/形状同步迭代的仿射不变性点区域检测子 |
4.2.1 基于形状自适应的仿射规范化理论 |
4.2.2 仿射不变性点区域的检测 |
4.3 实验及结果分析 |
4.3.1 广义仿射不变性的实验验证和分析 |
4.3.2 可重复性的实验验证和分析 |
4.4 本章小结 |
5 基于目标区域内局部不变特征和空间一致性度量的图像检索技术 |
5.1 基于内容的图像检索 |
5.1.1 基于对象区域的检索 |
5.1.2 基于显着性特征的检索 |
5.2 SIFT描述子 |
5.2.1 特征的方向 |
5.2.2 图像局部特征描述子的生成 |
5.3 基于空间一致性的目标区域内仿射不变特征图像检索理论 |
5.3.1 基于矢量量化不变性描述子的视觉关键词表 |
5.3.2 空间一致性 |
5.3.3 基于目标区域的图像检索 |
5.4 基于EMSER-A的图像检索 |
5.4.1 实验参数说明 |
5.4.2 检索结果衡量标准 |
5.4.3 检索示例 |
5.4.4 检索结果分析 |
5.5 基于LS~2-I的图像检索 |
5.6 稳定性大库验证 |
5.7 广义检索 |
5.8 检索时间分析 |
5.9 本章小结 |
结论 |
参考文献 |
论文创新点摘要 |
攻读博士学位期间发表学术论文情况 |
致谢 |
(8)视觉感知的稀疏编码理论及其应用研究(论文提纲范文)
摘要 |
第一章 引言 |
1.1 研究背景与意义 |
1.2 研究现状概述 |
1.3 本文的主要贡献 |
1.4 论文的组织 |
第二章 人类视觉感知系统及有效编码概述 |
2.1 什么是视觉感知 |
2.1.1 外部环境的输入刺激 |
2.1.2 神经信息处理机制 |
2.1.3 视感官系统的输出 |
2.2 人类视觉感知系统 |
2.2.1 人类视觉系统的初级视觉通道 |
2.2.2 神经细胞感受野特性 |
2.2.3 人类视觉系统的特点 |
2.3 有效编码概述 |
2.3.1 自然图像统计特性 |
2.3.2 有效编码研究进展 |
2.3.3 有效编码研究面临的挑战 |
2.3.4 有效编码理论的应用 |
2.4 小结 |
第三章 面向知觉任务的稀疏编码模型 |
3.1 引言 |
3.2 相关工作 |
3.2.1 线性叠加模型 |
3.2.2 稀疏编码模型 |
3.3 冗余可辨别的系数空间 |
3.4 面向分类任务的稀疏编码模型 |
3.4.1 判别约束 |
3.4.2 学习算法 |
3.5 仿真结果 |
3.5.1 预处理和实验条件 |
3.5.2 仿真结果 |
3.6 参数分析 |
3.6.1 对稀疏性能的影响 |
3.6.2 对重构误差的影响 |
3.6.3 对分类准确性的影响 |
3.7 讨论 |
3.8 小结 |
第四章 双层反馈稀疏编码模型 |
4.1 引言 |
4.2 相关工作 |
4.2.1 独立成份分析方法 |
4.2.2 基于ICA的稀疏编码模型 |
4.2.3 多层感知机 |
4.3 双层反馈稀疏编码模型 |
4.3.1 TLF-SC模型概述 |
4.3.2 TLF-SC网络模型训练算法 |
4.4 仿真结果 |
4.4.1 模拟数据仿真 |
4.4.2 自然图像数据仿真 |
4.5 小结 |
第五章 基于注意选择机制的稀疏编码模型 |
5.1 引言 |
5.2 相关工作 |
5.2.1 稀疏编码模型 |
5.2.2 注意选择机制研究现状 |
5.3 基于注意机制的稀疏编码模型 |
5.3.1 模型概述 |
5.3.2 非均匀采样注意模块 |
5.3.3 基于响应显着度的注意模块 |
5.3.4 注意选择策略 |
5.4 实验结果 |
5.4.1 仿真环境和设置 |
5.4.2 仿真结果 |
5.4.3 参数分析 |
5.5 小结 |
第六章 基于稀疏编码模型的纹理特征分析 |
6.1 引言 |
6.2 纹理特征的相关工作 |
6.2.1 Tamura纹理特征 |
6.2.2 自回归纹理模型 |
6.2.3 小波和Gabor纹理特征 |
6.2.4 纹理谱特征 |
6.3 ICA系数纹理特征 |
6.3.1 纹理感知理论和模型 |
6.3.2 ICA系数纹理特征表示和抽取 |
6.3.3 几种纹理特征的分析与比较 |
6.3.4 距离测度 |
6.4 ICA系数纹理特征的图像检索实验 |
6.4.1 实验环境 |
6.4.2 评价准则 |
6.4.3 性能比较 |
6.5 小结 |
第七章 结束语 |
7.1 本文的主要贡献 |
7.2 下一步研究方向 |
附录A Gabor滤波器 |
附录B 定理证明 |
参考文献 |
致谢 |
作者简历 |
(9)基于Faster R-CNN的场景相似性计算与标注方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 目标检测的研究现状 |
1.2.2 图像检索的研究现状 |
1.2.3 数据集的研究现状 |
1.3 论文的研究内容以及结构安排 |
2 场景相似性计算的相关理论 |
2.1 深度学习关键技术 |
2.1.1 反向传播算法 |
2.1.2 梯度下降法 |
2.1.3 激活函数 |
2.2 目标检测相关理论 |
2.2.1 ResNet网络 |
2.2.2 Fast R-CNN网络 |
2.2.3 RPN网络 |
2.3 图像检索质量评价 |
3 基于Faster R-CNN的场景相似性计算方法 |
3.1 引言 |
3.2 基于Faster R-CNN目标检测网络的数据预处理 |
3.2.1 Visual Genome数据集 |
3.2.2 数据预处理 |
3.3 场景目标树和图模型的构建方法 |
3.3.1 场景目标树的构建方法 |
3.3.2 目标间相对位置关系的表示方法 |
3.3.3 场景图模型的构建方法 |
3.4 基于图模型的场景相似性计算方法 |
3.4.1 基于OT图模型的场景相似性计算方法 |
3.4.2 基于PGAOT图模型的场景相似性计算方法 |
3.5 仿真实验及结果分析 |
3.5.1 构建场景目标树和图模型的实验结果与分析 |
3.5.2 图像检索的实验结果与分析 |
3.6 本章小结 |
4 CSBOGM数据集制作与标注方法 |
4.1 引言 |
4.2 CSBOGM数据集的制作与标注 |
4.2.1 CSBOGM数据集的制作 |
4.2.2 CSBOGM数据集的标注 |
4.3 仿真实验及结果分析 |
4.4 本章小结 |
5 总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
致谢 |
参考文献 |
攻读学位期间主要研究成果 |
(10)面向可见光通信的CDMA技术及其应用研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
缩写清单 |
1 绪论 |
1.1 研究背景及意义 |
1.2 可见光通信发展概述 |
1.3 可见光通信中多址接入技术研究现状 |
1.4 论文的研究内容及主要创新点 |
1.5 论文的组织与安排 |
2 可见光通信及CDMA技术基本原理 |
2.1 可见光通信系统构成 |
2.2 可见光通信关键技术 |
2.2.1 多址接入技术 |
2.2.2 调制技术 |
2.2.3 调光控制技术 |
2.3 基于CDMA的多址接入技术 |
2.3.1 CDMA基本原理 |
2.3.2 扩频码集在VLC中的应用 |
2.3.3 基于CDMA的可见光通信系统模型 |
2.4 针对CDMA-VLC系统的研究点 |
2.5 本章小结 |
3 面向VLC系统的调光控制CDMA方案及其应用研究 |
3.1 引言 |
3.2 调光控制CDMA-VLC方案 |
3.2.1 方案原理 |
3.2.2 方案示例 |
3.3 仿真系统实现和性能分析 |
3.4 基于FPGA的实时系统实现 |
3.5 本章小结 |
4 面向QS-CDMA-VLC系统的新型码集构造及其应用研究 |
4.1 引言 |
4.2 OZCZ码集构造基础 |
4.3 基于交织迭代的OZCZ码集构造 |
4.3.1 构造方法 |
4.3.2 特性分析 |
4.3.3 构造示例 |
4.4 单通道QS-CDMA-VLC系统模型和性能分析 |
4.4.1 系统模型 |
4.4.2 系统性能仿真和实验分析 |
4.5 基于迭代扩展的OZCZ码集构造 |
4.5.1 构造方法 |
4.5.2 特性分析 |
4.5.3 构造示例 |
4.6 双通道QS-CDMA-VLC系统模型和性能分析 |
4.6.1 系统模型 |
4.6.2 系统性能实验分析 |
4.7 本章小结 |
5 面向多速率QS-CDMA-VLC系统的码集构造及其应用研究 |
5.1 引言 |
5.2 多速率QS-CDMA-VLC系统建模 |
5.3 OVSF-OZCZ码集构造 |
5.3.1 构造基础 |
5.3.2 构造方法 |
5.3.3 特性分析 |
5.3.4 构造示例 |
5.4 多速率QS-CDMA-VLC系统性能分析 |
5.4.1 性能分析 |
5.4.2 数值仿真结果 |
5.5 本章小结 |
6 基于CDMA技术的可见光通定一体化系统实现 |
6.1 引言 |
6.2 基于CDMA的可见光通定一体化系统 |
6.2.1 系统模型 |
6.2.2 基于CDMA的可见光通定一体化方案 |
6.3 可见光通定一体化系统性能分析 |
6.4 可见光通定一体化实时系统实现 |
6.5 本章小结 |
7 总结与展望 |
7.1 论文工作总结 |
7.2 未来研究展望 |
参考文献 |
作者简历及在学研究成果 |
学位论文数据集 |
四、基于内容检索的图像系统及其应用(论文参考文献)
- [1]哈希学习算法及其应用技术研究[D]. 姚亮. 南京理工大学, 2020(01)
- [2]基于图结构的视觉场景表达及其应用研究[D]. 徐丽娟. 大连理工大学, 2019(08)
- [3]结合方向增强型LBP与Gabor小波特征的图像检索算法研究[D]. 刘恬. 长安大学, 2019(01)
- [4]图像特征编码及其应用研究[D]. 杨贞. 上海交通大学, 2016(02)
- [5]云计算环境下的并行Skyline算法及其应用研究[D]. 李媛媛. 大连海事大学, 2016(05)
- [6]基于脉冲耦合神经网络的图像处理若干问题研究[D]. 刘勍. 西安电子科技大学, 2011(12)
- [7]图像局部不变特征提取技术研究及其应用[D]. 孙晶. 大连理工大学, 2009(10)
- [8]视觉感知的稀疏编码理论及其应用研究[D]. 李清勇. 中国科学院研究生院(计算技术研究所), 2006(10)
- [9]基于Faster R-CNN的场景相似性计算与标注方法研究[D]. 彭晶. 西安理工大学, 2021(01)
- [10]面向可见光通信的CDMA技术及其应用研究[D]. 陈丹阳. 北京科技大学, 2021