更全的杂志信息网

传统的目标检测论文

发布时间:2024-07-08 11:48:20

传统的目标检测论文

姓名:牛晓银;学号:20181213993;学院:计算机科学与技术 转自: 【嵌牛导读】:目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪研究越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。 【嵌牛鼻子】:目标检测、检测模型、计算机视觉 【嵌牛提问】:你知道或者用过哪些目标检测算法? 【嵌牛正文】: (一)目标检测经典工作回顾 本文结构 两阶段模型因其对图片的两阶段处理得名,也称为基于区域(Region-based)的方法,我们选取R-CNN系列工作作为这一类型的代表。 R-CNN: R-CNN系列的开山之作 论文链接:  Rich feature hierarchies for accurate object detection and semantic segmentation 本文的两大贡献:1)CNN可用于基于区域的定位和分割物体;2)监督训练样本数紧缺时,在额外的数据上预训练的模型经过fine-tuning可以取得很好的效果。第一个贡献影响了之后几乎所有2-stage方法,而第二个贡献中用分类任务(Imagenet)中训练好的模型作为基网络,在检测问题上fine-tuning的做法也在之后的工作中一直沿用。 传统的计算机视觉方法常用精心设计的手工特征(如SIFT, HOG)描述图像,而深度学习的方法则倡导习得特征,从图像分类任务的经验来看,CNN网络自动习得的特征取得的效果已经超出了手工设计的特征。本篇在局部区域应用卷积网络,以发挥卷积网络学习高质量特征的能力。 R-CNN将检测抽象为两个过程,一是基于图片提出若干可能包含物体的区域(即图片的局部裁剪,被称为Region Proposal),文中使用的是Selective Search算法;二是在提出的这些区域上运行当时表现最好的分类网络(AlexNet),得到每个区域内物体的类别。 另外,文章中的两个做法值得注意。 一是数据的准备。输入CNN前,我们需要根据Ground Truth对提出的Region Proposal进行标记,这里使用的指标是IoU(Intersection over Union,交并比)。IoU计算了两个区域之交的面积跟它们之并的比,描述了两个区域的重合程度。 文章中特别提到,IoU阈值的选择对结果影响显著,这里要谈两个threshold,一个用来识别正样本(如跟ground truth的IoU大于),另一个用来标记负样本(即背景类,如IoU小于),而介于两者之间的则为难例(Hard Negatives),若标为正类,则包含了过多的背景信息,反之又包含了要检测物体的特征,因而这些Proposal便被忽略掉。 另一点是位置坐标的回归(Bounding-Box Regression),这一过程是Region Proposal向Ground Truth调整,实现时加入了log/exp变换来使损失保持在合理的量级上,可以看做一种标准化(Normalization)操作。 小结 R-CNN的想法直接明了,即将检测任务转化为区域上的分类任务,是深度学习方法在检测任务上的试水。模型本身存在的问题也很多,如需要训练三个不同的模型(proposal, classification, regression)、重复计算过多导致的性能问题等。尽管如此,这篇论文的很多做法仍然广泛地影响着检测任务上的深度模型革命,后续的很多工作也都是针对改进这一工作而展开,此篇可以称得上"The First Paper"。 Fast R-CNN: 共享卷积运算 论文链接: Fast R-CNN 文章指出R-CNN耗时的原因是CNN是在每一个Proposal上单独进行的,没有共享计算,便提出将基础网络在图片整体上运行完毕后,再传入R-CNN子网络,共享了大部分计算,故有Fast之名。 上图是Fast R-CNN的架构。图片经过feature extractor得到feature map, 同时在原图上运行Selective Search算法并将RoI(Region of Interset,实为坐标组,可与Region Proposal混用)映射到到feature map上,再对每个RoI进行RoI Pooling操作便得到等长的feature vector,将这些得到的feature vector进行正负样本的整理(保持一定的正负样本比例),分batch传入并行的R-CNN子网络,同时进行分类和回归,并将两者的损失统一起来。 RoI Pooling 是对输入R-CNN子网络的数据进行准备的关键操作。我们得到的区域常常有不同的大小,在映射到feature map上之后,会得到不同大小的特征张量。RoI Pooling先将RoI等分成目标个数的网格,再在每个网格上进行max pooling,就得到等长的RoI feature vector。 文章最后的讨论也有一定的借鉴意义: multi-loss traing相比单独训练classification确有提升 multi-scale相比single-scale精度略有提升,但带来的时间开销更大。一定程度上说明CNN结构可以内在地学习尺度不变性 在更多的数据(VOC)上训练后,精度是有进一步提升的 Softmax分类器比"one vs rest"型的SVM表现略好,引入了类间的竞争 更多的Proposal并不一定带来精度的提升 小结 Fast R-CNN的这一结构正是检测任务主流2-stage方法所采用的元结构的雏形。文章将Proposal, Feature Extractor, Object Classification&Localization统一在一个整体的结构中,并通过共享卷积计算提高特征利用效率,是最有贡献的地方。 Faster R-CNN: 两阶段模型的深度化 论文链接: Faster R-CNN: Towards Real Time Object Detection with Region Proposal Networks Faster R-CNN是2-stage方法的奠基性工作,提出的RPN网络取代Selective Search算法使得检测任务可以由神经网络端到端地完成。粗略的讲,Faster R-CNN = RPN + Fast R-CNN,跟RCNN共享卷积计算的特性使得RPN引入的计算量很小,使得Faster R-CNN可以在单个GPU上以5fps的速度运行,而在精度方面达到SOTA(State of the Art,当前最佳)。 本文的主要贡献是提出Regional Proposal Networks,替代之前的SS算法。RPN网络将Proposal这一任务建模为二分类(是否为物体)的问题。 第一步是在一个滑动窗口上生成不同大小和长宽比例的anchor box(如上图右边部分),取定IoU的阈值,按Ground Truth标定这些anchor box的正负。于是,传入RPN网络的样本数据被整理为anchor box(坐标)和每个anchor box是否有物体(二分类标签)。RPN网络将每个样本映射为一个概率值和四个坐标值,概率值反应这个anchor box有物体的概率,四个坐标值用于回归定义物体的位置。最后将二分类和坐标回归的损失统一起来,作为RPN网络的目标训练。 由RPN得到Region Proposal在根据概率值筛选后经过类似的标记过程,被传入R-CNN子网络,进行多分类和坐标回归,同样用多任务损失将二者的损失联合。 小结 Faster R-CNN的成功之处在于用RPN网络完成了检测任务的"深度化"。使用滑动窗口生成anchor box的思想也在后来的工作中越来越多地被采用(YOLO v2等)。这项工作奠定了"RPN+RCNN"的两阶段方法元结构,影响了大部分后续工作。 单阶段(1-stage)检测模型 单阶段模型没有中间的区域检出过程,直接从图片获得预测结果,也被成为Region-free方法。 YOLO 论文链接: You Only Look Once: Unified, Real-Time Object Detection YOLO是单阶段方法的开山之作。它将检测任务表述成一个统一的、端到端的回归问题,并且以只处理一次图片同时得到位置和分类而得名。 YOLO的主要优点: 快。 全局处理使得背景错误相对少,相比基于局部(区域)的方法, 如Fast RCNN。 泛化性能好,在艺术作品上做检测时,YOLO表现比Fast R-CNN好。 YOLO的工作流程如下: 1.准备数据:将图片缩放,划分为等分的网格,每个网格按跟Ground Truth的IoU分配到所要预测的样本。 2.卷积网络:由GoogLeNet更改而来,每个网格对每个类别预测一个条件概率值,并在网格基础上生成B个box,每个box预测五个回归值,四个表征位置,第五个表征这个box含有物体(注意不是某一类物体)的概率和位置的准确程度(由IoU表示)。测试时,分数如下计算: 等式左边第一项由网格预测,后两项由每个box预测,以条件概率的方式得到每个box含有不同类别物体的分数。 因而,卷积网络共输出的预测值个数为S×S×(B×5+C),其中S为网格数,B为每个网格生成box个数,C为类别数。 3.后处理:使用NMS(Non-Maximum Suppression,非极大抑制)过滤得到最后的预测框 损失函数的设计 损失函数被分为三部分:坐标误差、物体误差、类别误差。为了平衡类别不均衡和大小物体等带来的影响,损失函数中添加了权重并将长宽取根号。 小结 YOLO提出了单阶段的新思路,相比两阶段方法,其速度优势明显,实时的特性令人印象深刻。但YOLO本身也存在一些问题,如划分网格较为粗糙,每个网格生成的box个数等限制了对小尺度物体和相近物体的检测。 SSD: Single Shot Multibox Detector 论文链接: SSD: Single Shot Multibox Detector SSD相比YOLO有以下突出的特点: 多尺度的feature map:基于VGG的不同卷积段,输出feature map到回归器中。这一点试图提升小物体的检测精度。 更多的anchor box,每个网格点生成不同大小和长宽比例的box,并将类别预测概率基于box预测(YOLO是在网格上),得到的输出值个数为(C+4)×k×m×n,其中C为类别数,k为box个数,m×n为feature map的大小。 小结 SSD是单阶段模型早期的集大成者,达到跟接近两阶段模型精度的同时,拥有比两阶段模型快一个数量级的速度。后续的单阶段模型工作大多基于SSD改进展开。 检测模型基本特点 最后,我们对检测模型的基本特征做一个简单的归纳。 检测模型整体上由基础网络(Backbone Network)和检测头部(Detection Head)构成。前者作为特征提取器,给出图像不同大小、不同抽象层次的表示;后者则依据这些表示和监督信息学习类别和位置关联。检测头部负责的类别预测和位置回归两个任务常常是并行进行的,构成多任务的损失进行联合训练。 相比单阶段,两阶段检测模型通常含有一个串行的头部结构,即完成前背景分类和回归后,把中间结果作为RCNN头部的输入再进行一次多分类和位置回归。这种设计带来了一些优点: 对检测任务的解构,先进行前背景的分类,再进行物体的分类,这种解构使得监督信息在不同阶段对网络参数的学习进行指导 RPN网络为RCNN网络提供良好的先验,并有机会整理样本的比例,减轻RCNN网络的学习负担 这种设计的缺点也很明显:中间结果常常带来空间开销,而串行的方式也使得推断速度无法跟单阶段相比;级联的位置回归则会导致RCNN部分的重复计算(如两个RoI有重叠)。 另一方面,单阶段模型只有一次类别预测和位置回归,卷积运算的共享程度更高,拥有更快的速度和更小的内存占用。读者将会在接下来的文章中看到,两种类型的模型也在互相吸收彼此的优点,这也使得两者的界限更为模糊。

论文原文:

YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:

如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:

每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:

其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。

每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)

举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:

在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。

得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。

1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。

2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。

3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。

4、损失函数公式见下图:

在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:

解决方法:

只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。

作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。

然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。

作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。

作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。

作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。

YOLO模型相对于之前的物体检测方法有多个优点:

1、 YOLO检测物体非常快

因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、 YOLO可以很好的避免背景错误,产生false positives

不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。

3、 YOLO可以学到物体的泛化特征

当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。

尽管YOLO有这些优点,它也有一些缺点:

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。

2、YOLO容易产生物体的定位错误。

3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。

作为计算机视觉三大任务(图像分类、目标检测、图像分割)之一,目标检测任务在于从图像中定位并分类感兴趣的物体。传统视觉方案涉及霍夫变换、滑窗、特征提取、边界检测、模板匹配、哈尔特征、DPM、BoW、传统机器学习(如随机森林、AdaBoost)等技巧或方法。在卷积神经网络的加持下,目标检测任务在近些年里有了长足的发展。其应用十分广泛,比如在自动驾驶领域,目标检测用于无人车检测其他车辆、行人或者交通标志牌等物体。

目标检测的常用框架可以分为两类,一类是 two-stage/two-shot 的方法,其特点是将兴趣区域检测和分类分开进行,比较有代表性的是R-CNN,Fast R-CNN,Faster R-CNN;另一类是 one-stage/one-shot 的方法,用一个网络同时进行兴趣区域检测和分类,以YOLO(v1,v2,v3)和SSD为代表。

Two-stage的方式面世比较早,由于需要将兴趣区域检测和分类分开进行,虽然精度比较高,但实时性比较差,不适合自动驾驶无人车辆感知等应用场景。因而此次我们主要介绍一下SSD和YOLO系列框架。

SSD与2016年由W. Liu et al.在 SSD: Single Shot MultiBox Detector 一文中提出。虽然比同年提出的YOLO(v1)稍晚,但是运行速度更快,同时更加精确。

SSD的框架在一个基础CNN网络(作者使用VGG-16,但是也可以换成其他网络)之上,添加了一些额外的结构,从而使网络具有以下特性:

用多尺度特征图进行检测 作者在VGG-16后面添加了一些特征层,这些层的尺寸逐渐减小,允许我们在不同的尺度下进行预测。越是深层小的特征图,用来预测越大的物体。

用卷积网络进行预测 不同于YOLO的全连接层,对每个用于预测的 通道特征图,SSD的分类器全都使用了 卷积进行预测,其中 是每个单元放置的先验框的数量, 是预测的类别数。

设置先验框 对于每一个特征图上的单元格,我们都放置一系列先验框。随后对每一个特征图上的单元格对应的每一个先验框,我们预测先验框的 维偏移量和每一类的置信度。例如,对于一个 的特征图,若每一个特征图对应 个先验框,同时需要预测的类别有 类,那输出的大小为 。(具体体现在训练过程中) 其中,若用 表示先验框的中心位置和宽高, 表示预测框的中心位置和宽高,则实际预测的 维偏移量 是 分别是:

下图是SSD的一个框架,首先是一个VGG-16卷积前5层,随后级联了一系列卷积层,其中有6层分别通过了 卷积(或者最后一层的平均池化)用于预测,得到了一个 的输出,随后通过极大值抑制(NMS)获得最终的结果。

图中网络用于检测的特征图有 个,大小依次为 , , , , , ;这些特征图每个单元所对应的预置先验框分别有 , , , , , 个,所以网络共预测了 个边界框,(进行极大值抑制前)输出的维度为 。

未完待续

参考: chenxp2311的CSDN博客:论文阅读:SSD: Single Shot MultiBox Detector 小小将的知乎专栏:目标检测|SSD原理与实现 littleYii的CSDN博客:目标检测论文阅读:YOLOv1-YOLOv3(一)

作者的其他相关文章: 图像分割:全卷积神经网络(FCN)详解 PointNet:基于深度学习的3D点云分类和分割模型 详解 基于视觉的机器人室内定位

目标检测系统论文

原文: Scalable Object Detection using Deep Neural Networks——学术范 最近,深度卷积神经网络在许多图像识别基准上取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文,但如果不天真地复制每个实例的输出数量,就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型,它预测了一组与类无关的边界框,每个框有一个分数,对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例,并允许在网络的最高级别上进行跨类泛化。 目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器,并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中,以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加,这个挑战变得更加困难,因为大多数方法都训练每个类单独的检测器。为了解决这个问题,人们提出了多种方法,从检测器级联到使用分割提出少量的对象假设。 关于对象检测的文献非常多,在本节中,我们将重点讨论利用类不可知思想和解决可伸缩性的方法。 许多提出的检测方法都是基于基于部件的模型,最近由于有区别学习和精心设计的特征,已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板,这是非常昂贵的。此外,它们在类的数量上是可伸缩的,这对像ImageNet这样的现代数据集来说是一个挑战。 为了解决前一个问题,Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题,Song et al.使用了一个低维部件基,在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。 另一种不同的工作,与我们的工作更接近,是基于对象可以本地化的想法,而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机,Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分,并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型,分割作为第一层,分割分类作为后续层。尽管它们编码了已证明的感知原理,但我们将表明,有更深入的模型,充分学习可以导致更好的结果。 最后,我们利用了DeepLearning的最新进展,最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而,基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能,但由于单个掩模回归的成本,不能扩展到多个类。 我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说,我们使用了深度神经网络(DNN),它输出固定数量的包围盒。此外,它为每个盒子输出一个分数,表示这个盒子包含一个对象的网络信任度。 为了形式化上述思想,我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值,可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸,以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的,后面跟着一个sigmoid。 我们可以组合边界盒位置sli,i∈{1,…K}为一个线性层。同样,我们可以将所有置信区间ci,i∈{1,…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层 在推理时,我们的算法生成kbound盒。在我们的实验中,我们使用ek = 100和K= 200。如果需要,我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此,它们可以通过后续的分类器进行分类,实现目标检测。由于盒子的数量非常少,我们可以提供强大的分类器。在我们的实验中,我们使用另一个dnn进行分类。 我们训练一个DNN来预测每个训练图像的边界框及其置信度得分,以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子,对象被标记为boundingboxesgj,j∈{1,…,M}。在实践中,pre- dictionary的数量远远大于groundtruthboxm的数量。因此,我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置,以提高他们的匹配度,最大化他们的信心。与此同时,我们将剩余预测的置信度最小化,这被认为不能很好地定位真实对象。为了达到上述目的,我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1,如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为 其中,我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外,我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为  最终的损失目标结合了匹配损失和信心损失 受式1的约束。α平衡了不同损失条款的贡献。 对于每个训练例子,我们通过解决一个最佳的赋值x*的预测到真实的盒子 约束执行赋值解决方案。这是二部匹配的一种变体,是一种多项式复杂度匹配。在我们的应用程序中,匹配是非常便宜的——每幅图像中标记的对象的数量少于一打,而且在大多数情况下只有很少的对象被标记。然后,通过反向传播优化网络参数。例如,反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的,但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类,并找到这样的聚类/质心,我们可以使用这些聚类/质心作为每个预测位置的先验。因此,鼓励学习算法为每个预测位置学习一个残差到一个先验。 第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配,而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成,就会像之前一样计算目标的置信度。此外,位置预测损失也不变:对于任何一对匹配的(目标,预测)位置,其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配,并假设它促进了预测的多样化。  需要注意的是,尽管我们以一种与类无关的方式定义了我们的方法,但我们可以将它应用于预测特定类的对象盒。要做到这一点,我们只需要在类的边框上训练我们的模型。此外,我们可以预测每个类的kbox。不幸的是,这个模型的参数数量会随着类的数量线性增长。此外,在一个典型的设置中,给定类的对象数量相对较少,这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此,我们认为我们的两步过程——首先本地化,然后识别——是一个更好的选择,因为它允许使用少量参数利用同一图像中多个对象类型的数据 我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减,128的小批量,以及使用多个相同的网络副本进行并行分布式训练,从而实现更快的收敛。如前所述,我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外,使用非最大抑制对盒进行修剪,Jaccard相似度阈值为。然后,我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络,我们从训练集中生成了大约3000万幅图像,并对训练集中的每幅图像应用以下步骤。最后,样品被打乱。为了训练我们的本地化网络,我们通过对训练集中的每一幅图像应用以下步骤,从训练集中生成了大约3000万幅图像。对于每幅图像,我们生成相同数量的平方样本,使样本总数大约为1000万。对于每幅图像,样本被桶状填充,这样,对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例,都有相同数量的样本,其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中,我们没有探索任何非标准数据生成或正则化选项。在所有的实验中,所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成,其中包含了20种不同的对象类别的边界框。在我们的评估中,我们关注的是2007版VOC,为此发布了一个测试集。我们通过培训VOC 2012展示了结果,其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。 我们在一个由1000万作物组成的数据集上训练分类器,该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。 在第一轮中,定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络,我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后,保留评分最高的前10个检测项,并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估,并用于计算精确查全曲线。 首先,我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量,正如Pascal检测标准所定义的那样,与生成的包围框的数量相对比。在图1中,我们展示了使用VOC2012进行训练所获得的结果。此外,我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的,当使用10个边界框的预算时,我们可以用第一个模型本地化的对象,用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能,例如对象度算法达到42%[1]。此外,这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象,但当使用更高分辨率的图像作物时,我们获得了额外的提升。进一步,我们用21-way分类器对生成的包围盒进行分类,如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是,与先进水平相当。注意,我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是,可视化检测是通过仅使用最大中心方形图像裁剪,即使用全图像获得的。然而,我们设法获得了相对较小的对象,例如第二行和第二列的船,以及第三行和第三列的羊。 在本工作中,我们提出了一种新的方法来定位图像中的对象,该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下,对1000个盒子进行非max-suppression,使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则,并学习在未见图像中预测这些位置。 我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果,在这两个基准上,所提出的方法具有竞争力。此外,该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明,deepmultibox的方法是可扩展的,甚至可以在两个数据集之间泛化,就能够预测感兴趣的定位,甚至对于它没有训练的类别。此外,它能够捕获同一类物体的多种情况,这是旨在更好地理解图像的算法的一个重要特征。 在未来,我们希望能够将定位和识别路径折叠到一个单一的网络中,这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下,双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估,每个评估的速度大约为1个CPU-sec(现代机器)。重要的是,这个数字并不与要识别的类的数量成线性关系,这使得所提出的方法与类似dpm的方法非常有竞争力。

能不能给我发一份呢?

运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min: Avg: Max:23 Min: Avg:15 运动区域占 1/3 左右时 Max:45% Min: Avg:20% Max:18 Min: Avg:8 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。

目标检测的论文

论文原文:

YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:

如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:

每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:

其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。

每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)

举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:

在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。

得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。

1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。

2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。

3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。

4、损失函数公式见下图:

在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:

解决方法:

只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。

作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。

然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。

作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。

作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。

作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。

YOLO模型相对于之前的物体检测方法有多个优点:

1、 YOLO检测物体非常快

因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、 YOLO可以很好的避免背景错误,产生false positives

不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。

3、 YOLO可以学到物体的泛化特征

当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。

尽管YOLO有这些优点,它也有一些缺点:

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。

2、YOLO容易产生物体的定位错误。

3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。

原文: Scalable Object Detection using Deep Neural Networks——学术范 最近,深度卷积神经网络在许多图像识别基准上取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文,但如果不天真地复制每个实例的输出数量,就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型,它预测了一组与类无关的边界框,每个框有一个分数,对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例,并允许在网络的最高级别上进行跨类泛化。 目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器,并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中,以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加,这个挑战变得更加困难,因为大多数方法都训练每个类单独的检测器。为了解决这个问题,人们提出了多种方法,从检测器级联到使用分割提出少量的对象假设。 关于对象检测的文献非常多,在本节中,我们将重点讨论利用类不可知思想和解决可伸缩性的方法。 许多提出的检测方法都是基于基于部件的模型,最近由于有区别学习和精心设计的特征,已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板,这是非常昂贵的。此外,它们在类的数量上是可伸缩的,这对像ImageNet这样的现代数据集来说是一个挑战。 为了解决前一个问题,Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题,Song et al.使用了一个低维部件基,在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。 另一种不同的工作,与我们的工作更接近,是基于对象可以本地化的想法,而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机,Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分,并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型,分割作为第一层,分割分类作为后续层。尽管它们编码了已证明的感知原理,但我们将表明,有更深入的模型,充分学习可以导致更好的结果。 最后,我们利用了DeepLearning的最新进展,最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而,基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能,但由于单个掩模回归的成本,不能扩展到多个类。 我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说,我们使用了深度神经网络(DNN),它输出固定数量的包围盒。此外,它为每个盒子输出一个分数,表示这个盒子包含一个对象的网络信任度。 为了形式化上述思想,我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值,可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸,以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的,后面跟着一个sigmoid。 我们可以组合边界盒位置sli,i∈{1,…K}为一个线性层。同样,我们可以将所有置信区间ci,i∈{1,…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层 在推理时,我们的算法生成kbound盒。在我们的实验中,我们使用ek = 100和K= 200。如果需要,我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此,它们可以通过后续的分类器进行分类,实现目标检测。由于盒子的数量非常少,我们可以提供强大的分类器。在我们的实验中,我们使用另一个dnn进行分类。 我们训练一个DNN来预测每个训练图像的边界框及其置信度得分,以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子,对象被标记为boundingboxesgj,j∈{1,…,M}。在实践中,pre- dictionary的数量远远大于groundtruthboxm的数量。因此,我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置,以提高他们的匹配度,最大化他们的信心。与此同时,我们将剩余预测的置信度最小化,这被认为不能很好地定位真实对象。为了达到上述目的,我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1,如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为 其中,我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外,我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为  最终的损失目标结合了匹配损失和信心损失 受式1的约束。α平衡了不同损失条款的贡献。 对于每个训练例子,我们通过解决一个最佳的赋值x*的预测到真实的盒子 约束执行赋值解决方案。这是二部匹配的一种变体,是一种多项式复杂度匹配。在我们的应用程序中,匹配是非常便宜的——每幅图像中标记的对象的数量少于一打,而且在大多数情况下只有很少的对象被标记。然后,通过反向传播优化网络参数。例如,反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的,但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类,并找到这样的聚类/质心,我们可以使用这些聚类/质心作为每个预测位置的先验。因此,鼓励学习算法为每个预测位置学习一个残差到一个先验。 第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配,而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成,就会像之前一样计算目标的置信度。此外,位置预测损失也不变:对于任何一对匹配的(目标,预测)位置,其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配,并假设它促进了预测的多样化。  需要注意的是,尽管我们以一种与类无关的方式定义了我们的方法,但我们可以将它应用于预测特定类的对象盒。要做到这一点,我们只需要在类的边框上训练我们的模型。此外,我们可以预测每个类的kbox。不幸的是,这个模型的参数数量会随着类的数量线性增长。此外,在一个典型的设置中,给定类的对象数量相对较少,这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此,我们认为我们的两步过程——首先本地化,然后识别——是一个更好的选择,因为它允许使用少量参数利用同一图像中多个对象类型的数据 我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减,128的小批量,以及使用多个相同的网络副本进行并行分布式训练,从而实现更快的收敛。如前所述,我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外,使用非最大抑制对盒进行修剪,Jaccard相似度阈值为。然后,我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络,我们从训练集中生成了大约3000万幅图像,并对训练集中的每幅图像应用以下步骤。最后,样品被打乱。为了训练我们的本地化网络,我们通过对训练集中的每一幅图像应用以下步骤,从训练集中生成了大约3000万幅图像。对于每幅图像,我们生成相同数量的平方样本,使样本总数大约为1000万。对于每幅图像,样本被桶状填充,这样,对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例,都有相同数量的样本,其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中,我们没有探索任何非标准数据生成或正则化选项。在所有的实验中,所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成,其中包含了20种不同的对象类别的边界框。在我们的评估中,我们关注的是2007版VOC,为此发布了一个测试集。我们通过培训VOC 2012展示了结果,其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。 我们在一个由1000万作物组成的数据集上训练分类器,该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。 在第一轮中,定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络,我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后,保留评分最高的前10个检测项,并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估,并用于计算精确查全曲线。 首先,我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量,正如Pascal检测标准所定义的那样,与生成的包围框的数量相对比。在图1中,我们展示了使用VOC2012进行训练所获得的结果。此外,我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的,当使用10个边界框的预算时,我们可以用第一个模型本地化的对象,用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能,例如对象度算法达到42%[1]。此外,这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象,但当使用更高分辨率的图像作物时,我们获得了额外的提升。进一步,我们用21-way分类器对生成的包围盒进行分类,如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是,与先进水平相当。注意,我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是,可视化检测是通过仅使用最大中心方形图像裁剪,即使用全图像获得的。然而,我们设法获得了相对较小的对象,例如第二行和第二列的船,以及第三行和第三列的羊。 在本工作中,我们提出了一种新的方法来定位图像中的对象,该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下,对1000个盒子进行非max-suppression,使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则,并学习在未见图像中预测这些位置。 我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果,在这两个基准上,所提出的方法具有竞争力。此外,该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明,deepmultibox的方法是可扩展的,甚至可以在两个数据集之间泛化,就能够预测感兴趣的定位,甚至对于它没有训练的类别。此外,它能够捕获同一类物体的多种情况,这是旨在更好地理解图像的算法的一个重要特征。 在未来,我们希望能够将定位和识别路径折叠到一个单一的网络中,这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下,双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估,每个评估的速度大约为1个CPU-sec(现代机器)。重要的是,这个数字并不与要识别的类的数量成线性关系,这使得所提出的方法与类似dpm的方法非常有竞争力。

有一个月没更博客了,捂脸 o( ̄= ̄)d

端午回家休息了几天,6月要加油~

回到正文,HOG是很经典的一种图像特征提取方法,尤其是在行人识别领域被应用的很多。虽然文章是2005年发表在CVPR上的,但近十年来还没有被淹没的文章真的是很值得阅读的研究成果了。

key idea: 局部物体的形状和外观可以通过局部梯度或者边缘的密度分布所表示。

主要步骤:

上图为论文中提供的图,个人觉得我在参考资料中列出的那篇 博客 中给出的图可能更好理解一些。

具体细节: 关于每一个过程的详细解释还是在 这篇博客 中已经写得很清楚了,这里就不再搬运了。

文章中数据集的图像大小均为:64*128, block大小为16x16, block stride为8x8,cell size为8x8,bins=9(直方图等级数);

获取到每张图的特征维度后,再用线性SVM训练分类器即可。

下图为作者而给出的示例图:

这两篇博客写的都很好,推荐阅读一波。

电传动系统检测论文

电力机车在我国的国民经济和社会发展中起着大动脉的作用,同时对国家经济持续增长和社会安全所起的作用也是其他运输方式所无法替代的。下面是我整理的电力机车新技术论文2500字,希望你能从中得到感悟!

电力机车新型智能真空主断路器的研制

[摘要]针对现有电力机车主断路器的不足,研制一种新型电力机车真空主断路器,以“1+1”方式安装,在某主断路器发生故障时,司机可通过开关切换到另一台主断路器,保证机车不因为主断路器故障而发生机破。

[关键词]“1+1” 电力机车 智能 真空主断路器

主断路器是用来接通和分断电力机车的高压电路,是机车的电源总开关,同时,当机车发生故障时它又可迅速切断机车总电源以保护其他设备,是机车最主要的保护装置,所以主断路器具有控制和保护的双重功能,其可靠性直接影响机车的安全运行。

目前,电力机车安装的主断路器分空气断路器和真空断路器。由于空气断路器结构复杂、故障率高而不被新型机车采用,但普通真空断路器也存在绝缘强度薄弱等不足,

因此我们于2008年9月立项研制一种电力机车新型真空主断路器,以“1+1”安装方式,即两台主断路器安装在同一底座上,控制装置也相互独立。实现一台机车上有两台主断路器交替工作,避免因单台主断路器发生故障而引起的机破,保证机车安全运行。

1设计思路

两台主断路器、两套装置

目前,电力机车上主断路器只有一台,无论是空气断路器还是真空断路器,在运行中一旦主断路器发生故障,则机车只能停止运行等待救援。因此我们设计增加一台主断路器,当一台主断路器发生故障时可以有另一台替代使用,确保机车正常运行。同时为了不过多地改变机车原有的构造和尺寸,我们设计将两台主断路器放置在同一台底座固定板上,以便于安装。

采用真空灭弧

为提高主断路器的使用寿命和减小主断路器的体积,我们取消原空气断路器的隔离开关,并把灭弧室改用真空灭弧室。真空灭弧的电性能和机械性能高,绝缘强度比大气的绝缘强度要高得多,同时由于采用真空灭弧,所需的间隙很小,可以实现提高使用寿命和减小体积的设想。

采用永磁机构

为保证主断路器分合闸动作的可靠性,我们将传统的

电空机械装置改成永磁机构,使整个操动机构结构简单可靠、工作寿命长、操作功率小、作用特性与断路器的反力特性很好匹配,且能做到合闸速度较小而分闸速度较高的理想结构。

2结构和原理

“1+1”电力机车智能真空断路器以底座为界,分为高压和低压两部分。高压部分位于机车顶部,由引出线和断路器主体组成。低压部分由永磁机构和智能控制装置组成。永磁机构的运动部件只有一个,具有合闸、分闸两种状态。永磁机构的拉杆带动真空灭弧室作直线运动。

图3新型智能真空主断路器结构示意图

灭弧室单元由长寿命真空灭弧室和复合绝缘材料组成,通过固体绝缘密封技术和连接件组成一体,永磁机构通过连接螺杆直接安装在开关体上,通过控制得电动作,控制连接螺杆上推和下拉。合闸时,连接螺杆上推,压动开关体内绝缘拉杆,带动触头弹簧和传动件,使真空灭弧室动触头闭合,并以恒定压力压紧,使动静触头紧密接触;分闸时,连接螺杆下拉,同样通过开关体内绝缘拉杆和传动件拉开灭弧室动触头,使开关打开。在开关动作的同时,安装在永磁机构上的联锁拨杆同时上下移动,带动直线凸轮,使联锁开关打开或闭合。

Ⅰ、Ⅱ、Ⅲ―磁力线分布图;

①―静铁芯;②―动铁芯;③―合闸线圈;④―永久磁铁;⑤―分闸线圈;⑥―导向轴。

永磁机构处于合闸位置,永久磁铁产生的磁力线如图中Ⅰ。这时,下部磁路磁阻远大于上部磁路,动铁芯②保持在合闸位置。分闸时,分闸线圈⑤通电,分闸线圈中的电流产生磁场,其磁力线方向如图中磁力线Ⅱ。分闸线圈在上部工作气隙产生的磁场方向与永久磁铁所产生的磁场方向相反。当分闸线圈中的电流达到某一值时,机构上端的磁力线被抵消殆尽,动铁芯开始在触头簧(或分闸簧)及少量电磁力的作用下向下运动。随着底部气隙的减小,气隙磁阻也逐渐减小,当下部气隙的磁感应强度远远大于上部气隙的磁感应强度时,动铁芯向下将呈加速运动。当动铁芯运动至行程一半后,线圈电流和永久磁铁产生的合成磁场,其方向是向下的,于是,又进一步加速了动铁芯的运动,直到断路器分闸到位。断路器分闸到位后,连锁装置将信号返回控制器,自动切断分闸线圈⑤中的电流,动铁芯保持在分闸位置上。

3各部件的设计

灭弧室的设计

普通真空灭弧室还不能直接应用到电力机车上。因为普通灭弧室的寿命为1万次,而电力机车上断路器分合动作频繁,1万次的寿命使用期限也就一年左右,所以我们采用双断口串联,可提高分断高电压的能力;触头间距为小开距,可极大地提高灭弧室的寿命。为了保证断口同步断开,设计采用特殊的传动机构,使不同步度小于1ms,小于2ms的安全值。另外,我们还采用特殊结构的波纹管,以配合小开距,使灭弧室的寿命>30万次。大量的动态分析试验证明,本文所述的真空断路器的机械寿命达到20万次以上。

我们设计分断最大短路电流为10kA,但灭弧能力为20kA,实际裕度为l倍之多。灭弧室中,动静触头材料选择铬铜合金,截断电流为5A以下,可有效防止操作过电压的发生。

操作机构及传动的设计

在各种条件下都应可靠地分、合闸,是主断路器对操动机构的基本要求之一。目前广泛使用的操动机构有电磁、弹簧、气动、液压电动,但其机械故障率占主断路器总故障的70%左右。为此,我们采用无磨耗件精密型永磁机构,不但保证了主断路器长期动作的可靠性,而且满足主断路器分、合闸及灭弧特性要求。灭弧室需要的闭合力为1000~1200kN,永磁机构闭合力设计为3300kN,足以确保机构的正常动作,传动中的触头弹簧寿命>500万次,机构动作安全可靠。

我们采用钕铁硼(Nd-Fe-B)永磁体,因为它有高的剩余磁感应强度,Br可以达到(退磁曲线上磁场强度H为零时,相应的磁感应强度,也成为剩磁)以及高的矫顽力,使永磁体很不容易退磁。永磁机构的压力和触头压力相比,留了100%的裕量,以保证足够的安全性。

永磁机构通过电磁机构和永磁铁的特殊结合实现传统机构的功能,电磁线圈和磁路为静止机构,只要设计合理,没有外力破坏,一般它不会损坏。大量试验证明,只要选材合理,精心设计,永磁机构本身机械寿命可以达到100万次以上。

永久磁铁与分、合闸线圈相配合,较好地解决了合闸时需要大功率能量的问题,因为永久磁铁可以提供磁场能量,作为合闸之用。永磁机构工作时,只需瞬时供电,一般小于60ms,在分、合闸状态时,线圈没有电流通过,保持力由永磁铁提供,不再消耗能量。这就使我们可以减小合闸线圈的尺寸和工作电流。因此,永磁操动机构可以做到真正意义上的免维修、少维护、长寿命。

绝缘设计

高压开关的绝缘设计至关重要。由于车顶空间的限制,绝缘距离不能很大。电瓷绝缘材料绝缘优良、价格便宜,但联接须采用金属连接件,体大物重,不耐碰撞,内外温差大时容易开裂。根据电力机车上的使用环境条件,我们选用粘接力强,机械强度高,有较高的耐寒、耐热、耐化学稳定性的APG工艺复合绝缘材料,双断口上进上出,在空气湿度100%饱和情况下,空气间绝缘距离>400mm,电压等级,外爬距、内爬距,对地耐压80kV/lmin,断口间耐压85kV/lmin。APG工艺复合绝缘材料与水不亲和,可防止因雨水绝缘放电,从而有效地防止瓷瓶放电事故的发生。

智能控制器及联锁设计

永磁操动机构必须在控制器的驱动下才能实现开关的分合操作,因此,控制器的性能优劣对断路器的性能有很大的影响,要保证断路器的可靠工作,就必须要有一个可靠的控制器。

系统组成的原理

智能控制器主要由5部分组成:电源模块、输入模块、输出模块、CPLD智能控制模块、驱动模块。我们采用复杂可编程逻辑器件CPLD作为智能控制部件,借助于计算机,在EDA工具软件quartus II平台上,以硬件描述语言VHDL为系统逻辑描述手段,自动完成逻辑编译、逻辑化简、逻辑分割、逻辑综合、结构综合、以及逻辑优化和仿真测试,直至实现规定的电子线路系统功能。这种纯硬件的实现方式在工作可靠性方面有很大的优势,这是因为硬件电路不管受到什么干扰,其电路结构不会发生变化。采用EDA技术的全硬件实现方式,由于非法状态的可预测性以及进入非法状态的可判断性,从而确保了从非法状态恢复到正常状态的各种措施的可行性。

可靠性设计

电磁兼容性设计

永磁操动机构在运行中由于开关大电流而产生很大的电磁干扰,永久磁铁和线圈均会产生很大的磁场干扰,另外,开通和关断过程中,电容充放电亦会产生幅值很大的脉冲电压和脉冲电流,会通过电源通道耦合到控制器自身,所以抗干扰问题对于控制器来说非常重要。我们在设计中采取的措施主要有:①电源输入加有性能优良的电源滤波器,可以防止通过电源线的传导干扰;②专用芯片通过光电电路完全与外部I/O部分隔离,以保证专用芯片安全运行;③模拟电路滤波和专用芯片数字滤波同时使用,确保不会发生误动的情况;④电路板精心设计,精心布线,避免线路之间的串扰。

电力电子电路的可靠性设计

电力电子电路是控制器的另一个关键部件,它的负载是一个大的电感,在开通和关断过程中会产生很大的动态dv/dt,加之工作电流很大,使器件有可能同时受到大电流、高电压和寄生电容中的位移电流的作用,所以确保这部分电路稳定可靠的工作亦很关键。

①在设计中使用抗冲击能力强、dv/dt性能好的IR公司生产的IGBT和IGBT控制芯片;

②精心设计电路参数,反复测试,保证输出波形好;

③精心设计和调试吸收电路,保证驱动电路稳定工作;

④过流保护电路,确保电力电子电路的安全运行;

⑤为防止长时间通电,采用的控制算法是:正常时采用最短时间与开关位置信号控制,在位置信号失效时采用最长时间控制。

智能自诊断、自检测设计

控制器采用全硬件状态机作为整个系统的工作调度,这就使其可以充分发挥全硬件电路容错技术的优势,在运行中可以对各种状态进行跟踪,可以监视各种非法状态,由非法状态转入正常状态只需要几个微秒,因而不会因进入非法状态而对系统造成影响,确保在运行中不会出现死机现象,即确保控制器永远保持在运行状态。

零位断合

利用电子操控计算机的多余功能和精密性永磁结构优势,设计零电流打开和零电压闭合的智能控制技术,即适时采样,计算发令,自适应修正等,使断合点在零位正负2ms以内。经模拟试验表明,该项技术达到了预期效果,较好地抑制了过电压的产生。

传动关节点的固体润滑技术

为了使断路器实现其真正意义上的少维护、不检修,甚至不维护,断路器的几个转动关节,采用了二硫化铝加石墨的固体润滑技术,寿命试验的结果基本达到了预期的目标。

4主要技术指标

工作电压:AC25kV;最大工作电压:AC30kV;

工作电流:ACl000A;最大工作电流:AC1250A;

工作频率:50Hz;

额定短路开断电流:ACl0kA;

额定峰恒耐受电流:;

最大开断电流:AC20kA;

控制器工作电压:DC110V;

开关动作反应时间:≤20ms;

开关动作时间:≤50ms;

开关动作控制器永磁机构通电时间:≤25ms。

5执行标准

TB/(机车车辆电气设备、第四部分,电工器件交流断路器规则)

TB/T2055-1999(机车真空断路器技术条件)

TB/T3021-2001(铁道机车车辆电子装置)

GB/(电磁兼容试验和测量技术浪涌(冲击)抗扰度试验)

6主要技术特点

①采用先进的复合绝缘材料,具有抗老化、防紫外线、高强度及优良的电气绝缘性能;

②断路器主体采用先进的APGP注射成型工艺加工技术;

③专门研制的长寿命的真空灭弧室;

④国家专利技术的永磁操动机构;

⑤开关内部结构简洁、稳定性好;

⑥可靠性高;

⑦与机车原有主断路器有互换性。

7结束语

“1+1”电力机车智能真空主断路器于2009年5月19日在福州机务段的SS3B4045机车上安装试用,运用至今仅出现过一次真空断路器控制预备中间继电器联锁线断,导致继电器不得电,机车无压无流。但正因为这种断路器有两台断路器,运行中司机通过切换,启用另一台断路器,照常运行,回段处理,不造成机破。这也正体现了这种断路器的优越性。

浅析电力机车空转原因及处理

[摘 要]本文通过对电力机车空转故障分类、故障原因、故障判断检测以及故障处理方法进行分析,为保证机车运行安全,确保铁路提速和重载牵引能够顺利进行提供一定的理论依据。

[关键词]电力机车 空转故障 处理方法

中图分类号:U269 文献标识码:A 文章编号:1009-914X(2016)07-0330-01

铁路在我国的国民经济和社会发展中起着大动脉的作用,同时对国家经济持续增长和社会安全所起的作用也是其他运输方式所无法替代的。随着机车运行速度的提高和牵引定数的增加,机车出现空转故障的几率越来越大,对机车安全运行的影响也越来越明显,因此,完善机车控制系统和提高乘务员操作水平,防止机车空转故障的发生,是保证机车运行安全,确保铁路提速和重载牵引能够顺利进行的关键所在。

1.电力机车空转现象及防空转系统

空转故障分类

轮对产生的轮周牵引力大于轮轨间的黏着力时车轮就会发生空转。根据机车实际运用中空转故障发生的情况,机车空转故障分两类:一是非正常空转,即大空转或真空转,恶化后会导致轮轨擦伤:二是正常空转,即假空转,及时采取人工补砂的措施会有明显的效果。

防空转系统

电力机车电子柜或微机柜均设置了微机防空转系统,该系统是以提高黏着利用率及防止大空转为主,允许一定程度的微小空转。当轮对空转趋势达到一定程度,就将相应的电机电流高速大幅度削减,可使空转很快得到抑制,然后再以一定规律恢复牵引电流。

2.电力机车空转故障的原因分析

正常空转的原因

(1)机车转向架到司机室端子排的光电传感器接线断路或绝缘破损,引起速度信号异常,导致假空转。

(2)光电传感器故障引起假空转。电力机车上目前使用的光电传感器大部分是TQG15B型传感器,当传感器芯片烧损或绝缘破损、传感器引出线绝缘破损,线路断路、短路或接触不良等,瞬间无速度信号输出或速度信号受干扰,都会引起假空转。

(3)光电传感器接线盒进水,引起线路接地或短路将导致假空转。

(4)电子插件故障。防空转系统电子元件超出使用寿命期限,造成插件程序故障。

非正常空转的原因

(1)电力机车轮缘喷油装置喷油量太大、线路道岔油润过多等也会引起机车真空转,伴随空转灯亮、撒砂、减载等。这种情况下,机车检修部门应适当调节轮缘喷脂装置的喷油量或改为干式轮缘润滑装置,防止真空转。

(2)司机操作不当。电力机车在运行中,司机操作不当,手柄指令过高,容易发生真空转。因此,机车在雨天或坡道上起车或行驶时,指令不应一次给得太高,当速度起来后再继续追加电流。当发生真空转或滑行时,司机应适当降低手柄级位,待速度起来后再追加电流,抑制真空转发生。

3.电力机车空转故障判断及检测方法

一般故障的显示

机车在运行中遇到启车加速、持续大坡道大电流运行、过岔区、曲线运行、轨面有油、冰、雨、雪天气经常会发生空转、滑行或电流电压波动等现象,机车乘务员可采取人工补砂的措施。发生大空转时,空转灯亮、自动撒砂、电流电压波动频繁,而且电流电压波动弧度大。发生小空转时有时空转灯不亮、不下砂,只是电流电压在小范围内波动。这种情况下,机车乘务员只需切除电子柜上方或微机防空转上的“空转保护”开关即可或将电子柜倒B组维持运行即可让防空转系统正常保护动作。

机车进行库内检测

机车在运行中发生空转故障回段报修时,可利用光电传感器动态检测仪。光电传感器动态检测仪简单来说是一个在机车静止的状态下,能给光电传感器提供均匀的速度信号,并且能实时观察速度及频率大小、变化情况,速度信号输出波形的检测设备。利用该设备,可以在库内对机车光电传感器及相关线路进行检测,可以较准确地判断出造成空转故障的故障点,并在库内做相应的处理,大大提高了处理空转故障的效率,同时减少了机车试运行,减少了检修或技术人员跟车处理的次数,节约了人力资源,提高了机车的运用效率。在库内进行检测无结果的就要跟车用便携式示波器进行动态检测。

跟车进行动态检测

由于机车在运行中产生剧烈振动,使空转保护系统某些线路瞬间接触不良,引起速度信号丢失,从而造成空转,这种情况是极少数的。这类故障在库内机车静止的情况下是很难检测到故障点,因此,必须派人跟车使用携式示波器进行动态检测,另外也可用示波器检测。

4. 空转故障的处理方法

运行中对空转故障的处理

(1)如果是正常空转,乘务员只需及时采取人工补砂的措施就会有明显的效果。

(2)机车电流、速度大于某值,空转、撒砂不止,电流卸载不能恢复,可能是某一速度传感器发生故障,乘务员可根据防空转系统自动查找出故障传感器,自动切除该位置速度传感器,并在插件面板上显示,然后可正常操作机车运行,回段后向检修人员报修。

(3)微机防空转插件板故障可能使电机电流达到某一值而卸载,机车并没有发生空转就发出减载指令,牵引时无恒速控制。此类故障乘务员可通过将防空转故障开关转到故障位运行来判断,如果正常,就可判断为防空转系统故障,回段后报修。

回段对空转故障的处理

(1)机车回段后,检修人员对报空转故障的机车要详细了解运行中的情况,例如空转发生区段的自然状况,乘务员是否采取自诊断功能,是否切除防空转功能等。

(2) 光电传感器信号线故障的检测及处理

若在司机室端子上检测到某轴位传感器信号不良,而光电传感器下车检测又正常的情况下,可以判定为该位传感器的信号线故障。表现在线路断路、短路、接地。可以通过数字万用表进行检测线路的通断,用250V兆欧表检测其线路绝缘状态。确定线路不良时,必须进行换线才能彻底处理。换线时应注意不要损伤插头及线,接线时应按照接线表对应接线,防止接错线。

(3)光电传感器故障的检测及处理

电力机车光电传感器可以通过车下检测设备进行检测,确定传感器故障后,则可更换光电传感器。光电传感器在安装上车时,传感器与轴箱之间要加防水胶垫,同时传感器引出线应斜向下,防止进水,同时要避免引出线过度弯曲。光电传感器接线插头与接线盒插接应牢固,用绝缘粘胶带包扎好,防止进水。

总而言之,能够根据电力机车空转的具体情况,对机车产生空转故障的原因进行正确综合的分析,并提出故障处理方法,可减少因空转引起的机车故障及行车事故发生率,提高机车的运用效率,确保机车运行的安全性。

参考文献:

[1] 王迁.浅谈电力机车的空转故障[J].机车电传动,2009(6):60-61.

SMT的丝网印刷机的机电一体化设计(机械设计部分)论文编号:JX400 包括设计图,论文,外文翻译,论文字数:25534.页数:44摘 要随着丝印技术在电子产品制造业中占有越来越重要的地位,它的应用,不仅提高了印制电路的生产效率,降低了印制电路的生产成本,还提高了印制电路板的加工质量。新型元器件的发展和应用必然对焊膏印刷工艺带来新的冲击。因此,我国必须加强这方面的开发与研究,赢得更为广阔的市场前景。为此SMT(表面组装技术)丝网印刷机设计在工业生产中具有重大的意义。本文设计一台模板印刷机,线性位移定位精度,最大进退速度Vmax=,最大行程400cm,可广泛应用于各种PCB焊膏印刷的场合。本文设计主要是整机总体设计,可细分为刮刀组件设计、传送导轨、基板定位夹持设计和基板支撑的升降台设计等;刮刀设计主要在于刮刀头移动与刮刀升降使用的传动类型和刮刀类型,传送导轨设计主要是宽度可调节,可以满足一系列尺寸PCB板传送;基板定位夹持设计主要设计PCB板的定位方式,而升降台设计在于设计支撑基板的方法。在刮刀组件设计中,刮刀组件运动采用了直齿轮与带齿条啮合方式,实现了刮刀组件往复运动速度平稳、均匀;刮刀升降设计传动中采用了滚珠丝杠传动类型,保证了线性位移定位精度,通过高度可调整刮刀压力。在基板定位夹持设计中,本文采用了顶面夹持的方式;而基板支撑的升降台设计中,则采用了四个锁紧气缸来对升降台进行驱动,能够防止突发事件,保证了工程的安全。辅以检测电气,本设计可成为真正的机电产品,适用一系列PCB板的焊膏印刷。设计任务达到了任务书的要求。关键词:表面组装技术;印刷机;基板;刮刀; Abstract As the importance role of Printing Technology in the manufacturing industry of electronic products, its application not just can improve the efficiency of printed circuit, but also can reduce the cost besides the improvement of the quality of products. Inevitably, the development and application of new type devices make an impact on the solder printing technology. Therefore, our country must strengthen the research and development at this item to gain further development . Thus ,the design of SMT screen process press is of great significance in industrialized production .This paper designs a stenciler, with the precision of linear displacement , maximum back-and-forth rate Vmax= and maximum distance 400cm ,which can be applied to various PCB solder printings. This paper mainly focuses on the complete machine design , which is composed of Squeegee module , rail , The design of PCB locating clamp as well as the rising table of board support, and so on .The design of Squeegee is the transmission and stencil printing type for the queegee head movement and stencil printing rising .And the design of rail is the transmission, which can adjust the width to meet the need of a series of PBC .The designing PCB locating clamp is the way to locate the PCB. And the rising table is to design the way for the board support. As for the Squeegee module, its movement uses the forms of the meshe of spur-gear and the rubber rack to achieve the goal of stability and evenness in back-and-forth movement of that . The transmission of squeegee rising design adopts the way of ball screw transmission type to assure the precision of linear displacement and adjust the pressure of squeegee through the height. The design of PCB locating clamp,introduces the way of the top clamp tooling. While, the rising table of board support employs four locking cylinders to transmit ,which can guarantee emergency not to happen ,meanwhile the security of the project can be ensured . Accompanying with detecting electric, the design may become the real electromechanical product, and is suitable for a series of PCB solder printing. Naturally, this design task can meet the requirement. key words:SMT; Stencil Printer; PCB; Squeegee 目 录引言 11 绪论 课题背景 SMT印刷机的概述 32 方案设计 方案设计的选择 设备的总体组成 各个组件功能的说明 53 机器的设计基础 方案的机械设计基础知识 一般传动形式应遵循如下原则 滑轨设计 步进电机概述 滚球丝杠副概述 气缸概述 134 方案设计分析 机器各个组件的详细设计 刮刀组件的设计过程 传送导轨与基板支撑工作台的设计过程 模板的夹持组件的设计 各个组件联动过程 刮刀组件步进电机和丝杠选择与校核 按精度要求验证允许的滚珠丝杠的最小螺纹底径d2m 确定滚珠丝杠副预紧力 滚珠丝杠的参数选择 螺纹滚道半径R 滚珠丝杠的长度的计算 锁紧气缸分析选用 345 小结 37谢 辞 38参考文献 39普通CA6140车床的经济型数控改造 机电一体化包括外文,说明书,和电气图,装配图 字数:14549,页数:35 论文编号:JX090 概 论一、数控系统发展简史1946年诞生了世界上第一台电子计算机,这表明人类创造了可增强和部分代替脑力劳动的工具。它与人类在农业、工业社会中创造的那些只是增强体力劳动的工具相比,起了质的飞跃,为人类进入信息社会奠定了基础。6年后,即在1952年,计算机技术应用到了机床上,在美国诞生了第一台数控机床。从此,传统机床产生了质的变化。近半个世纪以来,数控系统经历了两个阶段和六代的发展。二、国内数控机床状况分析(一)国内数控机床现状 近年来我国企业的数控机床占有率逐年上升,在大中企业已有较多的使用,在中小企业甚至个体企业中也普遍开始使用。在这些数控机床中,除少量机床以FMS模式集成使用外,大都处于单机运行状态,并且相当部分处于使用效率不高,管理方式落后的状态。 2001年,我国机床工业产值已进入世界第5名,机床消费额在世界排名上升到第3位,达亿美元,仅次于美国的亿美元,消费额比上一年增长25%。但由于国产数控机床不能满足市场的需求,使我国机床的进口额呈逐年上升态势,2001年进口机床跃升至世界第2位,达亿美元,比上年增长。近年来我国出口额增幅较大的数控机床有数控车床、数控磨床、数控特种加工机床、数控剪板机、数控成形折弯机、数控压铸机等,普通机床有钻床、锯床、插床、拉床、组合机床、液压压力机、木工机床等。出口的数控机床品种以中低档为主。(二)国内数控机床的特点 1、新产品开发有了很大突破,技术含量高的产品占据主导地位。 2、数控机床产量大幅度增长,数控化率显著提高。 2001年国内数控金切机床产量已达万台,比上年增长。金切机床行业产值数控化率从2000年的提高到2001年的。 3、数控机床发展的关键配套产品有了突破。 三、数控系统的发展趋势1.继续向开放式、基于PC的第六代方向发展 目 录第一章 前言……………………………………………………………………1 概论……………………………………………………………………2 摘要……………………………………………………………………7 设计要求 总体方案设计要求………………………………………………8 设计参数…………………………………………………………9 .其它要求…………………………………………………………12第三章 进给伺服系统机械部分设计与计算 进给系统机械结构改造设计……………………………………13 进给伺服系统机械部分的计算与选型…………………………13第四章 步进电动机的计算与选型 步进电动机选用的基本原则……………………………………24 步进电动机的选择………………………………………………25第五章 主轴交流伺服电机 主轴的变速范围…………………………………………………26 初选主轴电机的型号……………………………………………26 主轴电机的校核…………………………………………………26第六章 微机控制系统硬件电路设计 控制系统的功能要求……………………………………………27 硬件电路的组成…………………………………………………27 设计说明…………………………………………………………27第七章 车床改造的结构特点…………………………………………30第八章 安装调整中应注意的问题……………………………………31参考文献………………………………………………………………32总结……………………………………………………………………33以上回答来自: 汽车主减速器试验台结构设计 机电一体化字数:13658.页数:33,包括,任务书,说明书, 所有设计图 论文编号:JX085 汽车主减试验台结构设计摘要:主减速器是汽车传动系中减小转速、增大扭矩的主要部件,其性能对整车质量有着直接影响,在生产线上通过试验台对主减速器进行全方位的检测能够有效地保证产品质量。本文介绍了汽车主减试验台的机械结构设计及电气系统设计。系统可以实现对三种主减速器的综合性能检测,并能根据预先设定的技术参数进行产品性能评判。机械部分的设计包括试验台底座,传动系统及夹具系统的设计。其中底座可实现对整个试验台以及电机的支撑定位。传动系统实现对电机输出动力的传送并且将转矩转速传感器接入整个系统。夹具系统实现主减速器的定位和夹紧同时保证主减速器输入轴能和传动系统形成稳定的连接。关键词:主减速器 ;试验台 ;机械结构设计 Abstract: The final drive is the main vehicle of transmission in reducing speed and increase torque of the main components,its performance has the direct influence to the entire vehicle quality, carries on the omni-directional examination on the production line through the experimental system of final drive to be able effectively to guarantee the product quality. This article introduced the mechanism design and the Electrical system design. The system may realize to three types of final drive overall performance examinations, and evaluate the production performance according to the technique parameters beforehand. Machine parts include platform system, transmission system and jig system. Platform system may realize to strut and localization of electromotor. The transmission system may realize to translate power and connect torque tachometer to overall system. The jig system may realize to locate and clamp the final drive and guarantee the final drive input axis can form the stable connection with the transmission system. Keywords: final drive ;experimental system ;Mechanical structure design 目录中文摘要 1Abstract 21 引言 主减速器简介 国内外主减速器检测技术意义及发展现状 42 主减实验台总体方案 主减速器工作环境和要求 53总体设计思路和方案 底座部分设计 传动系统设计 电机选择 传动带选择 联轴器选择 传感器选择 轴承校核 齿轮参数 传动法兰选择 夹具定位系统 气缸的选择 224 电气控制系统 工业控制计算机的组成 系统控制模块 295 检测原理与步骤、 检测原理 检测步骤 30六.结论 31致谢 31参考文献 32以上回答来自:

电力拖动自动控制系统 课程涉及到各种电动机控制系统的模型建立、系统分析和系统设计等的基础理论。下面是我为大家整理的电力拖动自动控制系统论文,供大家参考。

《 浅析电力拖动自动控制系统 》

【摘 要】电力拖动控制系统是一种较为重要的控制系统,其在工业生产中发挥着很大的作用,随着社会的发展以及科技的推动,这一系统开始趋向于自动化的应用形式。电能在人们的生活中发挥着重要的作用,电器的种类越来越多,现代社会对电力的需求量也越来越大,所以,自动化的电力拖动控制系统,可以更好的满足人类社会对电力的需求。本文分析了电力拖动自动控制系统的设计原理,还介绍了电力拖动自动控制系统的安全防护,希望对相关电力人员有所帮助,使相关企业生产可以更加安全、稳定的进行。

【关键词】电力拖动;系统;自动控制;原理;安全防护

电力拖动系统在工业领域应用极其广泛,伴随着我国科技的发展,工业企业的生产效率越来越高,人类社会对电能的需求量也越来越大。很多工业企业引进了先进的机械设备,提高了企业的生产水平,同时也对电力拖动控制系统提出了更高的要求,所以,电力拖动控制系统的自动化也是企业未来发展的必然趋势。电力拖动自动控制系统是对传统系统的改进与优化,这种系统在运行的过程中,更加安全稳定,而且满足了企业对自动化机械设备生产运行的要求。为了使电力拖动自动控制系统发挥更大的效用,相关人员要研究出更加完善的安全防护 措施 ,这也可以为企业增产以及效益提升做出更大的贡献。

1.电力拖动自动控制系统的设计原理

电力拖动控制系统在工业企业生产中发挥着重要的作用,工作人员在系统运行的过程中,可以更好的掌握电动机的运行状况,还可以通过信息反馈,了解企业生产运行机制的运转情况,比较常见的反馈信息是电流信息。电力拖动控制系统中包含着很多的构件,其中电气设备是生产运行机制中比较重要的系统,其也是企业实现机械自动控制的关键因素。在利用计算机设备,可以在系统运行的过程中,可以直观的从 显示器 中,了解设备的运行状况,通过计算机等设备的信息反馈,可以有效的实现电力拖动的自动化控制。

实现电力拖动控制系统的自动化运行,需要借助先进的计算机技术,相关工作人员通过计算机信息的反馈,以及企业生产需求的变化,可以有效的制定出不同的控制方案,还可以实现机械运行的自动化生产。在这一过程中,计算机的编程起着至关重要的作用,计算机不但具有强大的计算等功能,还具有操作便捷等特点,所以,工作人员一定要多了解计算机相关知识,这样才能编制出独立的驱动程序,实现多种设备的自动控制。工作人员还要利用计算机操作技术,实现系统的对接测试,这些步骤有利于简化电力拖动自动化控制编程。电力拖动自动控制系统的各项参数可以认为调动,根据不同的要求,技术人员可以更改编程,所以这项工作具有一定的变动性。但是从系统的设计原理来看,电力拖动自动控制系统在调整的过程中,需要遵循一定的设计原则,其主要是利用计算机作为控制中心,而且是通过信号传输完成下达命令以及执行命令这一系列工作。

2.电力拖动系统自动控制的内容选择

电力拖动自动控制系统对电动机的选择

电动机功率的选择应当与生产机械标准要求直接挂钩,要选择与其相匹配,能够拥有一定负载的电动机,这样,才能保证生产机械的正常运行。电动机采用直流还是交流电需要结合企业经济、技术等方面综合考量,通常情况,企业只需要选择操作简单,稳定性强、价格低廉的交流异步电动机。但如果所在企业生产机械功率大、调速范围广,则可以采用调速性能优质的直流电动机。在选择电动机时也要考虑后期维护问题,任何系统在使用一段时间后,都可能因为外界因素的干扰而出现故障,为了降低线路损坏对企业生产效益的影响,设计人员一定保证维护工作的便捷性,便于及时抢修。

电力拖动自动控制系统对电器控制线路的选择

电器控制线路的选择是电力拖动自动控制系统中一项重要的工作,其不但影响着整个控制系统的安装设计,也影响着电器选择的质量,在选择电器控制线路时,需要参考不同部件的特点以及生产的需求,在控制线路时,要利用总体框架,细化生产线路中局部电器的控制,还要考虑不同设备之间的关联,将局部电器控制融入整体线路控制中,构成完整的控制线路。

在设计的过程中,还要保证线路运行的稳定性以及安全性,这样才能有效的提高企业的生产效率,降低生产过程中安全事故发生的概率。电器控制线路的选择,需要保证元件选择的正确性,所以,设计人员一定要选择性能良好的设备,这样能延长设备使用年限,还能降低外界因素对电器的影响与干扰,使电器的运行线路更加稳定。相对而言,选择安全可靠的继电器,可以降低电器出现故障的概率,也可以降低设备维修的成本。另外,在选择具体的电器控制线路时,设计人员还要注意以下几点内容:

触头设计

在选择电器控制线路时,首先要保证线路中的电器触头可以有效的对接在一起。比如,有的线路中,将常闭与常开的电器触头连接在一起,这两种电器处于不同的电源中,很容易因为触头的长期接触而出现短路等问题,而且如果该线路的绝缘防护措施做的不好,则很容易引发线路的安全故障。

电器线圈联接

在设计电器的线圈联接时,要注意线路中的电器线圈是否联接正确,如果出现线圈设计失误问题,一定要及时处理,否则也会影响线路的正常运行。在检测电器线圈的联接时,要观察串联的线圈是否存在于交流控制线路中,要保证两个线圈的外加电压不能超过额定电压,另外,非并联的线圈也不能直接联接。

3.电力拖动自动控制系统的安全防护

短路保护

短路故障一般是因为电流短路而造成局部电气设备绝缘体过热损害,电流过大,容易造成强大的电磁脉冲进而产生电动应力,进而损害电力拖动自动控制系统或各种电器设备。

过流保护

如果使用电动机不当,很容易使得电动机超负荷运作,这样会引起电动机局部过电流,一般的过电流能量是正常启动电动机电流的数倍,因此容易损害电动机及系统元器件。

热保护

任何元器件在经过长时间工作时都会出现过热现象,如果电动机绕组或长时间超载运行,那么势必会造成自身温度高于允许值,进而导致电动机出现故障,为避免过热损害,可以采用多个电动机相替换的 方法 进行热保护。

4.结语

综上所述,本文对电力拖动自动控制系统的设计原理、设计时电动机以及电器线路的选择进行了介绍,这些内容可以有效的保证电力拖动控制系统的稳定运行。另外,笔者还对电力拖动自动控制系统的安全防护提出了几点建议,希望对相关设计人员有所帮助,从而提高该系统的安全性以及稳定性,使其在工业生产应用的过程中,发挥更大的效用。

【参考文献】

[1]王春凤,杨耕.电力电子与运动控制实验平台安全性建设[J].实验技术与管理,2011(07).

[2]陈伯时.电力拖动自动控制系统―运动控制系统[M].北京:机械工业出版社,2003.

[3]黄华.浅析电力系统中的电器控制线路设计[J].科技信息,2010(35).

《 试论电力拖动自动控制系统 》

摘要:随着社会的高速发展,更多电器的出现导致电力的需求不断攀升,因而人们对电力拖动控制系统自动化程度提出了更高更新的要求。鉴于此,拟通过对电力拖动控制系统的设计原理、设计方案的确定、设计应遵循的规章以及安全防护等内容进行分析,为使用者与企业提供借鉴与参考。

关键词:电力拖动 自动控制 运行

中图分类号:TM76 文献标识码:A 文章 编号:1007-3973(2012)010-028-02

1 引言

随着科技日新月异的发展,机械自动化程度与生产水平达到了前所未有的高度,在当前的工业生产领域中,电力拖动自动控制系统得到了广泛的应用。电力拖动自动控制系统的优势在于:一方面可以保障自身 系统安全 稳定运行;另一方面可以满足企业机械生产要求。电力拖动系统可以很好的对电动机、各类继电器等原件进行保护,进而减少系统运行过程中故障发生概率。因此,研究电力拖动自动控制系统,提升其自动化程度,增强其安全性,完善其功能,对于企业而言是至关重要的。

2 电力拖动系统自动控制原理及其设计

电力拖动系统自动控制原理

操作人员在电力拖动控制系统运行过程中可以得到电动机各信息的反馈,例如电流反馈等。在电力拖动控制系统中,电气设备是实现机械自动控制的核心器件。计算机系统在此过程中的主要作用是显示信息显示、运行连锁、安全保护等信息,同时其也是电力拖动系统自动控制实现的唯一途径。

在计算机系统中,操作人员可以利用计算机根据实际生产需求实行不同的自动控制方案。电力拖动自动控制主要是利用计算机完成逻辑计算、功能模块化、编程等工作,然后为操作人员提供独立于机械设备的仪器驱动程序,方便使用者可以较快的将程序与自己的系统进行对接测试,方便编程。虽然电力拖动自动控制系统的各项参数及要求的设定“因人而异”。但从系统的本质来讲,系统构成的基本原理还是殊途同归的,即以计算机为系统的集中控制中心,信号输入给计算机下达指令,信号输出执行指令。电力拖动自动控制系统计算机接收信号与输出信号的系统反应如图1所示。

电力拖动自动控制系统方案的确定

在电力拖动自动控制设计方面,是否确定好方案与控制方式将会决定整个设计能否成功。如果宏观方案是正确切实可行的,那么生产设备各项指标达到要求的可能性才能得到保障。在设计时,即便出现某个控制环节设计的错误,也可以通过不断改进与测试达到要求,但如果宏观方案一开始就制定有问题,那么设计工作必须等到方案明确后重新开始。

学术领域认为,所谓电力拖动自动控制方案,其主要是依据不同的生产工艺要求,例如根据运动要求、加工效率、零部件加工精度等条件来决定电动机运行、类型、数量、传动方式等控制要求。最后将这些调研好的工艺要求与控制要求相结合,作为电气控制原理图设计电器原件选择的重要参考凭证。譬如说,在设计效率要求较高的加工机床时,拖动方式可以随机变化,如可以使用直流拖动,也可以使用集中拖动等。确定好拖动方案后,拖动电动机的数量以及各项参数也随之明了,控制方式的选择就是控制要求的选择。

电力拖动系统自动控制电动机的选择

在确定好电力拖动系统设计方案后,需要根据实际需求对电动机的数量、规格及各项参数如额定转速、功率等进行选择与确定。笔者通过 总结 ,归纳出电动机在选择方面应当遵循以下几点:

(1)电动机功率的选择应当与生产机械标准要求直接挂钩,要选择与其相匹配,能够拥有一定负载的电动机,这样,才能保证生产机械的正常运行。此外,在明确电动机功率时,还需对以下三大要素进行综合考虑:1)允许过载能力;2)启动能力;3)电动机发热。确决定电动机功率选择的核心条件是电动机容量,通常,电动机容量容易受外界环境影响,所以电动机额定功率的确定要进行多次校验确认。

(2)电动机采用直流还是交流电需要结合企业经济、技术等方面综合考量,笔者认为,通常情况,企业只需要选择操作简单,稳定性强、维护遍历、价格低廉的交流异步电动机即可。但如果所在企业生产机械功率大、调速范围广,则可以采用调速性能优质的直流电动机。

(3)电动机额定转速需要结合以下方面来选择,主要是看所在企业机械匹配的技术经济程度,如企业所需电动机需拥有较高的使用寿命,并较少使用,那么就需要结合企业经济、技术等多方面因素来选择;如果企业使用电动机频繁,那么该电动机额定转速就需要以电动机的动能储存量来选择。

(4)必须在供电电网电压基础上选择电动机额定电压各参数,必须保证两者一致。电动机机构形式要根据企业的作业环境进行选择。

总而言之,电动机数量、规格以及各项参数的选择应当根据企业的经济、技术、作业环境、使用需求等多方面综合考虑来选择,要保证所选择的电动机既能满足企业生产机械的实际需求,又能够保证其运行的可靠性与实惠。

电力拖动设计中电器控制线路的设计

拖动方案与电动机的选择之后,其次是电器控制线路的设计。电器控制线路是整个电器选择与安装图设计的主要依据,通常,电器控制线路的设计方法是,根据所有部件不同的需求,根据控制线路的总体框架来细化局部线路,最后根据生产机械的实际需求与相互关联,将局部线路统筹规划到线路总体框架中,形成一个完整的控制线路。

设计前期调研:控制线路设计之初,设计者需要对企业生产工艺与机械实际需求进行调研。对于一般企业而言,控制线路仅需要满足下属三种功能即可:即制动、起动与反向。生产机械工艺较大的企业通常还需要平滑调速、安全预警功能等。另外,操作者能否对控制线路做出及时反应,能否进行操作等问题也都需要设计人员在设计前调研明白。

设计过程的掌控:控制线路能否稳定安全运行取决于控制线路工作是否安全与稳定,因此在选择设计元件时,应当采用性能良好、使用期限长、抗干扰能力强、安全可靠、稳定的继电器,同时在规划具体线路时,笔者认为,设计人员还需要注意以下几点内容: (1)触头的设计,要保证所有电器触头必须全部正确对接。例如同一电器,如果将常闭与常开的辅助头放在一起,那么当将它们接在不同相的电源上时,很可能由于限位开关上的常开/闭触头产生电位差使得电路短路,如果线路没有良好的绝缘性,那么势必会造成电路短路事故。

(2)设计电器线圈联接时,要保证所有电器线圈正确联接。串联的两个电器线圈一般不能出现在交流控制电路中,即便串联的两个线圈的额定电压和等同于外加电压,也不允许非并联线圈连接。要实现接触器与接触器,接触器与线圈的同步,应当将所有线圈并联在电路中,使所有线圈承受相同的额定电压。

(3)设计后的控制机构,其后期维护与操作必须简单明了,在操作人员采用某种控制方式控制时,可以根据实际需求迅速、快捷的切换到其他控制方式,例如,在进行自动控制时,可以根据需求直接切换到手动控制,所有电控设备都需保证其后期运行的稳定性与维护的便利性,同时还需为其配置隔离电器,以便在仪器出现故障时进行抢修。

电力拖动自动控制系统设计应遵循的原则

笔者通过总结,归纳出当前电力拖动自动控制系统在设计时应当遵循的原则:

(1)经济简单化原则。企业在选择电力拖动自动控制系统时,都想要低廉的价格换来可靠的电力拖动控制系统。因此在设计过程中,设计人员应当尽最大努力将系统不必要的电器与触头数量进行减少,线路设计应当最优化。

(2)稳定、安全、可靠性原则。在经济简单化原则基础上选择稳定性、可靠性、安全性较强的元件。

3 电力拖动自动控制系统的安全防护

任何系统的出现都需要制定想匹配的安全防护措施,电力拖动自动控制系统亦是如此,一般情况下,电力拖动自动控制系统的安全防护分为两种:一种是计算机系统保护;另一种是电器保护。电器保护是最基本,也是必要的保护,其通常有过流保护、短路保护、欠压保护以及热保护。而计算机系统保护则是不可或缺的保护,它属于高级保护,主要是对确保系统运行、维稳等进行保护。笔者在下文将从以下几点对电力拖动自动控制系统的安全防护进行分析:

(1)短路保护:短路故障一般是因为电流短路而造成局部电气设备绝缘体过热损害,电流过大,容易造成强大的电磁脉冲进而产生电动应力,进而损害电力拖动自动控制系统或各种电器设备。

(2)过流保护:如果使用电动机不当,很容易使得电动机超负荷运作,这样会引起电动机局部过电流,一般的过电流能量是正常启动电动机电流的数倍,因此容易损害电动机及系统元器件。

(3)欠压保护:系统运行过程中,如果电源电压不能满足电动机正常运作的需求,容易造成系统因欠压而减缓电动机速率甚至同志运作,当负载矩不变时,可以适当的增加电源来提压。另外,欠压还会造成电气释放问题,进而影响系统所有器件的正常工作,情况严重时还会出现系统故障。所以,笔者认为,当电压达到电动机电压临界值时,可以采取切断电源措施来进行保护。

(4)热保护:任何元器件在经过长时间工作时都会出现过热现象,如果电动机绕组或长时间超载运行,那么势必会造成自身温度高于允许值,进而导致电动机出现故障,为避免过热损害,可以采用多个电动机相替换的方法进行热保护。

(5)安全链:安全链的保护主要涉及五个方面。1)欠压保护的控制;2)过流保护的控制;3)水压保护;4)油压保护;5)轴瓦温度保护。安全链是将上述五种保护串联在一起的保护,无论其中哪个环节出现问题,计算机都会直接将自动控制系统关闭。

(6)运行连锁和启动连锁的保护:当计算机接收到信号后,电力拖动自动控制的实现主要是通过计算机所配置的程序完成,该过程主要是预防系统运行时信号条件的消失或电动机缺乏条件启动的保护。

4 结论

本文通过对电力拖动自动控制系统各方面的研究,提出了加强、完善系统设计与安全防护的意见,以期为设计者与使用者提供帮助。

参考文献:

[1] 王春凤,李旭春,杨耕.电力电子与运动控制实验平台安全性建设[J].实验技术与管理,2011(07).

[2] 陈伯时.电力拖动自动控制系统——运动控制系统[M].北京:机械工业出版社,2003.

[3] 黄华.浅析电力系统中的电器控制线路设计[J].科技信息,2010(35).

[4] 罗毅,李莺.浅析电力拖动系统稳定运行的充要条件[J].太原师范学院学报(自然科学版),2006(02).

有关电力拖动自动控制系统论文推荐:

1. 自动化专业自荐信范文

2. 浅谈电力优质服务论文

3. 自动化专业求职方向

4. 浅谈电力安全管理论文

5. 有关电气工程及其自动化硕士论文

6. 有关电力锅炉技术论文

论文检测系统标准

标准

通常大学本科毕业论文的查重标准为30%以下;硕士毕业论文的查重标准为15%-20%。

原则

1、安全原则。很多学校都有自己的一套论文检测系统的,但不一定要开个人用户,如果你坚持使用相同的检测与学校系统,将会被记录,通过一个不知名的网站查重,会存在问题很大的风险性,如果可以被上传到网上面,那么我们后续的查重率肯定是100%了。

2、实用原则。很多人都认为,学校用啥检测,我们就提前用啥检测,殊不知,良好的系统检测只是为了要最后那个重复率的数字,而其查重报告对于修改来说,根本不方便。你都不知道是那几个词引起的重复。

3、修改原则。论文修改,无非是同义换词和同义换句。因为,将一句话中造成重复的词汇换掉,就有可能拯救了整句话。这是最快的修改方法。

研究生毕业论文查重标准是相当严格的,对于论文的重复率是严格把控的,会根据研究生论文查重结果来判断是否符合研究生论文查重标准。更加准确来说就是,就是查抄袭率。一般一篇论文的抄袭率不能够超过20%,低于5%,可以直接送审或者答辩,5%-20%之间则需要导师审核做出判定。20%-35%之间的就需要重新进行研究生毕业论文查重了。

毕业论文是每个大学生都要经历的,它不仅代表着你即将结束大学的生活,也代表着从出生到现在的学校学习、生活的一个结束。写毕业论文是对大学学习、生活的一个总结。为了提高学生论文的质量,防止抄袭的学术不端行为,论文查重系统由此诞生,并且开辟出了一个市场,可以说论文查重是趋势所需的。那么,论文查重的原理是什么呢?今天小编来给大家讲讲。

首先,我们来了解一下论文查重的规则。一般来说,机构都是使用内部规定的论文查重,而论文查重规则是:将用户上传的论文跟论文查重系统数据库的数据进行对比,有点数据库中会加入互联网的数据,所以数据库的资源是极其庞大的。论文检测对比时,如果一个句子中存在了有连续13个字重复,就会被认为重复,并计算全文查重率。而大部分的论文查重系统都只能检测文本数据,对于图片、图表是无法进行识别的,因此不会参与检测过程。参考文献只要进行正确地格式标注、引用,也是不会参与查重检测的。如果参考文献格式规范、错误引用、虚假引用等,那么参考文献将会被认为是正文部分而参与查重检测,那么可能会导致论文查重率变高。

其次,我们需要了解一下论文查重的标准是什么。不同的单位对于论文查重的要求是不一样的,不同的论文查重系统对同一篇论文的查重结果也不一样的,因为每个论文查重系统的数据库、查重算法是不一样的,所以检测的结果肯定是不相同的。其实,就算是同一篇论文在同一个查重系统检测,其结果也是会有波动的。因为很多查重系统里面都是加入了数据库的数据的,而互联网的数据是实时更新的,所以在进行查重检测结果也是有波动的。我们需要了解清楚单位规定的查重系统是什么,然后选择对应的查重系统检测,这样可以节省时间。现在一般情况下,本科论文查重率要求一般在20%-30%之间,硕博论文查重比较严格,一般查重率要求在5%-10%之间,而期刊论文查重率要求一般在10%-20%之间。

以上就是“论文查重的标准是什么?”的全部内容,希望阅读后能对大家有所帮助。还想了解更多相关知识,可以关注papertime官网论文技巧页面~更多资讯等你来看~

毕业论文是衡量一个人是否能毕业的指标, 现在许多大学选择通过论文查重系统来判断论文是否符合学校标准。如果没有达到学校的标准,那么是无法顺利毕业的。现在很多本科毕业生对论文查重的范围有不了解的,今天来说说论文查重的标准是什么。论文重复率是否达标是非常重要的,因为这是高校判断论文是否能进入答辩环节的依据之一。如果论文重复率超过要求标准,那么会被延迟答辩时间,这样是会影响正常毕业时间的。所以,降低重复率是我们必须要做的事情,并且还要选择与学校一致的系统进行检测。由于学校不同,本科论文重复率也不同,但是一般论文重复率在15%~30%间,毕竟本科阶段,有的同学写的论文内容质量没有非常高的标准,达到学校的基本要求就可以了。知网是连续13个字相似就会判定为重复,所以如果内容复制得比较多,那么重复率也会相对较高。有的同学使用改变句子中的某些单词或句子的语态来降重,但是可以重复的计算技术标准问题依然没有存在。最好的办法就是按照别人的观点,对其进行总结以及归纳,用自己的想法写出一篇新文章。大学毕业论文查重时,系统的查重标准仅供指导老师的参考,并非最终的查重比例。只是部分文章与其他文章相似,如果一定要出现,就不能根据实际情况认为是重复的,因此导师的意见也是非常重要的一部分。

相关百科

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号-2