首页 > 论文发表知识库 > 人脸关键点检测论文详解

人脸关键点检测论文详解

发布时间:

人脸关键点检测论文详解

最近一直了解人脸检测的算法,所以也尝试学多人脸检测框架。所以这里将拿出来和大家分享一下 Retinaface 与普通的目标检测算法类似,在图片上预先设定好一些先验框,这些先验框会分布在整个图片上,网络内部结构会对这些先验框进行判断看是否包含人脸,同时也会调整位置进行调整并且给每一个先验框的一个置信度。 在 Retinaface 的先验框不但要获得人脸位置,还需要获得每一个人脸的五个关键点位置 接下来我们对 Retinaface 执行过程其实就是在图片上预先设定好先验框,网络的预测结果会判断先验框内部是否包含人脸并且对先验框进行调整获得预测框和五个人脸关键点。 MobileNet 网络是由 google 团队在 2017 年提出的,专注移动端和嵌入式设备中轻量级 CNN 网络,在大大减少模型参数与运算量下,对于精度只是小幅度下降而已。 在主干网络输出的相当输出了不同大小网格,用于检测不同大小目标,先验框默认数量为 2,这些先验框用于检测目标,然后通过调整得到目标边界框。 深度可分离卷积好处就是可以减少参数数量,从而降低运算的成本。经常出现在一些轻量级的网络结构(这些网络结构适合于移动设备或者嵌入式设备),深度可分离卷积是由DW(depthwise)和PW(pointwise)组成 这里我们通过对比普通卷积神经网络来解释,深度可分离卷积是如何减少参数 我们先看图中 DW 部分,在这一个部分每一个卷积核通道数 1 ,每一个卷积核对应一个输入通道进行计算,那么可想而知输出通道数就与卷积核个数以及输入通道数量保持一致。 简单总结一下有以下两点 PW 卷积核核之前普通卷积核类似,只不过 PW 卷积核大小为 1 ,卷积核深度与输入通道数相同,而卷积核个数核输出通道数相同 普通卷积 深度可分离卷积

人脸关键点检测可以精确定位面部的关键区域位置,包括眉毛、眼睛、鼻子、嘴巴,脸部轮廓等。支持一定程度遮挡以及多角度人脸。使用关键点检测技术,可以精确定位人脸美化局部,还可以实现表情交互。

python使用dlib进行人脸检测与人脸关键点标记

Dlib简介:

首先给大家介绍一下Dlib

Dlib是一个跨平台的C++公共库,除了线程支持,网络支持,提供测试以及大量工具等等优点,Dlib还是一个强大的机器学习的C++库,包含了许多机器学习常用的算法。同时支持大量的数值算法如矩阵、大整数、随机数运算等等。

Dlib同时还包含了大量的图形模型算法。

最重要的是Dlib的文档和例子都非常详细。

Dlib主页:

这篇博客所述的人脸标记的算法也是来自Dlib库,Dlib实现了One Millisecond Face Alignment with an Ensemble of Regression Trees中的算法

这篇论文非常出名,在谷歌上打上One Millisecond就会自动补全,是CVPR 2014(国际计算机视觉与模式识别会议)上的一篇国际顶级水平的论文。毫秒级别就可以实现相当准确的人脸标记,包括一些半侧脸,脸很不清楚的情况,论文本身的算法十分复杂,感兴趣的同学可以下载看看。

Dlib实现了这篇最新论文的算法,所以Dlib的人脸标记算法是十分先进的,而且Dlib自带的人脸检测库也很准确,我们项目受到硬件所限,摄像头拍摄到的画面比较模糊,而在这种情况下之前尝试了几个人脸库,识别率都非常的低,而Dlib的效果简直出乎意料。

相对于C++我还是比较喜欢使用python,同时Dlib也是支持python的,只是在配置的时候碰了不少钉子,网上大部分的Dlib资料都是针对于C++的,我好不容易才配置好了python的dlib,这里分享给大家:

Dlib for python 配置:

因为是用python去开发计算机视觉方面的东西,python的这些科学计算库是必不可少的,这里我把常用的科学计算库的安装也涵盖在内了,已经安装过这些库的同学就可以忽略了。

我的环境是:

大家都知道Ubuntu是自带的,而且很多Ubuntu系统软件都是基于的,有一次我系统的python版本乱了,我脑残的想把卸载了重装,然后……好像是提醒我要卸载几千个软件来着,没看好直接回车了,等我反应过来Ctrl + C 的时候系统已经没了一半了…

所以我发现想要搞崩系统,这句话比rm -rf 还给力…

sudo apt-get remove

首先安装两个python第三方库的下载安装工具,好像是预装了easy_install

以下过程都是在终端中进行:

1.安装pip

sudo apt-get install python-pip1

2.安装easy-install

sudo apt-get install python-setuptools1

3.测试一下easy_install

有时候系统环境复杂了,安装的时候会安装到别的python版本上,这就麻烦了,所以还是谨慎一点测试一下,这里安装一个我之前在博客中提到的可以模拟浏览器的第三方python库测试一下。

sudo easy_install Mechanize1

4.测试安装是否成功

在终端输入python进入python shell

python1

进入python shell后import一下刚安装的mechanize

>>>import mechanize1

没有报错,就是安装成功了,如果说没有找到,那可能就是安装到别的python版本的路径了。

同时也测试一下PIL这个基础库

>>>import PIL1

没有报错的话,说明PIL已经被预装过了

5.安装numpy

接下来安装numpy

首先需要安装python-dev才可以编译之后的扩展库

sudo apt-get install python-dev1

之后就可以用easy-install 安装numpy了

sudo easy_install numpy1

这里有时候用easy-install 安装numpy下载的时候会卡住,那就只能用 apt-get 来安装了:

sudo apt-get install numpy1

不推荐这样安装的原因就是系统环境或者说python版本多了之后,直接apt-get安装numpy很有可能不知道装到哪个版本去了,然后就很麻烦了,我有好几次遇到这个问题,不知道是运气问题还是什么,所以风险还是很大的,所以还是尽量用easy-install来安装。

同样import numpy 进行测试

python>>>import numpy1234

没有报错的话就是成功了

下面的安装过程同理,我就从简写了,大家自己每步别忘了测试一下

6.安装scipy

sudo apt-get install python-scipy1

7.安装matplotlib

sudo apt-get install python-matplotlib1

8.安装dlib

我当时安装dlib的过程简直太艰辛,网上各种说不知道怎么配,配不好,我基本把stackoverflow上的方法试了个遍,才最终成功编译出来并且导入,不过听说更新之后有了,那真是极好的,我没有亲自配过也不能乱说,这里给大家分享我配置的过程吧:

1.首先必须安装libboost,不然是不能使用.so库的

sudo apt-get install libboost-python-dev cmake1

2.到Dlib的官网上下载dlib,会下载下来一个压缩包,里面有C++版的dlib库以及例子文档,Python dlib库的代码例子等等

我使用的版本是,大家也可以在我这里下载:

之后进入python_examples下使用bat文件进行编译,编译需要先安装libboost-python-dev和cmake

cd to 123

之后会得到一个,复制到dist-packages目录下即可使用

这里大家也可以直接用我编译好的.so库,但是也必须安装libboost才可以,不然python是不能调用so库的,下载地址:

将.so复制到dist-packages目录下

sudo cp /usr/local/lib/

最新的好像就没有这个bat文件了,取而代之的是一个setup文件,那么安装起来应该就没有这么麻烦了,大家可以去直接安装,也可以直接下载复制我的.so库,这两种方法应该都不麻烦~

有时候还会需要下面这两个库,建议大家一并安装一下

9.安装skimage

sudo apt-get install python-skimage1

10.安装imtools

sudo easy_install imtools1

Dlib face landmarks Demo

环境配置结束之后,我们首先看一下dlib提供的示例程序

1.人脸检测

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image.  In#   particular, it shows how you can take a list of images from the command#   line and display each on the screen with red boxes overlaid on each human#   face.##   The examples/faces folder contains some jpg images of people.  You can run#   this program on them and see the detections by executing the#   following command:#       ./ ../examples/faces/*.jpg##   This face detector is made using the now classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear classifier, an image#   pyramid, and sliding window detection scheme.  This type of object detector#   is fairly general and capable of detecting many types of semi-rigid objects#   in addition to human faces.  Therefore, if you are interested in making#   your own object detectors then read the example#   program.  ### COMPILING THE DLIB PYTHON INTERFACE#   Dlib comes with a compiled python interface for python on MS Windows. If#   you are using another python version or operating system then you need to#   compile the dlib python interface before you can use this file.  To do this,#   run .  This should work on any operating#   system so long as you have CMake and boost-python installed.#   On Ubuntu, this can be done easily by running the command:#       sudo apt-get install libboost-python-dev cmake##   Also note that this example requires scikit-image which can be installed#   via the command:#       pip install -U scikit-image#   Or downloaded from . import sysimport dlibfrom skimage import iodetector = ()win = ()print("a");for f in [1:]:print("a");print("Processing file: {}".format(f))img = (f)# The 1 in the second argument indicates that we should upsample the image# 1 time.  This will make everything bigger and allow us to detect more# = detector(img, 1)print("Number of faces detected: {}".format(len(dets)))    for i, d in enumerate(dets):print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(i, (), (), (), ()))()(img)(dets)()# Finally, if you really want to you can ask the detector to tell you the score# for each detection.  The score is bigger for more confident detections.# Also, the idx tells you which of the face sub-detectors matched.  This can be# used to broadly identify faces in different (len([1:]) > 0):img = ([1])dets, scores, idx = (img, 1)    for i, d in enumerate(dets):print("Detection {}, score: {}, face_type:{}".format(d, scores[i], idx[i]))1234567891011128192021222324252627282930337383940414243444546474849505575859606162636465666768697077778798081

我把源代码精简了一下,加了一下注释:

# -*- coding: utf-8 -*-import sysimport dlibfrom skimage import io#使用dlib自带的frontal_face_detector作为我们的特征提取器detector = ()#使用dlib提供的图片窗口win = ()#[]是用来获取命令行参数的,[0]表示代码本身文件路径,所以参数从1开始向后依次获取图片路径for f in [1:]:    #输出目前处理的图片地址print("Processing file: {}".format(f))    #使用skimage的io读取图片img = (f)    #使用detector进行人脸检测 dets为返回的结果dets = detector(img, 1)    #dets的元素个数即为脸的个数print("Number of faces detected: {}".format(len(dets)))    #使用enumerate 函数遍历序列中的元素以及它们的下标#下标i即为人脸序号#left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离#top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离for i, d in enumerate(dets):print("dets{}".format(d))print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format( i, (), (), (), ()))    #也可以获取比较全面的信息,如获取人脸与detector的匹配程度dets, scores, idx = (img, 1)for i, d in enumerate(dets):print("Detection {}, dets{},score: {}, face_type:{}".format( i, d, scores[i], idx[i]))    #绘制图片(dlib的ui库可以直接绘制dets)(img)(dets)    #等待点击()123456789101112819202122232425262728293033738394041424344454647484950

分别测试了一个人脸的和多个人脸的,以下是运行结果:

运行的时候把图片文件路径加到后面就好了

python ./data/

一张脸的:

两张脸的:

这里可以看出侧脸与detector的匹配度要比正脸小的很多

2.人脸关键点提取

人脸检测我们使用了dlib自带的人脸检测器(detector),关键点提取需要一个特征提取器(predictor),为了构建特征提取器,预训练模型必不可少。

除了自行进行训练外,还可以使用官方提供的一个模型。该模型可从dlib sourceforge库下载:

也可以从我的连接下载:

这个库支持68个关键点的提取,一般来说也够用了,如果需要更多的特征点就要自己去训练了。

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image and#   estimate their pose.  The pose takes the form of 68 landmarks.  These are#   points on the face such as the corners of the mouth, along the eyebrows, on#   the eyes, and so forth.##   This face detector is made using the classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear

是的,比如云脉人脸识别中的人脸检测技术就是采用三维定向,对人脸三维朝向,做精准到“度”的判断,以及对人脸特征点进行“像素级”定位,轻松判断眼睛开合状态,还可通过技术对现有人脸识别做技术上的补充和完善,进而达到识别的创新性和严谨性。

关键点检测论文集

oks是关键点检测中的一个评价指标,其中keypoint similarity指一个关键点预测结果和标注之间的相似度,其定义为,其中 表示预测结果, 表示ground truth, 是物体(instance)的像素面积, 是和关键点类型相关的,也就是说即使距离相同,不同关键点其ks是不一样的。上面的公式中,相似度和距离呈反比,和 呈正比,和面积也呈正比。关键点影响因子 是从5000张标注图片中计算得到的, 表示关键点未标注, 表示关键点有遮挡但已经标注, 表示关键点无遮挡且已标注。 在条件成立时为1否则为0 在评估一个算法时,先找出所有ground truth oks最大的预测点,然后OKS的阈值变化从,大于阈值的认为时True Positive,否则是False Positive,而没有匹配的gt关键点认为是False Negative,即可以得到 AP (图像级别的计算AP)。 pck是在oks之前广泛使用的关键点检测评价指标,是以关键点为单位计算的指标。对于一个检测器 来说其PCK为表示关键点检测器, 表示关键点是否和gt匹配的阈值。 表示测试集合, 表示检测器预测位置,而 表示其gt。一般来说人体关键点检测中 取值为人头像素scale的、、...分别计算得到不通阈值下的pck,同理也可以卡不通的阈值来获取 AP 这个指标计算和PCK类似,不过其参考的scale是输入图片的大小, 因此指标并不是归一化的,关键点最小框面积占输入图片面积越小这个指标越低,仅仅用作训练时的一个参考指标[1] Matteo Ruggero Ronchi, Pietro Perona. Benchmarking and Error Diagnosis in Multi-Instance Pose Estimation. ICCV, 2017. [2] Leonid Pishchulin, Eldar Insafutdinov . DeepCut: Joint Subset Partition and Labeling for Multi Person Pose Estimation. CVPR, 2016. [3] Tomas Simon, Hanbyul Joo . Hand Keypoint Detection in Single Images using Multiview Bootstrapping. CVPR, 2017.

cornerNer论文链接: github: CenterNet论文链接: github: CornerNe-Lite论文链接: github: 所谓基于关键点进行目标检测,其实就是使用one-stage网络将目标边界框检测为一对关键点(即边界框的左上角和右下角)。通过将目标检测为成对关键点,就可消除现有的one-stage检测网络中对一组anchors的需要,这个最近火热的anchor-free也是不谋而合。接下来,先简单介绍下CornetNet和CenterNet这两个基于特征点的目标检测网络。最后对CornerNet-Squeeze做个简单介绍! CornerNet网络的整体思路是,首先通过Hourglass Network网络进行特征提取,紧接着将网络得到的特征输入到两个模块: Top-left Corner pooling 和 Bottom-right Corner pooling 提取关键点的特征,对于每个Corner Pooling模块都会进行目标框的左上角关键点和右下角关键点的类别分类( Heatmaps ),并找到每个目标的一对关键点( Embeddings ),以及减少基于坐标回算目标目标位置时的偏置( offsets )。网络的整体结构图如下: 很显然,CornerNet的核心是四个部分: 最终,如下图所示,上半支路的网络结果如下所示,网络最终是由两条支路组成的。 CenterNet网络主要是基于CornerNet网络存在的问题,而提出的基于关键点目标检测的网络。其实现了目前为止在one-stage系类算法中最高的MAP。CenterNet的作者发现,CornerNet是通过检测物体的左上角点和右下角点来确定目标,但在此过程中CornetNet使用corner pooling仅仅能够提取到目标边缘的特征,而导致CornetNet会产生很多的误检。基于此,CenterNet利用关键点 三元组 即 中心点、左上角关键点和右下角关键点 三个关键点而不是两个点来确定一个目标,使得网络能够获取到目标内部的特征。而CornerNet在论文中也说道了,约束其网络性能最重要的部分是关键点的提取,因此CenterNet提出了 Center Pooling 和 cascade corner Pooling 用来更好的提取本文提出的三个关键点。 作者基于Corner Pooling的系列思想,提出了Center Pooling的思想,使得网络提取到的中心点特征能够更好的表征目标物体。 最终,CenterNet在CornerNet的基础上增加了中心点的预测,以及修改了关键点特征的提取方式,大大减小了网络的误检,并且实现了one-stage系列算法中的最好效果。 普林斯顿大学在4月19号提出了两种更高效的基于关键点的目标检测算法,分别为: CornetNet-Saccade 和 CornetNet-Squeeze ,若将两种策略结合则称为 CornerNet-Lite 。以下是Cver对这两个网络的介绍,个人感觉写的很好,我就不造轮子了: 最终我最感兴趣的网络CornerNet-Squeeze和YOLOv3进行对比,达到了如下图所示的效果。 然而,就在我学习并总结这篇文章的过程中,我发现CornerNet-Squeeze是基于CornerNet改进的,但正如上文中介绍CenterNet的时候提到过的CornerNet所具有的那些弊端,我总觉得CornerNet-Squeeze在误检的部分不一定会很优秀,所以接下来就是看源码阶段了,希望CornerNet-Squeeze能够不负我望哈~

google人脸检测论文

dlib的安装很头疼我自己折腾了好几星期才成功 要讲的话很多所以写在了word里

链接:

python使用dlib进行人脸检测与人脸关键点标记

Dlib简介:

首先给大家介绍一下Dlib

Dlib是一个跨平台的C++公共库,除了线程支持,网络支持,提供测试以及大量工具等等优点,Dlib还是一个强大的机器学习的C++库,包含了许多机器学习常用的算法。同时支持大量的数值算法如矩阵、大整数、随机数运算等等。

Dlib同时还包含了大量的图形模型算法。

最重要的是Dlib的文档和例子都非常详细。

Dlib主页:

这篇博客所述的人脸标记的算法也是来自Dlib库,Dlib实现了One Millisecond Face Alignment with an Ensemble of Regression Trees中的算法

这篇论文非常出名,在谷歌上打上One Millisecond就会自动补全,是CVPR 2014(国际计算机视觉与模式识别会议)上的一篇国际顶级水平的论文。毫秒级别就可以实现相当准确的人脸标记,包括一些半侧脸,脸很不清楚的情况,论文本身的算法十分复杂,感兴趣的同学可以下载看看。

Dlib实现了这篇最新论文的算法,所以Dlib的人脸标记算法是十分先进的,而且Dlib自带的人脸检测库也很准确,我们项目受到硬件所限,摄像头拍摄到的画面比较模糊,而在这种情况下之前尝试了几个人脸库,识别率都非常的低,而Dlib的效果简直出乎意料。

相对于C++我还是比较喜欢使用python,同时Dlib也是支持python的,只是在配置的时候碰了不少钉子,网上大部分的Dlib资料都是针对于C++的,我好不容易才配置好了python的dlib,这里分享给大家:

Dlib for python 配置:

因为是用python去开发计算机视觉方面的东西,python的这些科学计算库是必不可少的,这里我把常用的科学计算库的安装也涵盖在内了,已经安装过这些库的同学就可以忽略了。

我的环境是:

大家都知道Ubuntu是自带的,而且很多Ubuntu系统软件都是基于的,有一次我系统的python版本乱了,我脑残的想把卸载了重装,然后……好像是提醒我要卸载几千个软件来着,没看好直接回车了,等我反应过来Ctrl + C 的时候系统已经没了一半了…

所以我发现想要搞崩系统,这句话比rm -rf 还给力…

sudo apt-get remove

首先安装两个python第三方库的下载安装工具,好像是预装了easy_install

以下过程都是在终端中进行:

1.安装pip

sudo apt-get install python-pip1

2.安装easy-install

sudo apt-get install python-setuptools1

3.测试一下easy_install

有时候系统环境复杂了,安装的时候会安装到别的python版本上,这就麻烦了,所以还是谨慎一点测试一下,这里安装一个我之前在博客中提到的可以模拟浏览器的第三方python库测试一下。

sudo easy_install Mechanize1

4.测试安装是否成功

在终端输入python进入python shell

python1

进入python shell后import一下刚安装的mechanize

>>>import mechanize1

没有报错,就是安装成功了,如果说没有找到,那可能就是安装到别的python版本的路径了。

同时也测试一下PIL这个基础库

>>>import PIL1

没有报错的话,说明PIL已经被预装过了

5.安装numpy

接下来安装numpy

首先需要安装python-dev才可以编译之后的扩展库

sudo apt-get install python-dev1

之后就可以用easy-install 安装numpy了

sudo easy_install numpy1

这里有时候用easy-install 安装numpy下载的时候会卡住,那就只能用 apt-get 来安装了:

sudo apt-get install numpy1

不推荐这样安装的原因就是系统环境或者说python版本多了之后,直接apt-get安装numpy很有可能不知道装到哪个版本去了,然后就很麻烦了,我有好几次遇到这个问题,不知道是运气问题还是什么,所以风险还是很大的,所以还是尽量用easy-install来安装。

同样import numpy 进行测试

python>>>import numpy1234

没有报错的话就是成功了

下面的安装过程同理,我就从简写了,大家自己每步别忘了测试一下

6.安装scipy

sudo apt-get install python-scipy1

7.安装matplotlib

sudo apt-get install python-matplotlib1

8.安装dlib

我当时安装dlib的过程简直太艰辛,网上各种说不知道怎么配,配不好,我基本把stackoverflow上的方法试了个遍,才最终成功编译出来并且导入,不过听说更新之后有了,那真是极好的,我没有亲自配过也不能乱说,这里给大家分享我配置的过程吧:

1.首先必须安装libboost,不然是不能使用.so库的

sudo apt-get install libboost-python-dev cmake1

2.到Dlib的官网上下载dlib,会下载下来一个压缩包,里面有C++版的dlib库以及例子文档,Python dlib库的代码例子等等

我使用的版本是,大家也可以在我这里下载:

之后进入python_examples下使用bat文件进行编译,编译需要先安装libboost-python-dev和cmake

cd to 123

之后会得到一个,复制到dist-packages目录下即可使用

这里大家也可以直接用我编译好的.so库,但是也必须安装libboost才可以,不然python是不能调用so库的,下载地址:

将.so复制到dist-packages目录下

sudo cp /usr/local/lib/

最新的好像就没有这个bat文件了,取而代之的是一个setup文件,那么安装起来应该就没有这么麻烦了,大家可以去直接安装,也可以直接下载复制我的.so库,这两种方法应该都不麻烦~

有时候还会需要下面这两个库,建议大家一并安装一下

9.安装skimage

sudo apt-get install python-skimage1

10.安装imtools

sudo easy_install imtools1

Dlib face landmarks Demo

环境配置结束之后,我们首先看一下dlib提供的示例程序

1.人脸检测

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image.  In#   particular, it shows how you can take a list of images from the command#   line and display each on the screen with red boxes overlaid on each human#   face.##   The examples/faces folder contains some jpg images of people.  You can run#   this program on them and see the detections by executing the#   following command:#       ./ ../examples/faces/*.jpg##   This face detector is made using the now classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear classifier, an image#   pyramid, and sliding window detection scheme.  This type of object detector#   is fairly general and capable of detecting many types of semi-rigid objects#   in addition to human faces.  Therefore, if you are interested in making#   your own object detectors then read the example#   program.  ### COMPILING THE DLIB PYTHON INTERFACE#   Dlib comes with a compiled python interface for python on MS Windows. If#   you are using another python version or operating system then you need to#   compile the dlib python interface before you can use this file.  To do this,#   run .  This should work on any operating#   system so long as you have CMake and boost-python installed.#   On Ubuntu, this can be done easily by running the command:#       sudo apt-get install libboost-python-dev cmake##   Also note that this example requires scikit-image which can be installed#   via the command:#       pip install -U scikit-image#   Or downloaded from . import sysimport dlibfrom skimage import iodetector = ()win = ()print("a");for f in [1:]:print("a");print("Processing file: {}".format(f))img = (f)# The 1 in the second argument indicates that we should upsample the image# 1 time.  This will make everything bigger and allow us to detect more# = detector(img, 1)print("Number of faces detected: {}".format(len(dets)))    for i, d in enumerate(dets):print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(i, (), (), (), ()))()(img)(dets)()# Finally, if you really want to you can ask the detector to tell you the score# for each detection.  The score is bigger for more confident detections.# Also, the idx tells you which of the face sub-detectors matched.  This can be# used to broadly identify faces in different (len([1:]) > 0):img = ([1])dets, scores, idx = (img, 1)    for i, d in enumerate(dets):print("Detection {}, score: {}, face_type:{}".format(d, scores[i], idx[i]))1234567891011128192021222324252627282930337383940414243444546474849505575859606162636465666768697077778798081

我把源代码精简了一下,加了一下注释:

# -*- coding: utf-8 -*-import sysimport dlibfrom skimage import io#使用dlib自带的frontal_face_detector作为我们的特征提取器detector = ()#使用dlib提供的图片窗口win = ()#[]是用来获取命令行参数的,[0]表示代码本身文件路径,所以参数从1开始向后依次获取图片路径for f in [1:]:    #输出目前处理的图片地址print("Processing file: {}".format(f))    #使用skimage的io读取图片img = (f)    #使用detector进行人脸检测 dets为返回的结果dets = detector(img, 1)    #dets的元素个数即为脸的个数print("Number of faces detected: {}".format(len(dets)))    #使用enumerate 函数遍历序列中的元素以及它们的下标#下标i即为人脸序号#left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离#top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离for i, d in enumerate(dets):print("dets{}".format(d))print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format( i, (), (), (), ()))    #也可以获取比较全面的信息,如获取人脸与detector的匹配程度dets, scores, idx = (img, 1)for i, d in enumerate(dets):print("Detection {}, dets{},score: {}, face_type:{}".format( i, d, scores[i], idx[i]))    #绘制图片(dlib的ui库可以直接绘制dets)(img)(dets)    #等待点击()123456789101112819202122232425262728293033738394041424344454647484950

分别测试了一个人脸的和多个人脸的,以下是运行结果:

运行的时候把图片文件路径加到后面就好了

python ./data/

一张脸的:

两张脸的:

这里可以看出侧脸与detector的匹配度要比正脸小的很多

2.人脸关键点提取

人脸检测我们使用了dlib自带的人脸检测器(detector),关键点提取需要一个特征提取器(predictor),为了构建特征提取器,预训练模型必不可少。

除了自行进行训练外,还可以使用官方提供的一个模型。该模型可从dlib sourceforge库下载:

也可以从我的连接下载:

这个库支持68个关键点的提取,一般来说也够用了,如果需要更多的特征点就要自己去训练了。

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image and#   estimate their pose.  The pose takes the form of 68 landmarks.  These are#   points on the face such as the corners of the mouth, along the eyebrows, on#   the eyes, and so forth.##   This face detector is made using the classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear

URL: 论文pdf Google出品。亚毫秒级的移动端人脸检测算法。移动端可达200~1000+FPS速度。主要以下改进: 在深度可分离卷积中,计算量主要为point-wise部分,增加depth-wise部分卷积核大小并不会明显增加成本。因此本文在depth-wise部分采用了5x5的卷积核,已获得更大的感受野,故此可以降低在层数上的需求。 此外,启发于mobilenetV2,本文设计了一个先升后降的double BlazeBlock。BlazeBlock适用于浅层,double BlazeBlock适用于深层。 16x16的anchor是一样的,但本文将8x8,4x4和2x2的2个anchor替换到8x8的6个anchor。此外强制限制人脸的长宽为1:1。 由于最后一层feature map较大(相对于ssd),导致预测结果会较多,在连续帧预测过程中,nms会变导致人脸框变得更加抖动。本文在原始边界框的回归参数估计变为其与重叠概率的加权平均。这基本没有带来预测时间上的消耗,但在提升了10%的性能。 效果好速度快的方法想不想要?

人脸识别与人脸检测毕业论文

计算机软件毕业论文的题目都好写啊

网络、网站,或管理系统都可以的

==你是本科还是硕士啊论文的话应该主要是算法的研究和改进吧……问题比如:你采用了哪种人脸识别算法你对这种算法的改进在哪里(你不只要说明改进在哪里可能还需要做一些实验收集下数据来对比说明算法在改进后对性能有了提升)新算法比其他算法好在哪里(还是通过实验收集数据对比一下)分析下算法的复杂度(时间复杂度和空间复杂度可能都会要求毕竟图像分析很占空间)然后是怎样进行优化的实验采用的样本是哪些(我们当时用的UCIrvineMachineLearningRepository下面会有CMUFaceImages大家一般都用这个库来作为样本)怎样对实验结果进行量化比较的(标准是什么)如果是模式识别的话还可能关心怎样选的特征值和特征空间(计算量大的话是怎样减少计算量的)训练样本采用的什么算法实验的识别率是多少算法的性能是不是稳定……==我想到的都是本科的问题如果是研究生的话可能还会问的更难

1 KM-1 键混器的设计 1 Sw3204V监控器的设计 1 基于射频遥控型(单片机)交通灯的设计1 Sw802V视频切换器的设计 1 无线数控多相位灯从机的设计1 基于RS232遥控型交通灯的设计1 Sw802A音频切换器的设计1 Sw6408V监控器的设计 1 KM-3键混器的设计1 无线数控多相位灯主机的设计1 SW162V数字视频切换器的设计1 基于RS232监控切换器1 SW401V 数字视频切换器的设计1 基于单片机的多路数据采集系统1 RS485转RS232的模块设计1 基于LCD显示的波形发生器的设计1 4-20mA转RS-485模块的设计 1 基于RS232流量计的设计 1 基于PTR2000的交通灯控制器主机的设计1 基于RS485量水仪的设计1 压力采集控制器的设计 1 数字量转4-20mA模拟量输出的模块设计1 正弦波形发生器的设计1 基于PTR2000的交通灯控制器从机的设计1 基于RS485视频切换器的设计1 LCD车速里程表电路设计1 LED车速里程表电路设计1 MSK通信系统的仿真设计1 员工信息管理系统 1 计算机文化基础考试系统的设计和开发1 人事工资管理系统1 员工信息管理系统设计1 超市进销存管理系统的VB实现1 基于单片机的多波形发生器的应用1 基于单片机电动自行车控制器设计1 个人理财管理系统1 基于CAN总线火灾监控系统的研究1 基于DSP平台的FIR滤波器设计1 于Matlab的FIR数字滤波器设计与仿真1 基于TMS320VC5402-DSP的最小系统硬件设计1 基于单片机的热水控制器 1 基于单片机的路灯控制系统的设计1 于单片机远程控制家用电器系统的设计1 基于液晶显示的乘法口诀测试仪的设计1 实验室设备管理系统毕业设计开题报告1 用AT89C51做 洗衣机全自动控制.doc1 数显频率计的设计.doc1 数控车间温度湿度控制系统设计.doc1 三角波斜率测试仪设计.doc1 人脸几何特征提取1 全自动洗衣机的控制程序设计.doc1 乞丐论文.doc1 教学楼毕业设计.doc1 建立海上风电场的技术要求分析与探讨.doc1 基于凌阳61A的数字式温湿度检测仪.doc1 基于几何匹配和分合算法的人脸识别.doc1 基于单片机数字钟的设计.doc1 基于单片机数据通用采集器的设计.doc1 基于单片机数据采集器.doc1 基于单片机的自动报警器的设计.doc1 基于单片机的终端设计.doc1 基于单片机的路灯控制系统控制系统的设计.doc1 基于单片机的交通灯的设计.doc1 基于单片机的简易计算器的设计.doc1 基于单片机的家用安保系统的设计.doc1 基于VHDL的数字频率计.doc1 基于SystemView的OFDM系统仿真设计.doc1 基于SystemView的OFDM系统仿真设计 基于PLC的烧结配料控制系统设计.doc1 基于MSP430的温度检测系统设计 基于MATLAB工具箱的数字滤波器设计.doc1 基于MATLAB的扩频通信系统仿真研究.doc1 基于GSM短信息通信方式的路灯无线监控系统.doc1 基于FPGA的信号源设计.doc1 基于EPP协议的AVR与PC并行通信系统的设计 单片机交通灯.doc1 单片机多点温度巡回检测系统的设计.doc1 单片机的温湿度检测系统 单路口交通信号PLC控制系统的设计.doc1 城市路口多相位自寻优交通信号控制设计.doc1 陈洁(螺旋瓶盖的设计).doc1 八路竞赛抢答器.doc1 matlab信号与系统.doc1 GSM系统的研究与SystemView仿真.doc1 蒯申红智能语音报站系统设计 MT8888在家庭安全电话报警系统中的应用设计1 基于FPGA的频率与功率因数在线测量1 基于FPGA的误码测试仪如果需要定做的话系 Q 273546756

人脸跟踪检测论文

计算机论文题目

随着大科学时代的到来及科技水平的高速发展,计算机科学与技术已经渗透到我国经济、社会的各个领域,这些都有利于全球经济的发展,还极大地推动了社会的进步,

1、基于物联网的煤矿井下监测网络平台关键技术研究

2、基于抽象状态自动机和π演算的UML动态语义研究

3、基于多种数据源的中文知识图谱构建方法研究

4、基于矩阵化特征表示和Ho-Kashyap算法的分类器设计方法研究

5、基于博弈论的云计算资源调度方法研究

6、基于合约的泛型Web服务组合与选择研究

7、本体支持的Web服务智能协商和监测机制研究

8、基于神经网络的不平衡数据分类方法研究

9、基于内容的图像检索与推荐技术研究

10、物联网技术及其在监管场所中的应用

11、移动图书馆的研发与实现

12、图书馆联机公共目录查询系统的研究与实现

13、基于O2O模式的外卖订餐系统

14、网络时代个人数据与隐私保护的调查分析

15、微信公众平台CMS的设计与实现

16、环保部门语义链网络图形化呈现系统

17、BS结构计量信息管理系统设计与研究

18、基于上下文的天然气改质分析控制系统的设计与实现

19、基于增量学习和特征融合的多摄像机协作监控系统目标匹配方法研究

20、无线自组网络密钥管理及认证技术的研究

21、基于CDMI的云存储框架技术研究

22、磨损均衡在提高SSD使用寿命中的应用与改进

23、基于.NET的物流管理软件的设计与实现

24、车站商铺信息管理系统设计与实现

25、元数据模型驱动的合同管理系统的设计与实现

26、安睡宝供应与销售客户数据管理与分析系统

27、基于OpenCV的人脸检测与跟踪算法研究

28、基于PHP的负载均衡技术的研究与改进

29、协同药物研发平台的构建及其信任机制研究

30、光纤网络资源的智能化管理方法研究

31、基于差异同步的云存储研究和实践

32、基于Swift的云存储产品优化及云计算虚拟机调度算法研究

33、基于Hadoop的重复数据删除技术研究

34、中文微博情绪分析技术研究

35、基于协议代理的内控堡垒主机的设计与实现

36、公交车辆保修信息系统的研究与设计

37、基于移动互联网的光纤网络管理系统设计与开发

38、基于云平台的展馆综合管理系统

39、面向列表型知识库的组织机构实体链接方法研究

40、Real-time Hand Gesture Recognition by Using Geometric Feature

41、基于事件的社交网络核心节点挖掘算法的研究与应用

42、线性判别式的比较与优化方法研究

43、面向日志分类的蚁群聚类算法研究

44、基于决策树的数据挖掘技术在电信欠费管理中的应用与研究

45、基于信任关系与主题分析的微博用户推荐技术

46、微博用户兴趣挖掘技术研究

47、面向多源数据的信息抽取方法研究

48、基于本体约束规则与遗传算法的BIM进度计划自动生成研究

49、面向报关行的通关服务软件研究与优化

50、云应用开发框架及云服务推进策略的研究与实践

51、复杂网络社区发现方法以及在网络扰动中的影响

52、空中交通拥挤的识别与预测方法研究

53、基于RTT的端到端网络拥塞控制研究

54、基于体系结构的无线局域网安全弱点研究

55、物联网中的RFID安全协议与可信保障机制研究

56、机器人认知地图创建关键技术研究

57、Web服务网络分析和社区发现研究

58、基于球模型的三维冠状动脉中心线抽取方法研究

59、认知无线网络中频谱分配策略的建模理论与优化方法研究

60、传感器网络关键安全技术研究

61、任务关键系统的软件行为建模与检测技术研究

62、基于多尺度相似学习的图像超分辨率重建算法研究

63、基于服务的信息物理融合系统可信建模与分析

64、电信机房综合管控系统设计与实现

65、粒子群改进算法及在人工神经网络中的应用研究

66、污染源自动监控数据传输标准的研究与应用

67、一种智能力矩限制器的设计与研究

68、移动IPv6切换技术的研究

69、基于移动Ad hoc网络路由协议的改进研究

70、机会网络中基于社会关系的数据转发机制研究

71、嵌入式系统视频会议控制技术的研究与实现

72、基于PML的物联网异构信息聚合技术研究

73、基于移动P2P网络的广播数据访问优化机制研究

74、基于开放业务接入技术的业务移动性管理研究

75、基于AUV的UWSN定位技术的研究

76、基于隐私保护的无线传感网数据融合技术研究

77、基于DIVA模型语音生成和获取中小脑功能及其模型的研究

78、无线网络环境下流媒体传送技术的研究与实现

79、异构云计算平台中节能的任务调度策略研究

80、PRAM模型应用于同步机制的研究

81、云计算平台中虚拟化资源监测与调度关键技术研究

82、云存储系统中副本管理机制的研究

83、嵌入式系统图形用户界面开发技术研究

84、基于多维管理的呼叫中心运行系统技术研究

85、嵌入式系统的流媒体播放器设计与性能优化

86、基于组合双向拍卖的云资源调度算法的研究

87、融入隐私保护的特征选择算法研究

88、济宁一中数字化校园系统的设计与实现

89、移动合作伙伴管理系统的设计与实现

90、黄山市地税局网络开票系统的设计与应用

91、基于语义的领域信息抽取系统

92、基于MMTD的图像拼接方法研究

93、基于关系的垃圾评论检测方法

94、IPv6的过渡技术在终端综合管理系统中的实现与应用

95、基于超声波测距与控制的运动实验平台研发

96、手臂延伸与抓取运动时间协调小脑控制模型的研究

97、位置可视化方法及其应用研究

98、DIVA模型中定时和预测功能的研究

99、基于蚁群的Ad Hoc路由空洞研究

100、基于定向天线的Ad Hoc MAC协议的研究

101、复杂网络社区发现方法以及在网络扰动中的影响

102、空中交通拥挤的识别与预测方法研究

103、基于RTT的端到端网络拥塞控制研究

104、基于体系结构的无线局域网安全弱点研究

105、物联网中的RFID安全协议与可信保障机制研究

106、机器人认知地图创建关键技术研究

107、Web服务网络分析和社区发现研究

108、基于球模型的`三维冠状动脉中心线抽取方法研究

109、认知无线网络中频谱分配策略的建模理论与优化方法研究

110、传感器网络关键安全技术研究

111、任务关键系统的软件行为建模与检测技术研究

112、基于多尺度相似学习的图像超分辨率重建算法研究

113、基于服务的信息物理融合系统可信建模与分析

114、电信机房综合管控系统设计与实现

115、粒子群改进算法及在人工神经网络中的应用研究

116、污染源自动监控数据传输标准的研究与应用

117、一种智能力矩限制器的设计与研究

118、移动IPv6切换技术的研究

119、基于移动Ad hoc网络路由协议的改进研究

120、机会网络中基于社会关系的数据转发机制研究

121、嵌入式系统视频会议控制技术的研究与实现

122、基于PML的物联网异构信息聚合技术研究

123、基于移动P2P网络的广播数据访问优化机制研究

124、基于开放业务接入技术的业务移动性管理研究

125、基于AUV的UWSN定位技术的研究

126、基于隐私保护的无线传感网数据融合技术研究

127、基于DIVA模型语音生成和获取中小脑功能及其模型的研究

128、无线网络环境下流媒体传送技术的研究与实现

129、异构云计算平台中节能的任务调度策略研究

130、PRAM模型应用于同步机制的研究

131、云计算平台中虚拟化资源监测与调度关键技术研究

132、云存储系统中副本管理机制的研究

133、嵌入式系统图形用户界面开发技术研究

134、基于多维管理的呼叫中心运行系统技术研究

135、嵌入式系统的流媒体播放器设计与性能优化

136、基于组合双向拍卖的云资源调度算法的研究

137、融入隐私保护的特征选择算法研究

138、济宁一中数字化校园系统的设计与实现

139、移动合作伙伴管理系统的设计与实现

140、黄山市地税局网络开票系统的设计与应用

141、基于语义的领域信息抽取系统

142、基于MMTD的图像拼接方法研究

143、基于关系的垃圾评论检测方法

144、IPv6的过渡技术在终端综合管理系统中的实现与应用

145、基于超声波测距与控制的运动实验平台研发

146、手臂延伸与抓取运动时间协调小脑控制模型的研究

147、位置可视化方法及其应用研究

148、DIVA模型中定时和预测功能的研究

149、基于蚁群的Ad Hoc路由空洞研究

150、基于定向天线的Ad Hoc MAC协议的研究

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

  • 索引序列
  • 人脸关键点检测论文详解
  • 关键点检测论文集
  • google人脸检测论文
  • 人脸识别与人脸检测毕业论文
  • 人脸跟踪检测论文
  • 返回顶部