整理了各类场景应用中AI算法
一、图像CV
内容安全,目标检测,图像识别,智能视觉生产,图像搜索,图像分割,物体检测,图像分类,图像标签,名人识别,概念识别,场景识别,物体识别,场景分析,智能相册,内容推荐,图库管理,网红人物识别,明星人物识别,图像搜索,商品图片搜索,版权图片搜索,通用图片搜索,车牌识别,垃圾分类,车辆检测,菜品识别,车型识别,犬类识别,实例分割,风格迁移,智能填充,智能识图,拍照搜商品,精准广告投放,电商导购,图像分析,图像理解,图像处理,图像质量评估,场景识别,物体识别,场所识别,图像自训练平台,图像分类,目标检测,图像分割,关键点检测,图像生成,场景文字识别,度量学习,图像识别,图像比对,图像分类使用手册,图像分类API文档目标检测使用手册,目标检测API文档Logo检测使用手册,Logo检测API文档,通用图片搜索,车牌识别,垃圾分类,车辆检测,车型识别,犬类识别,实例分割,风格迁移,智能填充,车牌识别,相册聚类,场景与物体识别,无限天空,图像识别引擎,黄色图片识别,暴力图像识别,工业轮胎智能检测,肋骨骨折识别,显微识别,图像处理,广告识别,人脸算法,人体算法,图像识别,图像增强,OCR,图像处理,ZoomAI,智能贴图,智能制作,质量评价,图像识别,智能鉴黄,图像识别,实时手写识别,唇语识别,通用文字识别,手写文字识别,图像技术,图像识别,图像审核,图像搜索,图像增强,图像特效,车辆分析,图像生成,绘画机器人独家,动漫化身独家,像素风独家,超清人像独家,图像融合,换脸技术,神奇变脸,图像风格化,证件照生成,线稿图像识别,宝宝检测,图像分类,圉像深度估计,天空分割,食物分割,猫狗脸技术,食物识别独家,图像美学评分,车辆分析,车型识别,车型识别(含指导价),车型识别(含配置参数),车标识别,人脸识别(活体),车牌识别,表情识别,安全帽识别,计算机影像,计算机视觉,聚焦光学字符识别、人脸识别、质检、感知、理解、交互,图像视频分析,Logo检测,内容审核,智能批改,笔记评估,思维导图评估,物体检测,物体识别。
二、人脸、体态、眼瞳、声音、指纹
人脸分割人脸识别,无,人体分析HAS,识别人的年龄,性别,穿着信息,客流统计分析,智能客服,热点区域分析,人体检测,人脸口罩识别,人脸对比,人脸搜索,人脸检测与属性分析,人脸活体检测,人体关键点检测,行人重识别,细粒度人像分割,人像分割,人脸解析,3D人体姿态估计,人脸融合,人脸识别,换脸甄别,人脸支付,人脸核身,人像变换,人脸试妆,人脸融合,人体分析,手势识别,人脸验证与检索,人脸比对,人脸比对sensetime,人脸水印照比对,静默活体检测,静默活体检测sensetime,人脸检测和属性分析,人脸特征分析tuputech,配合式活体检测,人脸安防,计算机视觉,智能应用服务,人脸查询人脸分析人脸统计名单库管理人脸布控,人脸应用,人体应用,人体查询,车辆查询车辆分析车辆统计车辆布控车辆名单库管理,车辆应用,人脸图像识别人体图像识别车辆图像识别,图像识别,图像比对,人脸比对,人体检测,人脸口罩识别,人脸对比,人脸搜索,人脸检测与属性分析,人脸活体检测,人体关键点检测,行人重识别,细粒度人像分割,人像分割,人脸解析,3D人体姿态估计,人脸融合,人脸识别,人脸检测,人脸比对,人脸搜索,人脸关键点,稠密关键点,人脸属性,情绪识别,颜值评分,视线估计,皮肤分析,3D人脸重建,面部特征分析人体识别,人体检测,人体关键点,人体抠像,人体属性,手势识别人像处理,美颜美型,人脸融合,滤镜,声纹识别支付,语音合成,语音合成,声纹识别,语音唤醒,人脸识别引擎,摄像头人脸识别,图片人脸检测,身份识别,人脸识别,人脸属性,人体识别,声纹识别,衣服检索及聚类,语音分析,声纹识别,说话人归档,人脸和人体识别,人脸检测,手势识别,人脸与人体识别,人脸识别云服务,人脸识别私有化,人脸离线识别SDK,人脸实名认证,人像特效,人体分析,人脸技不,皮肤分析独家,头部分割,宏观人脸分析,人脸关键点检测,微观人脸分析独家,头发分析独家,五官分割,头发分割人体技术,人体外轮廓点检测独家,精细化人像抠图,人体框检测,肢体关键点检测,人像分割,服饰识别,手势识别,皮肤分割,人脸,说话人识别,人脸检测识别,人脸1:1比对,人脸检测,AI人脸/人形车辆,大数据人像图片防伪,QoS保障,CDN,表情识别,举手动作识别,人脸检测,网络切片,边缘计算,人脸分析,人脸检测,人脸搜索,人体分析,手势识别,着装检测,人脸识别,行为检测,人脸识别,人形检测,行为分析,人脸检测,人脸跟踪,人脸比对,人脸查找,人脸属性分析,活体检测,声音指纹,声纹识别。
三、视频
视频分割、视频处理、视频理解、智能视觉、多媒体,视频内容分析,人体动作监控,视频分类,智能交通,人/动物轨迹分析,目标计数,目标跟踪,视频编辑-,精彩片段提取,新闻视频拆分,视频摘要,视频封面,视频拆条,视频标签-,视频推荐,视频搜索,视频指纹-,数字版权管理,广告识别,视频快速审核,视频版权,视频查重,视频换脸,车辆解析, 体育 视频摘要,视频内容分析,颜色识别,货架商品检测, 时尚 搭配,危险动作识别,无,无,视频,视频换脸,车辆解析, 体育 视频摘要,视频内容分析,颜色识别,货架商品检测, 时尚 搭配,危险动作识别,菜品识别,视频识别引擎,结肠息肉检测,胃镜评估系统,视频标签,场景识别,客流分析,手势识别,视频技术,短视频标签,视觉看点识别,动态封面图自动生成,智能剪辑,新闻拆条,智能插帧,视频技术,多模态媒资检索公测中,媒体内容分析,媒体内容审核,视频生成,视频动作识别,
四、ocr文字识别
手写识别,票据识别,通用文档,通用卡证,保险智能理赔,财税报销电子化,证照电子化审批,票据类文字识别,行业类文字识别,证件类文字识别,通用类文字识别,通用文字识别,驾驶证识别,身份证识别,增值税发票识别,行驶证识别,营业执照识别,银行卡识别,增值税发票核验,营业执照核验,智能扫码,行业文档识别, 汽车 相关识别,票据单据识别,卡证文字识别,通用文字识别,手写文字识别,印刷文字识别,银行卡识别,名片识别,身份证识别intsig,营业执照识别intsig,增值税发票识别intsig,拍照速算识别,公式识别,指尖文字识别,驾驶证识别JD,行驶证识别JD,车牌识别JD,身份证识别,增值税发票识别,营业执照识别,火车票识别,出租车发票识别,印刷文字识别(多语种),印刷文字识别(多语种)intsig内容审核,色情内容过滤,政治人物检查,暴恐敏感信息过滤,广告过滤,OCR自定义模板使用手册,OCR自定义模板API文档,通用文字识别,驾驶证识别,身份证识别,增值税发票识别,行驶证识别,营业执照识别,银行卡识别,身份证识别,驾驶证识别,行驶证识别,银行卡识别,通用文字识别,自定义模板文字识别,文字识别引擎,身份证识别,图片文字识别,通用文字识别,身份证识别,名片识别,光学字符识别服务,通用文字识别,手写体文字识别,表格识别,整题识别(含公式),购物小票识别,身份证识别,名片识别,自定义模板文字识别,文字识别,通用文字识别,银行卡识别,身份证识别,字幕识别,网络图片识别, 游戏 直播关键字识别,新闻标题识别,OCR文字识别,通用场景文字识别,卡证文字识别,财务票据文字识别,医疗票据文字识别, 汽车 场景文字识别,教育场景文字识别,其他场景文字识别,iOCR自定义模板文字识别,通用类OCR,通用文本识别(中英)通用文本识别(多语言)通用表格识别,证照类OCR,身份证社保卡户口本护照名片银行卡结婚证离婚证房产证不动产证,车辆相关OCR,行驶证驾驶证车辆合格证车辆登记证,公司商铺类OCR,商户小票税务登记证开户许可证营业执照组织机构代码证,票据类OCR,增值税发票增值税卷票火车票飞机行程单出租车发票购车发票智能技术,票据机器人证照机器人文本配置机器人表格配置机器人框选配置机器人,文字识别,行驶证识别,驾驶证识别,表单识别器,通用文本,财务票据识别,机构文档识别,个人证件识别,车辆相关识别,通用表格,印章识别,财报识别,合同比对,识别文字识别,签名比对,OCR识别,教育OCR,印刷识别,手写识别,表格识别,公式识别,试卷拆录
五、自然语言NPL
文本相似度,文本摘要,文本纠错,中心词提取,文本信息抽取,智能文本分类,命名实体,词性标注,多语言分词,NLP基础服务,地址标准化,商品评价解析智能短信解析,机器阅读理解,金融研报信息识别,法律案件抽取,行业问答推理,行业知识图谱构建,文本实体关系抽取,搜索推荐,知识问答,短文本相似度,文本实体抽取, 情感 倾向分析,兴趣画像匹配,文本分类-多标签,文本分类-单标签,定制自然语言处理,语言生成,语言理解,自然语言处理基础,文本摘要,数据转文字,文本生成,智能问答系统,内容推荐,评价分析,文本分类,对话理解,意图理解, 情感 分析,观点抽取,中文分词,短文本相似度,关键词提取,词向量,命名实体,识别依存,句法分析, 情感 分析,评论观点抽取,短文本相似度,机器翻译,词法分析,词义相似度,词向量,句法分析,文本分类,短语挖掘,闲聊,文本流畅度,同义词,聚类,语言模型填空,新闻热词生成,机器阅读理解,商品信息抽取,词法分析, 情感 分析,关键词提取,用户评论分析,资讯热点挖掘,AIUI人机交互,文本纠错,词法分析,依存句法分析,语义角色标注,语义依存分析(依存树),语义依存分析(依存图), 情感 分析,关键词提取,NLP能力生产平台,NLP基础技术,中文词法分析-LAC,词向量—Word2vec,语言模型—Language_model,NLP核心技术, 情感 分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答,信息检索、新闻推荐、智能客服, 情感 分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答,机器问答、自然语言推断、 情感 分析和文档排序,NLP系统应用,问答系统对话系统智能客服,用户消费习惯理解热点话题分析舆情监控,自然语言处理,文本分类使用手册,文本分类API文档, 情感 分析,评论观点抽取,短文本相似度,机器翻译,词法分析,词义相似度,词向量,句法分析,文本分类,短语挖掘,闲聊,文本流畅度,同义词,聚类,语言模型填空,新闻热词生成,机器阅读理解,商品信息抽取智能创作,智能写作,搭配短文,种草标题,卖点标题,社交电商营销文案,自然语言处理能力,基础文本分析,分词、词性分析技术,词向量表示,依存句法分析,DNN语言模型,语义解析技术,意图成分识别, 情感 分析,对话情绪识别,文本相似度检测,文本解析和抽取技术,智能信息抽取,阅读理解,智能标签,NLG,自动摘要,自动写文章,语言处理基础技术,文本审核, 情感 分析,机器翻译,智能聊天,自然语言,基于标题的视频标签,台词看点识别,意图识别,词法分析,相关词,舆情分析,流量预测,标签技术,自然语言处理,语义对话,自然语言处理,车型信息提取,关键词提取,语义理解,语义相似度,意图解析,中文词向量,表示依存,句法分析,上下文理解,词法分析,意图分析,情绪计算,视觉 情感 ,语音 情感 , 情感 分析,沉浸式阅读器,语言理解,文本分析,自然语言处理,在线语音识别,自然语言理解火速上线中, 情感 判别,语义角色标注,依存句法分析,词性标注,实体识别,中文分词,分词,
6、知识图谱
知识图谱,药学知识图谱,智能分诊,腾讯知识图谱,无,药学知识图谱,智能分诊,知识理解,知识图谱Schema,图数据库BGraph,知识图谱,语言与知识,语言处理基础技术,语言处理应用技术,知识理解,文本审核,智能对话定制平台,智能文档分析平台,智能创作平台,知识图谱,实体链接,意图图谱,识别实体,逻辑推理,知识挖掘,知识卡片
7、对话问答机器人
智能问答机器人,智能语音助手,智能对话质检,智能话务机器人,无,电话机器人,NeuHub助力京东智能客服升级,腾讯云小微,智能硬件AI语音助手,对话机器人,无,问答系统对话系统智能客服,Replika对话技术,客服机器人,智能问答,智能场景,个性化回复,多轮交互,情绪识别,智能客服,金融虚拟客服,电话质检,AI语音交互机器人,中移云客服·智能AI外呼,人机对话精准语义分析
8、翻译
协同翻译工具平台,电商内容多语言工具,文档翻译,专业版翻译引擎,通用版翻译引擎,无,机器翻译,无,机器翻译,音视频字幕平台,机器翻译,机器翻译niutrans,文本翻译,语音翻译,拍照翻译,机器翻译,机器翻译,文本翻译,语音翻译,通用翻译,自然语言翻译服务,文本翻译,图片翻译,语音翻译,实时语音翻译,文档翻译(开发版,机器翻译,文本翻译,语音翻译,拍照翻译,机器翻译实时长语音转写,录音文件长语音转写,翻译工具,机器翻译火速上线中
9、声音
便携智能语音一体机,语音合成声音定制,语音合成,一句话识别,实时语音识别录音文件识别,客服电话,语音录入,语音指令,语音对话,语音识别,科学研究,安防监控,声音分类,语音合成,语音识别,实时语音转写,定制语音合成,定制语音识别,语音合成,语音合成声音定制,离线语音合成,短语音识别,录音文件识别,声纹识别,离线语音识别,实时语音识别,呼叫中心短语音识别,呼叫中心录音文件识别,呼叫中心实时语音识别,语音识别,语音合成,声纹识别,语音识别,语音听写,语音转写,实时语音转写,语音唤醒,离线命令词识别,离线语音听写,语音合成,在线语音合成,离线语音合成,语音分析,语音评测,性别年龄识别,声纹识别,歌曲识别,.客服平台能力中间件,语音识别,语音交互技术,语音合成,语音合成声音定制,离线语音合成,短语音识别,录音文件识别,声纹识别,离线语音识别,实时语音识别,呼叫中心短语音识别,呼叫中心录音文件识别,呼叫中心实时语音识别,远场语音识别,语音识别,一句话识别,实时语音识别,录音文件识别,语音合成,实时语音识别,长语音识别,语音识别,语音合成,波束形成,声源定位,去混响,降噪,回声消除,分布式拾音,语音识别,语音唤醒,语音合成,声纹识别,智能语音服务,语音合成,短语音识别,实时语音识别,语音理解与交互,离线唤醒词识别,语音识别,一句话识别,实时语音识别,录音文件识别,电话语音识别,语音唤醒,离线语音识别,离线命令词识别,远场语音识别,语音合成,通用语音合成,个性化语音合成,语音技术,短语音识别,实时语音识别,音频文件转写,在线语音合成,离线语音合成,语音自训练平台,语音交互,语音合成,语音识别,一句话识别,实时短语音识别,语音合成,语音唤醒,本地语音合成,语音翻译,语音转文本,短语音听写,长语音转写,实时语音转写,语音内容审核,会议超极本,语音交互技术,语音识别,语义理解,语音合成,音频转写,音视频类产品,语音通知/验证码,订单小号,拨打验证,点击拨号,数据语音,统一认证,语音会议,企业视频彩铃,语音识别,语音文件转录,实时语音识别,一句话语音识别,语音合成,通用语音合成,个性化语音合成,语音评测,通用语音评测,中英文造句评测,在线语音识别,语音识别,语音唤醒,语音合成,语音合成,语音识别,语音听写,语音转写,短语音转写(同步),语音识别,语音 情感 识别
十、数据挖掘AI硬件
算法类型:包括二分类、多分类和回归,精准营销,表格数据预测,销量预测,交通流量预测,时序预测,大数据,无,机器学习使用手册,机器学习API文档,大数据处理,大数据传输,数据工厂,大数据分析,数据仓库,数据采集与标注,数据采集服务,数据标注服务,AI开发平台,全功能AI开发平台BML,零门槛AI开发平台EasyDL,AI硬件与平台,GPU云服务器,机器人平台,度目视频分析盒子,度目AI镜头模组,度目人脸应用套件,度目人脸抓拍机,人脸识别摄像机,昆仑AI加速卡,智能预测,购车指数,数据科学虚拟机,平台效率,云与AI,抗DDoS,天盾,网站漏洞扫描,网页防篡改,入侵检测防护,弹性云服务器,对象存储服务,云专线(CDA,AI计算机平台—360net深度学习基础模型,AI算法训练适配主流AI框架
十一、其他
内容审核,智能鉴黄,特定人物识别,通用图片审核,文本智能审核,广告检测,Logo检测,商品理解,拍照购,商品图片搜索,通用商品识别,疫情物资识别,酒标识别,细分市场划分,品牌竞争力分析,老品升级,新品定制,商品竞争力分析,商品销量预测,商品营销,用户评论占比预测,商品命名实体识别,商品颜色识别,强化学习,智能地图引擎,内容审核,智能鉴黄,特定人物识别,通用图片审核,文本智能审核,广告检测,Logo检测商品理解,拍照购,商品图片搜索,通用商品识别,疫情物资识别,酒标识别,细分市场划分,品牌竞争力分析,老品升级,新品定制,商品竞争力分析,商品销量预测,商品营销,用户评论占比预测,商品命名实体识别,商品颜色识别,个性化与推荐系统,推荐系统,舆情分析,舆情标签,智慧教育,智能语音评测,拍照搜题,题目识别切分,整页拍搜批改,作文批改,学业大数据平台,文档校审系统,会议同传系统,文档翻译系统,视频翻译系统,教育学习,口语评测,朗读听书,增强现实,3D肢体关键点SDK,美颜滤镜SDK,短视频SDK,基础服务,私有云部署,多模态交互,多模态 情感 分析,多模态意图解析,多模态融合,多模态语义,内容审查器,Microsoft基因组学,医学人工智能开放平台,数据查验接口,身份验证(公安简项),银行卡验证,发票查验,设备接入服务Web/H5直播消息设备托管异常巡检电话提醒,音视频,视频监控服务云广播服务云存储云录制,司乘体验,智能地图引擎,消息类产品,视频短信,短信通知/验证码,企业挂机彩信,来去电身份提示,企业固话彩印,模板闪信,异网短信,内容生产,试卷拆录解决方案,教学管理,教学质量评估解决方案,教学异常行为监测,授课质量分析解决方案,路况识别,人车检测,视觉SLAM,高精地图,免费SDK,智能诊后随访管理,用药管家,智能预问诊,智能导诊,智能自诊,智能问药,智能问答,裁判文书近义词计算,法条推荐,案由预测,
这个很难办到,不过可以通过判断关键点的特点进行判断,但是准确率不高前言很多人都认为人脸识别是一项非常难以实现的工作,看到名字就害怕,然后心怀忐忑到网上一搜,看到网上N页的教程立马就放弃了。这些人里包括曾经的我自己。其实如果如果你不是非要深究其中的原理,只是要实现这一工作的话,人脸识别也没那么难。今天我们就来看看如何在40行代码以内简单地实现人脸识别。一点区分对于大部分人来说,区分人脸检测和人脸识别完全不是问题。但是网上有很多教程有无无意地把人脸检测说成是人脸识别,误导群众,造成一些人认为二者是相同的。其实,人脸检测解决的问题是确定一张图上有木有人脸,而人脸识别解决的问题是这个脸是谁的。可以说人脸检测是是人识别的前期工作。今天我们要做的是人脸识别。所用工具Anaconda 2——Python 2Dlibscikit-imageDlib对于今天要用到的主要工具,还是有必要多说几句的。Dlib是基于现代C++的一个跨平台通用的框架,作者非常勤奋,一直在保持更新。Dlib内容涵盖机器学习、图像处理、数值算法、数据压缩等等,涉猎甚广。更重要的是,Dlib的文档非常完善,例子非常丰富。就像很多库一样,Dlib也提供了Python的接口,安装非常简单,用pip只需要一句即可:pip install dlib上面需要用到的scikit-image同样只是需要这么一句:pip install scikit-image注:如果用pip install dlib安装失败的话,那安装起来就比较麻烦了。错误提示很详细,按照错误提示一步步走就行了。人脸识别之所以用Dlib来实现人脸识别,是因为它已经替我们做好了绝大部分的工作,我们只需要去调用就行了。Dlib里面有人脸检测器,有训练好的人脸关键点检测器,也有训练好的人脸识别模型。今天我们主要目的是实现,而不是深究原理。感兴趣的同学可以到官网查看源码以及实现的参考文献。今天的例子既然代码不超过40行,其实是没啥难度的。有难度的东西都在源码和论文里。首先先通过文件树看一下今天需要用到的东西:准备了六个候选人的图片放在candidate-faces文件夹中,然后需要识别的人脸图片。我们的工作就是要检测到中的人脸,然后判断她到底是候选人中的谁。另外的是我们的python脚本。是已经训练好的人脸关键点检测器。是训练好的ResNet人脸识别模型。ResNet是何凯明在微软的时候提出的深度残差网络,获得了 ImageNet 2015 冠军,通过让网络对残差进行学习,在深度和精度上做到了比 CNN 更加强大。1. 前期准备和都可以在这里找到。然后准备几个人的人脸图片作为候选人脸,最好是正脸。放到candidate-faces文件夹中。本文这里准备的是六张图片,如下:她们分别是然后准备四张需要识别的人脸图像,其实一张就够了,这里只是要看看不同的情况:可以看到前两张和候选文件中的本人看起来还是差别不小的,第三张是候选人中的原图,第四张图片微微侧脸,而且右侧有阴影。2.识别流程数据准备完毕,接下来就是代码了。识别的大致流程是这样的:3.代码代码不做过多解释,因为已经注释的非常完善了。以下是 -*- coding: UTF-8 -*-import sys,os,dlib,glob,numpyfrom skimage import ioif len() != 5:print "请检查参数是否正确"exit()# 1.人脸关键点检测器predictor_path = [1]# 2.人脸识别模型face_rec_model_path = [2]# 3.候选人脸文件夹faces_folder_path = [3]# 4.需识别的人脸img_path = [4]# 1.加载正脸检测器detector = ()# 2.加载人脸关键点检测器sp = (predictor_path)# 3. 加载人脸识别模型facerec = (face_rec_model_path)# win = ()# 候选人脸描述子listdescriptors = []# 对文件夹下的每一个人脸进行:# 1.人脸检测# 2.关键点检测# 3.描述子提取for f in ((faces_folder_path, "*.jpg")):print("Processing file: {}".format(f))img = (f)#()#(img)# 1.人脸检测dets = detector(img, 1)print("Number of faces detected: {}".format(len(dets)))for k, d in enumerate(dets):# 2.关键点检测shape = sp(img, d)# 画出人脸区域和和关键点# ()# (d)# (shape)# 3.描述子提取,128D向量face_descriptor = (img, shape)# 转换为numpy arrayv = (face_descriptor)(v)# 对需识别人脸进行同样处理# 提取描述子,不再注释img = (img_path)dets = detector(img, 1)dist = []for k, d in enumerate(dets):shape = sp(img, d)face_descriptor = (img, shape)d_test = (face_descriptor)# 计算欧式距离for i in descriptors:dist_ = (i-d_test)(dist_)# 候选人名单candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei']# 候选人和距离组成一个dictc_d = dict(zip(candidate,dist))cd_sorted = sorted((), key=lambda d:d[1])print "\n The person is: ",cd_sorted[0][0] ()4.运行结果我们在.py所在的文件夹下打开命令行,运行如下命令python ./candidate-faecs 由于和名字实在太长,所以我把它们重命名为和。运行结果如下:The person is Bingbing。记忆力不好的同学可以翻上去看看是谁的图片。有兴趣的话可以把四张测试图片都运行下试试。这里需要说明的是,前三张图输出结果都是非常理想的。但是第四张测试图片的输出结果是候选人4。对比一下两张图片可以很容易发现混淆的原因。机器毕竟不是人,机器的智能还需要人来提升。有兴趣的同学可以继续深入研究如何提升识别的准确率。比如每个人的候选图片用多张,然后对比和每个人距离的平均值之类的。全凭自己了。
最近一直了解人脸检测的算法,所以也尝试学多人脸检测框架。所以这里将拿出来和大家分享一下 Retinaface 与普通的目标检测算法类似,在图片上预先设定好一些先验框,这些先验框会分布在整个图片上,网络内部结构会对这些先验框进行判断看是否包含人脸,同时也会调整位置进行调整并且给每一个先验框的一个置信度。 在 Retinaface 的先验框不但要获得人脸位置,还需要获得每一个人脸的五个关键点位置 接下来我们对 Retinaface 执行过程其实就是在图片上预先设定好先验框,网络的预测结果会判断先验框内部是否包含人脸并且对先验框进行调整获得预测框和五个人脸关键点。 MobileNet 网络是由 google 团队在 2017 年提出的,专注移动端和嵌入式设备中轻量级 CNN 网络,在大大减少模型参数与运算量下,对于精度只是小幅度下降而已。 在主干网络输出的相当输出了不同大小网格,用于检测不同大小目标,先验框默认数量为 2,这些先验框用于检测目标,然后通过调整得到目标边界框。 深度可分离卷积好处就是可以减少参数数量,从而降低运算的成本。经常出现在一些轻量级的网络结构(这些网络结构适合于移动设备或者嵌入式设备),深度可分离卷积是由DW(depthwise)和PW(pointwise)组成 这里我们通过对比普通卷积神经网络来解释,深度可分离卷积是如何减少参数 我们先看图中 DW 部分,在这一个部分每一个卷积核通道数 1 ,每一个卷积核对应一个输入通道进行计算,那么可想而知输出通道数就与卷积核个数以及输入通道数量保持一致。 简单总结一下有以下两点 PW 卷积核核之前普通卷积核类似,只不过 PW 卷积核大小为 1 ,卷积核深度与输入通道数相同,而卷积核个数核输出通道数相同 普通卷积 深度可分离卷积
姓名:张钰 学号:21011210154 学院:通信工程学院 【嵌牛导读】Frequency-aware Discriminative Feature Learning Supervised by Single-Center Loss for Face Forgery Detection论文阅读笔记 【嵌牛鼻子】Deepfake人脸检测方法,基于单中心损失监督的频率感知鉴别特征学习框架FDFL,将度量学习和自适应频率特征学习应用于人脸伪造检测,实现SOTA性能 【嵌牛提问】本文对于伪造人脸检测的优势在哪里体现 【嵌牛正文】 转自:
Theysolvetheproblemsforpeoplewithlaw
facial recognition technology
人脸识别英文recognition。
双语例句:
1.“一个终极的人脸识别算法应该可以识别数据集中数以十亿计的人,”研究人员写道。
"An ultimate face recognition algorithm should perform with billions of people in a dataset," the researchers wrote.
2.基于Interest算子的人脸识别方法同时是一种基于像素变化信息的人脸识别方法。
Face recognition based on interest operator is also a face recognition method based on pixel-variation-information.
3.问题在于,进行人脸识别时机器也是有局限性的。
The thing is, machines still have limitations when it comes to facial recognition.
4.“巨型面”的创建者说,它是目前最大的公共人脸识别数据集了。
MegaFace's creators say it's the largest publicly available facial-recognition dataset out there.
5.这个技能支撑着二十一世纪人脸识别软件的巨大前景。
This skill is what supports the enormous promise of facial-recognition software in the 2lst century.
他们用法律为人们解决问题Theysolveproblemsforpeoplebylaw
很多人都认为人脸识别是一项非常难以实现的工作,看到名字就害怕,然后心怀忐忑到网上一搜,看到网上N页的教程立马就放弃了。这些人里包括曾经的我自己。其实如果如果你不是非要深究其中的原理,只是要实现这一工作的话,人脸识别也没那么难。今天我们就来看看如何在40行代码以内简单地实现人脸识别。一点区分对于大部分人来说,区分人脸检测和人脸识别完全不是问题。但是网上有很多教程有无无意地把人脸检测说成是人脸识别,误导群众,造成一些人认为二者是相同的。其实,人脸检测解决的问题是确定一张图上有木有人脸,而人脸识别解决的问题是这个脸是谁的。可以说人脸检测是是人识别的前期工作。今天我们要做的是人脸识别。所用工具Anaconda 2——Python 2Dlibscikit-imageDlib对于今天要用到的主要工具,还是有必要多说几句的。Dlib是基于现代C++的一个跨平台通用的框架,作者非常勤奋,一直在保持更新。Dlib内容涵盖机器学习、图像处理、数值算法、数据压缩等等,涉猎甚广。更重要的是,Dlib的文档非常完善,例子非常丰富。就像很多库一样,Dlib也提供了Python的接口,安装非常简单,用pip只需要一句即可:pip install dlib上面需要用到的scikit-image同样只是需要这么一句:pip install scikit-image注:如果用pip install dlib安装失败的话,那安装起来就比较麻烦了。错误提示很详细,按照错误提示一步步走就行了。人脸识别之所以用Dlib来实现人脸识别,是因为它已经替我们做好了绝大部分的工作,我们只需要去调用就行了。Dlib里面有人脸检测器,有训练好的人脸关键点检测器,也有训练好的人脸识别模型。今天我们主要目的是实现,而不是深究原理。感兴趣的同学可以到官网查看源码以及实现的参考文献。今天的例子既然代码不超过40行,其实是没啥难度的。有难度的东西都在源码和论文里。首先先通过文件树看一下今天需要用到的东西:准备了六个候选人的图片放在candidate-faces文件夹中,然后需要识别的人脸图片。我们的工作就是要检测到中的人脸,然后判断她到底是候选人中的谁。另外的是我们的python脚本。shape_predi
Python打造停车场 全部数据代码下载 | 第11-12章notebook课件.txt | 第16-17章notebook课件.txt | 第2-7章notebook课件.txt | 第八章notebook课件.txt | 第二十一章:项目实战-疲劳检测.txt | 第二十章:卷积原理与操作.txt | 第九章:项目实战-信用卡数字识别.txt | 第十八章:Opencv的DNN模块.txt | 第十九章:项目实战-目标追踪.txt | 第十三章:案例实战-全景图像拼接.txt | 第十四章:项目实战-停车场车位识别.txt | 第十五章:项目实战-答题卡识别判卷.txt | 第十章:项目实战-文档扫描OCR识别.txt 1-1 课程简介.mp4 1-2 Python与Opencv的配置.mp4 1-3 Notebook与IDE环境配置.mp4 10-1 整体流程演示.mp4 10-2 文档轮廓提取.mp4 10-3 坐标变换计算.mp4 10-4 透视变换结果.mp4 10-5 tesseract-ocr安装配置.mp4 10-6 文档扫描识别结果.mp4 11-1 角点检测基本原理.mp4 11-2 基本数学原理.mp4 11-3 求解化简.mp4 11-4 特征归属划分.mp4 11-5 opencv角点检测.mp4 12-1 尺度空间定义.mp4 12-2 高斯差分金字塔.mp4 12-3 特征关键点定位.mp4 12-4 生成特征描述.mp4 12-5 特征向量生成.mp4 12-6 opencv中的sift函数.mp4 13-1 特征匹配方法.mp4 13-2 RANSAC算法.mp4 13-3 图像拼接方法.mp4 13-4 流程解读.mp4 14-1 任务整体流程.mp4 14-2 所需数据介绍.mp4 14-3 图像数据预处理.mp4 14-4 车位直线检测.mp4 14-5 按列划分区域.mp4 14-6 车位区域划分.mp4 14-7 识别模型构建.mp4 14-8 基于视频的车位检测.mp4 15-1 整体流程与效果概述.mp4 15-2 预处理操作.mp4 15-3 填涂轮廓检测.mp4 15-4 选项判断识别.mp4 16-1 背景消除-帧差法.mp4 16-2 混合高斯模型.mp4 16-3 学习步骤.mp4 16-4 背景建模实战.mp4 17-1 基本概念.mp4 17-2 Lucas-Kanade算法.mp4 17-3 推导求解.mp4 17-4 光流估计实战.mp4 18-1 DNN模块.mp4 18-2 模型加载与输出结果.mp4 19-1 目标追踪概述.mp4 19-2 多目标追踪实战.mp4 19-3 深度学习检测框架加载.mp4 19-4 基于dlib和ssd的追踪.mp4 19-5 多进程目标追踪.mp4 19-6 效率提升对比.mp4 2-1 计算机眼中的图像.mp4 2-2 视频的读取与处理.mp4 2-3 ROI区域.mp4 2-4 边界填充.mp4 2-5 数值计算.mp4 20-1 卷积网络的应用.mp4 20-2 卷积层解释.mp4 20-3 卷积计算过程.mp4 20-4 padding与 20-5 卷积参数共享.mp4 20-6 池化层原理.mp4 20-7 卷积效果演示.mp4 20-8 卷积操作流程.mp4 21-1 关键点定位概述.mp4 21-2 获取人脸关键点.mp4 21-3 定位效果演示.mp4 21-4 闭眼检测.mp4 21-5 检测效果.mp4 3-1 图像阈值.mp4 3-2 图像平滑处理.mp4 3-3 高斯与中值滤波.mp4 4-1 腐蚀操作.mp4 4-2 膨胀操作.mp4 4-3 开运算与闭运算.mp4 4-4 梯度计算.mp4 4-5 礼帽与黑帽.mp4 5-1 Sobel算子.mp4 5-2 梯度计算方法.mp4 5-3 scharr与Laplace算子.mp4 6-1 Canny边缘检测流程.mp4 6-2 非极大值抑制.mp4 6-3 边缘检测效果.mp4 7-1 图像金字塔定义.mp4 7-2 金字塔制作方法.mp4 7-3 轮廓检测方法.mp4 7-4 轮廓检测结果.mp4 7-5 轮廓特征与近似.mp4 7-6 模板匹配方法.mp4 7-7 匹配效果展示.mp4 8-1 直方图定义.mp4 8-2 均衡化原理.mp4 8-3 均衡化效果.mp4 8-4 傅里叶概述.mp4 8-5 频域变换结果.mp4 8-6 低通与高通滤波.mp4 9-1 总体流程与方法讲解.mp4 9-2 环境配置与预处理.mp4 9-3 模板处理方法.mp4 9-4 输入数据处理方法.mp4 9-5 模板匹配得出识别结果.mp4 第11-12章notebook课件.zip 第16-17章notebook课件.zip 第2-7章notebook课件.zip 第八章notebook课件.zip 第二十一章:人脸关键点定位.zip 第二十一章:项目实战-疲劳检测.zip 第二十章:卷积原理与操作.zip 第九章:项目实战-信用卡数字识别.zip 第十八章:Opencv的DNN模块.zip 第十九章:项目实战-目标追踪.zip 第十三章:案例实战-全景图像拼接.zip 第十四章:项目实战-停车场车位识别.zip 第十五章:项目实战-答题卡识别判卷.zip 第十章:项目实战-文档扫描OCR识别.zip 全部数据代码下载.zip
现在的人脸识别技术已经得到了非常广泛的应用,支付领域、身份验证、美颜相机里都有它的应用。用iPhone的同学们应该对下面的功能比较熟悉iPhone的照片中有一个“人物”的功能,能够将照片里的人脸识别出来并分类,背后的原理也是人脸识别技术。这篇文章主要介绍怎样用Python实现人脸检测。人脸检测是人脸识别的基础。人脸检测的目的是识别出照片里的人脸并定位面部特征点,人脸识别是在人脸检测的基础上进一步告诉你这个人是谁。好了,介绍就到这里。接下来,开始准备我们的环境。准备工作本文的人脸检测基于dlib,dlib依赖Boost和cmake,所以首先需要安装这些包,以Ubuntu为例:$ sudo apt-get install build-essential cmake$ sudo apt-get install libgtk-3-dev$ sudo apt-get install libboost-all-dev我们的程序中还用到numpy,opencv,所以也需要安装这些库:$ pip install numpy$ pip install scipy$ pip install opencv-python$ pip install dlib人脸检测基于事先训练好的模型数据,从这里可以下到模型数据下载到本地路径后解压,记下解压后的文件路径,程序中会用到。dlib的人脸特征点上面下载的模型数据是用来估计人脸上68个特征点(x, y)的坐标位置,这68个坐标点的位置如下图所示:我们的程序将包含两个步骤:第一步,在照片中检测人脸的区域第二部,在检测到的人脸区域中,进一步检测器官(眼睛、鼻子、嘴巴、下巴、眉毛)人脸检测代码我们先来定义几个工具函数:def rect_to_bb(rect): x = () y = () w = () - x h = () - y return (x, y, w, h)这个函数里的rect是dlib脸部区域检测的输出。这里将rect转换成一个序列,序列的内容是矩形区域的边界信息。def shape_to_np(shape, dtype="int"): coords = ((68, 2), dtype=dtype) for i in range(0, 68): coords[i] = ((i).x, (i).y) return coords这个函数里的shape是dlib脸部特征检测的输出,一个shape里包含了前面说到的脸部特征的68个点。这个函数将shape转换成Numpy array,为方便后续处理。def resize(image, width=1200): r = width * / [1] dim = (width, int([0] * r)) resized = (image, dim, interpolation=) return resized这个函数里的image就是我们要检测的图片。在人脸检测程序的最后,我们会显示检测的结果图片来验证,这里做resize是为了避免图片过大,超出屏幕范围。接下来,开始我们的主程序部分import sysimport numpy as npimport dlibimport cv2if len() < 2: print "Usage: %s
虹软上就有免费的安卓版本的活体检测SDK啊,也有demo的,而且他们家及以上已内置活体的
强推你下载虹软的人脸识别SDK 免费的哦 他们提供的SDK本身是离线的 支持离线或在线运行 可实现局域网、互联网等多种网络需求 并可根据场景需求 将应用部署在公有云上 或者搭建私有云 保障数据隐私性以及安全性
可以在云脉的SDK开发者平台下一个人脸识别活体检测的SDK,好像只要注册登录就能下载试用了。云脉的活体检测是配合张嘴、闭眼、点头、摇头等各种动作来完成的,准确率高,识别速度快,还不错的。
以往的技术要求用户张嘴、点头,如果用户在公开场所对着手机做这些动作,感觉有些傻(真的有点尴尬不你)。像以前实名认证手机号的时候,也是这样:张张嘴、点点头、头向左、头向右….对着手机是不是有点逗比了,有一些还加了语音认证,就是给你一串数字让你念出来。而为了提高人脸识别体验感、减少依靠使用者动作配合,有不少企业正在研究一种能让用户在面对检测时不做任何动作,不去配合,也能检测面前是个活人,目前关注静默活体检测的就有商汤科技、世纪晟科技等知名科技公司。静默活体检测技术的需求与主要应用场景 一、来自以往活体检测技术的尴尬 随机动作人脸活体检测有着很高的安全性,但是按照指示让用户去做动作比较死板,对用户来说体验不是最好的。同时,不少科技公司,如世纪晟科技等,考虑到整个活检过程需用户高度配合,存在推广困难、检测时间长的问题,尤其是在针对老年人用户使用的场景下该问题更为棘手二、主要应用场景 活体检测是人脸识别中最重要的一环,是确保真人检测、防止面具攻击、视频攻击、照片攻击最重要的检测环节。实际生活中,活体检测的主要应用场景可以是门禁签到、商务签到、家庭门锁、进出授权管理、银行开户、备案登记等。静默活体检测技术解读 一、技术简介 静默活体检测,顾名思义,就是在没有眨眼、张嘴、数数等一系列的动作配合下来判断到底是不是一个真活人,恰恰与动态活体验证相反,静默活体验证不仅技术上实现难度更高,在实际应用中对准确性要求也更高。二、技术原理 以面部特征作为身份核对依据,通过动态核对面部轮廓方式准确识别用户。真实的人脸和照片相比,即使不刻意做动作,也会有微表情存在的,比如眼皮、眼球的律动眨眼、嘴唇以及周边面颊的伸缩等,静默活体检测技术正是利用了这些特征。三、技术要点 (1)人脸框的提取 Adaboost人脸检测算法是一种用来分类的方法,它能把一些比较弱的分类方法合在一起,组合出新的很强的分类方法。 近年来,为更好地区分不同模式,出现了一些新的特征定义,使其便于特征提取拓展了特征库,而采用AdaBoost算法从弱特征中选取分类能力强的特征组成强分类器的方法来设计层次型分类器,可以很好地解决直立正面人脸检测问题 (2)活体判断——基于传统特征 step1:人脸的特征提取与编码 step2:SVM分类——SVM的简介 支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题,用于进行人脸识别,2009年至2012年,稀疏表达(Sparse Representation)因为其优美的理论和对遮挡因素的鲁棒性成为当时的研究热点。——SVM的优点: [if !supportLists]A、 [endif]不需要很多样本,不需要有很多样本并不意味着训练样本的绝对量很少,而是说相对于其他训练分类算法比起来,同样的问题复杂度下,SVM需求的样本相对是较少的。并且由于SVM引入了核函数,所以对于高维的样本,SVM也能轻松应对。 结构风险最小。这种风险是指分类器对问题真实模型的逼近与问题真实解之间的累积误差。 非线性,是指SVM擅长应付样本数据线性不可分的情况,主要通过松弛变量(也叫惩罚变量)和核函数技术来实现,这一部分也正是SVM的精髓所在。静默活体检测技术优势明显 · 用户免去动作配合 · 活动检测时间减少一半以上 · 私密性保护好 · 用户体验更佳