数据增广下的人脸识别研究

黄法秀;张世杰;吴志红;陈虎;孙家炜;, 计算机技术与发展 发表时间:2019-12-05 13:06 期刊

...发性等优势应用越来越广泛,大规模数据是提高基于深度学习人脸识别准确率的关键因素,但往往数据不易获得,并且存在训练数据缺乏测试数据样本情况,如模糊、亮度失真和腐蚀感画质样本等。针对训练数据缺乏问题,提出了利用滤波、亮度调节和腐蚀操作3种传统图像处理方法 10种增广方式增加数据量和数据的多样性,进而来提高识别算法性能。将原始数据和增广数据作为训练数据训练模型,选择了从不同地方拍摄的视频上截取的人脸图像组成了四个测试集,实验结果表明,增广数据与测试集样本存在一致性时,增广方式对提...


面向实时应用的深度学习研究综述

张政馗;庞为光;谢文静;吕鸣松;王义;, 软件学报 发表时间:2019-12-05 14:55 期刊

深度学习算法和GPU算力的不断进步正促进着人工智能技术在包括计算机视觉、语音识别、自然语言处理等领域得到广泛应用.与此同时,深度学习已经开始应用于以自动驾驶为代表的安全攸关领域.但是,近两年接连发生了几起严重的交通事故表明深度学习技术的成熟度还远未达到安全攸关应用的要求,因此对可信人工智能系统的研究已经成为了一个热点方向.本文对现有的面向实时应用的深度学习领域的研究工作进行了综述,首先介绍了深度学习技术应用于实时嵌入式系统所面临的关键设计问题,然后从深层神经网络的轻量化设计...


基于轻量级卷积神经网络的烟雾识别算法

袁飞;赵绪言;王一戈;赵治晟;, 西南交通大学学报 发表时间:2019-12-05 15:28 期刊

...效特征,导致算法识别误报率和漏报率较高;此外,深度卷积神经网络结构复杂,参数繁多,难以缩短其计算时间至1毫秒内,这成为实时火灾预警的一大难题。为了解决上述问题,提出了一种基于四种Inception结构的轻量级卷积神经网络SInception,其显著地减少了网络的参数量和计算量,在此基础上加入SE Block用于对烟雾特征进行重新分配,使其针对烟雾图像具有更强的表征能力,同时,为了避免由于训练样本不足引起的过拟合,原始数据集上采用数据增强技术以及生成对抗网络生成更多训练样本,...


基于视觉注意力分析的三维内容生成方法

蔡凯; 李新福; 田学东, 计算机工程 发表时间:2019-12-06 11:04 期刊

由于在某些特殊场景中获取深度线索(depth cue)的难度较高,使得目前的3D内容生成算法还需面临诸多挑战。为了克服这一难题,提出使用显著图(saliency map)代替深度图进行2D-3D转换。此次所提方法使用流行的全卷积网络(fully convolutional network,简称FCN)生成粗糙的显著图,并通过条件随机场(conditional random field,简称CRF)对结果进行优化。实验结果证明深度学习方法比此前的方法表现更好,可以解决现有方法...


基于多尺度卷积网络的快速图像去雾算法

寇大磊; 钱敏; 权冀川; 刘佳洛; 张仲伟, 计算机工程与应用 发表时间:2019-12-07 08:54 期刊

针对目前图像去雾技术存在的使用场景有限、处理速度慢等问题,提出一种基于多尺度卷积网络的快速去雾算法。算法由去雾和修复两部分组成。去雾模块首先将有雾图像输入,经过特征提取和融合,然后通过变形后的大气物理散射算法对透射率图和大气光值统一学习,并演出去雾图像。去雾后的图像仍存在色调偏暗、细节不清晰的问题。修复模块利用对比度受限自适应直方图均衡方法对去雾图像进行修复,提升图像的对比度和算法的鲁棒性。通过去雾任务与目标检测任务相结合的测试实验进一步验证了算法的有效性。...


基于深度学习的目标检测综述

卢健;何金鑫;李哲;周嫣然;, 电光与控制 发表时间:2019-12-07 09:48 期刊

基于深度学习技术的目标检测是通过人工神经网络提取和学习目标多层次特征,并送入分类器中预测目标的类别与位置。根据模型训练方式可分为两种类型:单阶段检测算法和二阶段检测算法。本文对各阶段类型代表性算法进行了详细的介绍,并在PASCAL VOC数据集上进行了比较和分析。最后,对发展趋势进行了展望。...


唇读研究进展与展望

盛常冲; 陈小鼎; 匡纲要; 刘丽, 自动化学报 发表时间:2019-12-09 10:23 期刊

...机视觉和模式识别领域的一个重要问题,在公共安防、医疗、国防军事和影视娱乐等领域有着广泛的应用价值.近年来,深度学习技术极大地推动了唇读研究进展.本文首先阐述了唇读研究的内容和意义,并深入剖析了唇读研究面临的难点与挑战;然后介绍了目前唇读研究的现状与发展水平,对近期主流唇读方法进行了梳理、归类和评述,包括传统方法和近期的基于深度学习的方法;最后,探讨唇读研究潜在的问题和可能的研究方向.以期引起大家对唇读问题的关注与兴趣,并推动与此相关问题的研究进展....


BiLSTM在跨站脚本检测中的应用研究

程琪芩; 万良, 计算机科学与探索 发表时间:2019-12-09 10:46 期刊

目前传统的跨站脚本检测技术大多使用机器学习方法,存在代码被恶意混淆导致可读性不高、特征提取不充分并且效率低等缺陷,从而导致检测性能不佳。针对上述问题,提出了使用双向长短时记忆网络检测跨站脚本攻击的方法。首先,对数据进行预处理,使用解码技术将跨站脚本代码还原到未编码状态,从而提高跨站脚本代码的可读性,再使用深度学习工具word2vec将解码后的代码转换为向量作为神经网络的输入;其次,使用双向长短时记忆网络双向学习跨站脚本攻击的抽象特征;最后,使用softmax分类器对学习到的...


结合注意力机制的深度学习光流网络

周海赟; 项学智; 翟明亮; 张荣芳; 王帅, 计算机科学与探索 发表时间:2019-12-09 10:46 期刊

为提升基于编解码架构的U型网络在深度学习光流估计中的精度,提出了一种结合注意力机制的改进有监督深度光流学习网络。网络由收缩和扩张两部分组成,收缩部分利用一系列卷积层来提取图像之间的高级特征,扩张部分通过反卷积操作将特征图恢复至原始图像分辨率,将通道注意力机制引入U型网络架构中以学习通道之间的相互依赖性,自适应地调整各通道的特征权重,增强网络的特征提取能力。同时,改进的网络还使用了空洞卷积以在卷积核尺寸不变的情况下增大感受野,使用变分光流方法中的恒常约束与平滑约束以进一步利用...


AIS拼音船名到汉字的智能翻译技术研究

潘明阳;李琦;盛尊阔;韩斌;李超;李邵喜;, 大连海事大学学报 发表时间:2019-12-09 14:15 期刊

...2Seq和Transformer框架的智能船名翻译的深度学习模型. 通过在同一数据集上的性能对比分析,发现Transformer模型具有更好的效果. 为了弥补Transformer模型受语料库规模的限制而带来的翻译损失,进一步研究了其与隐马尔科夫链(HMM)的联合翻译模型,最终在测试集上达到了98.92%的准确率,实现了对AIS拼音船名的精准匹配和合理翻译. 该模型同样适用于AIS中目的港等拼音信息到汉字的翻译,对于提升AIS信息使用者的体验具有实际应用价值....


基于时空节点选择和深度学习的城市道路短时交通流预测

曹堉;王成;王鑫;高悦尔;, 计算机应用 发表时间:2019-12-09 19:21 期刊

...预测精度不高的问题,提出一种基于时空节点选择和深度学习的城市道路交通流短时预测方法。首先在理论和数据表现上对交通流特性进行分析,获得其时空特性和候选时空节点集合。其次确定车流的可到达范围,使用遗传算法进行时空节点选择。根据不同的交通流特性选择反向传播神经网络(BPNN)和长短期记忆网络(LSTM)进行预测。最后,通过新建的BPNN对两者的短时交通流预测结果进行融合。实验结果表明,所提出的模型与仅使用相邻时空节点数据、采用其他时间节点范围、使用单一BPNN、LSTM、支持向量...


基于焦点损失的半监督高光谱图像分类

张凯琳;阎庆;夏懿;章军;丁云;, 计算机应用 发表时间:2019-12-09 19:21 期刊

...框架利用有限的标记数据和丰富的未标记数据来训练深度神经网络。同时,由于高光谱样本分布是不平衡的,导致不同样本分类难度存在巨大差异,采用原始交叉熵损失函数无法刻画这种分布特征,因而分类效果不理想。为了解决这个问题,在半监督分类框架中提出了一种基于焦点损失的多分类目标函数。同时,考虑到高光谱图像的空间信息对分类的影响,结合马尔科夫随机场(MRF),利用样本空间特征进一步改善分类效果。在两个常用的高光谱图像数据集上,将提出的算法与多种典型算法进行了实验对比分析,实验结果表明本算法...


深度学习目标检测方法及主流框架综述

段仲静;李少波;胡建军;杨静;王铮;, 激光与光电子学进展 发表时间:2019-12-11 08:38 期刊

目标检测作为机器视觉中重要任务之一,是人工智能体系中一个具有重要研究价值的技术分支。对卷积神经网络框架,Anchor-Based模型和Anchor-Free模型三个主流的目标检测模型进行梳理分析。首先,综述了主流卷积神经网络框架的网络结构、优缺点以及相关的改进方法。其次,从one-stage和two-stage两个分支对Anchor-Based类模型进行深入分析,总结不同目标检测方法的研究进展;从早期探索、基于关键点和密集预测三部分分析Anchor-Free类模型。最后,


深度学习下的计算成像:现状、挑战与未来

左超;冯世杰;张翔宇;韩静;陈钱;, 光学学报 发表时间:2019-12-11 08:41 期刊

...一领域进一步发展的瓶颈问题。近年来,人工智能与深度学习技术的飞跃式发展为计算光学成像技术开启了一扇全新的大门。不同于传统计算成像方法所依赖的物理驱动,深度学习下的计算成像是一类由数据驱动的方法,它不但解决了计算成像领域许多过去被认为难以解决的难题,还在信息获取能力、成像的功能、核心性能指标(如成像空间分辨率、时间分辨率、灵敏度等)上都获得了显著提升。本文首先概括性介绍深度学习技术在计算光学成像领域的研究进展与最新成果,然后分析了当前深度学习技术在计算光学成像领域面临的主要问...


基于GPR和深度强化学习的分层人机协作控制

金哲豪; 刘安东; 俞立, 自动化学报 发表时间:2019-12-11 13:15 期刊

...ocess Regression, GPR)与深度强化学习(Deep Reinforcement Learning,DRL)的分层人机协作(Human-Robot Collaborative, HRC)控制方法,并以人机协作控制球杆系统为例检验该方法的高效性.本文的主要贡献是:1)在模型未知的情况下,采用DRL算法设计了一种有效的非线性次优控制策略,并将其作为顶层期望控制策略以引导HRC控制过程,解决了传统控制方法无法直接应用于模型未知人机协作场景的问题;2)针对HRC过程...


基于样本特征解码约束的GANs

陈泓佑; 陈帆; 和红杰; 朱翌明, 自动化学报 发表时间:2019-12-11 14:17 期刊

...图像的质量.首先利用U-Net结构的自动编码机学习出与用于激发生成器的随机向量同维度的训练样本网络中间层特征.然后在每次对抗训练前使用本文设计的解码约束条件训练解码器.其中,解码器与生成器结构相同,权重共享.为证明模型的可行性,推导给出了引入解码约束条件有利于JS散度不为常数的结论以及解码损失函数的类型选择依据.为验证模型的性能,利用CELEBA和CIFAR10数据集,对比分析了DCGANs, LSGANs, BEGANs, WGANs, WGANsGP及SAGANs的生成...


基于轻量化神经网络的目标识别跟踪算法研究

曹昭睿; 白帆; 刘凤丽; 郝永平, 弹箭与制导学报 发表时间:2019-12-12 13:17 期刊

为解决传统目标识别算法对于多尺度、可变速目标的识别性能较差与全尺寸卷积神经网络对硬件计算空间消耗较大的问题,利用轻量化的YOLO卷积神经网络对视频首帧进行目标识别,结合KCF目标跟踪算法与感知哈希算法对完成识别的目标进行跟踪与矫正。优化后的算法能够对复杂目标进行实时识别,对于目标物自身变化具有较强的自适应能力。能够为同一计算平台下的飞行控制、自主避障、目标测距等后续控制指令提供了计算空间。


融合知识图谱和协同过滤的推荐模型

康雁; 李涛; 李浩; 钟声; 张亚钏; 卜荣景, 计算机工程 发表时间:2019-12-13 14:41 期刊

...TransE算法将路径嵌入成向量,接着利用LSTM和soft attention机制捕获路径推理的语义,之后运用池化操作区分不同路径推理的重要性,最终经过全连接层和sigmoid函数获得预测评分。另一个模型根据知识图谱表示学习的语义相似性,利用协同过滤算法的思想获得预测评分。按预测评分的准确度将两个模型有效地融合,最终获得可解释的混合推荐模型。模型在MovieLens数据集上进行了实验分析。与相关代表性算法相比,实验结果具有较好的推荐解释性和更高的推荐准确率。...


基于深度学习的隐式篇章关系识别综述

胡超文; 杨亚连; 邬昌兴, 计算机科学 发表时间:2019-12-16 09:22 期刊

...句子)之间的语义关系(例如转折)。近年来,随着深度学习在自然语言处理领域的广泛应用,各种基于深度学习的隐式篇章关系识别方法取得了不错的效果,其性能全面超越了早期基于人工特征的方法。文中分三大类对最近的隐式篇章关系识别方法进行讨论:基于论元编码的方法、基于论元交互的方法和引入显式篇章数据的半监督方法。在PDTB数据集上的实验结果显示:1)通过显式地建模论元中词或文本片段之间的语义关系,基于论元交互的方法的性能明显好于基于论元编码的方法;2)引入显式篇章数据的半监督方法能有效地...


基于YOLO的自然场景倾斜文本定位方法研究

周翔宇; 高仲合, 计算机工程与应用 发表时间:2019-12-16 15:06 期刊

为了提升倾斜文本区域定位的准确度,提出了一种基于YOLO算法改进的YOLO_BOX定位模型。首先设置不同尺寸的anchor对图片进行训练,且定义LOSS损失函数训练预测模型;然后使用K-means算法对box进行聚类,并利用NMS方法进行多余候选框过滤;最后,利用Angle Correct算法对聚类后的box进行灰度化处理,通过计算像素灰度值的方差来得到文字的倾斜角度并进行角度矫正。实验表明,优化后的YOLO_BOX定位模型在ICDAR2015数据集上,对自然场景中倾斜文


相关搜索
 找到 30,764 条结果 
首页上一页8910111213141516下一页
关于iData
iData是第三方交流学术成果的公益互联网项目,旨在促进知识的传播和最新学术科技的共享,所有信息均来自公开、透明的互联网查询网站,iData重新对这些信息进行整合和优化,从而高效地输出有用信息,提高人与知识的连接效率。iData从创建之初便提供免费的学术文献浏览和下载。