计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (8): 1609-1618.doi: 10.7544/issn1000-1239.2018.20180181
所属专题: 2018数据挖掘前沿进展专题
谢娟英1,侯琦1,史颖欢2,吕鹏3,景丽萍4,庄福振5,张军平6,谭晓阳7,许升全8
Xie Juanying1, Hou Qi1, Shi Yinghuan2, Lü Peng3, Jing Liping4, Zhuang Fuzhen5, Zhang Junping6, Tan Xiaoyang7,Xu Shengquan8
摘要: 针对现有蝴蝶识别研究中所用数据集蝴蝶种类偏少,且只含有蝴蝶标本照片、不含生态环境中蝴蝶照片的问题,发布了一个同时包含标本照片和生态照片的蝴蝶图像数据集,其中标本照片包含全部中国蝶类志蝴蝶种类,共计4270张照片、1176种,蝴蝶生态环境下照片1425张、111种.提出基于深度学习技术Faster R-CNN的蝴蝶种类自动识别系统,包括生态照片中蝴蝶位置的自动检测和物种鉴定.实验去除只含有单张生态照片的蝴蝶种类,对剩余的蝴蝶生态照片进行5-5划分,构造2种不同训练数据集:一半生态照片+全部模式照片、一半生态照片+对应种类模式照片;训练3种不同网络结构的蝴蝶自动识别系统,以平均精度均值(mean average precision, mAP)为评价指标,采用上下、左右翻转、不同角度旋转、加噪、不同程度模糊、对比度升降等9种方式扩充训练集.实验结果表明,基于Faster R-CNN深度学习框架的蝴蝶自动识别系统对生态环境中的蝴蝶照片能实现其中蝴蝶位置的自动检测和物种识别,模型的mAP最低值接近60%,并能同时检测出生态照中的多只蝴蝶和完成物种识别.
中图分类号: