穆春华;范良忠;刘鹰
【摘 要】The paper mainly researches the residual feeds and feces recognition of recirculating aquaculture systems by using the computer vision technology and the machine learning methods, which provides a theory basis for intelligent feeding system based on residual feeds concentration detection. At first, the residual feeds and impurity images were obtained by preprocessing the residual feeds video record. Then, the features were extracted by analyzing the difference between residual feeds and feces in gray level distribution and shape. The features
include:AverPixel, Peri2Area, Conv2Area, Skeletons, Contrast and IDM. Finally, we realized the recognition of residual feeds image by using the support vector machine algorithm based on 4 different kinds of kernel function and the modified decision tree algorithm. Experimental results showed the SVM based on the radial basis kernel obtained the best recognition rate. And the recognition rate of residual feeds and feces were up to 99% and 97% respectively. The recognition rate of decision tree with modified discrete way is close to the SVM’ s, and the real-time
performance is better.%利用计算机视觉技术和机器学习方法研究工业化循环水养殖的残饵与粪便的识别问题,为基于残饵浓度检测的智能投喂系统提供理论依据。首先对残饵视频进行图像预处理,分割出残饵和粪便图像;然后根据残饵和粪便在灰度分布和形状上的差异,提取平均灰度,周长平方面积比、凸壳面积比、骨架数、对比度、逆差距6个特征;再分别运用4种不同核函数的支持向量机( SVM)算法
和改进的决策树算法进行残饵图像识别。结果显示,径向基核函数的SVM算法识别效果最好,残饵和粪便识别率分别达到99%和97%以上;改进离散方式的决策树算法识别率与SVM算法的识别率接近,并且实时性更好。 【期刊名称】《渔业现代化》 【年(卷),期】2015(000)002 【总页数】5页(P33-37)
【关键词】工业化循环水养殖;计算机视觉;决策树;支持向量机;残饵识别 【作 者】穆春华;范良忠;刘鹰
【作者单位】太原科技大学电子信息工程学院,太原030024; 浙江大学宁波理工学院信息与工程学院,宁波315100;浙江大学宁波理工学院信息与工程学院,宁波315100;中国科学院海洋研究所,青岛266071 【正文语种】中 文 【中图分类】TP391.4
传统的自动投喂系统主要是依据鱼类的生长情况和养殖经验建立投喂模型,实现饵料的定时定量投喂[1-2]。由于没有考虑反馈信息,很难做到精确投喂。目前,关于自动投喂过程中养殖状况信息反馈的研究主要有鱼群行为检测和饵料浓度检测。鱼群行为检测主要通过检测鱼群活动位置[3]或摄食时发出的声音[4-5],判断鱼群摄食需求,然而,鱼群行为易受外界影响,导致判断错误。饵料浓度检测方法利用红外[6]或多普勒效应[7-8]检测残饵浓度,该方法未考虑粪便对残饵浓度检测的影响。
随着计算机视觉技术的发展,图像处理得到广泛应用[9-11]。残饵浓度可以通过对视频中残饵的计数估计出来[12],然而残饵中夹杂有一定数量的粪便,为获得残饵的精确计数,需要准确识别出图像中残饵和粪便。文章根据残饵和粪便的特征差异,分别运用支持向量机算法和决策树算法实现对残饵和粪便的识别。 1 材料与方法
试验在山东东方海洋大西洋鲑鱼循环水养殖基地开展,饲料选用汉业、爱乐、Skretting三种品牌。投喂过程中,残饵很快被水流吸入到集污器中,并且成型效果较好,因此在集污器进水口处利用采集装置(图1)获取残饵视频。视频采集装置由箱体、光源和摄像头组成,箱体四周做镂空处理,使水流无阻力通过,箱体上方适当高度固定相机,箱体底部LED提供稳定光源。
图1 残饵视频采集装置示意图Fig.1 Diagram of the residual feeds video capture device 2 残饵识别 2.1 图像预处理
采用加权平均值法对采集的图像进行灰度化处理,得到残饵灰度图(图2-a)和粪便灰度图(图2-e),然后利用中值滤波法消除噪声干扰,并采用OTSU方法将图像二值化,分别得到残饵和粪便的二值图像(图2-b和图2-f)。采用轮廓搜索方法提取图像的连通域,计算出各连通域的轮廓面积,即轮廓内像素点数,通过设定轮廓面积阈值,在灰度图和二值图的基础上,分割和人工筛选出残饵图像836张和粪便图像789张,即为分割出的残饵灰度图(图2-c)、二值图(图2-d)和分割出的粪便灰度图(图2-g)、二值图(图2h),用于后续的残饵和粪便识别。
图2 残饵、粪便图像预处理结果Fig.2 Preprocessing results of the residual feeds and the feces 2.2 提取残饵和粪便特征
残饵一般呈现椭圆形,轮廓平滑,而粪便相对松散模糊,且轮廓形状不规范,并伴有很多毛刺。文章根据残饵和粪便在灰度分布和形状上的差异,提取残饵和粪便的平均灰度,周长平方面积比、凸壳面积比、骨架数、对比度和逆差距六个特征。 (1)平均灰度。平均灰度是指轮廓区域内像素点的灰度平均值。残饵较为圆实、紧密度大、颜色深,而粪便松散模糊、颜色也较浅,统计残饵、粪便在平均灰度上的分布(图3-a),可以得到残饵平均灰度在95~115之间,粪便平均灰度在106~127之间。
(2)周长平方面积比(C)。周长平方面积比用来表示物体圆形程度,图形为圆形时取最小值4,图形越不规则,取值越大,其公式为:
式中:L—分割图像的轮廓上像素点个数,即轮廓周长,m,S—分割图像轮廓区域内像素点总个数,即轮廓面积,m2。统计残饵、粪便在周长平方面积比上的分布(图3-b),残饵比值在13.17~16.0之间,较为集中;粪便比值在14.3~32之间,较为分散。
(3)凸壳面积比。凸壳面积比为分割图像的凸壳面积与图像轮廓面积的比值。以图像轮廓对应坐标点作为平面点集,运用 Graham扫描算法[13]生成凸壳,获得凸壳面积,即为凸壳轮廓内像素点个数。残饵图像轮廓呈椭圆形,接近凸多边形,其凸壳的面积和原图像面积相差不大;粪便轮廓为不规则形状,生成凸壳的面积相对于原图像有明显增大。图3-c为残饵、粪便在凸壳面积比上的分布统计。 (4)对比度和逆差距。纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征。对比度反映图像的清晰度和纹理沟纹深浅的程度,纹理沟纹越深,其对比度越大,视觉效果越清晰。残饵图像清晰,而粪便相对模糊,因此残饵的对比度高于粪便。逆差距反映图像纹理的同质性,度量图像纹理局部的变化,其值越大,说明图像纹理区域间变化小,局部相对均匀。残饵局部灰度变化较大,逆差距较小,
而粪便灰度变化小,局部相对均匀,逆差距较大。图3-d、3-e分别为残饵、粪便在对比度和逆差距上的分布统计。
(5)骨架数。骨架数是指提取的分割图像骨架的分支个数。采用快速并行细化算法[14]对分割图像提取骨架,获取骨架数。骨架是目标的重要拓扑描述,残饵图像呈椭圆形,轮廓边缘光滑,拓扑结构较为简单,提取的骨架数较少,而粪便形状不固定,并含有毛刺,拓扑较为复杂,骨架数相应也会较多。图3-f为残饵、粪便在骨架数上的分布统计。 2.3 基于SVM的残饵识别
支持向量机(Support Vector Machine,SVM)的原理是寻找一个最优分类面,使得两侧附近的点到该分类面的距离达到最大[15]。当训练样本集线性可分时,可以通过二次规划的寻优方法选择出最优超分类面;当其线性不可分时,通过引入一个非负松弛因子ξ和错分惩罚常数C,将其转化为线性可分问题;当其非线性可分时,通过核函数将输入向量映射到高维空间,将其转化为线性可分问题,从而求解最优分类面。常见的核函数有线性、多项式、径向基和Sigmoid四种核函数。 图3 残饵、粪便在各个特征上的分布统计Fig.3 Distribution statistics of the feeds and feces on the various characteristics
文章中残饵和粪便识别属于非线性可分问题,分别运用这四种核函数的SVM对残饵和粪便进行识别处理。 2.4 基于决策树的残饵识别
本文采用ID3算法[16]进行残饵和粪便的识别,其核心是以信息增益最大选择节点属性,其具体步骤为计算节点(以根节点开始)处样本集合的信息熵和对应各属性的信息增益;选择最大信息增益所对应的属性作为该节点的属性;按节点属性对样本进行划分,获得新的节点,并在新节点中删除已用过的属性;判断新节点下为同一类样本或没有剩余属性时设定其为叶子节点,否则继续上述步骤直到获得叶子结
点,生成决策树模型。
ID3算法直接处理的是离散数据,这里需要对连续的残饵特征属性做离散化处理。由于C4.5算法中连续属性离散方法[17]的缺点:选取的离散阈值未必对应最大的信息增益,并且二值离散未必能得到最好的离散效果。文章借鉴并改进C4.5算法中连续属性离散方法,以遍历的方式选择信息增益最大对应的一个或两个离散阈值,实现连续属性的二值离散和三值离散。假设连续属性的样本个数为n,其离散过程为:将样本按属性值大小排序,并将样本由大到小标号为C1,C2,…,Cn;以 Ci作为离散分段点,其中,i=1,2,…,n-1,分别计算把[C1,Ci]和[Ci,Cn]作为区间值时的信息增益Gain值,并比较;选择Gain值最大的Ck作为离散阈值,将样本属性值离散为X1和X2,获得二值离散数据。以Ci,Cj作为离散分段点,其中,i=1,2…,n-2,j=i+1,i+2,…,n-1,分别计算把[C1,Ci]、[Ci,Cj]和[Cj,Cn]作为区间值时的信息增益Gain值,并计较;选择Gain值最大对应的Ck1、Ck2作为离散阈值,将样本属性值离散为X1、X2和X3,获得三值离散数据。 3 结果与分析
3.1 SVM对残饵的识别
把分割出来的836张残饵和789张粪便图像作为试验样本,分别提取残饵和粪便图像的平均灰度、周长平方面积比、凸壳面积比、骨架数、对比度、逆差距6个特征,对单个特征做残饵和粪便识别测试,得到各个特征对残饵和粪便的识别率分别为 80.9%、80.0%、77.4%、76.9%、72.6%、69.9%。选择残饵和粪便图像各500张作为训练集,剩余的残饵和粪便图像作为测试集,验证识别的准确率。单张图像提取特征所需时间平均为22.37 ms。
对训练样本数据做归一化处理,对4种不同核函数的SVM,运用交叉验证法选出最佳匹配参数,并训练出各核函数的分类器;将测试集样本代入分类器,得到各核
函数的SVM。对残饵和粪便的识别结果如表1。其中,参数设定为C=10,ξ=0.001,多项式核函数中 q=3,径向基核函数中σ2=3/2,Sigmoid 核函数中 v=1/3,c=-1。残饵识别率为正确识别的残饵占测试样本中残饵的比例;粪便识别率为正确识别的粪便占测试样本中粪便的比例;运行时间是指单个测试样本处理和识别所需的时间。
表1 基于SVM算法的残饵识别结果Tab.1 Recognition results of residual feeds based on SVM核函数 支持向量个数正确识别率/%残饵 粪便运行时间/ms线性53 97.62 95.50 7.80多项式 75 98.81 96.19 23.78径向基 61 99.11 97.23 21.45 Sigmoid 98 98.52 96.89 27.04
从表1中可得出,SVM的残饵和粪便的识别率比较高,径向基核函数SVM对残饵和粪便的识别效果最好,多项式核函数和Sigmiod核函数次之,线性核函数的识别效果最差。从运行时间上看,线性核函数SVM的识别所需时间为7.8 ms,是其他3种核函数SVM的识别时间的1/4~1/3,实时性较好。 3.2 决策树对残饵识别结果
将训练样本中连续属性离散化,得到二值离散数据和三值离散数据,同时记录离散阈值;然后用离散后的训练数据对决策树进行训练,生成识别模型;最后用离散阈值将测试集样本离散化为二值离散数据或三值离散数据,代入对应的识别模型,得到残饵和粪便的识别结果(表2)。
表2 基于决策树算法的残饵识别结果Tab.2 Recognition results of residual feeds based on decision tree离散方式正确识别率/%残饵 粪便 运行时间/ms二值离散97.38 95.16 0.01三值离散98.52 96.54 0.017
从表2可以看出,决策树对残饵和粪便识别所需时间极短,实时性好;与二值离散数据相比,决策树算法对三值离散数据处理获得的识别效果好。对比表1和表2可以得出,基于径向基核函数的SVM算法有较好的识别效果,残饵识别率达到
99%以上,粪便识别率达到97%以上。决策树算法对残饵和粪便识别具有更好的实时性。 4 结论
根据残饵和粪便在灰度分布和形状上的差异,提取平均灰度、周长平方面积比、凸壳面积比、对比度、逆差距、骨架数6个特征。把6个特征数据作为输入,分别运用支持向量机(SVM)和决策树对残饵和粪便进行识别,结果证明这两种方法的识别率远高于单个特征的识别率。对比4种不同核函数的SVM算法和决策树算法对残饵和粪便的识别效果,发现基于SVM算法的残饵和粪便识别率要高于决策树算法,改进离散方式的决策树算法识别率与SVM算法的识别率接近,并且识别实时性更好。而在实际检测残饵浓度时对残饵计数实时性要求较高。因此,相对于SVM算法,决策树算法更适合于残饵识别。 参考文献
[1] 袁凯,庄保陆,倪琦,等.室内工厂化水产养殖自动投饲系统设计与试验[J].农业工程学报,2013,29(3):169-176
[2] 徐丽英,于承先,邢斌,等.基于PDA的集约化水产饲料投喂决策系统[C]//国际农产品质量安全管理、检测与溯源技术研讨会.2008,24(2):250-254. [3] CHANG C M,FANG W,JAO R C,et al.Development of an intelligent feeding controller for indoor intensive culturing of eel[J].Aquacultural Engineering,2005,32(2):343-353. [4] LAGARDERE J P,MALLEKH R.Feeding sounds of
turbot(Scophthalmus maximus)and their potential use in the control of food supply in aquaculture:I.Spectrum analysis of the feeding sounds[J].Aquaculture,2000,189(3):251-258.
[5] 汤涛林,唐荣,刘世晶,等.罗非鱼声控投饵方法[J].渔业科学进展,
2014,35(3):40-43.
[6] CHEN WEIMIN,PURSER G J,BLYTH P J.A waste pellet monitoring system for detection of feeding rhythms in fish:continuously quantifying actual feed intake without disturbance[J].Fisheries Science 2002,68(1):943-946
[7] JUELL J E,FUREVIK D M,BJORDAL A.Demand feeding in salmon farming by hydroacoustic food detection[J].Aquacultural Engineering,1993,12(3):155-167.
[8] SUMMERFELT S T,HOLLAND K H,HANKINS J A,et al.A
hydroacoustic waste feed controller for tank systems[J].Water Science and Technology,1995,31(10):123-129.
[9] 田有文,李天来,李成华,等.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180.
[10]史智兴,程洪,李江涛,等.图像处理识别玉米品种的特征参数研究[J].农业工程学报,2008,24(6):193-195.
[11]司永胜,乔军,刘刚,等.基于机器视觉的苹果识别和形状特征提取[J].农业机械学报,2009,40(8):161-165.
[12] FOSTER M,PETRELL R,ITO M R,et al.Detection and counting of uneaten food pellets in a sea cage using image analysis[J].Aquacultural Engineering,1995,14(3):251-269.
[13] SKLANSKY J.Measuring concavity on a rectangular mosaic[J].IEEE Transactions on Computers,1972, (12):1355-1364.
[14] ZHANG TY,SUEN CY.A fast parallel algorithm for thinning digital patterns[J].Image Processing and Computer Vision,1984,27(3):236-
239
[15] CORTES C, VAPNIK V. Support-vector networks[J].Machine Learning ,1995 ,20(3):273-297.
[16]潘琛,杜培军,张海荣.决策树分类法及其在遥感图像处理中的应用[J].测绘科学,2008,33(1):208-2011.
[17]钟映春.基于决策树的焊缝缺陷类型识别研究[J].计算机工程与应用,2008,44(20):226-228.
因篇幅问题不能全部显示,请点此查看更多更全内容