华北地区井灌区农户灌溉用水状况调查研究

2024-10-08 版权声明 我要投稿

华北地区井灌区农户灌溉用水状况调查研究(共4篇)

华北地区井灌区农户灌溉用水状况调查研究 篇1

2005年1月http://

18日

中国水势网 编辑:宋金凤

1 引 言

华北地区不仅是我国政治、经济、文化和交通的中心地带,而且是重要的粮食生产基地,但同时也是全国水资源、人口、耕地资源分布最不均衡的地区。作为全国粮食主产区,华北地区水资源短缺,生活、工业、生态和农业灌溉用水的矛盾日益突出,成为地区可持续发展的限制性因素。农户作为灌溉用水的主体,其用水现状及行为成为目前关注的焦点。

目前全国井灌区面积已达到22 005万亩,约占总灌溉面积的1/4,基本分布在华北平原。仅海河流域1997年已有机井125.4万眼,灌溉面积达7 246万亩,占灌溉面积的70%以上。因此,井灌区,尤其是华北地区的井灌区对区域和全国的粮食生产具有重要意义。但是,过去节水灌溉和管理的重点主要是在渠灌区,国内对井灌区的研究较少。因此,2003年就下列三个问题对华北地区主要井灌区的农户灌溉用水进行了调查:(1)农户灌溉用水的现状;(2)灌溉费用与水价现状;(3)节水技术的应用现状及推广情况。

调查区覆盖5个省、市及自治区,收回有效调查问卷99份,其中北京市1份,河北省76份,河南省14份,山东省6份,山西省2份。调查区涉及38县82乡(镇)的82村。调查重点为河北省中东部平原与河南省北部平原井灌区。此次共调查99户,户均人口为4.50人,户均耕地9.39亩,其中水浇地8.65亩,占耕地的92.4%。

2 农户灌溉用水现状

调查区农业灌溉主要对象有小麦和玉米,其他作物主要包括棉花、蔬菜、花生和大豆等,以棉花为主。调查区年平均灌溉用水量为231.3 m3/亩,但各种作物的灌溉水量相差很大,从大到小依次为小麦、玉米与其他作物,小麦年均灌溉用水量是玉米的1.7倍(表1)。2003年调查区降水比多年平均降水偏少10%~25%,作物需要的灌溉水量较多。估计在降雨量正常年份,平均灌溉用水量要小于调查的数据。

调查区农田灌溉亩均用水量比较低。现状灌溉用水量年平均231.3 m3/亩处于全国最低水平。整个调查区农田灌溉亩均用水量约为《1999中国水资源公报》公布的全国农田灌溉亩均用水量的50%。

总理基金项目“华北地区节水型农业技术体系研究与示范”提出华北地区节水灌溉定额如表2所列。对比表1和表2可以看出,调查区灌溉定额很低。小麦现状亩均灌溉用水量小于降水保证率50%的节水灌溉定额,玉米现状亩均灌溉用水量略低于保证率为75%时节水灌溉定额,但高于保证率50%时的亩均灌溉节水灌溉定额。其他作物(以棉花为例)现状亩均灌溉用水量也略低于降水保证率为50%时的节水灌溉定额。灌溉用水量不足对作物的产量有一定的影响。由于小麦的现状用水量大大小于节水灌溉定额,缺水对其产量影响比较大,对玉米产量的影响则与灌溉技术有很大关系。但也应该指出,虽然增加灌溉水量会使农作物的产量增加,但是也必须为增加的灌溉水量付出更多的费用。因此,根据边际效益原理,产量最高时的灌水量不一定是经济的。在本区缺水不断严重的情况下,增加亩均灌溉用水量既不现实,也不一定经济。为减小缺水对粮食产量的影响,应该大力推广节水技术,提高灌溉水利用系数,调整种植结构,推广适水种植,增加玉米种植面积,压缩小麦播种面积。

3 农户灌溉费用

3.1 灌溉费用收取方式和灌溉费用

按耗电或耗油量收费是井灌区水费收取的主要方式。据调查,调查区74.0%的农户水费按耗电(油)量来收取,18.8%的农户按亩交费,按用水量交费的农户很少(如表3所列)。

华北地区小麦与玉米多为轮作,种植条件相同,所以单位用水价格相同。单位用水价格小麦与玉米为0.28元/m3,其他作物以棉花为主,种植于地势较高地区,地下水位埋深大,提取地下水耗电量大,所以单位灌溉用水费用也高。每亩灌溉费用与灌溉用水量有关。一般灌溉用水量越大,每亩灌溉费用越高。调查区平均每亩灌溉费用小麦为43.0元、玉米为26.0元、其他作物为38.7元。

灌溉费用在不同的国家、不同的地区有很大差异,不易直接评价比较其高低。采用每亩灌溉成本占总成本的比例,或用每亩灌溉成本占总产值的比例可以粗略地衡量灌溉费用的相对高低。我们以河北省邯郸民有灌区和河南省安阳漳南灌区作为参照,对井灌区现状灌溉费用进行评价。如表4所列,1998年民有渠灌区和漳南渠灌区每亩灌溉费用占总成本的比例分别为17.8%和18.9%,占亩产值的比例为11.6%和9.7%。由此可见,井灌区目前灌溉费用占总产值和总成本的比例都比渠灌区低,这主要与井灌区灌溉用水量少、灌溉水利用率高有关。

目前,国内关于合理的农业灌溉成本水价还没有一个确定的数据,不同专家测算的农业灌溉用水成本水价差异较大,高值相当于低值的4~10倍,但目前对灌溉用水水价的测算大都是基于渠灌区的数据,对井灌区研究较少。井灌区合理的灌溉水费目前仍难以确定。但是,调查区不论与专家测算的合理水价、大型灌区的现行水价,还是与全国其他地区相比,调查区水费较高是毫无疑问的。

3.2 水费构成分析

调查区普遍没有征收地下水资源费,水费由提水费和其他费用组成。提水费反映了提取地下水所需消耗的能源费,主要与地下水埋深、提水设备效率、能源价格和工作水头有关。其他费用与机井管理体制有关。我们以河北省井灌区为例,对主要农作物水费构成进行分析。

按河北省平均每亩灌溉定额与灌溉费用测算,主要作物灌溉费用中电费超过75%。调查区没有征收水资源费,其他费用包括机井建设费、浇地费等,水资源本身的价值格没有体现。因此,井灌区的水费基本上由能源费组成,只是计算能源费的标准不同,按耗电(油)量收费、按亩收费和按用水量收费是一样的。

3.3 水价改革及农户的应对策略

水价是调节水资源利用的经济杠杆,许多专家呼吁提高灌溉用水水价。灌溉水价的提高,对农户的用水行为会产生什么样的影响?我们分别对水价提高20%、40%、80%和100%时农民是否改变种植结构进行了调查。调查表明,当水价提高20%时,对农户灌溉用水的行为影响不大,难以起到促进节水、提高水资源利用率的作用;水价提高超过40%时,农户对水费有所反映,价格成为调节水资源利用的有效手段。

水价提高对农户改变种植结构有较大的影响。随着水价的提高,认为没有必要改变种植结构的农户比例不断下降。水价提高20%时,近40%的农户认为没有必要改变种植结构,但水价提高40%时,认为没有必要改变种植结构的农户下降到27.1%,水价提高到80%时,认为没有必要改变种植结构的农户仅有17.2%。但是,农户缺乏改变种植结构的知识,不论水价提高多少,都有一半以上的农户不知道具体如何去改变种植结构。这个比例随着水价的提高而有所增加。

水价提高,农户改变种植结构的主要障碍是缺少资金和缺少市场信息。由于剩余劳动力的普遍存在和生产工具的不断改善,劳动力和生产工具对改变种植结构的影响不大。农户对市场信息了解较少,资金短缺导致难于制定改变种植结构的计划。随着水价的提高,资金对农户的影响日益明显,当提高水价超过40%时,资金成为农户改变种植结构的主要障碍。

华北地区井灌区大部分地区尚未征收地下水水资源费,大部分省市规定的农业灌溉用水地下水水资源费一般应在0.004~0.15元/m3,相当于现状水价的40%左右。如果水价上调40%,调查区水费支出占农业总成本的比例增加到8.1%~19.5%,占总产值的7.1%~13.3%,小麦灌溉费用占总成本和总产值的比例最高,略超过地表水大型灌区。因此,在现状水价的基础上征收地下水水资源费,水价成为促进节水的有效手段,有利于地下水资源的可持续利用和种植结构的优化,但对粮食生产和农民收入可能会产生不利的影响。在提高水价的同时,这些问题必须加以考虑。

4 节水技术 4.1 主要节水技术

调查区3/4的农户采用节水技术。农户采用节水技术多种多样,而且因地制宜地把各种节水技术进行组装配套(如表5所列)。在99个调查户中,74户采用节水技术的农民,实行小畦灌溉的农户有58户,使用管道输水进行灌溉的农户有56户,采用膜上灌溉的有7户,喷灌技术应用较少。因此,井灌区目前采用的节水模式基本为管道输水+小畦灌溉。

根据调查资料分析,80%以上的农户采用节水技术的目的是为减少灌溉费用,一半以上的农户因水源不足采用节水技术,28%的农户为增加产量采用节水技术,部分农户为应付灌溉管理部门的要求采用节水技术。因此,灌溉费用和来水量对节水技术应用的影响最大,这也从一个侧面表明提高水价对促进节水具有较大的作用。

4.2 节水技术推广途径

调查表明,农户学习节水技术最直接的途径就是向邻居(包括节水示范区)学习。一半以上农户是通过向邻居学习使用节水措施的,2/5的农户是由技术推广站负责推广的,通过科技书籍及杂志学习节水技术的农户非常少。这种情况下,节水技术的推广与我国实施建设节水增产重点县、节水井灌区、节水灌溉示范项目区的实际工作是分不开的。

调查区节水农业发展的主要障碍是资金缺乏,鼓励节水的政策和法规不健全。节水首先要有投入,据有关资料统计,喷灌、滴灌每公顷需要投资4 500~6 000元,管道输水2 250元,地膜覆盖900元。在目前农产品价格较低,农民还不富裕的情况下,发展起来确实存在着较大的困难。此外,土地承包制度和管理水平低也制约了节水技术的广泛应用,如喷灌在一家一户使用的难度比较大,一般喷头的射程都超出一户田块的宽度。井灌区渠系水利用系数为0.6~0.7,如果采用管道输水,渠系水利用系数可以提高到0.8~0.9。小畦灌溉是我国北方井灌区行之有效的一种劳动密集型的灌溉技术,在河北、山东、河南等省的一些园田化标准高的地方,或在发展低压管道输水灌溉的地方,正在逐步推广应用。其优点是灌水流程短,减少了沿畦长产生的深层渗漏量,田间水利用率在0.8~0.98之间。在存在剩余劳动力的北方井灌区,推广小畦灌溉既能减小节水灌溉投资,又能提高灌水均匀度和灌水效率。因此,管道输水结合小畦灌溉,灌溉水利用系数可以达到0.8以上,符合《节水灌溉技术规范》(SL207-98)的相关要求,井灌区应推广使用这种节水技术模式。5 结 论

5.1 现状灌溉定额较低

调查区现状灌溉定额为231.3 m3/亩,不到全国平均水平的1/2。小麦现状灌溉用水量低于降水保证率50%时的节水灌溉定额,玉米现状用水量低于降水保证率75%时的节水灌溉定额。因此,从总体上来说,华北地区井灌区普遍存在农业灌溉供水不足的问题,对粮食生产产生了不利影响。

5.2 井灌区应征收水资源费

井灌区合理的灌溉水价目前仍难以确定。但是调查表明,当水价提高20%时,对农户灌溉用水的行为影响不大,难以起到促进节水、提高水资源利用率的作用;水价提高超过40%时,价格成为促进水资源高效利用的有效手段。总体上来看,灌溉费用中电费占较大的比例,灌溉水费基本上由电费和其他费用如机井建设费,浇地费组成,水资源本身的价值格没有体现。在现状水价的基础上征收地下水水资源费,约相当于现状水价上调40%,将对优化种植结构、促进节水有较大的作用,但对农民收入也会产生影响。

5.3 改变灌溉制度和种植结构

华北地区主要粮食作物有小麦、玉米。玉米主要生长在雨季,根据本区降雨情况,只要适时播种,一般即可满足其对水分的需求。小麦生长在旱季,是区内较易种植的作物,只要有水灌溉,配合农业增产措施,一般能稳产高产,对我国的粮食安全意义重大。现状灌溉用水量可以满足玉米节水灌溉定额,但是冬小麦现状灌溉用水量仍低于保证率50%时的节水灌溉定额。因此,华北地区在推广节水技术、降低灌溉定额的同时,有必要调整种植结构,增加玉米种植面积,压缩小麦播种面积。

5.4 加大资金投入力度,加强市场信息对农户的引导作用

华北地区井灌区农户灌溉用水状况调查研究 篇2

灌溉用水效率低下一直是制约中国节水型社会建设的关键原因。2006年, 我国每立方米灌溉水粮食产量约为1.36 kg, 不足世界平均水平的1/2;农业节水灌溉面积占有效灌溉面积的35%, 而在英国、德国、法国、匈牙利和捷克等国家, 节水灌溉面积比例都达到80%以上。生产技术效率是评价经济资源使用效率的相对指标, 度量在固定数量的要素投入下实际农业生产达到最大产出的程度, 或者是在固定产出条件下所能实现最小要素投入的程度。借鉴Kaneko et al. (2004) 和王晓娟、李周 (2005) 的研究, 作为单一投入要素, 灌溉用水的生产技术效率 (即灌溉用水效率) 所度量的是在实际产出和其他投入水平不变的情况下, 灌溉水的最低使用量与实际使用量的比值, 其中, 可能达到的最小灌水量, 是指技术充分有效、不存任何效率损失情形下的灌溉水量[1,2]。

测算生产技术效率的最常用方法包括:随机前沿分析方法 (SFA) 与数据包络分析方法 (DEA) 。SFA方法的精髓在于不仅考虑了可控制的无效率因素对产出的影响, 而且考虑了随机冲击因素对产出的效应, 模型中的混合误差项同时包括衡量随机冲击因素效应的对称误差项和衡量生产者技术无效率的非负误差项两个部分, 但是它对生产函数形式和样本及误差项分布的预先假定, 大大降低了参数估计的有效性[3]。相对于SFA方法的缺陷, DEA作为非参数方法, 利用线性规划构建边界生产函数, 不预先假定函数和样本及误差项的分布形式, 允许相对效率值随时间变化, 计算简单, 不需要大规模样本数据, 但该方法的主要不足是其通常假定不存在随机误差, 如果样本观测点的随机误差存在, 就会影响生产有效样本点选择的准确性, 从而改变其他所有样本点的相对效率值[4,5,6,7]。本文尝试同时使用SAF和DEA两种方法对农户灌溉用水效率进行测度, 对两种方法估计出的效率结果进行比较分析, 研究结果将为深入开展运用不同方法考察农户灌溉用水效率问题提供有益的参考。

1 概念界定与文献回顾

假设生产单位i利用要素X与水资源W生产了农产品Y, 生产可能性集合满足T (Y, X, W) ≥0, 生产函数的一般表达式为Y=f (X, W) 。在给定产出和其他投入水平的情况下, 灌溉用水效率测定的标准定义为:

WER=min{μ:f (XR, μWR) YR (W^) }=W^/WR (1)

μ代表水资源使用无效的规模参数, WR为实际用水量, W^为技术上可行的最小用水量, WER为灌溉用水效率, WER∈[0, 1]。WER=1时, WR=W^, 表示水资源实现了有效利用;而0<WER<1, 则意味着灌溉用水没有达到有效利用状态, 还可进一步减少水资源的使用数量。

说明:TE代表农业生产效率;WE代表灌溉用水效率。

灌溉用水效率度量的基本思路如图1, Y0、Y1为等产量线, W代表水资源投入, X代表其他投入, 第i个农户利用水资源投入OW1和其他投入OX1的实际产出水平为Y0, 而该投入组合最大可能的产出水平位于A点, 这表明该省区的农业生产无效率, 那么第i个农户的农业生产效率TEi=OC/OA, 即固定数量的要素投入下实际农业生产占最大可能产出水平的比例。对于水资源投入来说, 假设其他投入保持不变, 生产Y0的最小水资源投入水平为OW2, 此时第i个农户的灌溉用水效率WEi=OW2/OW1, 最大可能的节水量为W1W2。

由于水资源短缺压力的日益凸现, 越来越多的研究者开始参照以上的概念框架专门对灌溉用水效率进行系统评价, 代表性研究文献如表1所示。这些研究都基于单一生产投入要素技术效率测定理论对灌溉用水效率进行了较为深入的实证分析, 但这些文献中的效率估计多采用SFA方法, 缺乏对不同研究方法及研究结论的对比分析。为此, 本文综合使用SAF和DEA两种方法对农户灌溉用水效率进行测度, 希望得出更准确可靠的效率评价结果。

2 SFA和DEA模型构建

2.1 SFA模型

在农业生产中, 生产环境的不同及非可控因素, 例如气候、自然灾害等外生干扰都会导致生产者的实际产出达不到最大产出水平或不可能实现最小投入水平。为获得一致有效的灌溉用水效率估计结果, 本文选择采用基于截面数据的随机前沿生产函数最大似然估计方法, 根据对Battese & Coelli (1995) 模型[10]的改进分别构建C-D和超对数生产函数形式的随机前沿分析模型, 然后依据数据特征选择参数估计结果最切合实际的随机前沿生产函数模型进行效率测算。假设Yi作为观察到的第 个农户的农业产出, 模型可用随机前沿生产函数描述为:

Yi=f (Xij, Wi, β) exp (vi-ui) (2)

式中:Wi代表第 个农户的水资源投入;Xij代表第i个农户的除水资源之外的第j种要素投入;β为待估计参数;vi~iidΝ (0, σv2) 是服从独立正态同分布假设的随机扰动项, 其中包含了农业生产中不可控制的因素;ui是管理误差项, 反映生产配置效率损失, 假定ui服从半正态分布, ui~iidΝ+ (0, σu2) , 且viui相互独立, 并独立于投入变量Xij。从式 (1) 中可以看出, 生产配置有效的产出水平Y^i可以通过设定ui=0而得到。那么, 第i个农户的生产效率测算公式为:

ΤEi=Yi/Y^i=Yi/f (Xij, Wi, β) exp (vi) =exp (-ui) (3)

借鉴Karagianni, Tzouvelekas & Xepapadea (2003) [8]和Dhehibi, Lachaal & Elloumi et al. (2007) [9]的研究, 所谓农户灌溉用水效率就是指在产出和其他投入水平已经确定的情形下, 该农户进行农业生产时最小可能的用水量与实际用水量之比。基于C-D和超对数生产函数的第 个农户的灌溉用水效率测算公式可分别表示为:

WEi=exp (-uiβw) (4) WEi=exp (-uiβ2+12βww+12jβjwlnXij) (5)

2.2 DEA模型

通常来说, 根据投入或产出距离函数, DEA可以相应分为基于投入或产出两种不同方法。基于投入的DEA方法目的是为了测算生产单元相对于给定产出水平下最小可能投入的效率, 而基于产出的DEA方法则是为了度量实际产出与给定投入水平的最大可能产出差距[11]。只有在规模收益不变的情况下, 两种方法的效率测算结果才会相等。本文侧重于考察作为农业投入要素的灌溉用水户效率, 因此我们选择采用基于投入的DEA方法。

从抽象意义上来看, 作为微观层面的农业生产决策单元, 农户使用相同种类的投入去生产相同种类的产出, 但每个决策单元采取和使用的生产工序和技术以及面临的成本不同, 这也最终决定了投入和产出水平的差距。按照基于投入的数据包络分析思想, 假设产出水平一定, 由要素投入最少的农户组成代表生产有效配置状态的逐段前沿面, 对各农户生产效率的测算实际上就是度量其与所对应前沿面上生产有效农户的差异程度, 也就是求解如下线性规划问题:

[ΗS1*2]ΤEi=minθ, λθi[ΗS1*2]s.t-yi+Yλ0[ΗS1*2]θxi-Xλ0[ΗS1*2]σxi-Xλ=0[ΗS1*2]Ν1´λ=1[ΗS1*2]λ0, 0σ1, i=1, 2, LΝ (6)

式中:θi是代表农户i的农业生产效率得分标量;λN×1阶常数向量;yi是农户i的一个M×1阶产出向量;xi是农户i的一个K×1阶投入向量, 水资源包括之中;YM×N阶产出矩阵, XK×N阶投入矩阵;N1是N×1阶单位向量。θi无量纲, 且0<θi≤1, 当θi值为1时, 表明农户i坐落在前沿面上, 是生产有效点。值得注意的是, 约束σxi-=0、N′1λ=1表明式 (6) 是投入弱处置 (WD) 和规模收益可变 (VRS) 条件下的DEA模型;当σ=1和不存在N′1λ=1约束时, 式 (6) 就成为投入强处置 (SD) 和规模收益不变 (CRS) 条件下的DEA模型。

为了在以上DEA模型的基础上具体测算灌溉用水效率, 进一步构建偏向量DEA效率模型[7]。假设θiw为第i个农户的灌溉用水效率得分标量, 其由如下线性规划模型确定:

WEi=minθ, λθi2s.t-Yi+Yλ0θiwXiw-Xwλ0Xin-w-Xn-wλ0σXi-Xλ=0Ν1´=1[ΗS1*2]λ0, 0σ1 (7)

其中, 第二个约束条件中的矩阵xiwXw仅指灌溉用水投入, 第三个约束条件中的xin-wXn-w则代表水资源以外的其他农业投入, 第四、五个约束条件如前所述。

3 农户灌溉用水效率的SFA与DEA测度

3.1 调查介绍与数据说明

由于供给的有限性, 水资源短缺是经济社会发展的必然趋势。目前, 我国大部分地区都面临不同程度和类型的水资源紧缺压力, 受地理条件和自然气候不同的影响, 北方地区多是水量型缺水, 南方地区则是水质型缺水, 但随着水污染的加剧, 水质型缺水逐渐会转变为水量型缺水。本文选择中国水资源最紧缺的西北地区的农户调查数据, 进行微观层面的灌溉用水效率研究, 相关结论对处于或正要面临水资源短缺状况的地区是具有借鉴意义的。

3.1.1 调查介绍

2007年5月-8月, 笔者组队分别在甘肃省张掖市和内蒙古包头市进行了两次大规模的实地入户调查。第一次时间为2007年5月11日-5月28日, 调查地点为甘肃省张掖市甘州区西干灌区、临泽县梨园河灌区和山丹县马营河灌区, 重点走访了山丹县马营河灌区位奇镇的五个村庄:十里堡村、高寨村、永兴村、东湾村和四坝村。第二次时间为2007年8月22日-8月30日, 地点为内蒙古包头市镫口黄河扬水灌区, 重点走访了土右旗毛岱镇的毛岱村、新营子村、任三尧村与侯家营子村, 以及明沙淖乡的苗六营村和大城西村。调查涉及灌区管理部门的运作现状, 灌区与村庄的水资源管理、分配与使用情况, 农户基本特征及其2006年种植业投入产出等具体内容。

3.1.2 数据说明

土地是农业生产的基础和载体, 水和其他投入要素只有依附在土地上才能实现农业生产。土地可以被看作是农业生产的固定投入要素, 而水等被农作物直接消耗的经济资源则是农业生产的可变投入要素, 二者在农业生产中所发挥的作用密不可分。因此, 本文投入产出变量都采用单位面积数据, 从而将农业生产中的可变投入要素与土地资源独立开来, 以便更为准确地反映灌溉用水效率。此外, 鉴于数据的易处理性和相关文献, 本文选择两个调查灌区432个农户所种植的主要粮食作物——小麦的投入产出数据作为微观层面灌溉用水效率测算的依据。具体说来, 选取亩均收益作为产出变量;选取亩均种子成本、化学投入成本、机械成本、劳动力投入时间和用水量作为投入变量。表2给出了农业生产效率与灌溉用水效率测算时所使用的各投入产出变量的表示符号和统计特征。

3.2 农户灌溉用水效率的SFA测度

基于通过实地调查获取的农户截面数据, 按照式 (3) 的模型结构, 利用FRONTIER 4.1软件, 分别对C-D随机前沿生产函数模型和超对数随机前沿生产函数模型进行估计, 进一步的SFA模型假设检验结果表明:在农户灌溉用水效率估计模型中使用C-D生产函数比较合适。根据SFA模型检验结果, 基于C-D随机前沿生产函数的参数估计, 利用式 (4) , 对农户的农业生产效率与灌溉用水效率进行估算。

SFA方法测算的被调查农户农业生产效率与灌溉用水效率的频度分布如表3所示。所有样本的效率值都小于1, 意味着被调查农户的小麦生产和灌溉用水均处于无效配置状态, 都存在一定的改进空间, 尤其是农户灌溉用水效率, 普遍小于农业生产效率, 平均水平仅为0.320 8, 表明相对于现有生产条件下可行的亩均最小用水量, 被调查农户在小麦生产中可能浪费了约68%的水资源。另一方面, 较之农业生产效率, 农户灌溉用水效率的测算结果还表现出很大的可变性, 最大值为89.67%, 最小值仅为5.21%, 两者相差16.21倍。对于农业生产效率来说, 所有样本的效率得分都在0.2以上, 60%以上的被调查农户效率得分高于0.8。而农户灌溉用水效率的情况则截然不同, 约40%的样本效率得分在0.2以下, 4/5左右的样本效率得分小于0.5, 而且还有2%的被调查农户效率得分低于0.1, 只有2%的被调查农户效率得分高于0.8。

资料来源:作者计算整理。

资料来源:本研究计算整理。

3.3 农户灌溉用水效率的DEA测度

根据公式 (6) 、 (7) , 基于432个农户截面数据, 下面我们运用ONFRONT2.1软件对规模收益不变 (CRS) 和规模收益可变 (VRS) 两种不同约束下的农户农业生产效率和灌溉用水效率进行DEA测算, 表4、5给出了DEA效率测定结果的频度分布。

表4显示, 总样本中, 有2.78%的被调查农户的小麦生产效率和灌溉用水效率得分等于1, 表明这些农户处于农业生产可能集的前沿包络面上, 无论是在小麦生产还是用水方面都实现了生产资源的有效配置。而较之有效生产点, 其他农户均处于生产的相对无效状态, 存在农业生产和水资源利用的改进空间, 其中, 农户灌溉用水效率最小值仅为0.03, 意味着该农户相对于小麦生产技术与经营水平充分发挥的情况下亩均可能浪费了97%左右的灌溉用水。全部样本的灌溉用水效率都小于农业生产效率, 平均得分为0.306 5, 说明在产出和其他投入保持不变的条件下, 相对于现有生产条件下可行的最小水投入量, 被调查农户在小麦生产过程中可能浪费了将近70%的水资源。

资料来源:本研究计算整理。

另一方面, 较之农业生产效率, 农户灌溉用水效率的测算结果表现出极大的可变性, 农户间效率得分差距高达97%。对于农业生产效率来说, 所有样本的效率得分都在0.1以上, 50%以上的被调查农户效率得分高于0.6。而农户灌溉用水效率的情况则截然不同, 约40%的样本效率得分在0.2以下, 85%左右的样本效率得分小于0.5, 且还有8%的被调查农户效率得分低于0.1, 只有约4%的被调查农户效率得分高于0.8。

表5显示, 就农业生产效率而言, 规模收益可变条件下所有样本的效率得分都在0.5以上, 60%以上的被调查农户效率得分高于0.7;而对于农户灌溉用水效率来说, 规模收益可变约束下, 约40%的样本效率得分在0.4以上, 还有20%左右的样本效率得分高于0.6, 仅有约7%的被调查农户效率得分低于0.2, 约0.2%的被调查农户效率得分小于0.1。可见, 无论农业生产效率还是农户灌溉用水效率, 规模收益可变条件下的效率得分都明显高于规模收益不变约束下的效率值, 表明农业经营规模的自由调整将有利于农业生产和水资源生产配置效率的提高。

资料来源:本研究计算整理。

4 SFA和DEA方法的效率测度结果比较

SFA和DEA都是基于生产前沿面理论的效率测算方法, 二者的理念、模型、前提假设和统计方法完全不同, 因此通过SFA和DEA两种方法测算出的效率得分势必存在显著差异。下面我们将利用配对t检验和Spearman相关检验来具体考察农户灌溉用水效率SFA和DEA估计结果的相关性与差异性。考虑规模收益对农业水资源生产配置效率的影响, 本部分还将进一步比较分析规模收益不变和可变两种不同假设前提下的DEA效率测算结果。

4.1 SFA与DEA效率测度结果的配对样本t检验

使用软件STATA10.0对通过SFA和DEA方法所测算出的农户灌溉用水效率得分进行均值比较中的配对样本t检验, 统计结果如表6所示。在三种效率估计结果中, 任两种效率估计得分之间的配对t检验结果均值都在1%或10%的水平统计显著, 说明三种效率估计得分之间具有明显的差异性。

说明:*代表10%的水平显著;**代表5%的水平显著;***代表1%的水平显著。

具体来看, SFA效率估计结果明显大于规模收益不变假设下的DEA效率估计结果;而其又显著小于规模收益可变假设下的DEA效率估计结果;规模收益可变假设下的DEA效率估计结果明显大于规模收益不变假设下的DEA效率估计结果。图2显示的是以上三种效率得分的累积分布。从中也可以看出, 规模收益可变假设下的农户灌溉用水效率DEA估计得分明显大于SFA效率得分, 而后者大于规模收益不变假设下的DEA效率估计结果。

4.2 SFA与DEA效率测度结果排序的一致性检验

表7给出了SFA和DEA方法所测算出的农户灌溉用水效率得分排名之间的Spearman 相关矩阵。该矩阵可以分别反映出农户灌溉用水效率的三种不同估计得分之间的相关性, 由表可见, 所有的Spearman相关系数都大于零。

说明:*代表10%的水平显著;**代表5%的水平显著;***代表1%的水平显著。

具体说来, 对于不同效率测算方法, 农户灌溉用水效率SFA估计得分与规模收益不变假设下的DEA效率测算结果之间的Spearman相关系数都在1%的水平下统计显著, 但其与规模收益可变假设下的DEA效率测算结果之间的Spearman相关系数在任何统计水平下都不显著, 而规模收益不变和可变假设下的DEA效率得分之间的Spearman相关系数在1%水平下也统计显著。

以上结果表明同一种测算方法的农户灌溉用水效率SFA估计得分排名与规模收益不变假设下的DEA效率测算结果排名之间具有显著的一致性;规模收益不变和可变假设下的DEA效率得分排名也显著一致;但SFA效率估计得分排名与规模收益可变假设下的DEA效率测算结果排名之间却不具有显著的一致性。

5 研究结论

本文尝试使用DEA与SFA两种方法来测度水资源短缺地区被调查农户的灌溉用水效率, 并利用配对样本t检验和Spearman相关检验方法进行了效率测度结果的对比分析, 得出如下研究结论。

(1) 两种方法综合的农户灌溉用水效率均值约为0.3, 意味着在其他投入和产出保持不变的情况下, 样本农户目前的农业生产可能浪费了将近70%的灌溉用水;大部分农户的效率值都小于1, 表明被调查农户的小麦生产和灌溉用水均处于低效配置状态, 都存在一定的改进空间, 尤其是农户灌溉用水效率, 普遍小于农业生产效率, 而且前者与后者相比具有较大的可变性, 这表明农民可能在使用其他农业生产资源时要比水资源谨慎得多。还应指出的是, 本文农户灌溉用水效率测算依据的是干旱地区的农户调查数据, 在这些地区, 水资源原本就非常稀少, 但有限的灌溉用水却并没有得到有效配置和高效利用。因此, 激励水资源使用主体——农户的节水行为, 提高微观层面的灌溉用水效率, 应是缓解农业用水紧缺的根本途径。

(2) 两种方法效率估计得分之间存在明显的差异性, SFA效率得分明显大于规模收益不变假设下的DEA效率估计结果, 但其又显著小于规模收益可变假设下的DEA效率估计结果, 这与以往实证文献的研究结论保持一致。三种效率估计结果的差异不仅来源于生产效率测算的参数方法与非参数方法在生产前沿面构建、距离函数模型和所运用统计方法等方面的不同, 更重要的原因则是SFA主要考虑影响效率的随机因素, 而DEA则侧重分析农户间的相对效率水平, 所以造成两种方法估计结果的显著不同。由于被调查农户之间的灌溉用水效率差异较大, 其他农户的效率得分相对于生产最优样本点差距明显, 导致了全体样本的效率估计均值较低, 因而规模收益不变假设下的DEA效率测算值要显著小于SFA效率估计结果。另一方面, 由于本部分随机前沿分析方法采取的是规模收益不具伸缩性的C-D生产函数形式, 而规模收益的自由调整会对农户灌溉用水效率的提高产生促进作用, 因此规模收益可变条件下的DEA效率测算值显著大于SFA和规模收益不变条件下的DEA效率估计结果。

(3) 尽管存在上述差异, 但是两种方法测度出的农户灌溉用水效率值及其排序之间存在显著相关性和良好的一致性。

摘要:根据2007年西北地区432个农户的实地调查数据, 采用随机前沿分析 (SFA) 和数据包络分析 (DEA) 方法对微观层面的农户灌溉用水效率进行测度, 在此基础上利用配对样本t检验和Spearman相关检验比较分析两类方法的效率估计得分, 结果表明虽然规模收益不变假设下的DEA效率值显著小于SFA效率估计值, 但两种方法所测算的农户灌溉用水效率排名具有显著一致性。可为深入开展运用不同方法考察农户灌溉用水效率问题提供有益的参考。

关键词:农户,灌溉用水效率,SFA,DEA

参考文献

[1]Kaneko S, Tanaka K, Toyota T.Water efficiency of agriculturalproduction in China:Regional comparison from 1999 to 2002[J].International Journal of Agricultural Resources, Governance andEcology, 2004 (3) :231-251.

[2]王晓娟, 李周.灌溉用水效率及影响因素分析[J].中国农村经济, 2005, (7) :11-18.

[3]孙巍.生产资源配置效率——生产前沿面理论及其应用[M].北京:社会科学文献出版社, 2000:56-93.

[4]Wadud A, White B.From household efficiency in Bangladesh:Acomparison of stochastic frontier and DEA[J].Applied Econom-ics, 2000, 32 (5) :1 665-1 673.

[5]Reig-Martinez E, Picazo-Tadeo A J.Analyzing farming systemswith data envelopment analysis:Citrus farming in Spain[J].Ag-ricultural Systems, 2004, 82 (1) :17-30.

[6]Haji, J.Production efficiency of smallholders'vegetable-domina-ted mixed farming system in Eastern Ethiopia:A non-parametricapproach[J].Journal of African Economies, 2006, 16 (1) :1-27.

[7]Speelman S, Haese M D, Buysse J, et al.Technical efficiency ofwater use and its determinants, study at small-scale irrigationschemes in North-West Province, South Africa[EB/OL].http://www.ageconsearch.umn.edu/bitstream/123456789/28982/1/sp07sp01.pdf, 2007.

[8]Karagiannis G, Tzouvelekas V, Xepapadeas A.Measuring irriga-tion water efficiency with a stochastic production frontier[J].En-vironmental and Resource Economics, 2003, 26 (1) :57-72.

[9]Dhehibi B, Lachaal L, Elloumi M, et al.Measuring irrigationwater use efficiency using stochastic production frontier:An ap-plication on citrus producing farms in Tunisia[J].African Journalof Agricultural and Resource Economics, 2007, 1 (2) :1-15.

[10]Battese G E, Coelli T J.A model for technical inefficiencyeffects in a stochastic frontier production function for panel data[J].Empirical Economics, 1995, 20 (2) :325-332.

华北地区井灌区农户灌溉用水状况调查研究 篇3

1 灌溉管理改革对生计活动方式的影响

1.1 农户生计活动类型

1.1.1 种植业

种植业是农户首选的生计活动, 也是绝大多数人认可的生计活动。调查显示, 灌溉管理改革地区农户从事种植业的比率高达99.60%, 农户种植的具体作物包括玉米、小麦、葵花、番茄、甜菜、甜瓜、籽瓜等作物, 除用于满足家庭日常食品需求外, 大部分要通过市场进行交易。在灌溉管理改革地区, 农户主要以种植玉米、葵花、番茄和小麦为主, 以上4种种植作物的户均种植面积除小麦外, 都比较多, 分别为0.69公顷、1.42公顷、0.51公顷和0.26公顷。与改革前相比, 玉米和小麦的种植比例由改革前的12.29%和31.08%降低至现在的10.28%和19.52%, 葵花、番茄、甜菜、瓜类、葫芦的种植比例都显著增加, 增长幅度分别为26.70%、21.91%、7.17%、15.94%和6.38%。跟非改革地区农户比较, 最显著的差别是种植业结构, 改革地区农户的种植业结构呈多样化, 而非改革地区农户的种植结构比较单一, 农户以种植小麦、玉米和葵花为主, 种植其他作物的农户比例非常低, 比如种植番茄的比例为0.98%, 瓜类的比例为3.92%, 葫芦、甜菜的比例则为0.00%。

1.1.2 养殖业

调查显示, 改革地区农户从事养殖业的比率为98.01%, 而改革前的比例为80.88%。农户养殖首选的家畜是羊, 参与改革农户中养羊的比例高达84.06%, 户均养殖数量为20.81只;其次是猪, 饲养比例为78.88%, 户均养殖数量为1.84头;再次是鸡 (产品包括禽蛋) , 饲养比例为44.62%, 户均养殖数量为15.89只, 此外还有少量牛、马、驴等。灌溉管理改革前农户养殖羊、猪、鸡的比例分别为43.43%、44.62%和23.51%, 户均养殖数量分别为6.06只、0.66头和12.17只。与非改革地区农户比较, 最明显的区别是, 改革地区农户养殖种类多样化, 非改革地区农户主要养殖羊、猪、鸡三类, 其他牲畜的饲养数量为0, 从事养殖的农户比例为85.29%, 比改革地区低14.31个百分点。

1.1.3 非农活动

除种植业和养殖业外, 非农活动也是农户从事的一项主要生计活动, 包括打工和非农自营。在改革地区的251户家庭中, 有190户从事非农活动, 占比为75.70%。在非农活动类型中, 打工的比例最高, 比例为58.57%, 主要包括本地打工和外出打工两种类型。改革地区农户家庭打工比例比改革前一年高出25.50个百分点, 比非改革地区高21.32个百分点。其次为非农自营, 包括做小生意、个体加工、个体运输等, 灌溉管理改革后, 农户中非农自营的比例为14.74%, 高于改革前的4.38%和非改革地区的7.84%, 可能是因为灌溉管理改革使得农户从繁重的灌溉活动中解放出来, 有了更多从事非农活动的时间和机会。除此以外, 还有少数从事教师、医生或乡村干部等职业的家庭, 对被调查地区而言, 这些生计活动并不具普遍代表性。

1.2 灌溉管理改革对农户生计活动方式的影响

首先, 从改革与非改革地区农户的对比来看, 不管改革地区还是非改革地区, 几乎100%的农户家庭都从事种植业, 种植业是调研地区农户最主要的生计活动类型;养殖业和打工 (包括本地打工和外地打工) 是除种植业外的最主要的生计活动, 改革地区农户养殖业占比为98.01%, 打工为58.57%;非改革地区农户养殖业占比为76.47%, 打工为37.25%;改革地区农户非农自营的比例为14.74%, 非改革地区为7.84%。其次, 从农户改革前后的对比数据来看, 改革没有对农户从事种植业这项生计活动产生显著影响, 因为改革前后几乎所有农户都从事种植业;但是, 对养殖业、打工 (包括本地打工和外地打工) 、非农自营等生计活动产生影响, 改革前从事养殖业、打工和非农自营活动的农户比例分别为74.50%、33.07%和4.38%, 改革后农户从事这些生计活动的比例明显提高, 分别为98.01%、58.57%和14.74%。

2 灌溉管理改革对农户收入来源构成的影响

2.1 总体收入情况

调研中我们发现, 灌溉管理改革提高了农业生产效率以及农作物产量, 进而增加了农户的种植业收入。2011年改革地区农户的户均种植业收入为31396.18元, 比非改革地区农户的24956.30元高出6 439.88元, 比灌溉管理改革前一年的13 740.16元高出一倍还多。灌溉管理改革使众多的劳动力得以解放从事其他生产活动, 使他们的收入来源多元化。比如农户可以将节省的时间用于畜牧养殖业、外出打工以及从事非农自营活动等, 增加了农户的非农收入。

2.2 收入来源构成情况

调查结果显示, 种植业收入和打工收入是农户收入的主要来源, 占到调研地区农户家庭总收入将近80%的比重。在改革地区, 两种收入占家庭总收入的比重为73.82%, 非改革地区比重为76.93%。灌溉管理改革在增加农户种植业收入的同时, 也增加了农户的非农收入, 对农户收入结构变化产生了显著影响。灌溉管理改革前后, 农户在收入结构上发生明显变化。2011年, 改革地区农户总收入平均达到68 843.61元, 非参与农户为47 425.23元, 改革农户比非改革农户家庭总收入平均高出21 418.38元。参与灌溉管理改革的农户打工收入、非农自营收入和养殖业收入所占比重要高于未参与农户, 但是种植业收入所占比重较未改革地区要低。同时, 纵向对比, 改革地区农户的收入结构也发生了显著改变。改革前一年, 农户的种植业收入占家庭总收入的一半以上, 达到了58.95%, 非农收入为33.81%, 养殖业收入比重为4.97%。改革后种植业收入比重有所降低, 但非农收入和养殖业收入比重明显增加, 分别为41.37%和8.77%, 这意味着他们的生计策略发生了明显的改变, 由以前依赖于种植业转变为现在的依赖于打工和养殖业。

3 灌溉管理改革对农户生计活动多样性的影响

对生计多样化的研究, 本文参考兰州大学翟彬博士的方法, 将采用每个家庭从事的生计活动种类作为生计多样化指数, 即对每个家庭中农户从事的每种生计活动赋值为1, 如某农户从事种植、养牛、外出打工3种生计活动, 则其多样化指数值为3。最后对每个地区不同乡镇的农户生计多样化指数取加权平均值, 则得出该乡镇农户生计多样化指数平均值。同理, 可以计算出农户家庭的种植业多样化指数和养殖业多样化指数。

2011年改革地区农户中采取一种生计方式的农户占0.40%, 两种的占27.49%, 三种的占64.54%, 四种的占7.57%。灌溉管理改革前农户中采取一种生计方式的占16.33%, 两种的占47.01%, 三种的占34.26%, 四种的占2.39%。2011年非改革地区农户中采取一种生计方式的占5.88%, 两种的占38.241%, 三种的占54.906%, 四种的占0.98%。2011年改革地区农户生计活动多样化指数为2.79, 生计多样化指数最高, 比灌溉管理改革前一年和2011年非改革地区农户的2.23和2.51分别高出0.56和0.28。这说明农户在灌溉管理改革后有了更多的精力去从事非农生产, 灌溉管理改革后, 农户不仅可以选择从事农业生产, 还可以经营副业、外出打工、从事养殖业等。与改革前和非改革地区农户家庭对比, 参与改革的农户家庭的生计活动种类比较多, 主要有种植业、畜牧业、非农自营、外出打工等。该地区基本的生计模式为“种地+养殖+打工”, 部分农户从事非农自营活动。而改革前农户基本的生计模式为“种地+养殖”, 很少人外出打工和从事非农自营。非改革地区农户以“种地+养殖+打工”为主, 但与改革地区相比, 从事打工的农户比重偏小, 很少有农户从事非农自营活动。灌溉管理改革后, 各“工种”相结合的综合生计活动则成为了更多农户的首选, 生计活动的多样化降低了农业生产的风险和农户生产经营的脆弱性。

另外, 灌溉管理改革也对农户的种植结构和养殖结构产生了影响。改革前, 大部分农户仅种植小麦、玉米等大宗作物, 改革后农户增加了蔬菜、糖料、瓜类等经济价值更高的作物种植面积, 如番茄、葫芦、甜菜、籽瓜、甜瓜等。家庭养殖结构由单一种类变为现在的猪、牛、羊、马、驴、鸡、鸭、鹅等多样化结构。同理, 采用上述计算农户生计多样化指数的方法, 计算2011年改革户种植业多样化指数为2.63, 养殖业多样化指数为2.19, 高于改革前和同一时期非改革地区农户种植业多样化指数和养殖业多样化指数。

4 结论

研究结果表明, 灌溉管理改革对农户生计活动状况产生了显著的影响, 具体结论如下:

(1) 灌溉管理改革后农户调整了种植业和养殖业结构, 改革地区农户的种植业和养殖业结构都呈多样化趋势, 种植业多样化指数由改革前的1.92提高到现在的2.63, 养殖业多样化指数由改革前的1.13提高到现在的2.19。

(2) 灌溉管理改革使得农户从繁重的灌溉活动中解放出来, 有了更多从事非农活动的时间和机会。灌溉管理改革后75.70%的家庭从事非农活动, 比改革前的44.62%高出31.08个百分点。在农户所从事的非农活动类型中, 打工的比例最高, 占总样本的58.57%, 主要包括本地打工和外出打工两种类型。

(3) 灌溉管理改革对农户从事不同生计活动方式产生影响, 改革使得更多的家庭、更多的农户开始将视线和时间从农业转向非农业, 农户从事养殖业、非农自营活动的比重也有所提高, 增加了农民的收入, 优化了农户家庭收入来源结构。

(4) 灌溉管理改革地区农户基本的生计模式为“种地+养殖+打工”, 部分农户从事非农自营活动。而改革前农户基本的生计模式为“种地+养殖”。非改革地区农户以“种地+养殖+打工”为主, 但与改革地区相比, 从事打工的农户比重偏小, 很少有农户从事非农自营活动。2011年改革地区农户生计活动多样化指数为2.79, 高于改革前的2.23和非改革地区的2.51。

摘要:本文利用内蒙古地区353户农户调查数据, 比较分析了灌溉管理改革前后农户的生计活动状况。结果表明, 灌溉管理改革对农户生计活动产生显著影响, 农户调整了种植业和养殖业结构, 有了更多从事非农活动的机会, 打工成为农户生计活动中除种植业外比重最高的一项, 而且农户从事养殖业、非农自营活动的比重也有所提高, 优化了农户家庭收入来源结构。灌溉管理改革提高了农户生计活动多样化水平, 降低了农业生产的风险和农户生产经营的脆弱性。

关键词:灌溉管理,改革,农户,生计

参考文献

[1]赵雪雁, 李巍, 等.生计资本对甘南高原农牧民生计活动的影响[J].中国人口·资源与环境, 2011, 21 (4) :111-118.

[2]许汉石, 乐章.生计资本、生计风险与农户的生计策略[J].农业经济问题, 2012 (10) :100-104.

[3]苏芳, 尚海洋.生态补偿方式对农户生计策略的影响[J].干旱区资源与环境, 2013 (2) :58-63.

[4]李聪, 李树茁, 等.外出务工对流出地家庭生计策略的影响——来自西部山区的证据[J].当代经济科学, 2010, 32 (3) :77-85.

华北地区井灌区农户灌溉用水状况调查研究 篇4

灌溉用水量的准确预测,对制定合理有效的灌区水资源调配方案和调度计划具有重要的意义。国内外研究者在灌溉用水量预测方面做了很多工作,采用的方法主要有指标分析、回归分析、灰色预测、神经网络等[1,2,3]。但由于灌区用水量受气象因素、作物种植结构、水源情况以及水费政策等多种因素的影响,年际、年内变化都比较大,各种预测方法都存在不同程度的缺陷。为此,研究者一直致力于改进预测方法,提高预测精度。

现有机器学习方法的重要理论基础之一是统计学。传统统计学研究的是样本数目趋于无穷大时的渐近理论,但在实际问题中,样本数往往是有限的,常用的学习方法在实际应用中可能不尽人意。支持向量机(SVM)方法是一种在学习样本数有限的情况下处理高度非线性问题的新的机器学习方法,SVM通过提高数据的维度把非线性分类问题转换成线性分类问题,较好地解决了传统算法中训练集误差最小而测试集误差仍较大的问题,算法的效率和精度都比较高。目前,SVM算法在模式识别、回归估计、概率密度函数估计等方面获得了广泛应用[4,5]。陈广洲等[6]建立了区域水资源开发利用程度的支持向量机评价模型。陈永义等[7]在气象预报预测中,应用SVM进行了分类预报和回归预报,收到了较好的效果。冯汉中等[8]建立了四川盆地内单站气温的SVM回归推理模型,进行了相应的预报试验,试验结果显示对应的SVM推理模型具有良好的预报能力。

标准SVM算法的复杂度主要取决于样本数据的个数,而不是输入空间的维数,当训练数据量大和维数高时,SVM模型计算速度较慢[9]。最小二乘支持向量机(LSSVM)采用不同的优化目标函数,用等式约束条件代替不等式约束条件,使求解过程变成解一组等式方程,避免了求解耗时的二次规划问题,解算速度加快,而且LSSVM不再需要指定逼近精度,确定的模型参数比标准支持向量机少,训练速度比标准支持向量机快,且有较强的预测能力。本文以人民胜利渠灌区需水量为研究对象,选用径向基函数(RBF)作为核函数,建立了最小二乘支持向量机预测模型,对灌区需水量进行了模拟计算,用检验样本与灰色预测和基于RBF的神经网络模型的预测结果进行了比较。结果表明,最小二乘支持向量机模型有较高的预测精度和较强的泛化能力,其预测结果可为灌区水资源规划提供科学依据。

1 SVM理论

支持向量机(Support Vector Machine,SVM)是最近比较流行的一种数据挖掘技术,其理论基础是统计学习理论。统计学习理论就是研究小样本统计估计和预测的理论,核心内容包括基于经验风险最小化准则的统计学习一致性条件、统计学习方法推广性的界、在推广界的基础上建立的小样本归纳推理准则、实现新准则的实际方法。支持向量机算法基于结构风险最小化原则,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。采用核函数方法,通过提高数据的维度把非线性分类问题转换成线性分类问题,较好解决了传统算法中训练集误差最小而测试集误差仍较大的问题,算法的效率和精度都比较高。其主要优点是可以解决小样本情况下的机器学习问题,提高泛化性能,解决高维问题及非线性问题,避免神经网络结构选择和局部极小点问题。

2 基于SVM的灌区引水量预测模型

支持向量机实现是通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间中构造最优分类超平面。使用SVM进行数据集分类首先通过预先选定的一些非线性映射将输入空间映射到高维特征空间,在高维属性空间中有可能对训练数据实现超平面的分割,避免了在原输入空间中进行非线性曲面分割计算。SVM数据集形成的分类函数是一组以支持向量为参数的非线性函数的线性组合,分类函数的表达式仅和支持向量的数量有关,而独立于空间的维度。

2.1 SVM算法

假定训练数据(x1, y1),…,(xi, yi),xRn,y∈{+1, -1}可以被一个超平面(w·x)-b=0没有错误地分开,与两类样本点距离最大(称为边缘最大)的分类超平面会获得最佳的推广能力。最优超平面将由离它最近的少数样本点(称为支持向量)决定,而与其他样本无关。与样本间隔为Δ的分类超平面形式如下:

(wx)-bw=1(1)y=1(wx)-bΔy=-1(wx)-b-Δ

式中:x是输入向量;w是可调的权值向量;b是偏置。

如果向量x属于一个半径为R的球中,那么Δ-间隔分类超平面集合的VC维h有下面的界:

hmin{[R2Δ2],n}+1(2)

这样,SVM首先保证了一个小的经验风险(在训练样本可分时为零),并通过选择边缘最大的超平面的方式控制了函数集的VC维,这正是SVM原则所要求的。

支持向量机的原理是用分类超平面将空间中两类样本点正确分离,并得到最大的分类间隔,将SVM的最优化问题中的分类超平面归一化:令Δ=1,而wb可以按比例缩放。离超平面最近的样本(支持向量)满足:

y=1(wxi)-b=1y=-1(wxi)-b=-1(3)

支持向量到超平面的距离为1/‖w‖。原问题就转换成一个有约束非线性规划问题:

ΜinimizeΦ(W)=12W2s.t.yi(xiW+b)-10i=1,2,,l(4)

目标函数是严格上凹的二次型,约束函数是下凹的,这是一个严格凸规划。按照最优化理论中凸二次规划的解法,把它转化为Wolfe对偶问题来求解。

构造Lagrange函数:

L(w,a,b)=12w2-i=1lαiyi(xiw+b)+i=1lαi,αi0,i=1,2,,l(5)

其中:αi为Lagrange乘子。

约束最优问题的解由Largrange函数L(w, a, b)的鞍点决定,此函数对wb必定最小化,对a必定最大化。L(w, a, b)对wb求微分方程,并令结果等于零,得到两个最优化条件(Kuhn-Tucker条件):

wL(w,a,b)=0bL(w,a,b)=0

w=iajyixi(6)iajyi=0(7)

将式(6)、式(7)代回Lagrange函数中,消去wb,经运算得到原最优化问题的Wolfe对偶问题:

Μaximizew(a)=ilai-12i,jlaiajyiyjxixjs.t.i=1laiyi=0(8)ai0i=1,2,,l

解出αi后利用iaiyixi确定最优超平面,只有支持向量所对应的Lagrange乘子αi才不为0。

2.2 核函数的确定

根据泛函的有关理论,只要核函数k(x,xi)满足Mercer条件,就可以对应变换空间中的内积[10]。支持向量机中可以采用不同的核函数构造实现输入空间不同类型的非线性决策面的学习机器。目前常用的核函数主要有多项式核函数、径向基函数、多层感知器和动态核函数等。

由于核函数对算法的影响较大,故选择一个最好的核函数极为重要。这里以径向基函数作为SVM方法中的核函数建立推理试验模型。径向基函数的形式为:

Κ(x,xi)=exp(-x-xi22σ2)(9)

2.3 最小二乘SVM

最小二乘支持向量机(LSSVM)是采用二次规划方法代替传统的支持向量机来解决函数估计问题。与标准支持向量机不同的是,LSSVM在利用结构风险原则时,在优化目标中选取了不同的损失函数,即误差ξi(允许错分的松弛变量)的二范数。LSSVM的优化问题为:

min12w2+C12i=1lξi2(10)

其中:ξi为松弛变量;C为正则化参数。

用于函数估计的最小二乘SVM为:

y(x)=k=1ΝαkΚ(x,xk)+b(11)

采用等式约束可以将求解的优化问题转化成线性方程,大大减少算法的复杂性,另外,采用径向基核函数的最小二乘SVM仅需确定γ,σ两个参数(γ为可调参数,σ为核函数宽度系数),参数的搜索空间由标准SVM的三维降低到二维,极大地加快了建模速度。对γ,σ两个参数,通过模型评估,进行参数调节与优化来确定参数最优值,大大提高了预测的精度。

3 实例分析

将LSSVM算法应用于人民胜利渠灌区用水量的预测。首先选择观测资料构成样本数据集,然后利用LSSVM进行学习训练,最后根据训练后获得的参数进行预测。为确定最优的γσ2,采用交叉验证,赋予参数初值。首先给定参数初值分别为2和10 000,再赋予γσ2的起始运算值分别为0.16和497.87。经过初始运算,给定γσ2的运算范围,γ的运算范围为[0.16, 24.37],σ2的运算范围为[497.87, 1 484 131.59]。再通过模型评估,调节与优化来确定参数最优值,进行迭代搜索,得出γσ2分别为2.52和59.66的预测误差均方差的平均值最小,将其作为模型的参数。用1986-1992年的全年用水量对1993-2000年的人民胜利渠各月灌溉用水量进行了预测,结果见表1。

将LSSVM预测结果与灰色理论、BP网络的预测结果进行对比分析,结果见表1。从表1可以看出:用LSSVM预测的最大误差8.78%,平均误差4.90%;灰色理论预测的最大误差17.36%,平均误差11.12%;神经网络预测的最大误差14.79%,平均误差6.71%。说明LSSVM模型的预测性能良好。

在灌溉需水量预测中,用灰色预测模型进行用水量的预测,由于用水需求并不完全是指数关系,只用一个单一的指数模型来描绘一个时间数列的动态发展变化规律,其预测精度往往较低。而BP网络的训练则易陷入局部最优,并且基于经验风险最小化的训练容易产生训练误差变小,预测误差变大的过学习问题,因而预测精度也较低。表1的对比预测结果表明,最小二乘支持向量机基于结构风险最小化,具有较高的预测精度和良好的推广能力,预测结果优于灰色预测理论和人工神经网络。

4 结 语

最小二乘支持向量机(LSSVM)以统计学习理论作为坚实的理论依据,具有较好的泛化性能,其在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,在有限的信息条件下,可获得最好的学习能力和推广能力。基于结构风险最小化,克服了传统方法的过学习和陷入局部最小的问题,具有很强的泛化能力。最小二乘支持向量机较好地协调了模型的复杂化和泛化能力之间的关系,并且由于需确定的模型参数比标准支持向量机少,训练速度比标准支持向量机快。

将最小二乘支持向量机模型应用到灌区需水量预测,对灌区需水量进行模拟计算,用检验样本与灰色预测和基于RBF神经网络模型的预测进行了比较,用SVM预测的最大误差8.78%,平均误差4.90%;灰色理论预测的最大误差17.36%,平均误差11.12%;神经网络预测的最大误差14.79%,平均误差6.71%,结果表明,最小二乘支持向量机具有较高的预测精度和良好的推广能力,预测结果优于灰色预测理论和人工神经网络。

参考文献

[1]钱慕尧.灰色预测在作物需水量推算中的应用[J].农田水利与小水电,1993,(10):24-27.

[2]郭宗楼,白宪台,马学强.作物需水量灰色预测模型[J].水电能源科学,1995,13(3):186-191.

[3]张兵,袁寿其,成立,等.基于L-M优化算法的BP神经网络的作物需水量顶测模型[J].农业工程学报,2004,20(6):73-76.

[4]Cortes C,Vapnikc V.Support-vector Networks[J].MachineLearning,1995,(20):273-297.

[5]张立君,刘先珊.支持向量机模型在渗流监测中的应用[J].水电能源科学,2005,23(1):86-89.

[6]陈广洲,汪家权,胡淑恒.基于支持向量机的水资源开发利用评价模型[J].中国农村水利水电,2008,(11):1-7.

[7]陈永义,俞小鼎,高学浩,等.处理非线性分类和回归问题的一种新方法(Ⅰ)——支持向量机方法简介[J].应用气象学报,2004,15(3):345-353.

[8]冯汉中,陈永义.处理非线性分类和回归问题的一种新方法(Ⅱ)——支持向量机方法在天气预报中的应用[J].应用气象学报,2004,15(3):355-363.

[9]罗伟,习华勇.基于最小二乘支持向量机的降雨量预测[J].人民长江,2008,39(19):29-31.

上一篇:写我的傻事的作文500字下一篇:以父爱无声为题目的散文