机器学习模型评估

机器学习模型评估（精选7篇）

机器学习模型评估篇1

我们在建立模型之后，接下来就要去评估模型，确定这个模型是否有用。在实际情况中，我们会用不同的度量去评估我们的模型，而度量的选择取决于模型的类型和模型以后要做的事。

1.1 二分类评估

二分类模型的评估。

1.1.1 业界标准叫法

二分类评估；分类算法。

1.1.2 应用场景

信息检索、分类、识别、翻译体系中。

1.1.2.1 新闻质量分类评估对于新闻APP，其通过各种来源获得的新闻，质量通常良莠不齐。为了提升用户体验，通常需要构建一个分类器模型分类低质新闻和优质新闻，进而进行分类器的评估。

1.1.2.2垃圾短信分类评估垃圾短信已经日益成为困扰运营商和手机用户的难题，严重影响人们的生活、侵害到运营商的社会公众形象。构建二分类器模型对垃圾短信和正常短信进行分类，并进行二分类评估。

1.1.3 原理

1.1.3.1混淆矩阵混淆矩阵（Confusion Matrix）。来源于信息论，在机器学习、人工智能领域，混淆矩阵又称为可能性表格或错误矩阵，是一种矩阵呈现的可视化工具，用于有监督学习，在无监督学习中一般叫匹配矩阵。混淆矩阵是一个N*N的矩阵，N为分类（目标值）的个数，假如我们面对的是一个二分类模型问题，即N=2，就得到一个2*2的矩阵，它就是一个二分类评估问题。混淆矩阵的每一列代表预测类别，每一列的总数表示预测为该类别的数据的数目，每一行代表了数据的真实归属类别，每一行的数据总数表示该类别的实例的数目。

图1 2*2混淆矩阵图

阳性（P，Positive）：阴性（N，Negative）：

真阳性（TP，True Positive）：正确的肯定，又称“命中”（Hit）；被模型预测为正类的正样本。

真阴性（TN，True Negative）：正确的否定，又称“正确拒绝”（correct rejection），被模型预测为负类的负样本。

伪阳性（FP，false Positive）：错误的肯定，又称“假警报”（false alarm）；被模型预测为负类的正样本。

伪阴性（FN，false Negative）：错误的否定，又称“未命中”（miss）；被模型预测为正类的负样本。

灵敏度（Sensitivity）或真阳性率（TPR，Ture Negative Rate）：又称“召回率”（recall）、命中率（Hit Rate）。在阳性值中实际被预测正确所占的比例。TPR=TP/P=TP/(TP+FN)伪阳性率（FPR，false positive rate）：又称“假正类率”、“错误命中率”、“假警报率”。FPR=FP/(FP+TN)特异度（SPC，Specificity）或真阴性率：在阴性值中实际被预测正确所占的比例。SPC=TN/N=TN/(FP+TN)=1-FPR 假发现率(FDR,false discovery rate)：FDR=FP/(FP+TP)=1-TPR 准确度（ACC）：预测正确的数占样本数的比例。ACC=(TP+TN)/(P+N)阳性预测值(PPV,positive predictive value)或精度(precision)：阳性预测值被预测正确的比例。PPV=TP/(TP+FP)阴性预测值(NPV,negative predictive value)：阴性预测值被预测正确的比例。NPV=TN/(TN+FN)

图2 一个模型的2*2混淆矩阵图示例

我们可以看出，这个模型的准确度是88%，阳性预测值比较高而阴性预测值较低，对于灵敏度和特异度也是相同。这是因为我们选的阈值导致的，若我们降低阈值，这两对数值就会变得接近。1.1.3.2 ROC曲线 ROC曲线（Receiver Operation Characteristic Curve），中文名叫“接受者操作特征曲线”，其实是从混淆矩阵衍生出来的图形，其横坐标是Specificity（特异度），纵坐标是Sensitivity（灵敏度）。

图3 ROC曲线图

随着阈值的减小，更多的值归于正类，敏感度和特异度也相应增加。而那条45度线是一条参照线，ROC曲线要与这条参照线比较。如果我们不用模型，直接把客户分类，我们得到的曲线就是这条参照线，然而，我们使用了模型进行预测，就应该比随机的要好，所以，ROC曲线要尽量远离参照线，越远，我们的模型预测效果越好。ROC曲线反映了错误命中率和灵敏度之前权衡的情况，即灵敏度随着错误命中率递增的情况下，谁增长的更快，快多少。灵敏度增长的越快，曲线越往上屈，反映了模型的分类性能越好。当正负样本不平衡时，这种模型评价方式比起一般的精确度评价方式好处尤为明显。

ROC曲线快速爬向左上，表示模型准确预测数据。一般情况下，ROC曲线都应该处于参照线的上方。1.1.3.3AUC（ROC曲线下面积 Area Under ROC Curve）

图3 AUC曲线图

ROC曲线是根据与45度参照线比较判断模型的好坏，但这只是一种定性的分析，如果需要定量的计算判断，就用到了AUC，即：ROC曲线下面积。参考线的面积是0.5，ROC曲线越往左上方靠拢，AUC就越大（这里的面积是0.869），模型评估的性能越好，完美分类的AUC值是1。1.1.3.4基尼系数基尼系统经常用于分类问题，公式：Gini=2*AUC-1。基尼系数大于60%，就算好模型。1.1.3.5

LIFT（提升）

图3 LIFT提升图

LIFT=(TP/(TP+FP))/((TP+FN)/(TP+FN+FP+TN))LIFT越大，模型的预测效果越好。LIFT值应一直大于1，如果LIFT值等于1，模型就没有任何提升了。横轴是预测为正例的比例，即：(TP+FN)/(TP+FN+FP+TN)1.1.3.6

Gains（增益）

图3 Gains增益图

与LIFT类似，区别在于纵轴的刻度不同，横轴相同。Gains= TP/(TP+FP)=LIFT*((TP+FN)/(TP+FN+FP+TN))

1.1.3.7

K-S（Kolmogorov-Smirnov chart）图 K-S图是用来度量阳性和阴性分类区分程度的。若我们把总体严格按照阳性和阴性分成两组，则K-S值为100，如果我们是随机区分阳性和阴性，则K-S值为0。所以，分类模型的K-S值在0到100之间，值越大，模型表现越好。

1.2 多分类评估

多分类模型的评估。

1.2.1 业界标准叫法

多分类评估。

1.2.2 应用场景

1.2.2.1商品图片分类淘宝、京东等电商含有数以百万级的商品图片，“拍照购”等应用必须对用户提供的商品图片进行分类。

1.2.3 原理

同1.1.3节。

1.2.3.1 混淆矩阵如果有150个样本数据，这些数据分成3类，每类50个。分类结束后得到的混淆矩阵如下：

每一行之和为50，表示50个样本。第一行说明类1的50个样本有43个分类正确，5个错分为类2，2个错分为类3。第一行第一列中的43表示有43个实际归属第一类的实例被预测为第一类，同理，第二行第一列的2表示有2个实际归属为第二类的实例被错误预测为第一类。

1.2.4 不同应用场景使用的方法及参数

1.2.4.1 混淆矩阵

混淆矩阵一般只能用于分类输出模型中。

对于混淆矩阵，一般情况下，我们只关心其中一个定义度量。例如：在医药公司，一般会更加关心最小化误诊率，也就是高特异度。而在磨损模型中，我们更关心的是灵敏度。1.2.4.2ROC和AUC曲线 ROC曲线的一个应用场景是在人脸检测中，很多相关的研究或者企业评价他们的检测性能程度是通过ROC曲线来评定的。

ROC和AUC曲线常被用来评价一个二值分类器的优劣。

1.3 Spark模型预测

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。是一种计算框架。

1.3.1 业界标准叫法

Spark。

1.3.2 应用

1.3.2.1 腾讯社交广告平台—广点通广点通是最早使用Spark的应用之一。腾讯大数据精准推荐借助Spark快速迭代的优势，围绕“数据+算法+系统”这套技术方案，实现了在“数据实时采集、算法实时训练、系统实时预测”的全流程实时并行高维算法，最终成功应用于广点通pCTR投放系统上，支持每天上百亿的请求量。基于日志数据的快速查询系统业务构建于Spark之上的Shark，利用其快速查询以及内存表等优势，承担了日志数据的即席查询工作。在性能方面，普遍比Hive高2-10倍，如果使用内存表的功能，性能将会比hive快百倍。

1.3.2.2 Yahoo—Audience Expansion（读者扩张）Yahoo将Spark用在Audience Expansion中的应用。Audience Expansion是广告中寻找目标用户的一种方法：首先广告者提供一些观看了广告并且购买产品的样本客户，据此进行学习，寻找更多可能转化的用户，对他们定向广告。Yahoo采用的算法是logistic regression。同时由于有些SQL负载需要更高的服务质量，又加入了专门跑Shark的大内存集群，用于取代商业BI/OLAP工具，承担报表/仪表盘和交互式/即席查询，同时与桌面BI工具对接。目前在Yahoo部署的Spark集群有112台节点，9.2TB内存。1.3.2.3 淘宝—搜索和广告业务阿里搜索和广告业务，最初使用Mahout或者自己写的MR来解决复杂的机器学习，导致效率低而且代码不易维护。淘宝技术团队使用了Spark来解决多次迭代的机器学习算法、高计算复杂度的算法等。将Spark运用于淘宝的推荐相关算法上,同时还利用Graphx解决了许多生产问题，包括以下计算场景：基于度分布的中枢节点发现、基于最大连通图的社区发现、基于三角形计数的关系衡量、基于随机游走的用户属性传播等。

1.3.2.4 优酷土豆—视频推荐和广告业务优酷土豆在使用Hadoop集群的突出问题主要包括：第一是商业智能BI方面，分析师提交任务之后需要等待很久才得到结果;第二就是大数据量计算，比如进行一些模拟广告投放之时，计算量非常大的同时对效率要求也比较高，最后就是机器学习和图计算的迭代运算也是需要耗费大量资源且速度很慢。最终发现这些应用场景并不适合在MapReduce里面去处理。通过对比，发现Spark性能比MapReduce提升很多。首先，交互查询响应快，性能比Hadoop提高若干倍;模拟广告投放计算效率高、延迟小(同hadoop比延迟至少降低一个数量级);机器学习、图计算等迭代计算，大大减少了网络传输、数据落地等，极大的提高的计算性能。目前Spark已经广泛使用在优酷土豆的视频推荐(图计算)、广告业务等。

1.3.3 原理

1.3.3.1Spark生态圈如下图所示为Spark的整个生态圈，最底层为资源管理器，采用Mesos、Yarn等资源管理集群或者Spark自带的Standalone模式，底层存储为文件系统或者其他格式的存储系统如Hbase。Spark作为计算框架，为上层多种应用提供服务。Graphx和MLBase提供数据挖掘服务，如图计算和挖掘迭代计算等。Shark提供SQL查询服务，兼容Hive语法，性能比Hive快3-50倍，BlinkDB是一个通过权衡数据精确度来提升查询晌应时间的交互SQL查询引擎，二者都可作为交互式查询使用。Spark Streaming将流式计算分解成一系列短小的批处理计算，并且提供高可靠和吞吐量服务。

图4 spark生态圈图

1.3.3.2 Spark运行框架

图5 spark运行框架图

Spark的运行框架首先有集群资源管理服务（Cluster Manager）和运行作业任务节点（Worker Node），然后就是每个应用的任务控制节点Driver和每个机器节点上有具体任务的执行进程。与MR计算框架相比，Executor有二个优点：一个是多线程来执行具体的任务，而不是像MR那样采用进程模型，减少了任务的启动开稍。二个是Executor上会有一个BlockManager存储模块，类似于KV系统(内存和磁盘共同作为存储设备)，当需要迭代多轮时，可以将中间过程的数据先放到这个存储系统上，下次需要时直接读该存储上数据，而不需要读写到hdfs等相关的文件系统里，或者在交互式查询场景下，事先将表Cache到该存储系统上，提高读写IO性能。另外Spark在做Shuffle时，在Groupby，Join等场景下去掉了不必要的Sort操作，相比于MapReduce只有Map和Reduce二种模式，Spark还提供了更加丰富全面的运算操作如filter,groupby,join等。1.3.3.3 Spark与hadoop

 Hadoop有两个核心模块，分布式存储模块HDFS和分布式计算模块Mapreduce  spark本身并没有提供分布式文件系统，因此spark的分析大多依赖于Hadoop的分布式文件系统HDFS  Hadoop的Mapreduce与spark都可以进行数据计算，而相比于Mapreduce，spark的速度更快并且提供的功能更加丰富 1.3.3.4 Spark运行流程

图5 spark运行流程图

1.构建Spark Application的运行环境，启动SparkContext。2.SparkContext向资源管理器（可以是Standalone，Mesos，Yarn）申请运行Executor资源，并启动StandaloneExecutorbackend。3.Executor向SparkContext申请Task。4.SparkContext将应用程序分发给Executor。

5.SparkContext构建成DAG图，将DAG图分解成Stage、将Taskset发送给Task Scheduler，最后由Task Scheduler将Task发送给Executor运行。

6.Task在Executor上运行，运行完释放所有资源。1.3.3.5 Spark运行特点

1.每个Application获取专属的executor进程，该进程在Application期间一直驻留，并以多线程方式运行Task。这种Application隔离机制是有优势的，无论是从调度角度看（每个Driver调度他自己的任务），还是从运行角度看（来自不同Application的Task运行在不同JVM中），当然这样意味着Spark Application不能跨应用程序共享数据，除非将数据写入外部存储系统。2.Spark与资源管理器无关，只要能够获取executor进程，并能保持相互通信就可以了。

3.提交SparkContext的Client应该靠近Worker节点（运行Executor的节点），最好是在同一个Rack里，因为Spark Application运行过程中SparkContext和Executor之间有大量的信息交换。4.Task采用了数据本地性和推测执行的优化机制。

1.4 回归评估

对回归模型的评估。

1.4.1 业界标准叫法

回归模型评估。

1.4.2 应用

1.4.3 原理及方法

1.4.3.1

均方根误差（Root Mean Squared Error，RMSE）RMSE是一个衡量回归模型误差率的常用公式。然而，它仅能比较误差是相同单位的模型。

1.4.3.2

相对平方误差（Relative Squared Error，RSE）与RMSE不同，RSE可以比较误差是不同单位的模型。

1.4.3.3

平均绝对误差（Mean Absolute Error，MAE）MAE与原始数据单位相同，它仅能比较误差是相同单位的模型。量级近似与RMSE，但是误差值相对小一些。

1.4.3.4

相对绝对误差（Relative Absolute Error，RAE）

1.4.3.5

相对绝对误差（Coefficient of Determination）

决定系数(R2)回归模型汇总了回归模型的解释度，由平方和术语计算而得。R2描述了回归模型所解释的因变量方差在总方差中的比例。R2很大，即自变量和因变量之间存在线性关系，如果回归模型是“完美的”，SSE为零，则R2为1。R2小，则自变量和因变量之间存在线性关系的证据不令人信服。如果回归模型完全失败，SSE等于SST，没有方差可被回归解释，则R2为零。

机器学习模型评估篇2

在机器人足球比赛中,态势评估系统通过传感器或其它途径获得球场上的信息形成当前球场的特征向量,并以此作为态势评估框架的输入项。通过分析和处理,输出对当前赛场态势的合理评估结果。态势评估结果的实时性和准确性,直接影响策略变更的有效性,影响球队战法的实施及综合实力的发挥,体现机器人足球的智能水平。

二十多年来,态势评估在军事、网络和语音图像等领域中主要理论和技术成果有:态势评估时间推理方法、用于军事态势评估的分布式人工智能(DAI)协作知识模型、用于态势特征和态势匹配的条件代数方法、模板匹配算法、计划识别理论、贝叶斯网络方法、不确定性因果推理、神经网络、黑板结构、人工势场等方法。目前国内关于态势评估的研究主要以信息融合、人工智能、不确定性信息处理为主,主要采用计划识别、模糊推理、模板匹配、贝叶斯网络等技术为主,还有学者提出一些新颖的思路,如人工势场、集对分析等。这些研究成果从不同的侧重,但距离实用化的距离还很远[1]。

针对赛场态势评估存在的实时有效性问题,本文提出一种基于隐马尔可夫模型(Hidden Markov Model,HMM)的机器人足球赛场态势评估模型。实验表明态势评估的结果较好的满足了实时性及准确性要求,可以为决策层策略的变更提供更加客观有效的依据。

1赛场态势评估模型

在机器人足球比赛中,赛场态势评估模型通过平台获得球场上各种信息参数,经过预处理提取赛场态势特征,量化后作为态势评估框架的输入,通过分析和处理,输出对当前赛场态势的合理评估结果,提供给策略决策层。

1.1态势要素

考虑到机器人足球状态空间的复杂性,如果选取的评判因素过多,将导致状态空间的爆炸。通过融入专家的经验和实际的比赛分析验证,确定了影响比赛态势的7个关键因素[2—4]如表1。

1.2态势表示

在5 vs 5机器人足球仿真比赛中,通常将策略分为五类:加强进攻、进攻、攻守平衡、防守、加强防守。态势的划分是以策略的划分为依据的,我们定义当前赛场应该采取的最佳策略所对应的态势为当前态势,例如当前赛场应该采取的最佳策略是加强进攻,那么当前的态势就是非常有利。

在机器人足球比赛中,赛场的五个态势分别与赛场的五个策略相对应,每个策略都有相应的赛场布阵打法也就是场上队形,策略、态势和队形的对应关系如表2所示。比赛的实质就是根据态势变化调整策略,比赛的关键是要实时准确地调整比赛策略来控制场上队形,而比赛策略的调整依据赛场态势的变化,赛场态势变化的获取通过态势评估系统,由此态势评估系统在比赛中起着举足轻重的作用。

2基于HMM的赛场态势评估

2.1赛场态势的HMM模型

HMM可以用一个五元组来描述[5]:

λ=(N,M,π,A,B)。

其中,隐含状态数目N,可观测值数目M,初始态势概率矩阵π,态势转移矩阵A以及观测值概率矩阵B。

结合机器人足球赛场态势,使用HMM建模,首先确定两个状态集合数N,M,然后确定HMM的三个矩阵参数π,A,B。

通常足球机器人赛场态势有N=5个,用θ={θ1,θ2,…,θ5}表示,则机器人足球赛场态势之间的转移构成了一个全连接互转Markov链如图1所示。我们选取影响比赛态势的关键因素M=7个(如表1),组成赛场状态为V={V1,V2,…,Vm,…,V7},1≤m≤7,而每一个状态qt对应的是一个随机观测序列为Ot={O1,O2,…,Om,…,O7},1≤m≤7,显然Om是特征信息Vm的实时量化表达值,由此采用一个离散结构的HMM建模。

定义一个三元组(π,A,B),其中初始状态矩阵π,表示计算初始赛场处于各个态势的概率矩阵π=(π1,π2,…,πi,…,π5),其中πi=p(q1=θi),1≤i≤5。态势转换矩阵A,即赛场态势之间转换的概率,aij表示在t时刻态势为θi,那么到t+1时刻态势为θj的概率,即aij=p(qt+1=θj|qt=θi),1≤i,j≤5。观察矩阵B,即赛场处于某一个特定态势的时候,感知到关键因素的概率, Bnm表示在时刻t赛场处于qn状态感知到Vm的概率,即,1≤m≤7,1≤n≤5。

这样,就构建了赛场态势和各特征因素之间的各状态互转的离散HMM,λ=(π,A,B)。根据t时刻感知的特征因素序列Ot={O1,O2,…,O7}和HMM模型参数,就可以计算出当前赛场处于各种态势的概率即为赛场态势评估结果,也就是在t时刻赛场态势的分布为rt={rt(i)},1≤i≤5其中。

2.2HMM算法优化

一般来讲建立HMM模型,采用三种比较成熟的算法来解决HMM的三个基本问题[6]::

(1) 前向—后向算法解决态势评估问题,也就是概率p(o|λ)的计算问题:给定观察序列O=O1,O2,…,OT和模型参数λ=(π,A,B),来有效地计算给定模型的观察序列的概率p(o|λ)。

(2) Viterbi算法解决解码问题,也就是最佳状态链的确定问题:给定观察序列O=O1,O2,…,OT和模型参数λ=(π,A,B),选择另一个状态序列Q+=q+1,q+2,…,q+T,使它在当前赛场态势下能最好地解释观察情况。

(3) Baum-Welch算法解决学习问题,也就是HMM的参数优化(或参数估计)问题:调整模型参数λ=(π,A,B),使p(O|λ)达最大。这是HMM在应用中的关键问题,与前两个问题相比,这也是最困难的一个问题。

但是,在机器人足球赛场环境下,Baum-Welch算法还存在着严重的上、下溢问题。这是因为在前馈和反馈过程中计算前馈变量式(1)和反馈变量式(2)时,它们是由多个小于1的实数连乘得到的,所以随着时间的推移,两个变量的值将有可能趋于0。但计算机所能表达的数值范围毕竟有限,当状态输出概率取较大或较小的数量时,累积计算的结果可能超出计算机浮点数范围,而产生上、下溢问题。但我们机器人足球比赛过程中又不允许人工介入,为解决这一问题采用自动计算比例因子算法[7]与Baum-Welch算法相结合。

at(i)=P(O1,O2,…,OT,qt=θi|λ),1≤t≤T (1)

βt(i)=P(Ot-1,Ot-2,…,OT|qt=θi,λ),1≤t≤T-1 (2)

依据参数估算公式[8]为

$\hat{λ} = \frac{\sum_{k = 1}^{Κ} [\sum_{B^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) V^{(k)} (i, j, t)]}{\sum_{k = 1}^{Κ} [\sum_{D^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) W^{(k)} (i, j, t)]} (3)$

式(3)中, $\hat{λ}$ 为迭代计算模型参数的估算值,它可以是HMM的ai,aij或者是态势转移概率p的均值或方差,K为训练样本总数,各元素右上角的(k)代表该元素对应第k个训练样本,V(k)(i,j,t)与W(k)(i,j,t)都是前次迭代值 $\hat{λ}$ 的函数,B(k)与D(k)分别代表相应的求和空间。

为了描述自动比例因子计算算法,将上式写

$\hat{λ} = \frac{\sum_{k = 1}^{Κ} v^{(k)} (i, j)}{\sum_{k = 1}^{Κ} u^{(k)} (i, j)}$ (4)

式(4)中

$\begin{array}{l} v^{(k)} (i, j) = \sum_{B^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) V^{(k)} (i, j, t) = \\ \sum_{B_{Ι}^{(k)}} \sum_{t = 1}^{Τ^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) V^{(k)} (i, j, t) (5) \end{array}$

$\begin{array}{l} u^{(k)} (i, j) = \sum_{B^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) V^{(k)} (i, j, t) = \\ \sum_{D_{Ι}^{(k)}} \sum_{t = 1}^{Τ^{(k)}} α_{t - 1}^{(k)} (i) β_{t}^{(k)} (j) V^{(k)} (i, j, t) (6) \end{array}$

B $_{Ι}^{(k)}$ =B(k)-{t|1≤t≤T(T)},D $_{Ι}^{(k)}$ =D(k)-{t|1≤t≤T(k)} (7)

为了防止上、下溢现象,在计算比例因子时,要考虑所有将被修整的量,比例因子φt的计算式为

φt= $\sum_{i, j = 1}^{Ν} v (i, j) + \sum_{i, j = 1}^{Ν} u (i, j) + \sum_{W \in Η} \sum_{i = 1}^{Ν} α_{t}^{(w)} (i)$ -1, $Η \in {w | 1 \leq w \leq k, Τ^{(w)} > t} (8)$

式(8)中v(i,j)和u(i,j)分别用φt-1正规化 $\tilde{v}$ (i,j)和 $\tilde{u}$ (i,j)得到,

$v (i, j) = φ_{t} \tilde{v} (i, j) = φ_{t} \sum_{Τ^{(k)} < t} \hat{v}^{(k)} (i, j) (9)$

$u (i, j) = φ_{t} \tilde{u} (i, j) = φ_{t} \sum_{Τ^{(k)} < t} \hat{u}^{(k)} (i, j) (10)$

其中 $\hat{v}$ (i,j)和 $\hat{u}$ (i,j)分别相当于用φt,t=1,...,t-2正规化后的v(k)(i,j)和u(k)(i,j)。在每次不仅用φt修整 $\hat{a}$ (·),同时也应修整v(i,j)和u(i,j)。最后计算

$\bar{λ} = \frac{v (i, j)}{u (i, j)}$ (11)

2.3HMM参数训练

机器人足球态势评估系统采用离散的隐马尔可夫模型,具体实现步骤如下[9]:

首先要建立各态势的HMM,每种态势用具有5种隐状态性质的7个关键因素量化值来描述;

其次收集整理训练数据形成数据库:赛场状态信息必须经过预处理后才能作为隐马尔可夫模型的训练数据,预处理主要包含赛场特征即关键因素的提取及关键因素的量化。其中关键因素的量化是用7个离散的量化值来表示各态势的特征,这样简化了赛场状态评估的复杂度,计算量小,同时也便于实现;

然后训练隐马尔可夫模型:模型训练是基于隐马尔可夫方法的重要步骤之一,它可以使模型参数最为理想地适应观察到的赛场状态训练数据。将训练集中的各个矢量序列量化为观察值序列,利用Baum-welch算法与自动计算比例因子算法相结合,逐步调整离散HMM系统的模型参数,以使得模型产生观察序列的概率不断增加并达到一个极大值点。

最后测试评估模型:赛场状态评估系统采集到平台输出信号经数据预处理,求解特征向量获取赛场7个关键因素值并量化组成一个序列,然后分别采用各种态势训练得到的HMM进行概率推理,得到各种赛场状态对应的HMM的概率值,HMM对应的概率最大的态势即为系统当前赛场状态,验证评估结果的准确性。

直观地来讲,HMM训练是采集某赛场态势的系统输出源信息,通过预处理、特征向量(关键因素)采集、特征向量的量化、再将量化后特征向量利用Baum-Welch算法和自动计算比例因子算法相结合训练HMM,得到该态势对应的HMM如图2所示。

2.4赛场态势评估处理流程

赛场态势提取是利用已经训练好的模型,通过HMM的求解得到的,可分为特征提取、态势划分和态势提取三个部分如图3所示。赛场态势评估系统采集到平台输出信号经数据预处理,求解特征向量获取赛场7个关键因素并量化组成一个序列,然后分别采用各种态势训练得到的HMM进行概率推理,得到各种赛场态势对应的HMM的概率值,HMM对应的概率最大的态势即为系统当前赛场态势。

3实验

基于HMM的机器人足球赛场态势评估,在每一个时间周期内,系统获取赛场信息集,得到大量待处理数据,然后进行预处理,提取关键因素,并对关键因素进行量化;合并经过量化的赛场态势关键因素,利用训练好的HMM进行当前态势的评估,得到基于概率的态势分类结果,数值代表当前赛场态势属于对应态势的概率,取最大值对应的态势作为当前赛场的态势评估结果。

此项实验中,我们要验证基于隐马尔可夫模型建立的态势评估模型评估出的结果与人们观看不比赛得出的结果有多少误差。如果误差很小,那么我们可以认为该模型对赛场态势的评估真实有效,可以为高层决策提供正确的建议。

在MiroSot5VS5仿真平台下分别用2006年世界强队-武科DEMO版作为黄队,西北工业大学基于HMM的态势评估版本作为蓝队进行比赛并录像。比赛进行到某时刻的HMM数据,包括模型输入数据即七个关键因素和模型输出数据即态势评估结果,与赛后观看录像人工统计的相应数据相比较,经过数据分析来验证态势评估结果的有效性,如表3所示。

为了进一步验证态势评估结果的有效性,我们又组织了53场比赛,每场比赛只随机抽取一个时间节点,总结这54次不同场次不同时间节点的HMM数据分别与我们赛后的客观评价相比较,结果表明主要存在关键因素微小误差,对态势分析结果的准确率达98.15%,态势评估结果的准确性得到了保证,这将为决策层进行策略选择起到很重要的基础性作用。

另外,该模型采用了离散的隐马尔可夫模型,一个明显的优点就是计算简单,运算周期短。比赛平台每1/60 s提供一次源信息,策略运行中每1/60 s(16.7 ms)内都可以自动计算出每个关键因素并量化。而HMM的运算周期,即从七个关键因素量化值输入到态势评估值输出的时间为252 ms至347 ms,取最大值347 ms也远小于通常情况下态势评估的计算周期5/6 s(833.3 ms),模型系统的实时性得到了保证。

4结论

赛场态势评估是机器人足球比赛系统重要的决策依据。态势评估的准确性决定球员与决策策略之间的吻合程度,反映策略变更的有效性,体现球队综合实力的发挥。态势评估的实时性决定着该模型的生存空间,是态势评估准确性的前提条件,而且随着赛场条件的开放,其要求会越来越高。

本文以机器人足球比赛为应用背景展开了基于HMM的态势评估研究。结果表明,基于HMM的机器人足球赛场态势评估系统能较好地满足实时性和准确性的要求,可以为球场上对应策略的变更提供及时、可靠的依据。

参考文献

[1]黄玺瑛,赵定海.态势评估研究现状初探.科协论坛,2009;(4)(下):94—95

[2]王斌.机器人足球比赛态势分析与性能评测系统研究.西安:西北工业大学硕士研究生学位论文,2005

[3]沈阳.机器人足球赛场态势评估模型及方法研究.西安:西北工业大学硕士研究生学位论文,2009

[4]车鸣.基于人工免疫机理的赛场态势评估模型.西安:西北工业大学硕士研究生学位论文,2011

[5] Arnes A,Vigna V F,Kemmerer G R.A.Using hidden markov mod-els to evaluate the risk of intrusions.In:Proceedings of the Interna-tional Symposium on the Recent Advances in Intrusion Detection(RAID 2006):Springer-Verlag,2006:145—164

[6] Rabiner L R.A tutorial on hidden Markov models and selected appli-cations in speech recognition.In:Proceedings of the IEEE.1989;77(2):257—286

[7]王玉洁.基于人工心理的情感建模及人工情感交互技术研究.北京:北京科技大学博士学位论文,2007

[8]贾宾,朱小燕,罗予频,等.消除溢出问题的精确Baum-Welch算法.软件学报,2000;11(5):707—710

机器学习模型评估篇3

[关键词]机器学习；生成式模型；判别式模型

充分理解和掌握生成式模型（Discriminative Model）和判别式模型（Generative Model）的区别和关系在机器学习算法分析方面是很有必要的。数据挖掘分类技术中统计模型被分为产生式和判别式两大类，这两类模型是近几年数据挖掘和机器学习的研究热点之一。生成式模型学习的是联合概率，主要侧重各类数据的分布情况；判别式模型学习的是条件概率，主要侧重各类数据的分类边界。两类方法侧重点不同，表现出的分类性能也不同。为了充分利用两种分类器各自的优势，扬长避短，越来越多的学者们开始研究生成式和判别式的混合分类模型，解决单类分类器不能解决、难以解决或者难以有效解决的分类问题[1]。

1、模型

在生成式模型中通过统计来建模，再通过bayes公式来判断类标。通过训练集，计算联合概率。由联合概率公式有：

而判别式模型是一种直接对条件概率建模的方法，直接通过训练样本估计，确定决策边界。当获得感兴趣的条件概率时，建模也就完成。

2、方法比较

在机器学习中，一般将分类问题分为两个阶段来进行：推理阶段和决策阶段。推理阶段的主要任务是使用训练数据学习一个用于判断或预测的模型；而决策阶段的主要任务是根据后验概率来给输入分配一个最优类标号。而判别式模型可将以上两步合二为一来解决分类问题。该方法主要是通过学习一个判别函数将输入变量X映射为决策。在实际中，求解决策问题的方法主要有3种[2]：

第一种：对每一个类，先求其类条件概率密度和相应的类先验概率。然后根据bayes公式来求类后验概率：

同样的，我们可以建模联合概率分布，再归一化来求后验概率。这种隐式或显式方式建模输入和输出概率分布的方法被称为生成式模型。

第二种：先求解后验概率的推理问题，在使用决策理论给每一个输入分配一个类标号。这种直接建模后验概率的方法被称为判别式模型。

第三种：找一个判别函数f（x），直接将每一个输入x映射到一个类标号。如在两类的情形中，f（□）是一个二值函数，f=0代表y1类，f=1代表类y2

这三种方法各有优点。方法（1）要求最多，涉及到求解的参数较多，如的计算x和yk的联合概率p（x，yk）。一方面，在实际应用中x通常是高维的，因而需要大量的训练样本才能求得合理准确率的类条件概率密度。另一方面，先验概率的计算p（yk）通常是简单的统计每一个类在训练样本中所占的比例。第一种方法的主要优点是数据的边缘密度p（x）可由（2）式获得。该方法在离群值检测或异常检测很有效。

在很多情形下，类条件概率与后验概率的相关性极小。此时，第二种方法通常直接面对分类决策，建模和计算后验概率，而不是费力地计算条件概率和先验分布获取后验概率。

第三种方法相对简单，是通过训练数据求解一个判别函数，该函数直接将输入映射到类标号。该方法将推理和决策步骤合为一个学习问题，从而不再参考后验概率。

机器学习中监督学习回归模型属于第三种方法。该方法利用训练集直接对条件概率建模，如logistic回归就利用对建模，g（z）是sigmoid函数[3]。对于分两类的问题，要根据样本的特征来区分类1（y=1）和类2（y=2）。给定这样的一种数据集，回归模型会试图找到一条直线也就是决策边界，来区分类1与类2。对于新来的样本，回归模型会根据这个新样本的特征计算这个样本会落在决策边界的哪一边，从而得到相应的分类结果。

生成式模型和决策式模型是区别于回归的另一种建模方式：根据训练集中的类1的样本，建立类1的模型；根据训练集中的类2的样本，建立类2的模型。对于新来的测试样本，让该样本与类1的模型匹配看概率有多少，与类2的模型匹配看概率有多少，哪一个概率大则该样本就属于那一个分类。

判别式模型又称为条件概率模型，是直接对条件概率建模。常见的判别式模型有线性判别分析、支持向量机SVM、神经网络等。生成式模型则会对x和y的联合分布建模，然后通过贝叶斯公式来求得，然后选取使得最大的yi，即：

；

常见的生成式模型有隐马尔可夫模型HMM、朴素贝叶斯模型、高斯混合模型GMM、LDA等。

3、结论

判别式模型寻找不同类别之间的最优分类面，反映的是异类数据之间的差异[4]；生成式模型对后验概率建模，从统计的角度表示数据的分布情况，能够反映同类数据本身的相似度。从数据集角度，判别式模型适合于固定数据集样本；而生成式模型更适合于动态数据集样本。当数据集发生改变时，判别式模型将重新计算决策边界，而生成式模型只需要修正后验概率。生成式模型适合于增量学习。在算法效率上，生成式模型比判别式模型收敛更快。由生成式模型可以得到判别式模型，但从判别式模型不能获得生成式模型。

参考文献

[1]江雪莲.产生式/判别式混合分类方法研究.硕士学位论文，2011（2）.

[2]Christopher M. Bishop. Pattern Recognition And Machine Learning. Springer 2007.

[3]http：//www.cnblogs.com/fanyabo/p/4067295.html.

[4]http：//www.leexiang.com/discriminative-model-and-generative-model.

[5]http：//blog.csdn.net/wolenski/article/details/7985426.

机器设备评估报告_实务案例篇4

评估基准日：2009年11月30日

评估报告提交日期：2009年12月30日

（共三册）

第一册

资产评估报告书

深圳市天健国众联资产评估土地房地产估价有限公司

公司地址：深圳市深南东路2019号东乐大厦10楼1008号

电

话： 25132315 25132260 25132267 25132276

传

真： 25132275

邮政编码： 518002 网

址：件）。

法定??拳

资产评估报告书的声明......................................................1 资产评估报告书摘要........................................................3 资产评估报告书............................................................5

一、委托方及被评估单位....................................................5

二、评估目的..............................................................8

三、评估报告使用者........................................................8

四、评估范围和对象........................................................8

五、评估基准日............................................................9

六、价值类型及定义........................................................9

七、评估依据..............................................................9

八、评估方法.............................................................10

九、评估程序实施过程和情况...............................................12

十、评估假设及前提条件...................................................13

十一、评估结论...........................................................15

十二、特别事项说明.......................................................16

十三、评估报告使用限制说明...............................................18

十四、本次评估报告提交日期...............................................19

十五、资产评估报告书的备查文件...........................................20 估?1毥R? 1

华孚色纺股份有限公司：

受贵公司委托，本公司对贵公司拟进行资产收购（机器设备）事宜所涉及的宁

海华联纺织有限公司的设备于2009年11月30日之市场价值进行了评定估算，并形成了资产评估报告书。在资产评估报告书载明的评估目的及价值定义、前提条件下，我们对资产评估结果承诺如下，并承担相应的法律责任：

一、本资产评估报告中的分析、意见和结论是我们公正的专业分析、意见和结论，仅在评估报告设定的评估假设及前提条件下成立。

二、我们在执行本资产评估业务中，遵循相关法律法规和资产评估准则，恪守独立、客观和公正的原则；根据我们在执业过程中收集的资料，评估报告陈述的内容是客观的，并对评估结论合理性承担相应的法律责任。

三、遵守相关法律、法规和资产评估准则，对评估对象价值进行估算并发表专业意见，是注册资产评估师的责任；提供必要的资料并保证所提供资料的真实性、合法性和完整性，恰当使用评估报告是委托方和相关当事人的责任。

四、注册资产评估师在评估对象中没有现存的或预期的利益，同时与委托方和相关当事方没有个人利益关系，对委托方和相关当事方不存在偏见。

五、注册资产评估师及其所在评估机构具备本评估业务所需的执业资质和相关专业评估经验；评估过程中没有运用其他评估机构或专家的工作成果；注册资产评估师及其业务助理人员已对评估对象所涉及的资产进行了必要的核实。

六、注册资产评估师对被评估资产的法律权属状况给予了必要的关注，但不对被评估资产的法律权属做任何形式的保证。

七、注册资产评估师执行资产评估业务的目的是对评估对象价值进行估算并发表专业意见，并不承担相关当事人决策的责任。评估结论不应当被认为是对评估对象可实现价格的保证。

八、委托方及资产占有方提供给评估机构和评估人员的各项依据等与评估相关的所有资料是编制本报告的基础。委托方及资产占有方对其所提供资料的可靠性、憏ǒE鞪?銵燃許Ⅵ乺B?lw1毱7? 2 真实性、准确性、完整性负责。如委托方及资产占有方提供的资料中存在虚假或隐

瞒事实真相等行为，本评估结果无效，由此引起的相关后果由委托方及资产占有方负责，本公司不承担相关的法律责任。

九、资产占有方存在的可能影响资产评估结论的有关事项，在委托评估时未作特殊说明、而评估人员根据专业经验一般不能获悉的情况下，评估机构及评估人员不承担相关责任。

十、本评估报告必须完整使用。报告使用者在使用本报告的评估结论时，须关注评估报告特别事项说明对评估结论的影响及评估报告的使用限制。

十一、本评估报告依照资产评估法律法规的有关规定发生法律效力。本评估报告只能用于评估报告载明的评估目的和用途，评估报告只能由评估报告载明的评估报告使用者使用。

十二、未征得本评估机构书面同意，评估报告的全部或部分内容不得被摘抄、引用或披露于公开媒体，法律、法规规定以及相关当事方另有约定的除外。

€ 3 深国众联评字(2009)第2-21235号

谨提请本报告书阅读者和使用者注意

本摘要内容均摘自深国众联评字（2009）第2-21235号资产评估报告书，欲了解本评估报

告项目的全面情况，应认真阅读资产评估报告书全文。本摘要单独使用可能会导致对评估结论的误解或误用。

深圳市天健国众联资产评估土地房地产估价有限公司接受华孚色纺股份有限公司

(以下简称“华孚色纺”)的委托，根据国家有关资产评估的规定，本着客观、独立、公正、科学的原则，按照公认的资产评估方法，对华孚色纺股份有限公司拟进行资产收购（机器设备）事宜所涉及的宁海华联纺织有限公司的设备于2009年11月30 日之市场价值进行了评估，被评估单位对其所提供资料的真实性、合法性、完整性承担责任，注册资产评估师是在遵守相关法律、法规和资产评估准则的基础上对评估对象价值进行估算并发表专业意见。本公司评估人员按照必要的评估程序对委托评估的资产实施了实地查勘、市场调查与询证，对委估资产在评估基准日2009年11月30日所表现的市场价值作出了公允反映。现将评估结果报告如下：

(一)委托方：华孚色纺股份有限公司（华孚色纺）。

被评估单位：宁海华联纺织有限公司（宁海华联）。

(二)评估目的

本次评估是为华孚色纺股份有限公司拟进行资产（设备）收购事宜所涉及的宁海华联纺织有限公司的设备于2009年11月30日之市场价值提供价值参考意见。

(三)评估范围和对象

本次评估范围和对象为委托方委托评估的一批设备。

1、委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的部分机器设备和电子设备；

2、委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的控股（持股比......20 估卑 4 例100%）子公司宁海县华兴纺织原料有限公司的部分机器设备和电子设备。

(四)评估基准日

本项目资产评估基准日为2009年11月30日。

(五)经济行为文件

华孚色纺股份有限公司与我司签订的《评估委托合同》。

(六)评估方法本次评估对纳入评估范围内的设备采用成本法进行评估。

(七)价值类型

本次评估的价值类型为市场价值。市场价值是指自愿买方和自愿卖方在各自理性行事且未受任何强迫的情况下，评估对象在评估基准日进行正常公平交易的价值估计数额。

(八)评估结论

纳入本次资产评估范围的宁海华联纺织有限公司设备于二零零九年十一月三十日账面原值为172,192,572.48人民币元，评估值为112,361,205.00人民币元。增值额-59,831,367.48人民币元，增值率-34.75%。账面净值27,200,764.01人民币元，评估值27,820,492.75人民币元，增值额619,728.74人民币元，增值率2.28%。

其中：

宁海县华兴纺织原料有限公司设备账面原值为22,289,437.20人民币元，评估值为18,186,760.00人民币元。增值额-4,102,677.20人民币元，增值率-18.41%。设备账面净值5,558,110.39人民币元，评估值5,591,834.00人民币元，增值额33,723.61 人民币元，增值率0.61%。

应予说明的是，本资产评估报告书“

十二、特别事项说明”中所述事项可能对资

产评估结果产生影响，鉴于目前条件的限制，我们无法对其可能产生的影响进行量化，需提请资产评估报告书使用者特别关注。

按照有关资产评估现行规定，本评估结论有效使用期限为一年，即自二○○九年十一月三十日起至二○一○年十一月二十九日止。

福?

2、委托评估的资产（设备）为??Y? 5 深国众联评字(2009)第2-21235号

本公司接受贵公司的委托，根据国家有关资产评估的规定，本着客观、独立、公

正、科学的原则，按照公认的资产评估方法，对贵公司拟进行资产收购（机器设备）

事宜所涉及的宁海华联纺织有限公司的设备于2009年11月30日之市场价值进行了评估，被评估单位对其所提供资料的真实性、合法性、完整性承担责任，注册资产评估师是在遵守相关法律、法规和资产评估准则的基础上对评估对象价值进行估算并发表专业意见。本公司评估人员按照必要的评估程序对委托评估的资产实施了实地查勘、市场调查与询证，对委估资产在评估基准日2009年11月30日所表现的市场价值作出了公允反映。现将评估过程报告如下：

（一）委托方概况

名

称：华孚色纺股份有限公司(以下简称“华孚色纺”)注册号：***（1-1）

住

所：淮北市濉溪路庆相桥

法定代表人姓名：孙伟挺

注册资本：贰亿叁仟伍佰壹拾壹万壹仟圆整

实收资本：贰亿叁仟伍佰壹拾壹万壹仟圆整

公司类型：股份有限公司（上市）

经营范围：许可经营项目：棉花采购、加工。一般经营项目：纺织品、针织品、印染品、服装及其相关产品的制造、销售：纺织科学研究、信息咨询、代理服务；本企业自产产品和技术出口及本企业生产所需的原辅材料、仪器仪表、机械设备、零配件和技术进出口（国家限定公司经营和国家禁止进出口的商品及技术除外）。有个人利益关系，对委?1殮k? 6 成立日期：2000年10月31日

（二）被评估单位概况

1、公司基本情况

名

称：宁海华联纺织有限公司（以下简称“宁海华联”）

注册号：***（1/1）

住

所：城关纺织路146号

法定代表人姓名：胡永峰

注册资本：5,600万元(深圳市华联控股有限公司5320万元，投资比例95%；深圳市华联物业管理有限公司280万元，投资比例5%)实收资本：5,600万元

公司类型：有限责任公司（国有控股）

公司成立日期：1995年6月19日

经营期限自2001年12月28日至2019年8月26日

经营范围：纺织、服装、制造、加工、纺织原料、纺织器材、五金交电、建筑材料、批发、零售、仓储运输、外贸自营进出口。

宁海华联纺织有限公司前身系浙江跃龙纺织集团有限公司，创建于1982年3 月，是一家国有独资企业。1995年公司通过建立现代制度试点工作，以浙江宁海棉纺织厂为核心，组建企业集团，该集团由五个全资企业构成，分别为：宁海棉纺织厂、宁海布厂、宁海棉纺织厂经营公司、宁海棉纺织厂对外贸易经营部、宁海天衣织造总公司。

1998年8月，宁海县工业总公司和深圳市华联发展投资有限公司签定兼并浙江跃龙纺织集团的协议书，双方在剥离宁海天衣织造总公司的基础上，以1998年12 月31日为评估基准日，对其进行资产评估，以宁海会计师事务所出具的宁会(1999)第265号浙江跃龙纺织集团有限公司整体资产评估报告为准，对企业进行承债式兼并。该评估经宁海县国有资产管理委员会办公室以宁国资办(1999)26号批复，确认评估后1998年12月31日的净资产为7,174.65万元。

1999年6月1日，深圳市华联发展投资有限公司股东决议一致同意并通过了如下资产剥离方案：(1)存货剥离48万元低值易耗品。(2)递延资产剥离335万元水电委托，根据国家有关资产评估的规定，41泟J? 7 增容费。也一致同意并通过了如下负债调整方案：(1)因宁海棉纺织厂与中国纺织进

出口公司上海分公司共同出资组建的宁波海达棉纺联营厂，于1997年10月期满，上海方的权益810万元转为长期应付款。(2)长期借款中基建借款和专项借款计779 万元转为资本公积。(3)兼并时转贷到深圳市华联发展投资有限公司名下的人民币贷款：工行宁海支行4338.80万元、将作为宁海新设公司(即本公司)对深圳市华联发展投资有限公司的长期应付款。

1999年8月，深圳市华联发展投资有限公司与深圳市惠中化纤实业股份有限公司签定股权转让协议。

2000年1月1日，将持股比例99%的宁海县华兴纺织原料有限公司作为合并子公司；2009年持股比率变更为100%。

2001年1月1日，将持股比例100%的宁海华联纺织进出口公司作为合并子公司，同时由于撤消了对宁海棉纺织厂对外贸易经营部的投资，2001年不再将其作为合并子公司。

控股子公司情况如下：控股子公司名称

注册资本(万元)

持股比例

主营业务

宁海县布厂

838.90

100%

药棉布

宁海棉纺织厂经营公司

100.00

100%

轻纺原料

宁海华联纺织进出口有限公司

80.00

100%

进出口业务

宁海县华兴纺织原料有限公司

1000.00

100%

纺织原料、服装等

厦门市宁华纺织有限公司

100.00

100%

纺织品销售

2、委托评估的资产：

（1）委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的部分机器设备和电子设备，存放在宁海县城关纺织路146号的宁海华联纺织有限公司的车间内。

（2）委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的控股（持股比例100%）子公司宁海县华兴纺织原料有限公司的部分机器设备和电子设备，存放在宁海县城关环城东路67号的宁海县华兴纺织原料有限公司的车间内。?009年11月30日之市场价值进行了

q1毨5? 8 本次评估目的系为华孚色纺股份有限公司拟进行资产收购（机器设备）事宜所涉及的宁海华联纺织有限公司的设备于2009年11月30日之市场价值提供价值参考意见。

本评估报告的使用者为华孚色纺股份有限公司和评估委托合同中约定的其他使用人和相关主管审核机构。

除国家法律、法规另有规定外，任何未经评估机构和委托方确认的机构或个人不能由于得到评估报告而成为评估报告使用者。

本次评估范围为委托方委托评估的一批设备(详见评估明细表)。

原值净值

5-2华联本部设备类合计149,903,135.2821,642,653.62 5-2-1固定资产—机器设备148,040,838.3920,989,030.80 5-2-3固定资产—电子设备1,862,296.89653,622.82 5-2华兴设备类合计22,289,437.205,558,110.39 5-2-1华兴固定资产—机器设备21,833,890.705,453,191.20 5-2-3华兴固定资产—电子设备455,546.50104,919.19 固定资产合计172,192,572.4827,200,764.01 减：固定资产减值准备

5固定资产净额172,192,572.4827,200,764.01 金额单位：人民币元账面价值

科目名称编号

（1）委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的部分机器设备和电子设备，存放在宁海县城关纺织路146号的宁海华联纺织有限公司的车间内。（2）委托评估的资产（设备）为被评估单位宁海华联纺织有限公司的控股（持股比例100%）子公司宁海县华兴纺织原料有限公司的部分机器设备和电子设备，存放在宁海县城关环城东路67号的宁海县华兴纺织原料有限公司的车间内。委托评估的评估对象和评估范围与经济行为所涉及的评估对象和评估范围是一致的。具体评估范围以企业申报的资产评估明细表为准。

本项目资产评估基准日为

评估基准日是由委托方根据本次评估的特定目的而确定。

由于资产评估结果是对某一时点的资产状况提出公允价值结论，故本次评估以评估基准日有效的价格标准为取价标准。评估基准日是评估结论成立的重要条件之一，如果评估基准日发生改变，评估结论将发生变化。

（一）主要法律法规

1、《资产评估准则——基本准则》；

2、《资产评估准则——评估报告》；

3、《资产评估准则——评估程序》；

4、《资产评估准则——业务约定书》；

5、《资产评估准则——工作底稿》；

6、《资产评估准则----机器设备》；

7、中评协2008[218]《企业国有资产评估报告指南》；

8、《中华人民共和国公司法》及国家现行的有关税收法规； 65号浙江跃龙纺织集团有限公司,1殱r? 10

9、《企业价值评估指导意见（试行）》（中评协[2004]134号）；

10、《注册资产评估师关注评估对象法律权属指导意见》；

11、《中华人民共和国公司法》；

12、其他适用的相关法律、法规、文件政策、准则及规定。

（二）经济行为文件

华孚色纺与我司签订的《评估委托合同》。

（三）资产占有方提供的重大合同协议、产权证明文件

1、宁海华联纺织有限公司填报的评估申报表；

2、宁海县华兴纺织原料有限公司填报的评估申报表；

3、委托方提供的部分发票及其他相关证照资料。

（四）取价依据

1、被评估单位提交的部分发票等资料；

2、《资产评估常用数据与参数手册》；

3、本公司收集的其他有关询价资料和参数资料，以及评估师市场信息调查结果。

本次评估设备采用成本法进行。

根据《资产评估准则——机器设备》规定，注册资产评估师执行评估业务，应当根据评估对象、价值类型、资料收集情况等相关条件，分析市场法、收益法和成本法三种资产评估基本方法的适用性，恰当选择一种或多种资产评估基本方法。

（一）市场法适应性分析

市场法是根据公开市场上与被评估对象相似的或可比的参照物的价格来确定被评估对象的价格，如果参照物与被评估对象并不完全相同，需要根据被评估对象与参照物之间的差异对价值的影响做出调整，市场法比较适用于有成熟的市场、交易比较活跃的机器设备评估。本次评估对象大多数为专业生产设备，目前在国内市场上的交易较少，因此很难在国内收集到类似交易案例，所以不宜采用市场法进行评估。

拦赖ノ荒；闹邢薰镜1毄^? 11

（二）收益法适应性分析

利用收益法评估机器设备是通过预测设备的获利能力，对未来资产带来的净利润或净现金流按一定的折现率折为现值，作为被评估机器设备的价值。使用这种方法的前提条件是要能够确定被评估机器设备的获利能力、净利润或净现金流量以及确定资产合理的折现率；但是大部分单项机器设备不具有独立获利能力。由于本次评估对象大多数为单项机器设备，因此亦不宜采用收益法进行评估。

（三）成本法适应性分析

重置成本法是用现时条件下重新购置或建造一个全新状态的被评估资产所需的全部成本，减去被评估资产已经发生的实体性贬值、功能性贬值和经济性贬值，得到的差额作为被评估资产的评估值，也可估算被评估资产与其全新状态相比有几成新，即求出成新率，然后用全部成本与成新率相乘，得到的乘积作为评估值。

综上所述，本次评估主要采用重置成本法进行评估，经综合分析后确定资产评估价值。

（四）评估方法的选择

本次评估采用成本法进行评估。

成本法是通过估算被评估资产的重置成本和资产实体性贬值、功能性贬值、经济性贬值，将重置成本扣减各种贬值作为资产评估值的一种方法。

重置成本法计算公式为：

V=C×q

其中；V=待估资产市场价值；

C=待估资产重置成本；

q=待估资产综合成新率。

（1）重置成本的确定

重置成本包括购置或购建设备所发生的必要的、合理的成本、利润和相关税费等。

（2）综合成新率的确定

首先，通过对照设备铭牌技术参数、根据设计使用年限、已使用年限和尚可使

用年限，测算出该设备的年限成新率；在宁海县城关环城东路67号的宁海?1殼Y? 12 其次，通过现场设备勘察，全面了解设备的原始制造质量、运行现状、使用维修、保养情况以及现时同类设备的性能更新、技术进步影响因素，综合考虑设备的实体性贬值、功能性贬值和可能存在的经济性贬值确定其现场勘察成新率。

最后，对年限成新率和现场勘察成新率分别赋予权重后确定综合成新率。

（3）评估值的确定

评估值=待估资产重置成本×综合成新率综上所述，根据评估对象、价值类型、资产特点、业务经营特点及资料收集情况等相关条件，在对三种资产评估方法的适用性进行分析后，确定本次评估采用成本法对宁海华联纺织有限公司的机器设备、电子设备进行评估。

深圳市天健国众联资产评估土地房地产估价有限公司接受华孚色纺股份有限公司的委托，对宁海华联纺织有限公司的设备进行了评估，评估基准日定于2009年 11月30日。评估目的是为华孚色纺股份有限公司拟进行资产（机器设备）收购提供价值参考意见。我司于2009年12月10日确定了评估方案，评估工作于2009年 12月11日正式开始，2009年12月14日现场工作结束，2009年12月30日出具正式报告。整个评估工作分为四个阶段。

1、评估前期准备

本阶段的主要工作是：根据评估工作的需要，向资产占有方布置评估准备工作，并对资产占有方有关人员进行辅导，由资产占有方填报资产评估报告申报表。评估人员协助资产占有方进行资产申报工作，同时收集资产评估所需的各种文件资料，制定资产评估工作计划。

2、现场清查核实

根据资产评估的有关规定，对评估范围内的资产进行了产权清查核实和价值评估，具体步骤如下：

（1）听取资产占有方对企业情况、待评估资产历史和现状的介绍；

（2）根据资产占有方申报的资产内容，评估人员到现场对实物资产进行逐项勘查。

1、《中华人民共和国公司法》?1毚I? 13（3）根据资产的实际状况和特点，以及取得的相关资料和会计准则的要求，确定资产的评估方法；

（4）查阅产权证明文件、设备购置合同以及相关凭证；

（5）开展市场调研、询价工作；

（6）对资产占有方的资产进行价值评估测算。

3、进行资产评估汇总分析根据对各类资产的初步评估结果，进行汇总分析工作，在确认评估工作中没有发生重复和遗漏的情况下，根据汇总分析情况对资产评估结果进行修改、校对与必要的调整和完善。经三级审核后形成正式评估报告。

4、提交报告

根据评估工作应遵循的原则，向委托方提交资产评估报告书初稿，对委托方提出的意见进行判断和修改后，本公司于2009年12月30日出具正式评估报告。

本报告系在以下评估基准和评估假设及限制条件下制作完成的：

(一)评估基准

1、所有申报评估资产的产权均是正常的，因而能够进行合法的自由交易，无任何限制或影响交易的他项权利之设置或其他瑕疵。

2、委托方和被评估企业所提供的有关本次评估的资料是真实、完整、合法、有效的。

3、我们的评估在很大程度上依赖委托方和被评估企业所提供的有关本次评估的

资料，我们对这些资料进行了必要的和有限的抽查验证，我们相信这些资料是真实、完整、合法、有效的，但对其准确性不作保证。

4、所有资产均采用人民币计算价值或价格。

(二)评估假设

1、除本报告中另有陈述、描述和考虑外，所有被评估资产的取得、使用等均被假设符合国家法律、法规和规范性文件的规定。

2、假设宁海华联纺织有限公司所有经营活动均能依照有关法律、法规的规定和：

（1）听取资产占有方对企业情凯1?Z? 14 相关行业标准及安全生产经营之有关规定进行。

3、本次评估以本资产评估报告所列明的特定评估目的为前提。

4、本次评估的各项资产均以评估基准日的实际存量为前提，假定评估对象在评估基准日的状况与完成实地查勘之日的状况一致。有关资产的现行市价以评估基准日的国内有效价格为依据。

5、本次评估均以被评估资产现有用途不变且资产占有方合法及持续经营为前提。

6、除本报告中另有声明、描述和考虑外，我们未考虑下列因素对评估结论的任何有利或不利之影响：

（1）已有或可能存在的抵押、按揭、担保等他项权利或产权瑕疵或其他对产权的任何限制等因素。

（2）未来经济环境、市场环境、社会环境等（如国家宏观经济政策、市场供求关系、财政税收政策、内外贸易政策、环境保护政策、金融货币政策等）因素之变化。

（3）各类资产目前的或既定的用途、目的和使用的方式、规模、频率、环境等

情况之改变，或被评估企业有关与被评估资产直接或间接的任何策略、管理、运营、营销、计划或安排等（如经营策略、管理方式、经营计划、管理团队和职工队伍等）发生变化。

（4）特殊的交易方可能追加或减少付出的价格。

（5）出现战争、自然灾害和其他不可抗力因素。

（6）被评估企业未列报或未向我们作出说明而可能影响我们对被评估资产价值分析的负债/资产、或有负债/或有资产；或者其他相关权利/或有权利和义务/或有义务等。

（7）债权债务实现（收款和付款）的时间。

7、除在本报告中另有说明外，以下情况均被假设处在正常状态下：

（1）所有实物资产的内部结构、性能、品质、性状、功能等均被假设是正常的。

（2）所有被评估资产均被假设是符合法律或专业规范等要求而记录、保管、存放等，因而资产是处在安全、经济、可靠的环境之下，其可能存在或不存在的危险誰 15 因子均未列于评估师的考察范围，其对评估价值的不利或有利影响均未考虑。

尽管我们实施的评估程序已经包括了对被评估资产的查看，这种查看工作仅限于对被评估资产可见部分的观察，以及相关管理、使用、维护记录之抽查和有限了解等。评估师并不具备了解任何实体资产内部结构、物质性状、安全可靠等专业知识之能力，也没有资格对这些内容进行检测、检验或表达意见。

(三)限制条件

1、评估报告中所列示的任一评估值，脱离本次评估范围的单独使用或其他非全部的任何组合使用都将使评估值无效。

2、对各类资产的数量，我们进行了抽查核实，并在此基础上进行评估。

就所有由我们此次评估资产的数量而言，被评估企业管理当局均认为于评估基

准日是实际存在并归被评估企业所有，同时向我们作出了承诺，我们相信这些承诺，但对其可靠性并不能作出保证。如果资产的实际数量与本报告所载资产数量不相符，评估价值将会发生变化。

若本次评估中遵循的评估假设及前提条件发生变化时，评估结果一般会失效。

本公司认为，除本报告所载明的特别事项说明外，在资产现有用途或既定用途不变，并持续经营使用和本报告载明的评估目的、价值前提及假设条件下，本次评估对象在评估基准日2009年11月30日的评估结果如下：

其中：

日的国?1洣6? 16

宁海华联纺织有限公司纳入评估范围的资产于二零零九年十一月三十日评估结果列示如下: 原值净值原值净值原值净值原值净值 5-2设备类合计149,903,135.2821,642,653.6294,174,445.0022,228,658.75-55,728,690.28586,005.13-37.182.71 5-2-1固定资产—机器设备148,040,838.3920,989,030.8092,925,950.0021,765,127.50-55,114,888.39776,096.70-37.233.70 5-2-3固定资产—电子设备1,862,296.89653,622.821,248,495.00463,531.25-613,801.89-190,091.57-32.96-29.085-2华兴设备类合计22,289,437.205,558,110.3918,186,760.005,591,834.00-4,102,677.2033,723.61-18.410.61 5-2-1固定资产—机器设备21,833,890.705,453,191.2017,966,260.005,503,519.00-3,867,630.7050,327.80-17.710.92 5-2-3固定资产—电子设备455,546.50104,919.19220,500.0088,315.00-235,046.50-16,604.19-51.60-15.83固定资产合计172,192,572.4827,200,764.01112,361,205.0027,820,492.75-59,831,367.48619,728.74-34.752.28减：固定资产减值准备5固定资产净额172,192,572.4827,200,764.01112,361,205.0027,820,492.75-59,831,367.48619,728.74-34.752.28 增值额（元）增值率评估基准日：2009年11月30日编号科目名称账面价值（元）评估价值（元）

评估结果与账面值比较变动原因：

设备评估净值增值619,728.74人民币元，其中华联纺织本部设备评估净值增值

586,005.13人民币元，评估增值率为2.71%,华兴纺织设备评估净值增值为33,723.61 人民币元，评估增值率为0.61%。由于评估成新率计算年限与企业会计折旧年限不同，因此造成增值。

应予说明的是，本资产评估报告书“

十二、特别事项说明”中所述事项可能对资产评估结果产生影响，鉴于目前条件的限制，我们无法对其可能产生的影响进行量化，需提请资产评估报告书使用者特别关注。

按照有关资产评估现行规定，本报告所载明的资产评估结果在评估基准日后一年内（即自2009年11月30日至2010年11月29日）有效。

本报告所载评估结果仅反映评估对象在本次评估目的、价值定义、评估假设及

限制条件下，根据有关经济原则确定的市场价值。本公司认为，下列事项可能会影份有限公司（上市）

经营??? 17 响评估结论，但在目前情况下本公司无法估计其对评估结果的影响程度，谨提请本

报告使用人和阅读人应予以特别关注：

1、在评估基准日至本报告出具期间，国家宏观经济政策及市场基本情况未发生任何重大变化。但本公司不能预计评估报告出具后的政策与市场变化对评估结果的影响。

2、遵守相关法律、法规和资产评估准则，对评估对象价值进行估算并发表专业意见，是注册资产评估师的责任；提供必要的资料并保证所提供资料的真实性、合法性、完整性，恰当使用评估报告是委托方和相关当事方的责任。

3、注册资产评估师执行资产评估业务的目的是对评估对象价值进行估算并发表专业意见，并不承担相关当事人决策的责任。评估结论不应当被认为是对评估对象可实现价格的保证。

4、注册资产评估师对评估对象的法律权属状况给予了必要的关注，但不对评估对象的法律权属作任何形式的保证。由于评估对象产权关系引起的一切纠纷与本公司和执行评估业务的注册资产评估师无关。

5、本评估报告结论是对2009年11月30日这一基准日所评估资产价值的客观

公允反映，本公司对评估基准日以后所评估资产价值发生的重大变化不负任何责任。

6、本评估机构没有接受进行结构性测试和检验设施的要求，因此对资产内部有无缺损不能确定。

7、本次评估结论是反映评估对象在本次评估目的下，根据公开市场的原则确定的现行公允市价，未考虑将来可能承担的抵押、担保事宜，以及特殊的交易方可能追加付出的价格等对评估价格的影响；亦未考虑该等资产所欠付的税项，以及如果该等资产出售，则应承担的费用和税项等可能影响其价值的任何限制。同时，本报告也未考虑国家宏观经济政策发生变化以及遇有自然力和其它不可抗力对资产价格的影响。

8、在评估基准日后，评论结论有效期内，若资产数量及作价标准发生变化时，应按以下原则处理，不能直接使用评估结论：

（1）资产数量发生变化时，应根据原评估方法对资产额进行调整；

（2）资产价格发生较大波动时，并对评估结论产生明显影响时，委托方应及时纳入评估范围的资产于二零零九年k1氌+? 18 聘请有资格的评估机构重新评估。

9、对于评估中可能存在的影响评估结果的其他事项，委托方及被评估单位在进行评估时未作特别说明，在评估人员根据专业经验一般不能获悉的情况下，评估机构及评估人员不承担相关责任。

10、本报告含有若干备查文件，备查文件构成本报告之重要组成部分，与本报告书正文同时使用方为有效。

1、本评估报告只能用于评估报告载明的评估目的和用途。

2、本评估报告只能由评估报告载明的评估报告使用者使用。

3、本评估报告的有关附件为本报告的重要组成部分，与本报告的正文具有同等法律效力。

4、本评估结论仅供委托方和评估委托合同约定的其他使用人为本报告评估目的的使用和送交财产评估主管机关审查使用。评估报告书的使用权归委托方所有，未经委托方许可评估机构不得随意向他人提供或公开。

5、本评估报告的签字注册资产评估师已对评估对象的法律权属给予了合理关注，本报告中对评估对象法律权属的陈述不代表评估师对评估对象的法律权属提供保证或鉴证意见。仅对其价值进行评估，不对其产权和产权分割负责，也不对第三方负责，如有利用其风险自担，与本公司和评估人员无关。

6、评估结论是本公司出具的，受本公司评估人员和注册资产评估师的执业水平和能力的影响。

7、本公司不对委托方和评估委托合同约定的其他使用人运用本报告于本次评估目的以外的经济行为所产生的后果负责，因评估报告使用不当所致后果与签字注册资产评估师及其所在评估机构无关。

8、评估结果有效期

按照有关资产评估现行规定，本评估结论有效使用期限为一年，即自二零零九年十一月三十日起至二零一零年十一月二十九日止。

9、评估报告使用限定匀涣推渌豢煽沽Χ宰什鄹?的??N? 19 对本评估报告书的使用应遵循以下限定：

（1）本资产评估报告书的使用权归委托方和评估业务约定书约定的其他使用人所有。委托方同意使用本公司资产评估报告书的其他使用人应当认真阅读和理解本报告的每一个组成部分，本报告的每一个组成部分（包括资产评估报告书摘要）单独使用或其他非全部的任何组合使用均可能造成对本报告所载评估结论的误解。使用人还应当特别关注本报告书中价值前提、特别事项说明、评估假设条件和法律效力。

（2）除法律法规要求的财产评估主管机关或其他法律法规授权部门审查使用本报告书以外，未经委托方书面许可或同意，本公司不会将本报告书的全部或部分内容向其他人提供或公开。除法律法规要求的财产评估主管机关或其他法律法规授权部门审查使用本报告书以外，本公司也没有向其他任何第三方解释本报告书的义务。

本次评估报告提交日期为。

.01 减：固定资产减值准备5箼

湱 20

1、华孚色纺股份有限公司《企业法人营业执照》（复印件）；

2、宁海华联纺织有限公司《企业法人营业执照》（复印件）；

3、宁海县华兴纺织原料有限公司《企业法人营业执照》；（复印件）；

4、委托方承诺函；

5、被评估单位承诺函；

6、资产评估机构及注册资产评估师承诺函；

7、部分资产现场勘察照片；

8、签字注册资产评估师资格证书（复印件）；

9、资产评估机构资质（复印件）；

10、资产评估机构《企业法人营业执照》（复印件）。

法定代表人：

中国注册资产评估师：

深圳市天健国众联资产评估土地房地产估价有限公司

机器学习模型评估篇5

浅谈机器设备资产评估中的几个问题

实践证明国有大中型企业建立资产预评估制度十分必要.本文就准格尔煤炭工业公司在设备预评估中存在的问题,从建立预评估组织机构、重置价值的`确认、设备应使用年限和已使用年限的确定、鉴定设备完好率时应考虑的因素、功能性和经济性贬值等方面谈了几点体会.

作者：黄乘昶作者单位：准格尔煤炭工业公司刊名：中国设备管理英文刊名：CHINA PLANT ENGINEERING年，卷(期)：“”(1)分类号：F4关键词：资产预评估重置价值设备完好率贬值

翻译质量评估系统模型的研究篇6

翻译质量评估系统模型的研究

描述了翻译质量评估模式的概念及其分类,分析了量化评估模式,进一步提出了评估系统模型及其开发标准,为实现翻译质量评估系统建立理论基础.

作者：肖立勤 XIAO Li-qin 作者单位：山西水利职业技术学院,山西,太原,030027 刊名：科技情报开发与经济英文刊名：SCI-TECH INFORMATION DEVELOPMENT & ECONOMY 年，卷(期)： 17(32) 分类号：H159 关键词：翻译质量评估模式系统模型系统开发

机器学习模型评估篇7

随着科学技术的发展,自动化生产线已经在各个行业得到普及,它是将机械技术、微电子技术、电工电子技术、传感测试技术、信息变换技术、网络通信技术等多种技术有机地结合,并综合应用到生产设备中,同时将传感检测、传输与处理、控制、执行与驱动等机构在微处理单元的控制下协调有序地工作,有机的融合在一起。在整个工作环节中,多次涉及对产品的识别问题,识别率的高低就直接决定了整条生产线的质量。

例如在水果自动包装生产线中,假设我们需要将采收来的苹果按照大小、色泽来分别包装,采用安装了传感器的识别装置来对苹果的色泽和大小进行识别。若我们需要识别装置能够准确的识别产品,则必须采用大量样本对识别装置进行学习模型设计和测试。通常我们需要的是识别装置能够学习样本中的普遍规律,但若识别装置的学习能力过强,将某些样本自身的特点当成了普遍规律,那么就会导致泛化能力下降,即可能将多数苹果认为是不合格产品,这种情况我们称之为“过拟合”。与之相对应的是“欠拟合”,即识别装置并未学习到所有的普遍规律,这样就有可能导致部分不合格的产品却被当成合格产品进行包装。不管是过拟合还是欠拟合,都不是我们想要的结果,那如何才能获得一个满足要求的识别装置呢,这就需要对所设计的模型进行选择和评估。

1.评估方法

通常我们将识别装置的实际输出与真实结果之间的差异称为“误差”。假如,我们将识别装置在训练集上的误差称为“训练误差”,将识别装置在新样本上的误差称为“泛化误差”。在很多情况下我们能得到的是一个训练误差很小的识别装置,有些识别装置的训练误差甚至为零,但是这并不一定是我们想要的识别装置。我们希望得到的是泛化误差尽可能小的识别装置。但实际上,我们并不知道新样本是什么样的,因此也就没有办法直接选择识别装置。但是我们可以通过实验测试来对识别装置的泛化误差进行评估。那么问题来了,通常我们采集数据时能得到一个包含有限样本的样本空间D,这些样本空间D既要用于训练,又要用于测试,那么怎样才能合理的划分训练集和测试集呢?下面介绍几种常用的划分方法。

(1)留出法

留出法是将样本空间D直接划分成两个互斥的集合,其中一个集合用于训练,称为训练集S,另一个集合用于测试,称为测试集T。该方法是最简单的一种数据划分方法。使用留出法时需要注意的问题是,训练集S和测试集T的划分一定要保证数据分布的一致性。例如将包含200个样本的样本空间D进行划分为包含60%样本的训练集S,和包含40%样本的测试集T,若S包含60个正例和60个反例,则T也应该按照相同比例包含40个正例和40个反例。若训练集S和测试集T中样本类别的比例差别过大,则可能会由样本比例误差导致识别装置的偏差过大。

另一个需要注意的问题是,由于划分训练集和测试集是随机的,所以单次应用留出法得到的测试结果是不够可靠的,一般需要经过多次随机划分并进行测试,将多次测试结果取平均值作为最终的返回值。

此外,我们需要评估的是用样本空间D训练出来的模型的性能,但是采用留出法需要对样本空间进行划分,将其划分成训练集和测试集。这就带来一个问题,若训练集S包含的样本数量较多,则训练出来的模型就更接近于用D训练出来的模型,但是由于测试集T包含的样本数量较少,就使得测试结果的偏差较大。若S包含的样本数量少,则S和D的差别就比较大,用训练集训练出来的模型就和用样本空间D训练出来的模型有较大的区别,从而降低了测试结果的真实性。通常我们的做法是将样本空间D的2/3~4/5作为测试样本,其余样本用于训练。

(2)交叉验证法

交叉验证法是将样本空间D划分成k个大小一致的子集,每个子集之间没有交集(即),并且在划分子集的时候要保证数据分布的一致性。然后,每次从k个子集中抽取k-1个子集作为训练集S,另外一个子集作为测试集T,这样我们就可以得到k组测试结果,最后返回k个测试结果的平均值。需要注意的是,采用交叉验证法所设计的识别装置其精确度和k的取值有关,一般情况下k值越大,其结果越准确,但同时计算量也就越大。在工程实践中通常取k=10,也称为10折交叉验证,或者k取10的倍数,如k=20、30等等。

(3)留一法

在使用交叉验证法时,假如样本空间D内共有m个样本,当k=m时就是交叉验证法的一个特例,称为留一法。留一法由于每次只抽取1个样本作为测试集T,其余数据均作为训练集S,用于训练识别装置,这样就最大程度的保证了S和D的一致性,训练出来的模型也就更接近于用样本空间D训练出来的模型。但需要注意的是,当样本空间D中的样本数量非常庞大时,要训练出m个模型所需要的计算量就非常大,例如某样本空间D中有1万个样本,若采用留一法,即要训练出1万个模型,然后输出这1万个模型的测试平均值作为最终的测试结果,计算量是非常惊人的。因此,当样本空间D中的样本数量相对较少时,可采用留一法进行模型训练,通常认为训练结果是比较准确的。

2.小结

在对识别装置的模型进行选择和评估时,除了以上介绍的三种常用方法以外,还涉及到参数的设置,通常称为“参数调节”或“调参”。参数包括识别装置中学习算法的参数和数学模型的参数,参数设置不同,获得的识别装置性能就有很大差别。

需要注意的是,上面介绍的三种评估方法中,均是从样本空间D中选出一部分样本作为训练样本,另外一部分样本用于测试,这毕竟和直接用D训练出来的模型不一致。因此在模型选择完成后,学习算法和参数配置已经选定的情况下,采用样本空间D重新训练模型,此时的模型在训练过程中使用了全部样本,这才是我们最终用到识别装置里面的模型。

摘要：在自动化生产线中,识别装置可以说是整条生产线的核心,其识别率的高低直接决定了该生产线的生产质量。本文列举了几种常用的依据样本空间划分训练集和测试集的方法,在使用时可依据实际情况合理选择和评估学习模型,获得满足要求的识别装置。

关键词：自动生产线,识别装置,样本空间

参考文献

[1]周志华.机器学习[M].清华大学出版社,2016

[2]郑恩辉.不平衡数据知识挖掘:类分布对支持向量机分类的影响[J].信息与控制,2005

【机器学习模型评估】推荐阅读：

动作模型学习09-11