模型评估与方法

2024-09-22 版权声明 我要投稿

模型评估与方法(推荐8篇)

模型评估与方法 篇1

我们在建立模型之后,接下来就要去评估模型,确定这个模型是否有用。在实际情况中,我们会用不同的度量去评估我们的模型,而度量的选择取决于模型的类型和模型以后要做的事。

1.1 二分类评估

二分类模型的评估。

1.1.1 业界标准叫法

二分类评估;分类算法。

1.1.2 应用场景

信息检索、分类、识别、翻译体系中。

1.1.2.1 新闻质量分类评估 对于新闻APP,其通过各种来源获得的新闻,质量通常良莠不齐。为了提升用户体验,通常需要构建一个分类器模型分类低质新闻和优质新闻,进而进行分类器的评估。

1.1.2.2垃圾短信分类评估 垃圾短信已经日益成为困扰运营商和手机用户的难题,严重影响人们的生活、侵害到运营商的社会公众形象。构建二分类器模型对垃圾短信和正常短信进行分类,并进行二分类评估。

1.1.3 原理

1.1.3.1混淆矩阵 混淆矩阵(Confusion Matrix)。来源于信息论,在机器学习、人工智能领域,混淆矩阵又称为可能性表格或错误矩阵,是一种矩阵呈现的可视化工具,用于有监督学习,在无监督学习中一般叫匹配矩阵。混淆矩阵是一个N*N的矩阵,N为分类(目标值)的个数,假如我们面对的是一个二分类模型问题,即N=2,就得到一个2*2的矩阵,它就是一个二分类评估问题。混淆矩阵的每一列代表预测类别,每一列的总数表示预测为该类别的数据的数目,每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的实例的数目。

图1 2*2混淆矩阵图

阳性(P,Positive): 阴性(N,Negative):

真阳性(TP,True Positive):正确的肯定,又称“命中”(Hit);被模型预测为正类的正样本。

真阴性(TN,True Negative):正确的否定,又称“正确拒绝”(correct rejection),被模型预测为负类的负样本。

伪阳性(FP,false Positive):错误的肯定,又称“假警报”(false alarm);被模型预测为负类的正样本。

伪阴性(FN,false Negative):错误的否定,又称“未命中”(miss);被模型预测为正类的负样本。

灵敏度(Sensitivity)或真阳性率(TPR,Ture Negative Rate):又称“召回率”(recall)、命中率(Hit Rate)。在阳性值中实际被预测正确所占的比例。TPR=TP/P=TP/(TP+FN)伪阳性率(FPR,false positive rate):又称“假正类率”、“错误命中率”、“假警报率”。FPR=FP/(FP+TN)特异度(SPC,Specificity)或真阴性率:在阴性值中实际被预测正确所占的比例。SPC=TN/N=TN/(FP+TN)=1-FPR 假发现率(FDR,false discovery rate):FDR=FP/(FP+TP)=1-TPR 准确度(ACC):预测正确的数占样本数的比例。ACC=(TP+TN)/(P+N)阳性预测值(PPV,positive predictive value)或精度(precision):阳性预测值被预测正确的比例。PPV=TP/(TP+FP)阴性预测值(NPV,negative predictive value):阴性预测值被预测正确的比例。NPV=TN/(TN+FN)

图2 一个模型的2*2混淆矩阵图示例

我们可以看出,这个模型的准确度是88%,阳性预测值比较高而阴性预测值较低,对于灵敏度和特异度也是相同。这是因为我们选的阈值导致的,若我们降低阈值,这两对数值就会变得接近。1.1.3.2 ROC曲线 ROC曲线(Receiver Operation Characteristic Curve),中文名叫“接受者操作特征曲线”,其实是从混淆矩阵衍生出来的图形,其横坐标是Specificity(特异度),纵坐标是Sensitivity(灵敏度)。

图3 ROC曲线图

随着阈值的减小,更多的值归于正类,敏感度和特异度也相应增加。而那条45度线是一条参照线,ROC曲线要与这条参照线比较。如果我们不用模型,直接把客户分类,我们得到的曲线就是这条参照线,然而,我们使用了模型进行预测,就应该比随机的要好,所以,ROC曲线要尽量远离参照线,越远,我们的模型预测效果越好。ROC曲线反映了错误命中率和灵敏度之前权衡的情况,即灵敏度随着错误命中率递增的情况下,谁增长的更快,快多少。灵敏度增长的越快,曲线越往上屈,反映了模型的分类性能越好。当正负样本不平衡时,这种模型评价方式比起一般的精确度评价方式好处尤为明显。

ROC曲线快速爬向左上,表示模型准确预测数据。一般情况下,ROC曲线都应该处于参照线的上方。1.1.3.3AUC(ROC曲线下面积 Area Under ROC Curve)

图3 AUC曲线图

ROC曲线是根据与45度参照线比较判断模型的好坏,但这只是一种定性的分析,如果需要定量的计算判断,就用到了AUC,即:ROC曲线下面积。参考线的面积是0.5,ROC曲线越往左上方靠拢,AUC就越大(这里的面积是0.869),模型评估的性能越好,完美分类的AUC值是1。1.1.3.4基尼系数 基尼系统经常用于分类问题,公式:Gini=2*AUC-1。基尼系数大于60%,就算好模型。1.1.3.5

LIFT(提升)

图3 LIFT提升图

LIFT=(TP/(TP+FP))/((TP+FN)/(TP+FN+FP+TN))LIFT越大,模型的预测效果越好。LIFT值应一直大于1,如果LIFT值等于1,模型就没有任何提升了。横轴是预测为正例的比例,即:(TP+FN)/(TP+FN+FP+TN)1.1.3.6

Gains(增益)

图3 Gains增益图

与LIFT类似,区别在于纵轴的刻度不同,横轴相同。Gains= TP/(TP+FP)=LIFT*((TP+FN)/(TP+FN+FP+TN))

1.1.3.7

K-S(Kolmogorov-Smirnov chart)图 K-S图是用来度量阳性和阴性分类区分程度的。若我们把总体严格按照阳性和阴性分成两组,则K-S值为100,如果我们是随机区分阳性和阴性,则K-S值为0。所以,分类模型的K-S值在0到100之间,值越大,模型表现越好。

1.2 多分类评估

多分类模型的评估。

1.2.1 业界标准叫法

多分类评估。

1.2.2 应用场景

1.2.2.1商品图片分类 淘宝、京东等电商含有数以百万级的商品图片,“拍照购”等应用必须对用户提供的商品图片进行分类。

1.2.3 原理

同1.1.3节。

1.2.3.1 混淆矩阵 如果有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵如下:

每一行之和为50,表示50个样本。第一行说明类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3。第一行第一列中的43表示有43个实际归属第一类的实例被预测为第一类,同理,第二行第一列的2表示有2个实际归属为第二类的实例被错误预测为第一类。

1.2.4 不同应用场景使用的方法及参数

1.2.4.1 混淆矩阵

混淆矩阵一般只能用于分类输出模型中。

对于混淆矩阵,一般情况下,我们只关心其中一个定义度量。例如:在医药公司,一般会更加关心最小化误诊率,也就是高特异度。而在磨损模型中,我们更关心的是灵敏度。1.2.4.2ROC和AUC曲线 ROC曲线的一个应用场景是在人脸检测中,很多相关的研究或者企业评价他们的检测性能程度是通过ROC曲线来评定的。

ROC和AUC曲线常被用来评价一个二值分类器的优劣。

1.3 Spark模型预测

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。是一种计算框架。

1.3.1 业界标准叫法

Spark。

1.3.2 应用

1.3.2.1 腾讯社交广告平台—广点通 广点通是最早使用Spark的应用之一。腾讯大数据精准推荐借助Spark快速迭代的优势,围绕“数据+算法+系统”这套技术方案,实现了在“数据实时采集、算法实时训练、系统实时预测”的全流程实时并行高维算法,最终成功应用于广点通pCTR投放系统上,支持每天上百亿的请求量。基于日志数据的快速查询系统业务构建于Spark之上的Shark,利用其快速查询以及内存表等优势,承担了日志数据的即席查询工作。在性能方面,普遍比Hive高2-10倍,如果使用内存表的功能,性能将会比hive快百倍。

1.3.2.2 Yahoo—Audience Expansion(读者扩张)Yahoo将Spark用在Audience Expansion中的应用。Audience Expansion是广告中寻找目标用户的一种方法:首先广告者提供一些观看了广告并且购买产品的样本客户,据此进行学习,寻找更多可能转化的用户,对他们定向广告。Yahoo采用的算法是logistic regression。同时由于有些SQL负载需要更高的服务质量,又加入了专门跑Shark的大内存集群,用于取代商业BI/OLAP工具,承担报表/仪表盘和交互式/即席查询,同时与桌面BI工具对接。目前在Yahoo部署的Spark集群有112台节点,9.2TB内存。1.3.2.3 淘宝—搜索和广告业务 阿里搜索和广告业务,最初使用Mahout或者自己写的MR来解决复杂的机器学习,导致效率低而且代码不易维护。淘宝技术团队使用了Spark来解决多次迭代的机器学习算法、高计算复杂度的算法等。将Spark运用于淘宝的推荐相关算法上,同时还利用Graphx解决了许多生产问题,包括以下计算场景:基于度分布的中枢节点发现、基于最大连通图的社区发现、基于三角形计数的关系衡量、基于随机游走的用户属性传播等。

1.3.2.4 优酷土豆—视频推荐和广告业务 优酷土豆在使用Hadoop集群的突出问题主要包括:第一是商业智能BI方面,分析师提交任务之后需要等待很久才得到结果;第二就是大数据量计算,比如进行一些模拟广告投放之时,计算量非常大的同时对效率要求也比较高,最后就是机器学习和图计算的迭代运算也是需要耗费大量资源且速度很慢。最终发现这些应用场景并不适合在MapReduce里面去处理。通过对比,发现Spark性能比MapReduce提升很多。首先,交互查询响应快,性能比Hadoop提高若干倍;模拟广告投放计算效率高、延迟小(同hadoop比延迟至少降低一个数量级);机器学习、图计算等迭代计算,大大减少了网络传输、数据落地等,极大的提高的计算性能。目前Spark已经广泛使用在优酷土豆的视频推荐(图计算)、广告业务等。

1.3.3 原理

1.3.3.1Spark生态圈 如下图所示为Spark的整个生态圈,最底层为资源管理器,采用Mesos、Yarn等资源管理集群或者Spark自带的Standalone模式,底层存储为文件系统或者其他格式的存储系统如Hbase。Spark作为计算框架,为上层多种应用提供服务。Graphx和MLBase提供数据挖掘服务,如图计算和挖掘迭代计算等。Shark提供SQL查询服务,兼容Hive语法,性能比Hive快3-50倍,BlinkDB是一个通过权衡数据精确度来提升查询晌应时间的交互SQL查询引擎,二者都可作为交互式查询使用。Spark Streaming将流式计算分解成一系列短小的批处理计算,并且提供高可靠和吞吐量服务。

图4 spark生态圈图

1.3.3.2 Spark运行框架

图5 spark运行框架图

Spark的运行框架首先有集群资源管理服务(Cluster Manager)和运行作业任务节点(Worker Node),然后就是每个应用的任务控制节点Driver和每个机器节点上有具体任务的执行进程。与MR计算框架相比,Executor有二个优点:一个是多线程来执行具体的任务,而不是像MR那样采用进程模型,减少了任务的启动开稍。二个是Executor上会有一个BlockManager存储模块,类似于KV系统(内存和磁盘共同作为存储设备),当需要迭代多轮时,可以将中间过程的数据先放到这个存储系统上,下次需要时直接读该存储上数据,而不需要读写到hdfs等相关的文件系统里,或者在交互式查询场景下,事先将表Cache到该存储系统上,提高读写IO性能。另外Spark在做Shuffle时,在Groupby,Join等场景下去掉了不必要的Sort操作,相比于MapReduce只有Map和Reduce二种模式,Spark还提供了更加丰富全面的运算操作如filter,groupby,join等。1.3.3.3 Spark与hadoop

 Hadoop有两个核心模块,分布式存储模块HDFS和分布式计算模块Mapreduce  spark本身并没有提供分布式文件系统,因此spark的分析大多依赖于Hadoop的分布式文件系统HDFS  Hadoop的Mapreduce与spark都可以进行数据计算,而相比于Mapreduce,spark的速度更快并且提供的功能更加丰富 1.3.3.4 Spark运行流程

图5 spark运行流程图

1.构建Spark Application的运行环境,启动SparkContext。2.SparkContext向资源管理器(可以是Standalone,Mesos,Yarn)申请运行Executor资源,并启动StandaloneExecutorbackend。3.Executor向SparkContext申请Task。4.SparkContext将应用程序分发给Executor。

5.SparkContext构建成DAG图,将DAG图分解成Stage、将Taskset发送给Task Scheduler,最后由Task Scheduler将Task发送给Executor运行。

6.Task在Executor上运行,运行完释放所有资源。1.3.3.5 Spark运行特点

1.每个Application获取专属的executor进程,该进程在Application期间一直驻留,并以多线程方式运行Task。这种Application隔离机制是有优势的,无论是从调度角度看(每个Driver调度他自己的任务),还是从运行角度看(来自不同Application的Task运行在不同JVM中),当然这样意味着Spark Application不能跨应用程序共享数据,除非将数据写入外部存储系统。2.Spark与资源管理器无关,只要能够获取executor进程,并能保持相互通信就可以了。

3.提交SparkContext的Client应该靠近Worker节点(运行Executor的节点),最好是在同一个Rack里,因为Spark Application运行过程中SparkContext和Executor之间有大量的信息交换。4.Task采用了数据本地性和推测执行的优化机制。

1.4 回归评估

对回归模型的评估。

1.4.1 业界标准叫法

回归模型评估。

1.4.2 应用

1.4.3 原理及方法

1.4.3.1

均方根误差(Root Mean Squared Error,RMSE)RMSE是一个衡量回归模型误差率的常用公式。然而,它仅能比较误差是相同单位的模型。

1.4.3.2

相对平方误差(Relative Squared Error,RSE)与RMSE不同,RSE可以比较误差是不同单位的模型。

1.4.3.3

平均绝对误差(Mean Absolute Error,MAE)MAE与原始数据单位相同,它仅能比较误差是相同单位的模型。量级近似与RMSE,但是误差值相对小一些。

1.4.3.4

相对绝对误差(Relative Absolute Error,RAE)

1.4.3.5

相对绝对误差(Coefficient of Determination)

决定系数(R2)回归模型汇总了回归模型的解释度,由平方和术语计算而得。R2描述了回归模型所解释的因变量方差在总方差中的比例。R2很大,即自变量和因变量之间存在线性关系,如果回归模型是“完美的”,SSE为零,则R2为1。R2小,则自变量和因变量之间存在线性关系的证据不令人信服。如果回归模型完全失败,SSE等于SST,没有方差可被回归解释,则R2为零。

模型评估与方法 篇2

水电设备是复杂的机、电、液、汽设备, 其结构关联复杂, 每个单一的故障都可能由不同的部分共同作用产生。故障和原因之间的因果关系不一定是确定的一一对应的映射关系, 而是表现为随机性和不确定性[1,2]。水电设备运行工况的传统态势评估都是由现场的水电专家根据经验人工实现。由于现场水电设备数量众多、型号各异, 通过专家进行现场评估建立模型已经无法满足现代化水电厂生产的需要。而目前国内外常用的专家系统诊断方法虽然在解决这一问题时会得到相对准确的诊断结果, 但由于其自身的一些局限性, 在解决不确定性和实时性问题上存在一定的缺陷。为此, 面对不确定性的设备特征信息, 建立水电设备的通用态势评估诊断模型, 准确地对水电设备的运行工况进行快速态势评估, 并建立水电设备的通用态势评估诊断模型成为本研究领域的研究热点[3,4,5]。

态势评估是一种多假设动态分类问题, 在工业控制、系统故障诊断、军事数据融合等领域中具有广泛应用[2,3]。态势评估不仅需要多层次、多角度的信息视图, 而且要把对目标的估计量化, 进而识别产生观测事件和行动的可能态势[2]。目前对态势进行评估诊断的手段如概率推理、判决树、信息融合、Petri网络等得到了深入研究[6]。这些方法在信息准确、完备的情况下, 大多能够得到比较满意的结果。然而, 实际上人们得到的往往是不完备、不精确的数据, 从而需要应用柔性方法来处理。虽然基于模型的诊断方法 (MBD) 克服了传统专家系统的诊断知识不完备性、知识表述歧义性、诊断结果不易解释等重大缺陷[7], 其应用越来越广泛。然而, 针对同一观测值存在多个诊断解可以描述时, MBD一般很难确定系统的最优诊断解。特别是, 在样本缺少关键信息的情况下, 诊断正判率过低。

贝叶斯网络对于解决复杂系统不确定因素引起的故障具有很大的优势, 被认为是目前不确定知识表达和推理领域最有效的理论模型[6,8,9]。随着从数据中学习贝叶斯网络结构和概率分布技术的发展, 贝叶斯网络已经在多个领域中获得了广泛关注, 特别是在医疗诊断、设备故障诊断等方面得到深入的研究并应用于实践[8]。近年来, 贝叶斯网络在电力系统中的应用也开始得到研究, 文献[10]将贝叶斯网络应用到电网故障诊断中, 建立了面向元件的电网故障诊断模型, 取得了较好效果。

由于贝叶斯网络是解决不确定性问题最好的方法[11,12,13], 为了使得构建的网络简洁、条件概率计算简单、较容易确定诊断的最优解, 本文在引入超件概念的基础上, 提出以MBD生成的最小诊断集构建贝叶斯网络 (BN) 的诊断方法, 通过BN确定候选诊断解的发生概率, 进而确定系统最有可能的诊断解。通过在水电设备调速系统的现场诊断应用中验证了该方法能够更有效、更直观地进行故障诊断, 易于进行属性和故障类型扩展, 方便处理不完整数据和不精确数据。

1 水电设备态势评估诊断模型

1.1 设备通用态势评估诊断的体系结构

设备的性能降低状态可以在总体上定义, 也可以在细节上定义。在总体上定义, 是指设备的任意一个指标只要出现性能降低, 设备即为性能降低状态, 不一定完全失去其功能。在细节上定义, 往往是指某个指标或在性能指标的某个范围内出现性能降低的现象。对性能降低状态进行详细定义的好处是我们对产生的影响可以了解得比较准确。如果能够及时地检测, 则可以在性能继续降低前就主动采取维护措施 (图1) 。

设备态势评估是通过建立关于设备运行过程中的各种参数组织形成的视图, 将评估设备的当前运行工况和周围环境、运行相关设备有机结合起来, 分析并确定故障事件发生的可能原因, 从而获得设备运行特性和可能的故障事件趋势的态势估计, 并形成最终的综合态势评估视图[14]。因此, 可将态势估计归为一个多假设分类问题。为对水电设备性能降低状态进行有效的在线检测和诊断, 本文提出了一套计算方法, 其工作原理见图2。

在水电设备通用态势评估诊断模型中, 从功能上将模型分为3层结构:态势特征层、态势理解层、态势评估层。每层可以根据不同的问题域实现不同的功能, 3层过程结构共同完成态势评估诊断的过程。为此, 将态势评估的过程分为态势特征提取过程、态势理解过程、态势评估过程 (见图2) 。

(1) 态势特征提取过程。特征提取过程的输入源为该时刻当前环境下的多源传感器采集的水电设备态势单元信息向量, 表示如下:

St={SΤ1, SΤ2, , SΤn} (1)

式中:Stt时间的单元信息向量;Tjt时间第i个传感器采集的设备特征信息。

为此, 连续时刻的水电设备态势单元信息向量就组成了态势信息空间S, 态势特征提取的过程就是从态势信息空间S中提取态势特征向量Ai的过程。态势提取过程实质上是寻找映射f:SA的过程。

(2) 态势理解过程。态势理解过程根据态势特征层生成的态势特征向量Ai对当前态势进行解释, 用于判断当前设备的各种运行状态, 进一步形成设备态势理解空间P, 并通过不断到来的特征向量修正态势理解空间P

全部工况假设态势空间为Pt={PT1, PT2, …, PTn}, 其中元素为设备运行工况中全部可能出现的态势分类。当前获取的态势特征向量集合为At={AT1, AT2, …, ATn}, 态势理解过程实质上是寻找映射g:AP的过程。

(3) 态势评估过程。态势评估过程是基于当前已经获得的设备态势理解空间P, 对未来可能出现的故障发展态势进行预测, 从而以可能性的方式给出设备的工况态势趋势, 即已知t时刻的态势P (t) , 求tt时刻的设备运行工况态势P (tt) 。态势评估过程是建立映射φ:P (t) →P (tt) 的过程。

简单来说, 图2所示的计算装置, 它的输入是矢量S= (S1, S2, …, Sn) , 输出是矢量P=F (S) 。根据给定的输入状态S来计算输出矢量P, 需要进行映射变换f:SA;g:AP

其中, A是中间单元矢量 (association cell vector) , 通常由一个比较大的内存地址表组成。对于给定的一个输入矢量S= (S1, S2, …, Sn) , 映射函数f即指向一些内存地址, 这些位置是在中间单元矢量A中, 通常被叫做中间响应单元 (active association cells) 。每个中间单元都配有一定的权重 (即对输出产生影响的一组成数值) 。如果输出矢量P是一维的, 就只有一个权重, 如果Pn维的, 就有n个权重。映射函数g使用中间响应单元的权重, 并生成输出值。如果每个中间响应单元都有权重, 函数g可以是简单的求和, 也可能根据记忆训练和存储过程不同, 情况也会不同。因此, 任何输入矢量都是一组内存地址指示器, 而输出矢量最简单的形式是这些地址指示器的权重的和。每个输出矢量P= (p1, p2, …, pn) 的元素都由一个分立的计算装置按照下面的公式计算:

p (k) =a1 (k) ω1 (k) +a2 (k) ω2 (k) ++an (k) ωn (k) (2)

式中:A (k) ={a1 (k) , a2 (k) , …, an (k) }是第k个看门狗的中间单元矢量;W (k) ={ω1 (k) , ω2 (k) , …, ωn (k) }是第k个计算装置的权重矢量。对应于每个输入的输出值可以通过改变中间响应单元的权重值来改变。

给一个计算装置输入函数的步骤是:

(1) 假定F是本文计算装置计算的函数, P=F (S) 是输入空间每个点上的输出矢量所期望的值。

(2) 在输入空间中选择点S, 其中P是要存储的, 与在此点上的函数值P*=F (S) 进行比较。

(3) 对P= (p1, p2, …, pn) 和P*= (p*1, p*2, …, p*n) 中的每个元素, 如果|pI-p*i|<ei, 其中ei是可以接受的误差, 则不需计算所期望的值被存储。但当|pI-p*i|>ei时, 则在P*每个的权重值上加上Mi= (pI-p*i) /N, 其中Np*i的权重值的个数。

一组输入数的数值就像指向随机数表格的指针, 这些随机数又组成了权重值的一组地址。这些地址所指示的权重值表中的数值经过求和后成为输出值。训练的过程是指根据当前的求和值与某个输入值所形成的输出期望值之间的误差, 来调整表中的权值。

1.2 用于态势评估的基于MBD的贝叶斯网络模型

为了克服基于模型的诊断 (MBD) 方法不能确定诊断最优解的缺陷, 提出以MBD生成的最小诊断集构建贝叶斯网络 (BN) 的诊断方法, 它能通过BN确定候选诊断解的发生概率, 进而确定系统最有可能的诊断解。

(1) 定义1。一个系统可以由一个三元组 (SD, COMPS, OBS) 表示, 其中SD为系统描述, 是一阶谓词公式的集合, 它描述了系统正常输入、输出行为以及它们之间的拓扑关系等;COPMS为系统组成部件, 是一个有限的常量集;OBS为一个观测集, 是一阶谓词公式的有限集, 它反映了系统的某些可测点在特定情况下的值。另外, 系统行为是指系统所有可测量点在系统各种正常工作情况下的集合, 用BEH表示, 因而当系统正常工作时, 任作一次测量, 都有OBS∈BEH;系统故障时, 任作一次测量, 都有OBS∉BEH, 称其为征兆。通常BEH不能显式表示, 仅推理时对特定值做预测。

从上面的定义可知, 对于同一征兆, 若有多个最小诊断解, 如果不考虑各最小诊断解发生概率的话, 检测次数将会增加, 从而增加检测成本。因而本文考虑通过贝叶斯网络 (BN) 确定候选诊断解的发生概率, 进而对系统最有可能的故障件进行检测, 以减少检测次数, 降低检测成本。然而, 当最小诊断解较多时, 构建的贝叶斯网络将非常复杂, 增加诊断难度[1,12]。对此, 本文在文献[7,15]的基础上引入超件概念, 以简化所构建的BN。

(2) 定义2。对于一个系统可能存在的各种不同征兆引出的所有最小冲突集, 总存在这样一组元件, 它们总是同时属于其中的某个 (些) 最小冲突集, 或同时不属于其中的某个 (些) 最小冲突集, 由该组元件所组成的器件称为超件, 符号S。 该组中的元件称为超件S的子件, 当该组元件数目为1时, 则其超件为该元件自身。

超件具有如下特性:

①性质1。令符号c¯为故障件, 符号c为正常件, 若SON (S1) ={c1, c2, …, ck}, 则Ρ (S1) ¯=Ρ (c¯1c¯2c¯k) , 且对于S1任意一个子件ci, 都存在Ρ (S1¯|c¯i) =1;

②性质2。系统的每一个观测点输出对应于一个超件的输出, 即一个超件输出不能包含2个 (或以上) 观测点输出且一个观测点输出不能包含2个 (或以上) 超件输出;

③性质3。一个超件 (输出值为观测值的除外) 的输出肯定同时影响2个 (或以上) 不同超件的输入。

(3) 定义3。Dl-1是超件层诊断问题, 即Dl-1= (SD, SUPER-COMPS, OBS) ;Dl是零件层诊断问题, 即Dl= (SD, COMPS, OBS) 。

(4) 性质4。令∏l-1、∏l分别为Dl-1与Dl的最小冲突集, Δl-1、Δl分别为Dl-1与Dl的最小诊断集, 显然∏l-1与∏l一致且Δl-1与Δl一致, ∏l-1只是∏l的抽象, Δl-1只是Δl的抽象。

由该性质可知Dl-1诊断解Δl-1不存在失真, 即用Dl-1诊断时, 诊断解Δl既不会被丢失也不存在多余诊断解, 因而可以用Δl-1构建贝叶斯网络, 这比直接用Δl构建来得简洁, 条件概率计算更简单。这是因为用Δl-1将大大减少最小诊断解。

直接根据定义确定超件是十分繁琐的, 将失去引入超件的意义, 因而我们利用系统有向图及超件性质构建超件。

(4) 定义4。系统有向图G=<C, E, I, O>。C为系统的组成元件集, C={c1, c2, …, cn};E为有向边, E={e1, e2, …, em}, 反映元件之间的数据流向;I为系统的输入, I={i1, i2, …, ik};O 为系统的输出, O={o1, o2, …, oj} 。

(5) 定义5。超件中作为超件数据输出的元件称为超件的输出节点;作为超件数据输入的元件称为超件的输入节点;超件是由超件的输入、输出节点以及超件的输入节点输出数据在流入输出节点之前经过的所有元件组成。

显然超件的输出节点必与其他某一 (些) 超件的输入节点相连, 因而只要确定了超件的输出节点cO, 就能够确定超件。

由超件性质2和3, 可以得出确定其输出节点cO的方法, 即输出为观测值 (OBS) 或其输出与2个 (或以上) 其他元件的输入相连且那2个 (或以上) 元件的输出数据最终流入至少2个不同观测点的元件就是cO

基于上述方法, 我们可以直接根据系统有向图确定系统中的超件, 如图3。本文所构建的BN分为4层, 分别为观测层、最小诊断层、超件层、元件层。观测层为系统当前的观测值;最小诊断层是根据当前的观测值, 并通过MBD确定的所有最小诊断集 (解) ;超件层是每个最小诊断解分解的所有超件集, 当最小诊断解只包含一个超件, 则该超件既在最小诊断层又在超件层;元件层是组成超件的所有元件集, 当元件自身为超件时, 则该元件既在超件层又在元件层。

设系统是由一组元件{c1, c2, …, cm}组成, 其中每一个元件在未对系统做观测之前, 都有一个先验概率值, 如元件出厂时标定的故障概率, 假设pi是元件ci正常概率值, 即P (ci) =pi, 则其故障 (先验) 概率值为Ρ (c¯i) =1-pi, 根据超件性质1可求得超件的概率值, 进而求得每个最小诊断解及当前观测值的发生概率。再通过式 (3) 求得各层节点间的条件 (后验) 概率, 例如元件ci的故障后验概率Ρ (c¯i|S¯j) =Ρ (S¯j, c¯i) Ρ (S¯j) Sjci的超件。最终根据式 (4) 确定在观测值B发生的前提下, 每个元件的故障概率, 概率大的将优先检测, 直到找到准确解。

Ρ (A|D) =Ρ (A, D) Ρ (D) (3) Ρ (c¯i|B) =Ρ (Μ|B) Ρ (S¯j|Μ) Ρ (c¯i|S¯j) (4)

式中:D为上层节点;A为下层节点;M为某一最小诊断解;B为当前观测值;ci为某一元件;Sjci的超件。

2 实例分析

水电厂采用水力能源进行发电, 水电厂调速器系统是根据水轮机的转速来调整水轮机的导叶开度的设备, 调速器系统是水电厂中的关键子系统, 可用于稳定发电机的输出电压和频率[4]。

2.1 贝叶斯模型属性变量、类变量的确定

本文从多个地区水电厂的历史资料和近年有关文献资料上收集了大量具有明确结论的水电厂调速器故障数据, 并参考了文献[1,2,3,4,5,6]对故障实例与决策表的划分经验, 将调速器系统工况异常态势分为接力器故障S1、甩负荷故障S2、空载频率故障S3等态势。考虑节点的状态为:偏低、正常、偏高。整理的故障属性集、故障类、训练样本集分别如表1、表2、表3所示。

注:表3中的值0、1、2分别表示属性值和趋势值均不超标、属性值或趋势值超标、属性值和趋势值均超标;“*”表示不能确定的属性值。

2.2 贝叶斯网络分类器的选择和参数的确定

在不同领域中, 贝叶斯网络分类器表现的性能不同。当样本数量较少时, 在众多的分类模型中适宜选择NB网络分类器或者TAN网络分类器[16,17,18]。贝叶斯网络分类器参数包括结构参数和概率参数, 参数设置可根据专家经验确定, 也可从样本集中学习获得。通常, 由领域专家给出属性变量和类变量的因果图, 或者从样本集中学习网络结构。给出众多节点变量的条件概率参数, 对领域专家比较困难, 此时可以通过学习样本集得到条件概率参数。本文首先按照选定的模型, 从样本集中学习获得结构参数和概率参数, 然后, 依据可靠性指标对模型参数进行调整, 实现专家经验与样本知识的结合。

通过故障树分析和专家经验, 可以获得贝叶斯故障诊断模型 (见图4) 。图中的SF (System Fault) 是顶层系统运行态势。

选取贝叶斯先验概率是用贝叶斯模型求解的第一步, 也是比较关键的一步。常用的选取先验分布的方法有主观和客观2种。主观的方法是借助人的经验、专家的知识等来指定其先验概率。而客观的方法是通过直接分析数据的特点, 来观察数据变化的统计特征, 它要求有足够多的数据才能真正体现数据的真实分布。在实际应用中, 这2种方法经常是结合在一起使用的[19]。为此, 本文利用历史数据和专家经验知识, 在定义随机变量的基础上确定参数的先验分布密度 (采用共扼先验分布, 如果对先验分布没有任何信息, 就采用无信息先验分布的贝叶斯假设。) , 最终根据式 (4) 确定贝叶斯网络的条件概率矩阵如下:

Ρ (S1|SF) =[0.50.30.20.20.50.30.30.20.5]Ρ (S2|SF) =[0.70.20.10.10.70.20.20.10.7]Ρ (S3|SF) =[0.60.20.20.20.60.20.20.20.6]Ρ (A1|S1) =[0.80.10.10.10.80.10.10.10.8]Ρ (A2|S2) =[0.40.30.30.30.40.30.30.30.4]Ρ (A3|S2) =[0.50.20.30.30.50.20.20.30.5]Ρ (A4|S2) =[0.60.30.10.10.60.30.30.10.6]Ρ (A5|S3) =[0.20.40.40.40.20.40.40.40.2]

在网络中, A1、A2、A3、A4、A5 都是证据节点, 可以将多传感器系统采集的数据作为证据输入到这些节点, 并进行证据传播更新过程。通过专家经验, 我们可以获取SF节点的的先验概率为π (S) = (0.3 0.4 0.3) 。

2.3 故障诊断分析

将该评估模型应用在调速器系统设备诊断中, 上百次诊断的平均正确率为95% (见表4) , 证实在调速器诊断中应用该态势评估诊断模型可以有效地提高评估系统的判决可信度。

实际工作中常常无法获得完备信息, 从而影响诊断方法的直接判断。应用贝叶斯网络分类器进行故障诊断并非在任何情况下都很完美, 研究表明在测试样本属性信息缺失较少的情况下正判率较高, 但当属性信息缺失较多时, 由于非关键属性的不完整干扰, 模型的正判率明显下降 (见表5) 。

图5为本文诊断方法和专家系统方法在不同样本的情况下诊断准确率的拟合曲线变化规律图。

从上述实验经数据对比分析, 可以得出如下的结论:

(1) 传统的专家系统方法和本文方法均能给出正确判断。专家系统的诊断性能明显低, 其主要原因在于:在专家系统方法中, 主要以当前的实际运行数据与规则库中的规则阈值相对比, 以判断发动机当前的运行状态, 因而核心问题在于阈值的选取, 阈值过高或过低都会引起故障诊断的误差。

(2) 本文方法的诊断准确率明显高于专家系统的方法。其主要原因在于专家系统是事前学习, 当规则确定后, 很难改变, 无法适应复杂的不确定的故障的形式。专家系统的规则是由专家经验总结得出的, 对某些关键参数非常敏感, 当这些参数值超过正常值范围很多时, 专家系统很容易得出诊断结果。而当这些参数值在正常值附近波动时, 专家系统就很难给出正确的诊断结果。而本文方法实现了在线学习的功能, 以不断适应运行过程中传感器获取的不断变化的数据, 在任何情况下都可以得到准确率较高的诊断结果。

3 结 论

针对水电设备故障诊断中属性变量常常不完备, 已有故障诊断方法处理不完备信息存在不足的状况, 将贝叶斯网络分类器应用于水电设备故障诊断领域。本文在贝叶斯网络的基础上, 建立了一种用于水电设备的态势评估诊断模型, 提出以MBD生成的最小诊断集构建BN的诊断方法, 通过BN确定候选诊断解的发生概率, 进而找出系统最有可能的诊断解, 并针对当最小诊断解较多时, 构建的BN将非常复杂, 不易诊断的问题, 提出了超件的概念, 并将超件应用于BN构建, 使得构建的BN简化, 有利于提高诊断效率。通过对水电厂调速设备系统的诊断过程为例, 与传统的专家系统诊断方法加以对比, 经数据的分析表明基于在线思想的贝叶斯网络故障诊断方法可以有效地处理不确定信息带来的复杂性, 从而实现高效、准确的故障诊断的进行。

摘要:鉴于水电设备故障诊断中的信息和知识具有随机性和不确定性的特点, 利用贝叶斯网络表达知识灵活、分析处理不确定性与关联性问题能力强的优点, 提出了以MBD生成的最小诊断集构建BN的诊断方法, 并建立了一种用于水电设备的态势评估诊断模型。该态势评估模型的功能分3层结构:特征级、理解级、评估级。将贝叶斯网络中的节点按照功能分为态势节点和事件节点, 并在推理过程中将传感器采集信息作为事件节点的证据用来更新态势节点概率, 并反过来影响事件节点的概率。详细阐述并验证了该方法解决信息不完备问题的优越性。该模型还可以通过不断积累完善训练样本, 自动修正网络结构参数和概率分布参数, 提高诊断效果。实例验证表明了该方法的有效性。

模型评估与方法 篇3

关键词:会展家具;拆卸回收;评估系统;研究

拆卸设计与装配设计概述

装配与拆卸设计(Design for Assembly and Disassembly, DFA&DFD)的基本含义是:在会展家具开发的早期就兼顾可装配性能和可拆卸性能,立足于产品的整个生命周期设计(Life Cycle Design),从家具性能、拆卸组合、回收利用等角度,充分考虑产品的装配与拆卸环节以及其相关的各种因素的影响,以便在保证会展家具功能要求的前提下,使产品装配与拆卸的成本最低。

1.实施装配与拆卸设计的意义

在产品设计的早期实施装配与拆卸设计具有重要的意义,主要表现在以下几个方面:

(1)有利于降低生产成本,提高产品利用率,通过运用DFA&DFD方法对产品的整个结构进行优化,在设计开发的早期进行纠错,从而提高会展家具使用效率,并节约开发的开发成本。

(2)有助于会展家具设计集成和综合质量的提高,从家具性能,结构,装配,回收等角度对产品进行DFA&DFD的设计,能够使设计出来的会展家具不仅满足可装配的要求,而且在其整个生命周期中,能多次折叠拆卸&回收利用,从而系统的提高产设计的综合质量。

(3)能够方便产品的维修和回收处理,延长产品的使用周期,良好的可拆卸性(DFA)性能,是会展家具能够进行维修或再利用的前提条件,通过对拆卸与装配设计的研究,可以推迟新的废弃物产生的时间,方便废弃物的处理,既可节约资源又有益于环境保护。

2. 面向拆卸与装配的家具设计

拆卸与装配是设计和使用和回收家具的过程中正好相反的两个过程,装配设计(DFA)与拆卸设计(DFD)之间既有相同点又有不同点。单纯依照装配设计(DFA)设计原则设计出来的产品不一定便于拆卸,反之,依照拆卸设计(DFD)原则设计出来的产品也不一定便于装配。

拆卸就是从家具的部件上有规律的拆下可用的零部件的过程,同时保证不因拆卸过程而影响后续工艺对零部件性能的要求。其主要的应用领域包括:家具的折叠,拆装,组合,再利用,维修、回收等。拆卸按方式进行分类,可以分为以下几种:破坏性拆卸(Destructive Disassembly)、部分破坏性拆卸( Partial Destructive Disassembly )和非破坏性拆卸(Non-destructive Disassembly)三种。本文主要集中于非破坏性拆卸的研究。拆卸在实际的设计应用中,可以作为实现有效回收策略的重要手段,它不仅有助于实现材料的回收,而且有助于零部件的重用和再制造。对资源的综合利用和可持续制造有重要的意义。

会展家具拆卸与回收模型的建立

1.可拆卸式会展家具的优点

可拆卸式会展家具不仅在设计、生产、运输、销售、储存、安装等方面能够适应现代化大工业生产方式,而且从生态环保的角度,它对环境保护具有重要的意义,有着一般会展家具难以比拟的优点:

(1)产品结构模块化、统一化,使产品有较大的可预测性;

(2)减少了可回收零部件和材料再次使用所需的工作量;

(3)拆卸分离简单快捷;

(4)拆下的零部件易于手工或自动化处理;

(5)回收材料及残余废弃物易于分类和处理。

2.会展家具拆卸与回收模型

会展家具的拆卸回收应该充分利用已有的产品装配模型。在综合设计和决策人员的知识以及经验基础上,交互式建立产品拆卸回收分析模型。在已有模型的基础上,针对维修和回收的特点,研究新的、更有效的产品拆卸回收模型。

(1)生命周期模型

生命周期设计(Life Cycle Design)是从产品性能、环境保护、经济可行性的角度,考虑产品开发全生命周期(包括产品设计、原材料的提取、产品的制造、包装、销售和使用、用后的回收与处置全过程)。生命周期的设计是从产品概念设计阶段一开始就要考虑产品周期的各个环节,以提高产品综合性能,满足产品的绿色属性要求。

(2)并行工程模型

并行工程模型是指在家具设计的初期就考虑产品从概念形成到产品报废各阶段的因素,并在设计过程中随时进行信息交流和反馈,实现多因素,多目标、闭环设计过程的产品最优化。使后续环节中可能出现的问题在设计的早期阶段就被发现,并得到解决,从而使会展家具在具有良好的可制造性、可装配性、可维护性及回收再生等方面的特性。

(3)模块化模型设计

模块化模型设计是指人们用各种连接件或插接结构将零部件组装而成、可以反复拆卸和安装,设计并划分出一系列基本功能模块、辅助功能模块和备选功能模块。力求以尽量少的模块组成尽可能多的产品,并在满足要求的基础上使产品精度高、性能稳定、结构简单、成本低廉。其目的在于用有限的产品品种和规格来最大限度又经济合理地满足用户的要求。

会展家具拆卸与回收模型的评估系统

会展家具的拆卸回收,应该根据企业的设备情况、当地的资源、能源等因素选择不同的拆卸方法和回收流程。因此回收工艺流程的评价指标要能尽可能地涵盖回收流程决策评价中的各种因素。

1.动态性。会展家具拆卸与回收模型的评估指标应是动态的,可以后续根据会展企业或参展商的实际需求和使用情况,及时进行调整和修改:增加、删减、调整或修改指标体系中的任一指标。

2.灵活性。该指标系统的框架要求会展家具的拆卸和回收具有可移动性和可扩展性。即拆卸与回收指标体系中的子指标可以独立成为新的评价指标方案,同时各个子结构之间可以互相调换和重组。

3.唯一性。会展家具拆卸与回收模型中的评价指标不能随意替换,体系中的任一指标都不允许重复出现在同一个评价指标方案中,即该指标体系中的评价指标具有唯一性。

4.层次性。拆卸与回收的指标评估体系中的每一个指标都可以由若干个子指标构成,这样有利于更加全面的描述某项评价因素的复杂内容。

5.顺序性。会展家具拆卸与回收的指标体系有严格的顺序性,层级和顺序已经确定的评价指标不能再和它的父级或子级交换位置,以此保证整个指标体系具有一致方向。

随着国民经济的快速发展,会展家具的可回收和再利用的程度,逐渐成为人们关注的焦点,也决定了我国的会展产业能否持续和健康发展,会展家具的可装配性和拆卸性是产品能够再生的重要前提,面向拆卸的设计是解决产品回收和再利用的有效设计方法。在产品的设计过程中适当的采用拆卸和装配设计,对提高拆装零部件的效率,降低拆装费用和提高会展家具的回收利用率具有十分重要的意义。

参考文献:

[1] 徐滨士. 中国再制造产业及再制造技术新进展[J]. 热喷涂技术. 2010(03)

[2] 李雪莲.家具模块化设计方法研究与设计实务[D].南京林业大学硕士学位论文,2007:24

[3] 陈志伟,徐鸿翔. 面向拆卸设计的可拆卸性评价指标研究[J]. 制造业自动化. 2003(07)

(作者单位:南京工业大学)

作者简介:周波(1979-),男,籍贯:江苏南京,南京工业大学副教授,南京林业大学博士研究生,研究方向:展示设计、室内设计。

企业制度体系评估的步骤与方法 篇4

制度建设是企业管理三大基础工作之一,另外两项基础工作是流程建设与企业文化建设。企业有制度不等于有管理,只有执行制度才是管理。制度设计只是奠定了管理的基础,能否执行才是关键。因此,制度设计完成之后,接下来的工作就是制度评估,确认制度是否符合企业实际、是否可行。评估企业制度,可以企业内部员工进行,也可以请第三方专业人士评估。本文从第三方评估的角度谈谈制度评估的步骤与方法,供企业管理者参考。

制度评估包括体系评估与单一制度评估。不论体系评估,还是单一制度评估,企业都必须建立有第三方专家参加的企业制度评估领导小组,企业负责人担任制度评估领导小组组长,专家担任副组长,企业各系统负责人担任领导小组成员,企业制度设计负责人担任项目办公室主任,另设项目秘书一人。项目领导小组制订企业制度评估的原则、方法、目标与项目推进计划,办公室主任协调项目进度。项目秘书服务项目领导小组,跟踪评估进度、整理评估文件。

首先介绍制度体系评估的思路与方法。

制度体系评估是指对企业所有制度进行整体评估,重点评估企业制度体系的完整性、制度体系的协调性、与流程体系的互补性、与企业文化的兼容性、与企业发展阶段的匹配度。

1.制度体系的完整性是指整个制度家族有没有重要制度缺失。比如说企业的人、财、物、生产、研发、技术、品质、市场、客户、采购、后勤诸方面工作是否都有成文制度,能否保证主要工作“有章可循”。

2、制度体系的协调性是指成文制度相互之间不交叉、不重叠、不矛盾。不能出现此制度与彼制度矛盾、不一致,或者说顾此失彼、前后不一。不能各说各话、制度内容互相打架。

3、与流程体系的互补性是指有流程规范的就不必在制度中重复,同时又保证二者的相互配套、相互补充。流程图就是对制度的延展和补充。流程体系健全的企业,一是制度的数量可能减少,二是制度的内容更加简练。

4、与企业文化的兼容性是指制度规定不能与企业的价值观念体系冲突。不能企业文化讲“以人为本”,而制度规定却完全无视员工安全,只追求产值利润不考虑其他。或者企业文化要求真诚待客,而制度规定又要求员工不择手段唯利是图。

5、与企业发展阶段的匹配度也就是与企业战略的吻合度,是指制度内容不能与企业战略脱节,不能偏离战略方向,不能超越现实,好高骛远、空话连篇,必须切合企业实际,可操作、可执行、能执行。

体系评估也叫总体评估。总体评估由企业制度评估项目领导小组集体讨论评估,专家制订详细的评估标准,经领导小组审批通过后,按双方协商一致的评估计划进行。项目办公室主任负责按计划跟进。

事实上,对企业制度体系的评估与单一制度的评估不能完全分开。总体评估必须做,但是完成总体评估后,还不能立即对制度体系是否合格是否可靠做出结论,还必须对单一制度逐一评估之后才能最后做出总体评估结论。

单一制度是否可行、是否合格,可以从以下九个方面进行评估:编号有序、名称规范、目的明确、责任到岗、对象清楚、操作唯

一、奖惩明晰、时效具体、接口清晰

单一制度评估由项目领导小组成员按照管辖系统分头主持评估,由制度设计者、制度执行员工代表参加,或者设立若干个评估小组按照专家设计经企业评估项目领导小组讨论通过的评估标准进行讨论评审,各小组分别在规定的时间内完成评估工作,并将评估结论列表上报,最后由企业评估项目领导小组进行总体评估,做出总体评估结论。专家和项目小组成员在评估结论上签字,以示负责。

不论在什么规格的评估会上,都必须有员工代表参加,一定要让制度设计充分反映各方阶层员工的意见,以确保上下认同、切实可行。

中精纵横企业管理顾问有限公司总部设立于广州,是中国本土制造型企业管理咨询公司中最具成长力的品牌。我们的成长力源于“切中核心问题,细节精益求精”的作业模式。

中精纵横成立以来,我们已经为许多中小制造企业提供高质量的专业化咨询服务,有效的解决了众多中小企业普遍存在的“经营家族化”“管理人情化”“制度表面化”“团队内耗化”“企业文化沙漠化”等问题。曾服务过的客户涵盖:电子、五金、纸品、包装、家具、服装、电器、橡胶、塑胶、灯饰和建筑材料等诸多行业。

模型评估与方法 篇5

陕西省雷电监测资料处理方法与评估

针对陕西省雷电监测系统获取的资料提出基本处理方法,对监测产品的发布类型初步规范.采用2004年6月-2006年9月闪电定位资料,对陕西省雷电活动进行试分析,得出全省范围的`雷电活动时空分布结论.对雷电监测资料在评估中的应用提出了基本思路.

作 者:庞亚峰 PANG Ya-feng  作者单位:西安市气象局,西安,710016 刊 名:陕西气象 英文刊名:JOURNAL OF SHAANXI METEOROLOGY 年,卷(期):2009 “”(z1) 分类号:P468 关键词:雷电监测   资料   评估  

责任心评估模型 篇6

评估一个人的责任心比较流行的方式有两种:

一是:从流程上评估,二是:从“态度”和“行为”两个维度去评估。

所谓从流程上评估,亦即通过考察一个人在做某件事情或完成某个目标中从事前事中事后所思所为,去考查此人的责任心的方式。考查3个阶段2大要素,分别是事前计划与准备,事中控制与推进,事后总结与助攻。

从态度和行为上评估,实际上时考察一个人做人和做事两方面表现,概括起来可从六个维度进行考察,进而评价一个人的责任心的方式。

下面就本人几年来工作的经验,简单地介绍一下第一种评估方式的建模和操作方法:

事前

各轴满分5分,据知行合一的原理,有计划有行动才得分,有计划无行动和无计划无行动均无分,无计划有行动(调动了资源),根据事中推进的难易评分。只是要注意将这些定性的事后

事中

评分准则通过一定的状态描述来取评分标准,以近似评价各维度分数。

获取信息的方式多种多样,可以是情景演示,可以是执行游戏,也可以是问话,如下面:在过去的学习、生活、工作中你处理过不少事情,举一件印象比较深刻的,描述一下当时你是怎么考虑的,采取了哪些行动,效果又怎样?

第一种方式评价结果稍显粗略,但易于操作。第二种方式则较为精细,操作起来须费些功夫。根据评价要素的不同,第二种方式的评价模型如下(我们仍然用雷达图):

做事 关注细节做人 敬业精神543210做人 积极主动分值分值分值做人 为人正直做事 过程监控做事 表率作用

最简单易行的考察方式-------问话 要素

一、敬业精神

释义:能够尽职尽责第履行工作职责,试图调动各种资源、发挥创造力地完成工作 问话

1、在以往的工作、学习和生活中,你感觉压力最大的是什么?怎么想的?怎么做的?效果怎么样? 答案越正向和肯定,分值越高。

要素

二、积极主动

释义:在没有外界压力的情况下,能够自觉地完成岗位职责之外且无人负责的工作。问话

2、你身边的电话响了,然而你的同事又不在位上,你会怎么办?

A 通常要等它响几声,之后看一下没别人认,我再接。B 如果不忙就去接,忙了就不接。

C 通常不去接,因为不知道对方是谁或者不知道是什么事情,怕尴尬。D 通常去接,并告诉对方自己同事不在,让他一会再打过来。E 通常去接,并了解一下对方是谁或什么事情,以便转告。分值依次是:1,2,3,4,5

要素

三、为人正直

释义:不考虑个人私利,为了公司的利益,敢于坚持原则,不怕得罪人,敢于承担责任。问话

3、假如你们公司规定:迟到不能超过三次,三次以上者每次计旷工半天。而在你的考勤核算中有一个人,有一个平时德高望重的干部偶尔迟到超了一次。当他找你问及此事时,你怎么讲? A迟到是偶然的,又是老员工,可以酌情放宽,我带着你去跟领导反映一下。B领导规定这样的,超过一次就要算半天旷工,我也没办法,要不你去找领导问问。C这是公司的规定,我们只能按制度办

D 您是知道的,公司既然规定了,我们就要带头执行呀!E这只是偶然,我想咱们做领导的不会再有第二次了。分值依次是:1,2,3,4,5

要素

四、表率作用

释义:为实现公司战略目标和工作结果的达成,用自己的行动去影响他人和带动他人。问话

4、某股份制民营企业,某阶段核心领导狠拼业绩。公司明文规定:所有职工必须穿工衣上班,且公司给每个员工都发了两套工衣,包括领导。一个下雨天的上班时间,车间的绝大部分员工都穿工衣;办公室人员有一半人穿了,一半人没穿,其中有些核心领导也没穿。作为公司这项制度的监督落实者,你怎么看?

A 既然是下雨天,特殊情况特殊考虑嘛,个别人没穿也没事。B 领导都没穿,看来对天气的情况都有考虑,今天就算了。

D 办公室里的领导和其他办公职员跟车间不同,没必要整天都穿那套工衣服,将来考虑给定做不同的制服。

E 调查一下,情况是偶然的,要先汇报给直接上司知道,之前也出现过或许多人都有不同的看法,要想一定的对策呈报给上司。分值依次是:1,2,3,4,5

要素

五、过程监控

释义:根据工作计划,对工作过程进行监督,确保工作结果的达成

问话

5、你是某个项目组的成员之一,项目的关键问题都已经攻克,整个项目也进入尾声,就差某些局部细节的复查和资料的整理。这时有几个人提出喝茶、唱歌等活动放松一下,你怎么做?

A 自己不喜欢或者累了,不去凑热闹。

B 看一下别的人,选择出去放松的人多,就跟着去。C无所谓,去也行,不去也行。

D最后的工作做完了再说,不然我睡不着觉的。

E 按照分工,要求项目组的部分人留守,把工作做完再去。分值依次是:1,2,3,4,5

要素

六、关注细节

释义:考虑问题周密,做事细致,追求工作成果的完美。

问话

6、公司要在总部组织全国性的营销会议,将历时3天,由行政副总领衔统筹,组成会务小组,负责整个会务的接待和会议服务工作。副总已经给各小组成员分工明确了,大家各自也很清楚自己该在什么时间什么地点做做什么事情,做为会务组的协调者,你该做些什么呢?

描述的要点要切合工作开展的五步骤给分:

1、有目标分解

2、有危机计划

3、有时间节点

4、有过程控制

模型评估与方法 篇7

一、电子商务测度的理论模型

OECD的研究报告认为,从各国电子商务测度的发展来看,电子商务测度的指标体系应该包括三个大类。首先是电子商务的就绪度,即支持电子商务发展所必须的技术、商务和社会基础设施如何;其次,是电子商务的应用度,即电子商务发展的规模和应用程度,包括哪些行业发展快,哪些行业发展慢,领先的行业和应用是什么;第三,是电子商务的影响度,即发现电子商务的附加价值和乘数效应,评估电子商务在提升经济和社会活动效率以及创造新的财富源泉方面的特殊贡献。

电子商务的发展可以用类似于罗杰斯的创新扩散理论的S曲线(sigmoid function)来描述,就绪度、应用度、影响度则反映了电子商务发展水平的不同阶段。对于罗杰斯理论的深度人们可能有不同的看法,但是,作为研究新生事物发展扩散过程的理论描述,罗杰斯的S曲线理论已经被广泛地采用。近年来,关于信息化、信息社会、电子商务、电子政务等方面发展状况评估的许多指标体系,实际上都是以S曲线的三阶段理论——就绪度、应用度、影响度为基础的。有些指标体系重点描述就绪度,有效指标体系重点描述应用度,至于影响度的描述,由于难度较大,目前仍处于探索阶段。

电子商务的就绪度指标通常反映一个国家经济、社会、技术基础设施和使用的程度,特别是反映一个国家是否具备发展电子商务的基本条件,而测度的重点是电信基础设施以及整个社会掌握信息技术的能力。电子商务的应用度指标通常反映电子商务交易活动的规模、增长速度、以及电子商务事务处理或业务活动的主要性质。电子商务的影响度指标通常聚焦于电子商务所产生的附加价值以及电子商务的乘数效应,电子商务对生产过程、业务模式的冲击、以及对业务活动、工作场所以及整个社会的影响和冲击。

二、电子商务绩效评估方法

国际上对电子商务测度的研究,起步于对知识经济和信息经济测度的研究,而最早对知识经济和信息经济进行定量测度研究的是马克卢普和波拉特,他们的研究对后来的发展具有重要影响。马克卢普在20世纪60年代首先用最终需求法(又称支出法、最终产品法)对美国的知识产业进行测算,其次是波拉特对美国信息经济的测度研究。他们的研究虽然并不是对电子商务的测度,但是对于电子商务的测度研究具有极大的借鉴意义,并对此后开展的各类信息化和电子商务的测度研究开辟了一条道路。增长核算的索洛(Solow)模型是电子商务和ICT对经济影响定量研究的主要方法,为当前主流研究普遍使用。DEA方法被用来对全要素生产率分解,确定技术效率变化,因此也可以用于电子商务的绩效评估。抽样调查和回归分析是利用微观数据研究的最常用方法,英国国家统计办公室和Net Impact作了最典型的应用。平衡计分卡方法也被推荐到企业电子商务绩效评估中。

(一)马克卢普——波拉特信息经济统计分析法

马克卢普——波拉特信息经济统计分析法来自于美国经济学家马克卢普(Machlup)以及波拉特(Porat)分别在20世纪60年底和70年代所做的开创性研究。马克卢普在对知识产业进行分类基础上,使用最终需求法测度美国知识产业的生产与分配过程。不过,马克卢普方法测算数据不易获得,并且有相当一部分数据被重复计算。1977年,波拉特在马克卢普知识产业理论基础上,首先明确信息、信息活动、信息资本、信息劳动者与信息职业的基本概念和范畴,并将全社会信息活动根据是否直接向市场提供信息商品和服务划分为一级信息部门和二级信息部门。波拉特在对信息经济规范性定义基础上,利用国民经济核算方法和投入产出法对信息经济的产业规模和就业规模进行定量化测度,从而为信息经济测度奠定了方法论;但他们的研究方法不能直接应用于电子商务绩效评估。

(二)增长核算的Solow模型法

增长核算的Solow模型是新古典经济学的经典模型,在研究ICT对经济影响时最普遍被应用,对电子商务的绩效研究也常常被引入作为回归方程分析。在ICT对经济增长的影响分析该模型。通过把技术因素引入生产函数,测算ICT对经济增长的贡献。最先讨论技术进步对经济增长的贡献的就是索洛,为此而获得经济学诺贝尔奖。索洛将技术因素作为一个外生变量引入生产函数,指出了技术变迁对经济增长的贡献率最大,其也被视为经济增长最主要的源泉。

施赖尔(Schreyer,2000)采用基于内生增长理论的模型,模型中,资本是特别的,因为能产生知识溢出效应或者类似于罗默(1986)的正向外向性。增长核算法可以解释不同国家和不同时期之间的增长率的差异。但因为许多相互依存的关系隐藏在技术创新中,难以将整个剩余分解到对经济增长做出的单一贡献中。

通过Solow模型,可以对地区或者企业的电子商务绩效进行评估。假定技术进步平均增长速度已定,分别对资本投入、劳动投入和电子商务投入对产出的影响进行评估。也可以对各种投入进行进一步的细分,对电子商务的范围进行界定,通过分析电子商务对总产出的影响来对其进行绩效评估。从上述分析来看,一个地区或者企业应该重视电子商务建设,加大电子商务建设的投入,充分利用电子商务来提高经济效益和降低成本,可是使总产出有较高幅度的提高。

(三)数据包络分析法(DEA)

DEA数据包络分析,是A.Charnes和W.W.Coope等运筹学家在“相对效率评价”概念的基础上发展起来的一种系统分析方法。应用DEA方法对电子商务的相对有效性进行评价,首先要求评价的决策单元DMU具有同种类型,即个案决策单元DMU具有相同的投入项指标和产出项指标。其次应该建立相应的评价指标体系。电子商务过程包括企业从事电子商务的企业信息化建设以及从事电子商务的市场环境。电子商务投入可以分为“硬件”和“软件”两个方面的内容、“硬件”建设投入主要包括设备购买、网络建设、连通、各种应用软件系统的集成和开发、企业外部资源的挖掘与综合利用等。“软件”建设投入有相关标准规范问题、系统安全、信息系统使用操作、数据录入与更新、维护费用、企业员工信息化培训和技能培训、与其适应的管理机制、经营模式和业务流程的调整或变革。

电子商务本身是一项多输入和多输出的复杂活动,输入和输出的各变量因时间、地点和具体对象不同其权重比较难确定。运用DEA方法可以避免预先确定指标权重的困难,为进行客观评价创造了条件。企业进行电子商务绩效评估过程中投入与产出对应关系比较难以确定,一项产出的增加,可能由多项活动共同参与,并具体由哪项活动参与也比较难以区分。利用DEA方法对企业进行电子商务绩效评估避免了区分对应关系的困难,使绩效评估具有操作性。

(四)抽样调查和回归分析方法

西方发达国家,尤其是美、英等国开展电子商务及ICT的相关抽样调查是比较成功的,目前在我国尚未完全展开和普及。国外主要通过一系列的抽样调查来分析信息经济在经济发展中的作用和影响。英国国家统计办公室(ONS)的研究方法,具有一定的典型性。

通过抽样调查和回归分析的方法对企业应用电子商务进行绩效分析,可以对电子商务与企业产出之间的关系进行分析。但是抽样调查和回归分析对企业应用电子商务效果分析结果是模糊的,是一种定性分析,难以做出定量分析。

(五)平衡计分卡法

平衡记分卡方法将在综合评价企业长期战略目标的基础上,把企业及其内部各部门的任务和决策转化为多样的、相互联系的目标,然后再把目标分解成多项指标的业绩评价体系。它包括财务、客户、内部经营和员工能力等四个完整且相互联系的方面。借着这四个方面指标的衡量,企业一方面保留传统的衡量过去业绩的财务指标,并且兼顾了促成财务目标实现的业绩因素的衡量;在支持企业追求业绩之余,也监督企业的行为并兼顾学习与成长的方面,并且透过一连串的互动因果关系,企业得以把产出和业绩驱动因素串联起来,把企业的目标和战略转变为一套前后连贯的系统业绩评价体系,把复杂而笼统的概念转化为精确的目标,借以寻求财务与非财务之间、短期与长期的目标之间、落后的与领先的指标之间、外部与内部业绩之间的平衡。它不仅是一个指标评价系统,而且还是一个战略管理系统。

平衡计分卡方法只能是作为电子商务绩效评估的一种分析框架,真正的运用必须由企业管理人员将其和企业的管理战略与企业整体绩效评估结合起来,但是这样也带来一个问题,很难把电子商务战略的绩效与其他战略绩效区分开来,从而也就无法准确确定电子商务的实际绩效。所以如何应用平衡计分卡方法围绕电子商务战略确定其相应的各个维度指标就十分重要,既是难点,也是当前研究的焦点。

三、电子商务绩效评估方法分析结论

(一)马克卢普和波拉特的统计分析方法力图解决的是产业产值计算问题,不适用直接评价电子商务绩效。(二)利用Solow模型的增长测算法,有严格的理论基础,结果也有很好的经济解释。但对输入数据要求高,一些参数也不易确定。对电子商务应用更是如此。(三)DEA方法是专门用来评价绩效的方法,在经济问题上已有很好的应用,但由于数据不容易分解出来的原因,用于电子商务也仅仅是在探索中,未有更广泛的应用。(四)抽样调查和回归分析是最常用的方法,关键是如何用好,同样决定于数据的收集。(五)平衡计分卡方法可以为企业电子商务提供绩效评估框架,但需要其它定量方法相结合,如财务核算的方法、AHP方法、模糊综合评判法等。还有许多方法可以用于电子商务绩效评估,如投入产出分析、乘数效应分析等,可以根据实际选择在某个方面使用。但从实际应用的角度来说,越简单的方法越容易使用和进行结果比较,从而也越有意义。

四、对我国开展电子商务绩效评估的建议

研究表明,发达国家对电子商务绩效评估的研究越来越重视,研究工作也越来越规范,国家之间的比较也逐步建立。发展中国家由于数据的原因,研究面临很大的挑战,但应该开始这项工作,而且可以开展这项工作,利用微观数据的研究工作更值得重视。从国际研究趋向来看,有几个方面的特点值得我国关注。包括:(一)利用微观数据的分析成为热点和主流;(二)研究工作更加强调测算结果的权威性及其对经济规律的揭示与经济问题的解释;(三)研究结果更加注重国家或地区之间的可比较性;(四)更加关注发展中国家弱数据输入情况下的有效测算方法研究,如联合国Orbicom计划的“信息密度”法。

我国要跟上国际步伐,必须建立官方的电子商务统计指标体系和统计数据库,以及正式的研究分析结果发布制度,摆脱学院式的只注重理论方法,不注重结果的实际应用的局面。具体工作包括:(1)着手建立电子商务统计指标体系,注重企业层的电子商务数据收集、积累、完善,强调数据的可用、可比较性,加强数据收集、调查统计的组织和管理工作;(2)抓紧电子商务数据库建设,包括宏观指标数据库和微观指标数据库建设,加强数据库维护和更新管理;(3)在测算模型和方法选择和参数设定上要形成标准和规范,保证统一性,可比较性;(4)要形成测算结果的分析使用和结果公布管理制度,数据、指标与测算方法与国际接轨,保证结果的可比较性。

参考文献

[1] “CII电子商务指数研究与测算”课题组.关于电子商务水平测度的研究[J].统计研究,2001,12.

[2] 电子商务统计标准课题组.电子商务统计方案[R].2006.

[3] Alessandra Colecchia. Defining and Measuring e-Commerce: a Status Report [R]. Working Party on Indicators for the Information Society, DSTI/ICCP/IIS (99) 4/FINAL, 8 October, 1999.

[4] OECD. Measuring Electronic Commerce [R]. Committee for Information, Computer and Communications Policy, Paris, 1997.

[5] OECD. The Economic and Social Impact of Electronic Commerce: Preliminary Findings and Research Agenda [R]. OECD Working Party for the Information Economy (WPIE), Paris, 1999.

模型评估与方法 篇8

【摘要】人类工程活动既可导致地面沉降,又可加剧地面沉降,对地面沉降产生的原因进行分析与工程监测,总结出地面沉降的预测评估模型,提出预防措施,对现代大型工程有一定的借鉴意义。

【关键词】地面沉降;预测;土压力;防治措施

Disaster assessment model prediction and prevention measures analysis of ground subsidence

Zhong Wei-hua1,Xie Jian-xue2

(1.Suzhou City Water Conservancy Water Authority Suzhou Jiangsu 215000;

2.Suzhou University of Science and Technology Department of Civil Engineering Suzhou Jiangsu 215011)

【Abstract】Human activity can cause land subsidence, but also exacerbated land subsidence due to ground subsidence resulting analysis and project monitoring, summed up the land subsidence prediction assessment model, proposed preventive measures to modern large-scale projects have a certain significance.

【Key words】Ground subsidence;Forecast;Earth pressure;Prevention measures

1. 地面沉降的概念及产生原因

1.1 地面沉降,又称地面下沉或地陷,是指某一区域内由于开采地下水或其它地下流体所导致的地表浅部松散沉积物压实或压密引起的地面标高下降的现象。在城市内过量开采地下水引起的地面沉降,其波及的面积大;涉及范围广,下沉速率缓慢,往往不易被察觉;地面沉降具有不可逆特性,就是用人工回灌办法,也难使地面沉降的地面回复到原来的标高。因此地面沉降对于建筑物、城市建设和农田水利设施危害极大。

1.2 人类工程活动既可导致地面沉降,又可加剧地面沉降,其主要表现在以下几方面:

(1)大量抽取液体资源(地下水、石油等)、地下气体(天然气、沼气等)活动是造成大幅度、急剧地面沉降的最主要原因。

(2)采掘地下团体矿藏(如沉积型煤矿、铁矿等)形成的大范围采空区,及地下工程(隧道、防空洞、地下铁道等)是导致地面下沉变形的原因之一。

(3)地面上的人为振动作用(大型机械、机动车辆等及爆破等引起的地面振动)在一定条件下也可引起土体的压密变形。

(4)重大建筑物、蓄水工程(如水库)对地基施加的静荷载,使地基土体发生压密下沉变形。

(5)由于在建筑工程中对地基处理不当,即地基勘探不周。

2. 地面沉降的灾情评估

2.1 地面沉降等级划分。

地面沉降调查应查明:沉降的位置、范围及面积;沉降量;沉降区的环境水文地质条件;沉降原因以及发展趋势。依据地面沉降面积、累计沉降量进行等级划分(表1)。

2.2 地面沉降的灾情评估。

地面沉降的危害是多方面的,包括:

(1)损失地面标高,造成雨季地表积水,防洪能力下降;

(2)沿海城市低地面积扩大,海堤高度下降,海水倒灌;

(3)海港建筑物破坏,装卸能力降低;

(4)地面运输线、地下管线扭曲断裂;

(5)城市建筑物基础下沉脱空开裂;

(6)桥梁净空减小,影响通航;

(7)深井井管上升,井台破坏,供水排水系统失效;

(8)农田低洼地区洪涝积水,农作物减产。

3. 地面沉降的预测评估模型

可采用统计模型、土水模型、生命旋回模型等。

3.1 统计模型:大量开采地下水引起地下水位持续下降,进而引起隔水层失水固结是地面沉降的根本原因,通过统计方法建立开采量Q(或含水层水位h)与地面沉降量s(mm)之间的统计关系。该方法简单明了,但有弱点,带有人为性,难于了解沉降机制。

3.2 土水模型:包括水位预测模型、土力学模型两部分,可利用相关法、解析法和数值法等进行地下水位预测分析;土力学模型包括含水层弹性计算模型、粘性土层最终沉降量模型、太沙基固结模型、流变固结模型、比奥(Biot)固结理论模型、弹塑性固结模型、回归计算模型及半理论半经验模型(如单位变形量法等)和最优化计算方法等。

(1)含水层的沉降计算方法。

一般采用弹性公式:

S=ΔhEγwH

式中:Δh——含水层水位变幅(m);

E——含水层压缩或回弹模量(常采用反算值);

γw ——水容重;

H——含水层厚度;

S——含水层变形量。

(2)粘性土沉降变形的计算方法。

粘性土层的固结是一个缓慢的过程,土层的最终沉降量是指土层完全固结情况下的沉降量,常采用分层总和法(e-logP曲线法):

S=∑Si

式中:Q N——固结度、时间因数;

CVK——固结系数(cm2/s)、渗透系数(cm/s);

t——时间(s);

st——承压水头降低后在时间t内的压缩量(cm)。

该法曾用于对日本东京、中国上海、常州等进行了地面沉降预测,与实测结果基本吻合。

3.3 生命旋回模型:该模型直接由沉降量与时间的相关关系构成,如泊松旋回模型。Verhulst生物模型和灰色预测模型等。

地面沉降预测中有代表性的成果有美国D、C、HolmA、leak的COMPAC软件,包括沉降预测模型、水位模型、优化调节模型、反馈计算模型。

4. 地面沉降的防治措施

大量实践表明,限制地下水开采或向含水层人工注水,可以控制或减缓地面沉降,表明地表沉降具有可控制性。地面沉降的控制与防治措施有:

(1)加强宣传,增强防灾意识:不断提高全民的防灾减灾意识,依法严格管理地下水资源,要合理开发利用地下水资源。

(2)限制或减少地下水开采量:可以地表水代替地下水资源;以人工制冷设备代替地下水资源;实行一水多用,充分综合利用地下水。

(3)采用地表水人工补给地下水:上海市自1966年采用了“冬灌夏用”为辅,大量人工补给地下水,水位大幅度回升,常年沉降转为“冬升夏沉”。

(4)调整地下水开采层次:地面沉降的主要原因是地下水的集中开采(开采时间集中、地区集中、层次集中),因此适当调整地下水的开采层和合理支配开采时间,可以有效的控制地面沉降。

参考文献

[1] 张梁等著. 《地质灾害灾情评估理论与实践》1998.

[2] 龚晓南,高有潮. 《深基坑工程设计施工手册》.中国建筑出版社,1998.

上一篇:职业病防治调查问卷下一篇:动物检验检疫员