统计学差异性分析(精选8篇)
统计学专业毕业的学生就业形势很严峻,社会需求量接近于饱和状态。近年来统计学专业工作领域内有影响的人物也不少,像付成敏,成功地应用统计专业知识为中国的统计工作进行了高效和精确的统计。像姚飞,李智等等一批统计工作者们都在这一工作领域内取得了可喜的成绩,已达到与世界的先进国家同步的水平。
由于统计学专业毕业生就业压力较大,所以就业时需注意的事项也很多。首先,要有优秀的专业知识成绩。竞争大,自然而然就要优中选优,而专业知识是衡量你是否优秀的一个最基本的条件。因而,在面试时,一定要带上你的成绩单。一般单位都认为,好学生是能做好统计工作的,因为统计工作需要认真、耐心、踏踏实实,所以这一点是很重要的。
总之,在就业时要从自身条件出发,客观地评价估计自己,在经历了大学四年的学习之后,要用成熟、稳重、自信的风貌出现在人们面前,另外,现在的大学生也不要总拘泥于选择大城市、大单位,总注意个人收入,工作环境,要多考虑一下偏远的地区,多注意一下西部的开发,多关注中国的不发达却需要人才的地方。
关键词:知识共享行为,人口变量,差异性分析
近年来,许多组织已经认识到员工知识共享的重要性,但是能够使知识在其内部有效地共享的组织却很少。知识怎么才能最好地被分享是一个极具挑战性的问题。人们己经开始认识到价值创造的核心是人,人是价值的创造者。人们把自己的知识进行共享对于企业的发展是有利的,但是人们不愿意共享知识,因为他们认为自己的知识是非常有价值的(Davenport和Prusak)。信息共享使得员工能够及时了解组织的财务信息,这样员工就更容易将自己的目标与组织的目标联系起来(程德俊,赵曙明)。
许多学者对知识共享的影响因素进行了研究。Chow等认为不同的文化背景会使企业员工的知识共享的决定性因素产生差异。Constant等把社会交换理论运用到信息交换领域,结果发现员工的信息交换受到社会和组织情境的影响。Bock等则基于理性行动理论以韩国27个大型企业154名知识工作者样本为资料,探索认为组织动机(主要是薪酬激励)、感知的自我价值和组织氛围与员工对待知识共享的态度、感知的互惠利益是知识共享的重要前因变量(Connolly和Thorn,Constant 等)。这些学者从不同的角度对知识共享的影响因素进行了分析,但是作为知识共享的主体——人,一些人口特征因素对知识共享产生了重要影响,如学历、年龄、性别等。研究这些人口特征变量的差异对于知识共享的影响具有重要的现实意义。
1 研究设计
1.1 量表说明
本文的量表设计主要用来调查员工人口特征变量和知识共享意愿。本研究欲衡量的人口特征样本变量包含下列6个部分:性别,男和女两种选择。年龄,主要分为4个阶段,30周岁以下、30—40周岁、40~50周岁、50周岁以上。学历,主要分为5个层次,中专及同等学历、大专及同等学历、本科及同等学历、硕士、博士及同等学历、其他。所在的部门,主要分为五种, 生产部门、研发部门、管理部门、销售部门其他部门。职位,分为基层员工、一般管理人员、中高层管理人员。到现单位工作时间,分为不到半年、半年—2年、2—5年、5—10年、10年以上。
本文在设计知识共享意愿的调查量表前,首先对其概念进行界定。Bock和Kim认为知识共享意愿是个人认为自己将投入知识共享行动的程度。陈必硕将知识共享意愿定义为:“成员在工作场合中,愿意致力于与同事分享工作相关专业知识、经验和意见的投入或欲想程度”。在前人研究的基础上并根据本文研究的内容,本研究对知识共享意愿的定义为:组织内部员工愿意把自己的知识贡献给其他员工,也愿意从其他员工处获取知识;并将知识共享意愿的两个维度定义为:知识贡献意愿指员工将自己的知识与组织其他成员共享或帮助组织其他成员的一组行为的意向,知识获取意愿是员工感知组织其他成员采取将他们的知识与自己共享或帮助自己的一组行为的意向。
本文对于知识共享行为的量表的测量依据Hooff和Ridder及Bock等的测量量表。Hooff 和Ridder根据过程论,从知识共享实践与知识流向的角度将知识共享分为“知识接收”和“知识捐赠”两个方面,并开发了一个包含10个条款的测量量表,信度分别为0.85和0.78,。报告中愿意共享显性知识的信度是0.92,愿意共享隐性知识的信度是0.93,问卷测量了愿意共享知识的程度。因此,本文就以Hooff和Ridder及Bock等的测量量表为基础,但在具体的测量条款上仍将其他几位学者的条款作为补充,并根据中国人的语言习惯进行修改。
笔者采用Likert7级态度量表直接测量受访者对某项行为或某个事件的主观感知:“1”表示非常不同意,“2”表示不同意,“3”表示不太同意,“4”表示中立,“5”表示有点同意,“6”表示同意,“7”表示非常同意。
1.2 研究样本
本研究通过问卷调研的方式获取数据,在问卷调研之前首先要进行研究样本的确定。样本选择是调研工作中极为重要的环节,样本质量的优劣决定了研究结论的适用性和外推性 (李怀祖)。为了确保样本的代表性,本研究遵循随机抽样的原则。
基于问卷的有效性,笔者在南京、苏州、上海、北京等企业共发放1 000份问卷,回收680份,基于下列原则进行筛选后,有效问卷580份,本文就是对这580份问卷进行分析得到相关数据的。
1.3 数据分析
通过对580份问卷分析,对人口特征变量进行了描述性统计。
从样本特征的分布来看,男性被调查者的比例是女性被调查者的1.5倍左右,明显高于女性;从年龄方面来看,样本主要集中在30周岁以下的人群,占据了样本总量的55.7%;而教育程度方面,人群主要集中于大专及其以上,占据了总样本量的83.7% ,说明调研的人群文化素质比较高;从职位来看,基层员工占据了大多数,占据了样本总量的 52.4%;在工作时间的调查中,10年以下工作时间的占据了样本总量的91.4%;在部门方面,生产部门的占据了样本总数的28.8%。
1.4 信度分析
信度(Reliability)是指测量工具的可靠性或稳定性,即问卷测量结果的一致性程度(风笑天)。对于信度指标,本研究主要采用Cronbach’s α系数作为信度分析的指标。Guieford(1965)曾指出Cronbach’s α如果大于0.7则为高信度,可以接受,如果Cronbach’s α小于0.35则为低信度。不同的学者有不同的观点,根据Hair和Anderson的建议,Cronbach’sα最低不能低于0.6,大于0.7最好。Nunnally认为Cronbach’s α值至少要大于0.5,最好能α>0.7。通常情况下,对于较成熟的量表,要求较高的信度,而对于探索性的量表,信度要求可以稍低一些。
1.5 知识共享行为探索性因子分析
首先,对知识共享行为问卷进行信度分析,发现整体及各维度信度指标良好(整体信度为0.815,知识贡献、知识获取的各个维度的信度为0.723、0.695);其次,进行Bartlett球形检验,x2值为1 516.376(df=15),KMO值为0. 887,说明量表适合做因子分析;再次,对问卷进行因子分析,发现各题项的因子载荷大于0.75。二因子模型的知识共享行为量表的 MSA 最小为 0.868,方差解释量 70.388%。从上表可以看出,所有的因子载荷都大于0.750,问卷能够测量出知识共享行为的2个维度,并且问卷总体与各个维度的信度也能够满足要求。
2 结果讨论
2.1 不同性别人群知识共享行为的差异分析
从表5可以看出,不同性别的人群在知识共享行为整体上以及知识获取和知识贡献维度方面都没有通过显著性检验,说明员工的性别不同对知识共享行为不具有显著差异。
具体来讲,男性人群在知识获取维度上的得分均值是5.08,方差是1.186;女性人群在知识获取维度上的得分均值是5.05,方差是1.153;而男性人群在知识贡献维度上的得分均值是5.58,方差是0.816。在知识获取维度上,男性的得分均值略高于女性,而在知识贡献的维度上,男性的得分均值略低于女性。由于得分相差很小,这并不能显著地说明在知识共享意愿上男性和女性存在显著差别。
注:+代表Sig值<0.10;*代表Sig值<0.05,**代表Sig值<0.01,***代表Sig值<0.001
2.2 不同年龄人群知识共享行为的差异分析
从表5可以看出,不同年龄的人群在知识共享整体上以及知识获取维度方面没有通过显著性检验,说明员工的年龄不同对知识共享行为不具有显著差异。而不同年龄的人群在知识共享意愿的 “知识贡献”维度方面的统计结果通过了显著性检验(F=3.622,P=0.013),说明不同年龄的人群对知识获取具有差异。
具体来讲,30周岁以下的人群在知识贡献维度上的得分均值是5.52,方差是.854;30 ~40岁的人群在知识贡献维度上的得分均值是5.63,方差是0.894;40~50岁的人群在知识贡献维度上的得分均值是5.85,方差是0.721;50岁以上的人群在知识贡献维度上的得分均值是5.9,方差是0.367。
从上述结果可以看出,不同年龄的人群在知识贡献维度上的认知随着年龄的增加得分均值也增加,说明了随着年龄的增加,人们对于知识贡献的认知呈现逐渐加深的规律。
2.3 不同教育程度人群知识共享行为的差异分析
从表5中可以看出,不同教育程度人群在知识共享行为整体上通过了显著性检验(F=3.327,P=0.01),说明员工的学历不同,对知识共享行为具有显著差异。不同教育程度的人群在知识共享意愿的知识获取维度上的统计结果也通过了显著性检验(F=2.982,P=0.019),说明不同年龄的人群对知识获取具有差异;而不同教育程度的人群在知识共享行为的知识贡献维度上的统计结果没有通过显著性检验(F=1.995,P=0.094),说明不同年龄的人群对知识贡献没有差异。
员工的学历不同,对知识共享行为具有显著差异。学历越高的人进行知识共享的越少,说明了学历越高,掌握的知识越多,认为知识对自己可能带来的优势就越多,越不大可能发生知识共享;而学历低的人一般从事的都是技术含量不高的工作,本身拥有的知识也不会为自己带来独特的优势,他们对于知识共享是愿意的。因此,从组织的角度出发,要激励高学历的员工共享自己的知识,以提高全体员工的知识水平,增强组织的竞争力。
2.4 不同部门的人群知识共享行为差异性分析
从表5中可以看出,不同部门人群在知识共享行为整体上通过了显著性检验(F=2.625,P=0.034),说明员工所在的部门不同,对知识共享行为具有显著差异。不同部门的人群在知识共享行为的知识获取维度上的统计结果也通过了显著性检验(F=2.807,P=.025),说明不同部门的人群对知识获取具有差异;而不同部门的人群在知识共享意愿的知识贡献维度上的统计结果没有通过显著性检验(F=1.559,P=0.184),说明不同部门的人群对知识贡献没有差异。
员工所在的部门不同,对知识共享行为具有显著差异。从得分均值来看,研发部门的员工最不愿意共享自己的知识,可能的原因是研发部门的工作要求的技术含量比较高,大家都想拥有自己独特的知识,从而使自己拥有独特的地位,因而不愿意共享自己的知识。其次是销售部门,这可能是因为现在的销售工作都是销售人员各自负责某一地理区域或一个产品系列,并构建相对独立的销售网络,工作中绝大多数时间是与客户打交道,与本组织同事的交往反而很少,所以销售部门的工作性质决定了其部门员工不像其它部门那样强调与本组织内部同事之间的知识共享;另外一个原因,可能是销售部门竞争比较大,互相之间都在争抢客户,争取获得高利润,因而互相之间不愿意把自己的销售渠道以及客户与同事共享,以免失去优势。
2.5 不同职位的人群知识共享行为差异性分析
从表5中可以看出,不同职位人群在知识共享行为整体上通过了显著性检验(F=3.148,P= 0.044),说明不同职位人群对知识共享行为具有显著差异。不同职位人群在知识共享行为的知识获取维度上的统计结果也通过了显著性检验(F=4.481,P=0.012),说明不同职位人群对知识获取具有差异,而不同职位人群在知识共享行为的知识贡献维度上的统计结果没有通过显著性检验,说明不同职位的人群对知识贡献没有差异。
不同职位人群对知识共享行为具有显著差异,其中中高层管理人员最不愿意贡献自己的知识给他人。这一点可以从两个方面来分析:第一种原因可能是相对于一般管理人员和基层员工来说,中高层管理人员的数量是比较少的,而且中高层管理人员都分管不同的部门,可能共同的经验不多,可共享的知识也就不多;另一个原因可能是中高层管理人员不愿意与一般的员工共享自己的知识,而对于和他(她)相同地位的人,又担心一旦共享了自己独特的管理知识,会对自己的职业道路的发展形成威胁。
根据这些情况,组织应该制定一些规则,对不同层次的人员制定不同的激励措施,鼓励他们进行知识共享。
2.6 组织工龄不同的人群知识共享行为差异性分析
从表5中可以看出,组织工龄不同的人群在知识共享行为整体上通过了显著性检验(F=4.207,P=0.002),说明组织工龄不同的人群的知识共享行为具有显著差异。组织工龄不同的人群在知识共享意愿的知识获取维度上的统计结果也通过了显著性检验(F=2.520,P=0.040),说明组织工龄不同的人群对知识获取具有差异;组织工龄不同的人群在知识共享行为的知识贡献维度上的统计结果也通过显著性检验(F=4.043,P=0.003),说明组织工龄不同的人群对知识贡献有差异。
组织工龄不同的人群的知识共享行为具有显著差异。从研究中发现,5年组织工龄以下的员工不愿意和同事共享自己的知识,而10年以上的员工最愿意和同事分享自己的知识。这可能是由于下列原因造成的:5年组织工龄以下的员工对于组织、同事还没有形成很深的感情,他们不愿意把自己掌握的知识与同事分享,以免对自己形成威胁;而10年组织工龄以上的员工对于长期相处的同事有着深厚的情感,他们愿意把自己的知识与同事分享,即使意识到共享自己的知识可能对自己造成不利的因素,但是从情感上出发,还是愿意帮助朝夕相处多年的同事。
3 结语
知识共享是企业获得核心竞争力的重要保证。在知识共同体中,被分享的知识具有准公共品的性质,在让大家从中受益的同时却会滋生成员的机会主义行为(王雎,罗珉),如何避免这种现象,促进员工间知识共享,进而实现组织的知识共享,是我国企业面临的一个重要课题。
3.1 政策建议
为更好地促进员工间知识共享,进而有效地实现组织的知识共享,提出以下方面几点建议:
(1)企业应该营造相互关心、彼此关爱的文化氛围,提升员工知识共享意愿并促进知识共享行为。从本文的研究结果中可以发现,知识共享在人口变量的不同特征上几乎都具有差异,除了性别以外,不同的教育程度、不同的职位、不同的部门、不同的组织工龄都对知识共享有着重要的影响,为了促进员工的知识共享,企业要构建和谐、友爱的文化氛围,培养员工集体主义荣誉感。
(2)组织应该制定合理的激励措施,鼓励员工共享知识。从本文的研究结果中可以发现,不同职位人群对知识共享意愿具有显著差异。中高层管理人员最不愿意贡献自己的知识给他人,组织应该针对这类人员的需求,进行不同的激励。由于中高层管理人员担心与同事共享自己的知识后会使自己失去许多优势,组织应该采取一些措施来确保中高层管理人员共享自己的知识不会对自己造成威胁,确保他们的特权、地位不受影响。从本文的研究结果中还发现研发部门的员工最不愿意共享自己的知识,组织在制定知识共享的奖励措施时,应该考虑不同部门的特殊情况,制定切实可行的政策。
(3)组织要让员工知识共享有足够的时间保证。知识共享要花费许多时间,许多员工担心共享知识会影响工作时间,因而有的员工就不愿意共享知识,因此组织要确保员工知识共享的时间,消除他们的担忧。
3.2 本文研究的局限性
在研究样本的选取上,本文研究对象是本土企业的员工,但由于数据获取难度,样本分布主要集中在南京、苏州、上海、北京等市,虽然样本的总体数量达到了统计分析的要求,但是地域分布的覆盖面仍不够,希望后续研究能够扩大样本覆盖地区,从而增强本文研究结论的普适性。
参考文献
[1]BOCK G W,ZMUD R W,KIM Y G,ET AL.Behavioral intentionformation in knowledge sharing:Examining the roles of extrinsic moti-vators,social-psychological forces,and organizational climate[J].MIS Quarterly,2005,29(1):87-111
[2]CHOW C W,DENG F J,HO J L.The openness of knowledge sha-ring within organizations:A comparative study of the United Statesand the People’s Republic of China[J].Journal of ManagementAccounting Research,2000(12):65-95
[3]CONNOLLY T,THORN B K.Discretionary databases:Theory,data,and implications in organizations and communication technology[M]//FULK J,STEINFIELD C.Newbury Park,CA.:SagePublications,1990:219-233
[4]CONSTANT D,KIESIER S,SPROULL L.What’s mine is ours,oris it?A study of attitudes about information sharing[J].InformationSystems Research,1994,5(4):400-421
[5]DAVENPORT T H,PRUSAK L.Working knowledge:How organiza-tion manage what they know[M].Cambridge,MA:Harvard Busi-ness School Press,1998:17-18
[6]GUIEFORD J P.Fundamental Statistics in psychology and education[M].4th ed.New York:McGraw-Hill,1965
[7]HOOFF B,RIDDER J.Knowledge sharing in context:the influenceof organizational commitment communication climate and CMC use onknowledge sharing[J].Journal of Knowledge Management,2004,8(6):117-130
[8]NUNNALLY J C.Psychometric theory[M].New York:McGraw-Hill,1978
[9]陈必硕.工作价值观、工作动机与知识分享行为关系之研究:台湾高科技业员工为例[D].台湾:台湾大学,2004
[10]程德俊,赵曙明.高参与工作系统中的社会关系网络及其变革障碍[J].中国工业经济,2006(12):90-97
[11]李怀祖.管理研究方法论[M].西安:西安交通大学出版社,2004:118-146
[关键词] 网络学习; 学习成效; 性别差异; 统计分析; 对策探讨
[中图分类号] G434 [文献标志码] A
网络学习是通过因特网或其他数字化手段进行学习与教学的活动,它充分利用现代信息技术所提供的、具有全新沟通机制与丰富资源的学习环境,实现学习全新的方式。这种学习方式将改变传统教学中教师的作用和师生之间的关系,从而根本改变教学结构和教育本质。[1]学界对网络学习内涵的理解有广义、狭义之分,广义的网络学习包括一切基于因特网或其他数字化资源进行的教学活动。狭义的网络学习则指利用网络或其他数字化资源,对某一门特定课程开展的有目的、有计划、有组织的学习活动。本文的网络学习取其狭义内涵,专指成人学习者在网络教育机构注册后按照其教学计划开展的有规律、有组织、有步骤并能取得学历的学习活动。在这种学习活动中,学习者的学习成绩是否存在性别差异,找出造成这种差异的原因,将有助于制定分别适合男女生的网络教学方式,提高学生网络学习的整体成效,提升网络教育的教学质量。
一、学习成效
学习成效是学习者学习行为的学习结果与实现这一结果所付出的学习成本之比,即单位学习成本的综合学习结果。[2]相应地,网络学习成效则是学生参加网络学院的系统学习后,所取得的学习结果与实现这一学习结果所付出的学习成本之比。对网络学习成效影响因素的研究,王昭君通过文献分析后提出影响网络学习成效的四大关键要素:学生特性、网络课程特性、学习平台特性和教学互动;[3]何字娟、李爽在借鉴已有分析模型的基础上提出用四元远程学习者特征(人口学维度、支持性维度、心理维度和策略维度)分析网络学习成效的影响因素;[4]而张家华、张剑平在综合国内外相关研究成果的基础上,将网络学习效果的影响因素归结为四个方面:学习者、教学者、网络课程及学习环境。[5]可见,大部分研究者认为影响网络学习成效的因素是多方面的,概括起来就是“内因”和“外因”。内因是人的内部因素,包括生理、心理以及策略等;外因是人以外的所有因素,包括教师、平台、课程、互动、环境、情境等。
同一网络学院的学生,网络学习的条件一样,影响网络学习成效的因素便主要是内因。对男女生而言,若网络学习成效存在差异,则应是由性别及其心理学、社会学方面的差异造成的。男女生心理学方面的差异包含智力因素与非智力因素,智力是人的各种基本能力的综合,包括观察力、记忆力、想象力、注意力、分析判断力、创造力及应变力等。非智力则指智力以外的心理能力,具体包括倾向性(兴趣、态度、动机、需要、归因等)、情感(信仰、世界观等)、意志力(自我效能感、自信心等)、调节力(情绪调节、环境适应等)、气质、性格和情绪等。社会学方面的差异主要是性别偏见、学习策略引起的差异。
对网络学习成效的评估,Moore(穆尔)和Thompson(汤普森)曾指出:基于双向交互通信的远程教学,其成效只有通过学习成就、师生态度以及投资与回报来衡量时,其评估结果才是有效的。[6]这一观点基本得到国外学界的认同。美国教师联盟探究了近10年有关远程教学成效的研究,得出评估远程教学成效的三个方面:①学生学习成绩,包括期末成绩和平时测验成绩;②学生对网络学习的态度;③学生对网络教育的满意程度。台湾洪明洲认为,评估网络学习成效,特别针对具体学习效果时,应包括客观的学习效果与主观的学习收获。客观的学习效果包括测验成绩、完成进度时间、学期分数等;主观的学习收获包括学习满足、成就、偏好等。[7]王昭君在认真查阅、整理相关文献的基础上,比较了很多研究者及机构的网络学习成效评估指标,得出大多数研究者网络学习成效的评估指标基本一致,一般包含学生主观感受(如学习满意度等)和客观表现(如期末成绩等)。[8]黄天慧、郑勤华对国内外相关文献进行比较研究后认为,大多数研究者在关于远程学习绩效评估指标方面的研究基本一致,倾向于用学生的学习成绩和对学习的满意度来衡量数字化学习绩效。[9]评估网络学习成效,对学生的网络学习成效进行统计分析、作出价值判断,是网络教育服务质量管理的核心,对提高教学和学习效果具有重要作用。
学习成绩就是学习所取得的成就、收获,它是衡量学习者学习行为综合结果的指标之一。在网络教育中,学习成绩也叫总评成绩,包括期末成绩、作业成绩和平时成绩,所占的比例分别为70%、20%和10%。期末成绩是学生学习完一门课程后,参加总结性考核的成绩;作业成绩是老师布置的、让学生课后完成的学习任务的成绩;平时成绩是学生学习过程积极程度的评价。本研究以学生的网络学习成绩为指标,对其性别差异进行统计与分析,找出性别影响网络学习成绩的缘由与规律,提出一些提高网络学习成效的建议及对策。
二、统计结果
(一)研究对象及问题
本文以华南师范大学网络教育学院2004年秋季、2005年春季及2005年秋季入学并已毕业的专升本计算机专业学生为调研对象,其中男生335人,女生54人。期末成绩来源于该学院教学教务管理平台的数据库(截止日期为2010年10月)。由于该学院采用完全学分制和弹性学制,学习年限为2~5年,本文将对调研对象学习年限内的成绩进行统计分析,以了解学习成效的性别差异,进而分析性别对学习成效的影响。
(二)课程成绩的统计结果
1. 男女生必修课平均成绩比较
统计学在地质工程中的应用分析
随着世界能源供应日益紧张,勘探技术日益得到人们的重视,统计学的相关的理论和知识在地质工程中也逐渐发挥出巨大的.作用.文章阐述了地质统计学的相关发展情况,分析了地质统计学的常见方法,并对地质统计学的应用进行了简单分析.
作 者:胡菁玫 郝煜 作者单位:天津市勘察院,天津,300191刊 名:中国高新技术企业英文刊名:CHINA HIGH TECHNOLOGY ENTERPRISES年,卷(期):2009“”(4)分类号:P562关键词:统计学 地质工程 应用分析
事实上,现在的数据不仅仅是数,图是数据、语句也是数据。只要蕴含着一定信息,无论是什么表现形式,就是数据,统计能帮助人们从这些数据中提取出大量的信息。
数据分析观念就是了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中蕴涵着信息;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。
数据分析是统计的核心。史宁中教授说:“数据是信息的载体,这个载体包括数,也包括言语、信号、图像,凡是能够承载事物信息的东西都构成数据,而统计学就是通过这些载体来提取信息进行分析的科学和艺术。”“统计与概率领域的教学重点是发展学生的数据分析意识,培养学生的随机观念;难点在于,如何创设恰当的活动,体现随机性以及数据获得、分析、处理进而作出决策的全过程。”可见,统计学的一个核心就是数据分析。不论是统计还是概率,都要基于数据,基于对数据的分析;在进行预测的时时,为了使预测更合理,也需要收集更多的数据。
习惯于从统计规律看问题的人在思想上不拘执一端:他既认识到一种事物从总的方面看有一定的规律,也承认例外。 陈希孺
数据分析观念是统计思想的一个重要组成部分。我们可以通过数据分析的教学,使学生体会到统计时需要收集数据,应用数据分析,能解决日常生活中很多实际问题,从而感受统计的实际价值,发展学生的应用意识。以下是我的几点体会:
一、通过统计教学,发展学生的数据意识
1、在活动中逐步形成统计观念。
统计观念主要指:能从统计角度思考与数据有关的问题;能从数据分析作出合理的决策;能对数据的来源、收集和描述数据的方法,由数据得到的结果提出合理的质疑。它绝非等同于计算、作图等简单技能,不能单纯看作是知识点的学习,而是一种需要在亲自经历的过程中培养出来的感觉,是逐步形成的。
《数学课程标准》对这一领域的具体目标,根据学生身心发展规律,对培养“统计观念”提出了三个学段“有所体验”、“经历”、“从事”的不同要求。
教师在统计活动材料的选用应采取由近及远的原则,先是身边的事、然后社会环境、再和其它学科相联系。收集的素材先是全部数据,如全班学生,利用统计对象的确定性组织统计活动,学习统计图表;随着学习的深入,统计对象更多地具有随机性。例如,“估计你们班所有同学的家庭一个月内共丢弃多少个塑料袋?通过实际调查验证你的估计。”在该统计活动中,每个同学家庭每个月要丢多少个塑料袋,统计对象的总数非常大,统计起来既浪费时间,又浪费人力和物力。此时,就可以渗透抽样统计的方法,帮助学生自己选择统计对象。这里,统计对象可以是全班同学家庭的某些天丢弃塑料袋的个数,或部分同学家庭的某个月丢弃塑料袋的个数。
2、在活动中发挥学生的主体性。
建立数据分析观念最好的办法是让学生经历完整的收集、整理、描述、分析的统计全过程,让学生明白为什么要进行数据的“收集、整理、描述、分析”,也就是说分析数据能帮助我们做什么。常见的教学中,数据的“收集、整理、描述、分析”都是教师布置的“任务”,只要学生按照教师的要求去做即可,而没有问一问为什么要做这些。
在统计活动中要发挥学生的主体性,而不要把学生成为按一定指令办事的操作工,要有探索性。如统计身高与体重,要让学生明白为什么要组织统计咱们班的身高与体重的活动,是要与同龄中国儿童身高、体重的正常值进行比较,从而采取措施提高我们的健康水平。这就需要教师提供或学生收集同龄中国儿童身高、体重的正常值。怎样收集咱们班身高、体重的数据呢?可以组织讨论,显然全班学生一一询问是很费时间的,可以采用小组记录数据的方式,继而让学生体会到如果把收集到的身高、体重数据分别用条形统计图呈现就更一目了然了。在用条形统计图呈现时,可能会产生由于大小两个数据相差比较多,统计图会过长或过宽,引导学生探索可以用一个格代表多个单位。在描述和分析数据时,可以和正常值进行比较,哪些同学在正常值范围之内,哪些同学已超过正常值,对这些同学提出一些改进的建议。在活动中发挥学生的主体性,把统计融入到解决问题之中,有利于统计观念的形成。
3、设计问题情境使学生体会需要收集数据。
要使学生接受统计特有的观念,就要让学生经历产生和发展统计思想的全过程,让学生经历收集数据、整理数据和分析数据的过程,逐步形成统计意识。
统计学的一个核心就是数据分析。不论是统计还是概率,都要基于数据,基于对数据的分析;在进行预测的同时,为了使预测更合理,也需要收集更多的数据。如要选谁参加数学竞赛,如果投票选举,那么就不具备统计观念,也就会不合理。但如果意识到事前要收集以往学习成绩,再通过整理与分析数据,然后去选选手肯定是比较可靠的。我们不但要让学生知道这些联系,还要培养学生有意识地从统计的角度思考有关问题,也就是遇到问题时能想到用统计的知识分析数据的能力。
二、通过数据分析,培养学生思维的灵活性
义务教育阶段的统计学习要让学生有意识地、正确地运用统计来解决实际问题,又能理智地分析他人的统计数据,以作出合理的判断。
1、鼓励学生用多种手段整理和描述信息
分类是整理数据的开始,但孩子们调查了一大堆数据后,看起来很杂乱,很自然的想法是把他们分类整理。让孩子们产生分类整理的想法,讨论分类方法,经历分类过程对学生统计意识的培养十分重要。
比如研究学校学生身高时,学生对收集到的数据怎样分段都有不同的意见,我就让学生各按照自己的分段方式分类,画出柱状图,用投影投出来,供学生比较鉴别,找出最佳方案。
2、鼓励学生分析数据,从中获取信息
统计图表教学的一个重要目标是,鼓励学生能够从统计图表中来获取尽可能多的信息。
教师应鼓励学生分析统计图表中的数据,注重学生从统计图表的数据中获取信息的能力。教师在呈现统计图表后通常都会提问:从这张统计图(表)中你能知道什么?(统计图中直接看见或通过简单推理能得到的信息)这属于简单层次的分析数据。老师往往还非常重视学生更深层次分析数据能力的培养,即通过分析统计图(表)中的数据,对未来的事件做一些有支撑观念的预测。
例如:在教学平均数、中位数、众数时,有这样一道题:王经理开了两家酒店,下面是两家酒店近五年的营业收入统计表。(单位:十万元)
甲 店 1.5 2.2 4.5 6.2 8.8
乙 店 6 6.8 4.8 3.2 2.4
1.分别计算出两家酒店的平均年收入。
2.王经理想转让一家酒店,你认为应转让哪家酒店?为什么?
学生在解决时是这样答的:“我认为转让甲或乙都可以,因为它们的平均年收入相等。”看到这样的答案,我就让他们对两组数据结合折线统计图进行理智地分析,发现平均年收入一样多,但甲店年收入越来越多,而乙店是越来越少。所以应转让乙店。
再比如解决道题目:1、某校为选拔参加全国初中数学竞赛的选手,进行了集体培训.在集训期间进行了10次测试,假设其中两位同学的测试成绩如下面的图表所示:
一
二
三
四
五
六
七
八
九
十
甲
85
95
94
96
94
85
92
95
99
95
乙
80
99
100
99
90
82
81
80
90
99
(1)根据图表中所示的信息填写下表:
类别信息
平均数
众数
中位数
方差
甲
93
95
18.8
乙
90
90
68.8
(2)这两位同学的测试成绩各有什么特点?谁的成绩更好些?(从不同的角度分别说出一条即可)
(3)为了使参赛选手取得好成绩,应选谁参加比赛?为什么?
学生对第二问和第三问的答案产生疑问,问什么成绩好的反而不适宜参赛呢?我让学生从平均数、众数、中位数、极差、方差各个方面进行比较,又从实际情况出发考虑,学生终于得出正确答案。这样,通过对数据的分析,既能根据问题的背景选择合适的方法,又能培养了学生思维的灵活性。
应用Plackett-Burman设计法对影响乳酸乳球菌发酵的.培养基主要组分进行筛选,确定了影响乳链菌肽效价的关键因素为酵母浸粉、葡萄糖和K_2HPO_4. 在此基础上,采用响应面法(RSM)优化乳链菌肽发酵培养基. 结果表明,当酵母浸粉质量浓度为22.35 g/L,葡萄糖质量浓度为24.80 g/L,K_2HPO_4质量浓度为13.65 g/L时,乳链菌肽产量最大,此时,乳链菌肽产率为2 157 IU/mL. 实验验证,最佳条件下乳链菌肽产率为2 115 IU/mL,预测值与验证值吻合得较好.
作 者:王秀丽 任晓冬 陈萍萍 韩文瑜 滕利荣 WANG Xiu-li REN Xiao-dong CHEN Ping-ping HAN Wen-yu TENG Li-rong 作者单位:王秀丽,WANG Xiu-li(吉林大学,畜牧兽医学院,长春,130062;吉林大学,生命科学学院,长春,130012)任晓冬,滕利荣,REN Xiao-dong,TENG Li-rong(吉林大学,生命科学学院,长春,130012)
陈萍萍,CHEN Ping-ping(延边大学,医学院,吉林,延吉,133002)
20世纪90年代以来, 我国城镇居民的消费水平和消费结构发生了显著变化, 而各地区的变化也不相同。本文在研究这些不同变化现象的基础上提出一些问题, 即传统研究将中国划分为东、中、西三个区域, 并有大部分人认为经济发展水平从东南往西北逐步降低, 从而消费水平也成趋势变化, 这一传统观念是否正确?另外自国家实施西部大开发战略后, 西部一些地区经济与消费有明显提高, 但有些地区由于地理环境限制发展还不够快, 也影响了当地消费, 应如何进一步引导?现在实施的中部崛起战略无疑又是一顺应时代发展的重要举措, 对促进全国一体化发展有很大意义, 而这一地区的消费情况如何呢?本文通过SPPS实证分析, 对以上问题得出一些个人见解。
二、数据来源及SPPS实证分析
(一) 数据来源
本文利用《中国统计年鉴 (2007) 》中的《10-16各地区城镇居民家庭平均每人全年消费性支出 (2006年) 》的八项指标数据, 即食品、衣着、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务、居住、杂项商品和服务。
(二) SPPS实证分析
本文采用SPSS 13.0 for windows综合运用因子分析、聚类分析和判别分析等方法对数据来源中的八项指标数据分析研究。具体步骤为:对数据因子分析提取两个因子, 得到全国31个省、市、自治区在每个因子上的得分和各地区综合得分。从而得出消费水平排名, 便于了解各地情况。然后抽出东部位于南方的海南, 西部的新疆, 西部位于北方的内蒙古和中部接近东部的安徽四省, 把其余27个省聚类和判别分析, 最后将剩下四省分别归类, 对结果分析得出结论。
1. 因子分析过程
首先计算原始变量之间的相关系数矩阵。从结果表中看出相关系数矩阵中只有一个相关系数小于0.3, 在统计检验中KMO是0.867, 并且通过巴特利特球体检验 (P=0.000<0.05) , 说明原有的8个变量具有很强的相关性, 它们反映的经济信息有很大重叠。
接着计算相关矩阵的特征值和特征向量。前两个公共因子对样本方差的贡献和为0.86376, 说明用这两个公共因子代表原来8个指标评价全国城镇居民消费结构已有足够把握。
然后对因子载荷矩阵旋转, 得到旋转后因子载荷矩阵, 判断变化趋势相近的消费项目。结果显示, 第一个主因子 (对原变量方差贡献已达74.815%) 主要由食品、家庭设备用品及服务、交通和通信、教育文化娱乐服务、居住、杂项商品和服务这六个指标决定, 这六个指标在主因子F1上的载荷均在0.7以上, F1是全国城镇居民消费结构研究中的主要方面, 命名为主要消费因子;因子二即F2 (解释了原变量11.561%信息) 则主要涵盖衣着与医疗保健, 命名为次要消费因子。
以各因子方差贡献率占两个因子方差贡献率的比重作权重进行加权汇总, 得出各城市综合得分, 结果下表所示。表1:
通过此表得出每个省市在不同因子上得分, 以备后用。
2. 聚类分析过程
按照前面提到的聚类思路, 本文采用欧式距离平方和离差平方和方法进行分层聚类分析。通过SPPS一系列操作, 最终可得出以下结果, 即表2:
通过上表可以明显看出27个省市具体分类情况, 即:
第一类 (高消费水平) :北京、上海、浙江
第二类 (较高消费水平) :天津、江苏、福建、山东、广东、重庆
第三类 (较低消费水平) :河北、山西、辽宁、吉林、黑龙江、河南、湖北、湖南、陕西、甘肃、青海、宁夏
第四类 (低消费水平) :江西、广西、四川、贵州、云南、西藏
3. 判别分析过程
对于所做的聚类有多大正确率以及我们抽出的四个省市属于哪一类这些深层次问题, 就要判别分析了。首先要确定所做的分类有多大正确率。本文采用Wilks’Lambda方法进行逐步判别分析, 结果看出第一类、第二类和第四类的正确分组率为100%, 错分率为0;只有第三类正确分组率为91.7%, 错分率为8.3%。通过SPPS显示, 可以知道是第三类的青海应该属于第四类, 而把它聚到了第三类造成的。总体来看, 本次聚类已经达到很高的正确分组率, 完全可以用作样本检验, 即用来判断剩下四省市属于哪个层次的消费水平。下表即表3是判别函数系数表:
通过上表可以明显看出27个省市具体分类情况, 即:
第一类 (高消费水平) :北京、上海、浙江
第二类 (较高消费水平) :天津、江苏、福建、山东、广东、重庆
第三类 (较低消费水平) :河北、山西、辽宁、吉林、黑龙江、河南、湖北、湖南、陕西、甘肃、青海、宁夏
第四类 (低消费水平) :江西、广西、四川、贵州、云南、西藏
3.判别分析过程
对于所做的聚类有多大正确率以及我们抽出的四个省市属于哪一类这些深层次问题, 就要判别分析了。首先要确定所做的分类有多大正确率。本文采用Wilks’Lambda方法进行逐步判别分析, 结果看出第一类、第二类和第四类的正确分组率为100%, 错分率为0;只有第三类正确分组率为91.7%, 错分率为8.3%。通过SPPS显示, 可以知道是第三类的青海应该属于第四类, 而把它聚到了第三类造成的。总体来看, 本次聚类已经达到很高的正确分组率, 完全可以用作样本检验, 即用来判断剩下四省市属于哪个层次的消费水平。下表即表3是判别函数系数表:
通过此表给出Fisher线性函数系数建立线性判别模型如下:
高消费水平:y1=-470.509+0.067x1+0.295x2+0.019x3+0.028x6+0.070x7+0.123x8
较高消费水平:y2=-254.472+0.054x1+0.213x2+0.066x3-0.004x6+0.073x7+0.017x8
较低消费水平:y3=-168.
低消费水平:y4=-149.626+0.048x1+0.163x2+0.073x3-0.020x6+0.041x7+0.008x8
将剩下四省市, 即内蒙古、安徽、新疆和海南的数据分别带入以上四模型中计算出这四省市的y值, 看每个省市的四个y值哪个最大, 即属于哪一类。通过计算得到结果:内蒙古、安徽和新疆属于较低消费水平, 而海南则属于低消费水平。
三、分析结论
第一、针对引言中提到的传统观念本文的研究思路是抽出四个位于不同地理位置的区域来研究。判别分析中得出所做的分类有很高的正确分组率并把剩下四省市分别聚到了原有的四类中, 最后发现这一传统观念并非正确, 位于祖国南部的海南消费水平最低, 位于西部的新疆和北部的内蒙古比海南还要高一个档次, 而靠近东部的安徽消费水平也不是很高, 与新疆和内蒙古属于同一类消费水平等等。
第二、聚类分析中的结果从一个侧面反映出我国经济发展及消费水平和结构。经济和消费水平有了较大提高, 但消费的主要来源仍然集中在几个发达省市, 如北京、上海。因子分析中可以看到西部的内蒙古 (传统东、中、西部地区划分中内蒙古属于西部) 虽然主消费因子和综合排名都比较后, 但它的次消费因子却比较靠前 (第3) , 说明自从国家实施西部大开发战略, 很多基础如医疗制度慢慢建立起来, 为人民生活带来了更多便利, 人们消费有了场所。所以从这里的分析看出, 要进一步引导西部消费, 以后的工作就是注重交通通信、文化教育和居住环境等方面的建设了。
第三、在因子得分表中, 可以观察到中部八省 (资料来源:第一次全国经济普查主要数据公报 (第一号) ) 除山西次要消费因子排名第5外, 其他的主要消费因子和次要消费因子以及因子得分总排名都处于靠后的位置;同时聚类分析中也可以看出这八省总体处于第三第四类消费水平, 这也从一个侧面反映了这一地区整体经济发展水平处于较低层次, 也应了一些学者提到的“中部塌陷”的观点。我们知道一个地方的消费可以拉动该地区经济发展, 所以这一地区在招商引资谋发展同时, 要注重各种消费基础设施的建设和改善, 如主要消费因子中的居住环境、交通通信, 以及次要消费因子中的医疗保健等, 只有这些设施改善了, 人们才愿意去消费, 更多的去消费, 从而带动当地各种产业的发展, 促进经济增长。
参考文献
[1].彭燕妮.东中西部地区经济发展和传统产业西部转移[J];企业研究;2006.9.
[2].余军华, 金荣学.我国地区经济差异的变化过程及其成因:1978-2004[J];改革;2006 (9) .
[3].卫海英, 刘潇.SPSS10.0for windows在经济管理中的应用;中国统计出版社;2000.8;
[关键词] 医学期刊 统计学问题 编辑
[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2013) 05-0067-03
医学统计学是一门以统计学原理和方法为基础,探索医学科研工作中遇到的有关数据的收集、整理和分析方法的应用科学,又可被看成一个收集信息、处理信息、分析信息,进而从中提炼和总结分析出新的信息的过程[1]。随着医学科研水平和医疗技术水平的不断提高,医学科研和临床实际工作中,人们对待科学的态度逐渐从原来的“经验主义”转变为“论据先行原则”,无论是在一些医学相关学科的基础实验中,还是在一些临床疾病的诊治等工作中,人们遇到问题时不再“想当然”,而是首先考虑为什么,有何依据,而这些依据大多需要通过统计学中的信息收集、整理、分析来提供。因此,医学统计学在医学工作中的地位越来越重要,统计学应用的正确与否直接影响着医学科研结论的科学性、严谨性和可靠性,具体到医学期刊方面,就会出现因统计学应用不恰当而导致医学期刊不严谨、不科学、不可靠和不具有影响力[2]。鉴于医学统计学在医学期刊中的重要地位,作者结合《肿瘤基础与临床》杂志2011年的240篇文章中出现的统计学问题,对目前我国医学期刊中常见的统计学问题进行分析,同时提出一定的解决方案,为医学编辑工作能力的提高以及医学期刊整体水平的上升提供一定帮助。
1 医学期刊中常见统计学问题
统计学的误用、错用和不用问题广泛存在于许多医学期刊中,统计学错误率处于较高水平,有文献报道期刊论文统计学错误率为38%—80%,而且统计学问题的种类几乎涉及统计学的每个方面,包括实验设计不合理、未进行统计学处理、统计分析软件未介绍或介绍不清、统计学数据的描述方法不当、统计学方法的描述不清或错用、统计值或P值不全或描述不清、统计学结果分析或描述错误等[3-4]。王倩等[5]对5种“中华”系列杂志刊登的文章的统计学应用进行回顾性分析,发现1985年统计学方法应用的错误率占24%,1995年占36%。沈进等[6]选取8种医学期刊,分析发表于1998年至2005年的544篇论著文章的统计学方法应用情况,结果显示,136篇的统计学出现明显错误,错误率达到25%,其中以资料处理方法不当所占比例最高,达到61.76%,其次为图表错误、未作统计学处理等。我刊2011年刊登的240篇论文中,排除个案报道、教学论文、棕色行论文36篇,剩余的204篇论文中有126篇论文采用了统计学处理,占61.76%(126/204),现结合本刊统计学应用现状针对医学期刊中常见的统计学问题进行分类分析如下。
1.1 统计研究设计不合理问题
大多数非统计学专业的学者在进行统计研究设计(包括实验设计、调查设计、临床试验设计)时仅仅从本专业的角度考虑,根据主观想要得到的结果进行分组设计,而完全没有考虑该实验设计的可行性、组间数据是否具有可比性等问题,主要表现在实验设计时不遵循随机化原则、未设置对照或对照不合理、均衡性原则贯彻不彻底等[7]。常见的统计研究设计不合理问题包括缺少对照或对照不合理、单因素设计取代多因素设计、样本量选择不具有代表性或样本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鳞状细胞癌组织中的表达及意义》一文,在实验分组设计时未对各组间数据是否具有可比性进行统计学分析。
1.2 未进行统计学处理问题
许多医学期刊论文虽然也进行了分组设计、设立对照等,但是文中未说明采用何种统计方法,也未对这些数据进行统计学处理,仅仅通过对实验所得的实际数据的直观判断就得出结论[9]。例如,本刊《肺尖癌26例疗效分析》一文中,作者在分析不同治疗方法对肺尖癌的疗效时并未采用任何统计方法,而是直接得出了“综合治疗较单纯治疗更能延长肺尖癌患者生存期”的结论,这不符合现代医学科研的结论需有据而立的原则。
1.3 统计方法的描述不具体或错用问题
1.3.1 统计方法的描述不具体
一些医学期刊论文中列出的统计方法过于简单,甚至未列出,主要有以下几种情况[10-12]:在“材料与方法”部分中的“统计学处理”中未列出所用的统计学软件或仅列出所用软件而未说明所用软件的版本;对于何种数据采用何种统计方法仅笼统描述,未具体列出文中的那些数据应该用何统计方法;对于定量数据仅列出采取t检验或方差分析,而未列出是否进行正态性检验和方差齐性检验;对于两组定量数据无论是应该采用成组设计t检验还是配对设计t检验,均仅描述为“两组定量数据比较采用t检验”;对于两组或多组定性数据的比较,无论是仅需用 2检验,还是需要采用矫正 2检验或 2分割检验,均描述为“两组或多组定性数据的比较采用 2检验”;统计学符号书写不规范,例如,根据GB/T3358-82,F检验、P值、 2检验、t检验等中的字母应为斜体,不符合上述规定的书写均为错误情况,这在论文中非常普遍;未列出检验水准 ,检验水准 是事先设定的判断小概率实践的标准,实际意义是允许犯假阳性错误概率的最大值,需要根据不同的研究目的进行设定。例如,本刊《 -连环蛋白和层粘连蛋白的表达与垂体腺瘤侵袭性的关系》一文在“统计学处理”仅说明数据的比较采用t检验,而未说明t检验的类型。
1.3.2 统计方法的错用
一些医学期刊论文中的统计方法的应用存在明显的错误。对于所有定量数据,常见的错误有[13-14]:无论是否符合正态分布、是否方差齐,一律盲目应用t检验或单因素方差分析等参数检验方法进行比较分析;无论数据分为几组,一律采用t检验进行比较分析,把其当做定量数据比较的万能工具;无论各组数据是何关系,一律采用成组设计t检验或单因素方差分析。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,定量数据进行比较分析之前未说明是否进行了方差齐性检验和正态性检验。对于所有定性数据,常见的错误有:把 2检验当做所有定性数据的万能统计工具,忽略了其应用的前提条件是, 2检验适用于正态分布的定性数据,且样本量最好>40,列联表数据进行 2检验时不能有1/5以上的格子其理论频数<5或任一个格子的理论频数<1;多组数据进行比较时,总体进行 2检验比较分析后,若还需要进行各组的两两比较时未进行 2分割,依然采用 2检验进行再次比较。例如,本刊《P16蛋白在宫颈组织中的表达及意义》一文中,数据总体进行 2检验比较分析后,再次两两比较时未进行 2分割,检验水准也未重新设定。
nlc202309032026
1.4 统计结果的描述及分析错误问题
许多医学期刊论文中均可见到统计结果的描述或分析错误,常见的有以下几种[15-17]:1)对于定量数据应当根据是否符合正态分布而采用不同的描述方法,符合者一般采用“均数±标准差”或“均数±标准误”表示,而不符合者则采用中位数和四分位间距来进行表示,不按上述规定进行描述者均属于错误描述;2)对于定性数据,常见的错误是构成比和百分率不分,计算率或构成比等相对数的样本量过小;3)解释有统计学意义时仅根据P值的大小得出相应结论,例如对于A、B组2组的疗效(假定A组疗效优于B组),其“P<0.05”认为A组显著优于B组,“P<0.01”认为A组非常显著优于B组,“P<0.001”认为A组极其显著优于B组,这在实际应用中非常常见,而犯这种错误的原因是对统计学中的P值理解错误,其实P值是拒绝特定无效假设而可能犯的假阳性错误的概率,并不代表组间差异的大小,其值越小仅越能说明组间比较不同,而不反映组间差异的大小。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,“18例肺癌患者血清TGF- 1的含量平均为(33.1±36.9)ng/L”中的标准差大于均数,这说明该数据不符合正态分布,不能用“均数±标准差”表示,而只能用中位数和四分位间距表示,用前者表示不但不能代表数据变化的趋势,还容易诱导作者采用t检验或单因素方差分析等参数检验对其进行分析。
1.5 统计值和(或)P值描述不清以及统计值缺失问题
许多医学期刊对统计结果进行描述时,通常不能完整清晰地描述出统计值和P值,常见的有以下几种情况[18-19]:统计结果仅用“P<0.05”或“P>0.05”得出结论,缺少相应的统计值;统计结果包括统计值,但是P值仅写出“<0.05”或“>0.05”,未列出具体的P值;仅列出具体的P值,而统计值缺失,上述几种情况均不利于文献阅读者进行数据验证和meta分析。例如,本刊《同步放化疗治疗局部晚期食管癌临床观察》一文中,所有统计结果均仅列出了“P<0.05”或“P>0.05”,未列出具体的统计值和P值。
2 针对医学期刊中常见统计学错误的解决对策
目前,医学期刊论文的统计学问题已经成为衡量论文质量高低的重要标准,统计学的错误可能会导致论文学术水平和学术质量的降低,甚至有可能导致严重的后果。近年来,随着广大医学科研工作者和医学期刊编辑及审稿专家对医学统计学应用的重视,医学期刊论文中的统计学问题已经明显减少,但仍然处于较高的水平,这可能与以下几点有关[20-22]:论文作者、编辑及审稿专家思想上不够重视论文统计学应用;期刊编辑的统计学应用知识匮乏;选择审稿专家只注重其专业领域内的影响力,而未关注其统计学应用水平。因此,要想提高医学期刊的统计学应用水平,从而更进一步提高期刊总体质量,需要做到以下几点:作为医学期刊编辑,必须不断进行统计学相关知识的学习,例如参加相关培训班、旁听医学院校的统计学课程及请教统计方面的专家等,以提高自身的统计学应用水平,并从思想上重视统计学应用的审查,在给新投稿件的作者的初步意见中就强调统计学应用的重要性,规定一旦统计学有问题,论文可随时退稿;聘请医学统计学专家进入期刊编委会,负责所有论文的统计学审稿;应通过各种途径,向广大科研工作者宣讲统计学在医学科研工作中的重要性,使其养成良好的正确应用统计学的习惯;在科研课题设计过程中要求有统计学相关专家的参与;科技期刊中增加统计学应用论文发表栏目,刊登与本刊论文关系密切的统计学方法,或者刊登一些常见的统计学错误,与作者或读者交流,提高其统计学应用能力。
注 释
[1]孙振球.医学统计学(第3版)[M].北京:人民卫生出版社,2010:1-8
[2]胡良平,郭秀花,刘惠刚.医学统计学是评价医学科技论文质量优劣的重要依据[J].中华口腔医学杂志,2011,36(3):229-232
[3][8]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003:4
[4] Garc€韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13
[5]王倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现状[J].中华医学杂志,1998,78(3):230-233
[6]沈进,苟莉,汤洁,等.生物医学期刊中统计学方法应用情况分析[J].中国修复重建外科杂志,2007,21(5):541-543
[7] [15]王晓瑜,王雅琢.《山东医药》论文中统计学错误分析[J].中国科技信息,2010(16):193-194
[8][9][10][20]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5):116-118
[11] 冉明会,罗萍,邓丹.医学期刊编辑应注意的几个统计学处理问题[J].编辑学报,2009,21(6):503-505
[12][16][18]李霞,张印朋,闫苏平.医学期刊作者来稿统计学应用与表述常见问题分析[J].中国科技期刊研究,2011,22(1):88-89
[13] 王晓瑜,王雅琢,封艳辉,等.医学期刊投稿常见统计学问题分析[J].科技与出版,2011(11):42-44
[14] 金永勤,王维.医学期刊编辑应重视统计学中的几个问题[J].编辑学报,2009,21(1):33-34
[17]张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析[J].郑州大学学报(医学版),2002,37(3):338-340
[19]叶亮,李伟东,范欣生.医学论文中常见的统计学应用问题辨析[J].南京中医药大学学报(社会科学版),2011,12(4):247-248
[21]吴红艳,尹平.医学期刊编辑应在数据的统计把关中有所作为[J].编辑学报,2008,20(5):400-401
[22]彭敏宁,昌兰.统计学审稿:医学期刊质量控制的重中之重[J].长沙铁道学院学报(社会科学版),2007,8(1):284-285
(收稿日期:2013-05-08)
【统计学差异性分析】推荐阅读:
统计学地域分析11-01
税收统计分析10-14
乡镇统计分析范文06-03
乡镇统计分析报告07-15
统计分析试题答案10-09
企业统计分析工作10-26
数理统计案例分析09-11
人工成本全年统计分析10-17
质量环境绩效统计分析11-21
多元统计分析期末论文12-15