运营数据分析工具(精选10篇)
来源:安迪大叔 知运营大学
优质的内容是新媒体运营的核心,而数据分析可以帮助我们解决很多问题,定方向、降成本、节开支等等。什么数据最值得去看呢,那必然就是各大自媒体平台的数据,它是新媒体平台中最具有参考性的数据。
必备的新媒体数据分析工具?
1,新榜
互联网渠道的价值标准:以日、周、月、年为周期,按24大分类权威发布以微信为代表的中国各自媒体平台最真实、最具价值的运营榜单,方便用户了解新媒体整体发展情况,为用户提供有效的参考导向…
2,清博大数据
中国新媒体大数据权威平台:清博大数据拥有清博指数、清博舆情、营广公品等多个核心产品。提供微信、微博、头条号等新媒体排行榜,广告交易、舆情报告、数据咨询...3,神策数据
多维度数据实时分析,事件分析,漏斗分析,留存分析,分布分析等8大分析模型,轻松搞定数据分析需求。即使调整运营策略,提高运营效果。深度洞察用户行为,深入了解用户是从哪里来,又在哪里消失,找到新的产品增长点,驱动产品优化迭代与提升运营效果,自定义多维度分析场景,可私有化部署的数据分析平台…
4,GrowingIO 实时采集用户行为数据,可视化实时出图。GrowingIO营运数据分析,多维分析更精准GrowingIO拥有国内颗粒度更细致的用户行为洞察系统,帮助运营人员灵活定制推广方案。
5,伯格运营
运营助手,运营管家...对于企业来说公众号运营的安全很重要,有了伯格运营质量诊断,再加上违规文章库,为公众号的健康起到保驾护航的作用...6,数说风云
一个实时、维度全面的微信排行与监控工具。微信运营监控,自媒体全行业分类排行榜。
7,易赞
易赞搭建了自媒体与广告主对接的社会化媒体营销平台。目前平台提供公众号用户画像查询及新媒体观象台大数据。可以通过易赞官方网站及公众号“易赞”获得数据查询及分析。
8,微指数
国内领先的微信大数据领导品牌,为广告公司、微信号运营者、新媒体行业和传统企业机构,提供微信运营、微信营销、微信推广相关的最专业的大数据服务。
9,西瓜数据
专业的微信公众号大数据服务商:收集380万公众号数据,4亿篇公众号发文记录提供广告价值预估,地区行业热门公众号排行。分钟级阅读量监控,全网竞品搜索监控,是公众号运营及广告投放效果监控首选大数据工具。
10,微信指数
是微信整合了微信上的搜索和浏览行为数据,基于对海量云数据的分析,从而形成当日、7日内、30日内以及90日内的“关键词”的动态指数变化情况,方便人们看到某个词语在一段时间内的热度趋势和最新指数动态。
11,大数据导航网
刘强, 福禄克网络公司中国区总经理, 全面负责福禄克网络在中国的业务。刘强先生毕业于清华大学, 曾在美国卡耐基-梅隆 (CarnegieMellion) 和Fordham大学学习, 拥有电子工程硕士和工商管理硕士学位。
全球各地的移动运营商正在急于从2G和3G迈向4G技术, 中国运营商也不例外。工信部计划在2013年末发放4G牌照, 而国务院近期宣布把宽带发展升级为国家战略, 并制定了实施时间表。为此, 三大运营商中国移动、中国联通和中国电信已经蓄势待发, 积极地在4G/LTE时代扩展业务。最雄心勃勃的中国移动从今年年初即加快这个项目的发展, 在4G网络建设上投资了417亿元。
未来一片光明。大多数国际公司需要快速精确地传递关键信息以保持竞争力。新兴市场上的小型企业主或SOHO (1980年创造的缩写词, 指的是小型办公室/家庭办公室) 使用智能手机和移动计算设备经营业务。由于日益扩展的LTE覆盖范围、容量、设备升级和新用户的进入, 个人数据的使用继续飙升。然而, 移动宽带用户对互动连接 (流媒体、网游、选择推送通知或其它各种应用等) 的需求不断增加, 促使他们让设备保持“时刻在线”。他们希望网络更快捷, 体验更完美, 随时随地、即时即用。
“时刻在线”的黄金标准给移动运营商带来了沉重的负担。由于接口数量快速增加以及目前应用程序的IP流量特征, LTE网络为故障诊断带来了新的挑战。部署4G/LTE要求运营商优化自己的移动宽带网络。这个过程很复杂, 而近期IPv6标准的实施给运营商的工程师团队带来了新的挑战。在LTE和Vo LTE之前, 通过信令测试进行故障诊断是标准的操作模式。真正移动宽带服务的来临提高了网络工程师的标准, 特别是之前主要从事移动通信工作的人。新的知识、技能和设备是快速高效地解决服务问题的关键。
传统的诊断工具 (包括很多知名的测试设备产品) 虽然有用, 但不能实现LTE需要的结果。核心网工程师使用这些工具, 花费数周时间查找问题的故事在业内并不陌生。这些低端工具不能为核心网工程师提供快速、高效解决问题所需的详细信息。LTE网络不仅仅面临信令问题, 例如在数据层会有更多应用造成的故障出现。传统工具聚焦信令分析, 而不提供应用分析, 而应用分析对于令人信服地验证问题在于应用而不是网络至关重要。
而且, 这些低端工具缺乏在骨干网络/EPC上管理高速数据传输的能力, 导致丢包和载荷丢失。它们的设计不是为了设置复合滤波器以避免缓存溢出。在多个捕捉点间同步需要耗费大量时间, 很多现有的测试工具设计糟糕, 无法从多个源发现和关联数据包。在捕捉控制信息并传至运营中心方面, 它们的表现通常很差。由于设计和功能复杂, 这些测试设备往往过于复杂而让现场技术人员无法正确地使用。派遣专业、熟练的工程师到故障地点使用这些设备的成本令人望而却步。网络运营中心应该拥有多么充沛的精通IPv6、LTE和应用分析的高级工程师团队才能考虑派遣一名工程师进行故障诊断?
那么, 运营商应当如何满足客户对设备“时刻在线”的需求?在此, 保证性能不下降是关键。为了保持网络的最优状态, 运营商必须有精妙的高性能工具来诊断任何问题的根本原因, 360度全方位解决LTE和Vo LTE问题。
如果我们认可“时间就是金钱”以及用户不能正常使用甚至由此丢失用户就相当于金钱损失, 那么就迫切地需要快速成功地解决问题。故障排除设备处理问题和实现“时刻在线”目标所需的关键特点是连接、捕捉、识别和解决。这些特点可以通过如下四种功能实现:
高性能:测试设备必须可以扩展, 高效地处理运营商的负载要求;
可视化:网络工程师必须能够在问题发生时立即清晰地看到数据包级别的指标, 并且确切地知道差距存在于通信渠道的哪个地方;
便捷性:无论何时需要以及具体情况如何, 设备必须快速建设并成本高效地运输到具体地点;
易用性:设备操作必须简单, 让现场工程师以即插即用的方式使用, 并能够提供通常远离测试地点的熟练工程人员所具备的综合捕捉与分析素质。
总体上说, 理想的故障排除工具需要能够关联控制信号、控制流量、用户信号和用户流量, 来提供清晰的用户体验情况。中国的目标是在2013年在重点城市公共区域实现Wi-Fi覆盖, 2015年固定宽带覆盖半数中国家庭, 到2020年实现城市和农村地区的全面宽带覆盖。因此, 拥有一体化的故障排除工具对于运营商至关重要, 这个工具可以在几分钟内发现、分析和判定故障, 而不是几小时或者几天, 完成这个目标需要可以提供信令和应用数据可见性最大化的工具。
于我个人而言,所用的数据分析软件包括EXCEL、SPSS、STATA、EVIEWS。在分析前期可以使用EXCEL进行数据清洗、数据结构调 整、复杂的新变量计算(包括逻辑计算);在后期呈现美观的图表时,它的制图制表功能更是无可取代的利器;但需要说明的是,EXCEL毕竟只是办公软件,它 的作用大多局限在对数据本身进行的操作,而非复杂的统计和计量分析,而且,当样本量达到“万”以上级别时,EXCEL的运行速度有时会让人抓狂。
SPSS是擅长于处理截面数据的傻瓜统计软件。首先,它是专业的统计软件,对“万”甚至“十万”样本量级别的数据集都能应付自如;其次,它是统计软 件而非专业的计量软件,因此它的强项在于数据清洗、描述统计、假设检验(T、F、卡方、方差齐性、正态性、信效度等检验)、多元统计分析(因子、聚类、判 别、偏相关等)和一些常用的计量分析(初、中级计量教科书里提到的计量分析基本都能实现),对于复杂的、前沿的计量分析无能为力;第三,SPSS主要用于 分析截面数据,在时序和面板数据处理方面功能了了;最后,SPSS兼容菜单化和编程化操作,是名副其实的傻瓜软件。
STATA与EVIEWS都是我偏好的计量软件。前者完全编程化操作,后者兼容菜单化和编程化操作;虽然两款软件都能做简单的描述统计,但是较之 SPSS差了许多;STATA与EVIEWS都是计量软件,高级的计量分析能够在这两个软件里得到实现;STATA的扩展性较好,我们可以上网找自己需要 的命令文件(.ado文件),不断扩展其应用,但EVIEWS就只能等着软件升级了;另外,对于时序数据的处理,EVIEWS较强。
综上,各款软件有自己的强项和弱项,用什么软件取决于数据本身的属性及分析方法。EXCEL适用于处理小样本数据,SPSS、STATA、EVIEWS可以处理较大的样本;EXCEL、SPSS适合做数据清洗、新变量计算等分析前准备性工作,而STATA、EVIEWS在这方面 较差;制图制表用EXCEL;对截面数据进行统计分析用SPSS,简单的计量分析SPSS、STATA、EVIEWS可以实现,高级的计量分析用 STATA、EVIEWS,时序分析用EVIEWS。关于因果性
做统计或计量,我认为最难也最头疼的就是进行因果性判断。假如你有A、B两个变量的数据,你怎么知道哪个变量是因(自变量),哪个变量是果(因变量)?
早期,人们通过观察原因和结果之间的表面联系进行因果推论,比如恒常会合、时间顺序。但是,人们渐渐认识到多次的共同出现和共同缺失可能是因果关 系,也可能是由共同的原因或其他因素造成的。从归纳法的角度来说,如果在有A的情形下出现B,没有A的情形下就没有B,那么A很可能是B的原因,但也可能 是其他未能预料到的因素在起作用,所以,在进行因果判断时应对大量的事例进行比较,以便提高判断的可靠性。
有两种解决因果问题的方案:统计的解决方案和科学的解决方案。统计的解决方案主要指运用统计和计量回归的方法对微观数据进行分析,比较受干预样本与 未接受干预样本在效果指标(因变量)上的差异。需要强调的是,利用截面数据进行统计分析,不论是进行均值比较、频数分析,还是方差分析、相关分析,其结果 只是干预与影响效果之间因果关系成立的必要条件而非充分条件。类似的,利用截面数据进行计量回归,所能得到的最多也只是变量间的数量关系;计量模型中哪个 变量为因变量哪个变量为自变量,完全出于分析者根据其他考虑进行的预设,与计量分析结果没有关系。总之,回归并不意味着因果关系的成立,因果关系的判定或 推断必须依据经过实践检验的相关理论。虽然利用截面数据进行因果判断显得勉强,但如果研究者掌握了时间序列数据,因果判断仍有可为,其中最经典的方法就是 进行“格兰杰因果关系检验”。但格兰杰因果关系检验的结论也只是统计意义上的因果性,而不一定是真正的因果关系,况且格兰杰因果关系检验对数据的要求较高(多期时序数据),因此该方法对截面数据无能为力。综上所述,统计、计量分析的结果可以作为真正的因果关系的一种支持,但不能作为肯定或否定因果关系的最 终根据。科学的解决方案主要指实验法,包括随机分组实验和准实验。以实验的方法对干预的效果进行评估,可以对除干预外的其他影响因素加以控制,从而将干预实施后的效果归因为干预本身,这就解决了因果性的确认问题。关于实验
在随机实验中,样本被随机分成两组,一组经历处理条件(进入干预组),另一组接受控制条件(进入对照组),然后比较两组样本的效果指标均值是否有差 异。随机分组使得两组样本“同质”,即“分组”、“干预”与样本的所有自身属性相互独立,从而可以通过干预结束时两个群体在效果指标上的差异来考察实验处 理的净效应。随机实验设计方法能够在最大程度上保证干预组与对照组的相似性,得出的研究结论更具可靠性,更具说服力。但是这种方法也是备受争议的,一是因 为它实施难度较大、成本较高;二是因为在干预的影响评估中,接受干预与否通常并不是随机发生的;第三,在社会科学研究领域,完全随机分配实验对象的做法会 涉及到研究伦理和道德问题。鉴于上述原因,利用非随机数据进行的准实验设计是一个可供选择的替代方法。准实验与随机实验区分的标准是前者没有随机分配样本。
通过准实验对干预的影响效果进行评估,由于样本接受干预与否并不是随机发生的,而是人为选择的,因此对于非随机数据,不能简单的认为效果指标的差异 来源于干预。在剔除干预因素后,干预组和对照组的本身还可能存在着一些影响效果指标的因素,这些因素对效果指标的作用有可能同干预对效果指标的作用相混淆。为了解决这个问题,可以运用统计或计量的方法对除干预因素外的其他可能的影响因素进行控制,或运用匹配的方法调整样本属性的不平衡性——在对照组中寻 找一个除了干预因素不同之外,其他因素与干预组样本相同的对照样本与之配对——这可以保证这些影响因素和分组安排独立。
随机实验需要至少两期的面板数据,并且要求样本在干预组和对照组随机分布,分析方法就是DID(倍差法,或曰双重差分法);准实验分析用截面数据就 能做,不要求样本在干预组和对照组随机分布,分析方法包括DID(需两期的面板数据)、PSM(倾向性得分匹配法,需一期的截面数据)和PSM-DID(需两期的面板数据)。从准确度角度来说,随机实验的准确度高于准实验和非实验分析。
关于分析工具的选择
如果根据理论或逻辑已经预设了变量间的因果关系,那么就无需使用实验方法。我对非实验数据分析工具的选择原则如下。
因变量为连续变量,自变量至少有一个连续变量,进行多元线性回归; 因变量为连续变量,自变量全部为分类变量,进行方差分析;
因变量为分类变量,自变量至少有一个连续变量,使用Logit模型或Probit模型; 因变量为分类变量,自变量全部为分类变量,进行交叉表分析和卡方检验;
因变量在某个闭区间内分布,并且有较多样本落在闭区间的边界上,使用Tobit模型;
因变量不唯一,如多产出问题,进行数据包络分析(DEA);
因变量为整数、数值小、取零个数较多,使用计数(Count)模型; 数据具有层次结构(嵌套结构),使用多层线性模型(HLM)。
随着统计和计量经济学的发展,各种前沿分析工具层出不穷,但我认为最靠谱的分析工具不外乎以下四种:DID(针对随机实验),多元线性回归,固定效 应变截距模型(FE,针对面板数据),Logit模型或Probit模型(针对分类因变量数据)。其他方法或适用条件苛刻,或分析过程折腾,或方法本身不 可靠(尤其是聚类分析、判别分析,超级不靠谱),因此能用以上四种方法分析问题时,不必为“炫方法”而瞎折腾。关于拟合优度、变量选择原则及估计值绝对大小的意义
在人人的“数据分析”小站中,某同学提出这样一个问题:“多元回归分析中,怎么选择自变量和因变量,可以使R方达到80%以上?”
很显然,问这个问题的同学要么没学好计量,要么就是犯了功利主义的错误,或者二者皆有。拟合优度的大小很大程度上取决于数据本身的性质。如果数据是 时序数据,只要拿有点相关关系的变量进行回归就能使拟合优度达到80%以上,但这样的高R方根本说明不了什么,很可能使分析者陷入伪回归的陷阱,严谨的做 法当然是做平稳性检验和协整检验;如果是截面数据,根本没必要追求R方到80%的程度,一般来说,有个20%、30%就非常大了。
如果一定要增大R方,那么最应该做的的确是对纳入模型的变量进行选择。选择纳入模型的原则我认为有三条。第一,从理论和逻辑出发,将可能影响因变量 的变量作为自变量纳入模型,即理论上或逻辑上能影响因变量的自变量必须纳入模型,即使该自变量的回归系数不显著。第二,奥姆剃刀原则——如无必要,勿增实体,即理论上或逻辑上不能影响因变量的自变量不能纳入模型,即使该自变量的回归系数显著。第三,防止纳入具有多重共线性的自变量。
百度统计指标描述
百度统计报告中指标的描述是我认为最好的一个,因为大部分指标都和行业标准保持了一致。并且在浏览量和访客数两个指标上还单独标注了英文指标缩写。这对于分析师在更换工具重新阅读报告时非常有帮助。建议其他中文指标后也能标注英文指标缩写。使报告中的指标描述保持一致。
CNZZ(全景)指标描述
CNZZ(全景)统计的指标描述看起来有些杂乱,中文指标名称和英文缩写出现在报告的不同位置。虽然是细节问题,但显然没有经过很好的规划。这样看起来会使整个工具显得很不专业,并且对于新入行的分析人员混乱。同样,这样的指标描述所展现的数据和报告也会显得有些混乱。
Google Analytics指标描述
“价值链”(Value Chain)最初是由美国哈佛大学教授迈克尔·波特(Michacl·PORTER)于1985年提
出来的。作为一种强有力的战略分析框架,15年来不断发展创新并被财务分析、成本管理、市场
营销等专门领域广泛融入和吸收。
——价值链的定义和分类
价值链是企业为客户创造价值所进行的一系列经济活动的总称,企业也可以说就是这些活动的集
合。价值链在经济活动中是无处不在的,价值链分为三个层面:
1、上下游关联的企业与企业之间存在行业价值链;
2、企业内部各业务单元的联系构成了企业的价值链;
3、企业内部各业务单元之间也存在着运营作业链。
——价值链分析的意义
1、行业分析
价值链上的每一项价值活动都会对企业最终能够实现多大的价值造成影响。进行价值链研究,就
是要在深入行业价值链“经济学”的基础上,对其影响的方面和影响程度进行深入的考察,充分权
衡其中的利弊,以求得最佳的投资方案(最佳价值链结构)。
2、竞争优势
企业的任何一种价值活动都是经营歧异性的一个潜在来源。企业通过进行与其它企业不同的价值
活动或是构造与其它企业不同的价值链来取得差异优势。真正重要的是,企业的经营差异战略必
须为客户所认同。另外经营差异必须同时控制实现差异经营的成本,以便将差异性转化为显著的盈利能力。
3、关键控制点
在企业的价值活动中增进独特性,同时要求能够控制各种独特性驱动因素,控制价值链上有战略
意义的关键环节。
——价值链的发展
价值链理论一直在发展和创新,在价值链提出后,又有学者提出了基于价值链的战略成本法和作
政治、经济和科学技术的急剧变化与发展对工作的`性质产生了重大的影响.本文以工作性质的变迁为背景,结合文献深入探讨了工作分析诸工具的特点和效能,并就工作分析工具的选择问题提出了考虑信息的最终用途、考虑选定方法的成本效益、确保信息的可靠性与可接受性、定期回顾与适时更新以及综合应用与扬长避短等5项建议.
作 者:杨杰 方俐洛 凌文辁 李耀章 苏家文 YANG Jie FANG Li-luo LING Wen-quan LI Yao-zhang SU Jia-wen 作者单位:杨杰,方俐洛,YANG Jie,FANG Li-luo(中国科学院心理研究所,北京,100101)
凌文辁,LING Wen-quan(暨南大学人力资源管理研究所,广州,510632)
李耀章,LI Yao-zhang(北京科技大学管理学院,北京,100083)
苏家文,SU Jia-wen(海南师范学院体育系,海口,571158)
为什么要采取非现金结算?现金结算有哪些不良后果? 第一,大量的现金结算阻碍了先进结算手段的推广和发展。在非现金结算手段日趋电子化之时,现金结算本应大大萎缩,然而在我国却没有十分明显的迹象,这种情况令人深思。
第二,造成大量的社会重复劳动。据了解,近年来现金在银行间搬家的现象时有发生。现金结算的劳动强度与票据结算是难以相提并论的,现金结算的劳动强度和劳动时间比票据结算大得多。
第三,现金结算的成本很高,国家为此付出了高昂的代价。
第四,大大降低了银行对市场运作的监测和调控能力,这也不利于反洗钱工作,同时对一些原本可以通过经济手段调控的事件无能为力。
第五,现金结算是造成国家税款流失的一个重要因素,不仅仅是银行难以监督企业和个人资金的使用情况,税务机关也难以掌握交易双方的真实情况,使税款流失于无形之中。
推广非现金支付工具的制约因素
1、使用主体方面
(1)个体工商户资金运作呈现模糊性。一方面,很多个体户为了逃避银行监督,将经营性的资金混同于自己的储蓄资金,通过储蓄账户频繁地存取现金进行业务交往。另一方面,由于个体户面广量大、经营灵活、运作快速等方面的特殊性,人民银行及金融机构对这类账户尚没有形成规范严格的管理模式,客观上为个体工商户大量使用现金进行交易创造了条件。
(2)企业对现金使用有较强需求。由于现金结算具有钱货两清、避免拖欠的“优越性”,部分企业认为现金结算最为理想。一些企业单位为提高资金回笼的速度和效果,有意识地对现金结算提供了比非现金结算更多的优惠,助长了现金结算的不正之风。个别企业经营不景气,为逃避银行收贷收息或是偷税漏税,人为地使大量资金体外循环,坐收坐支,超库存,限额保留现金。
(3)受电子工具发展的影响。由于计算机信息技术在金融领域的广泛应用,电子结算工具层出不穷,相应冲淡了其他支付工具的应用。加上金融机构宣传不到位,人们对传统工具的拓展认识不足,创新难度较大。另外,现代化支付系统的建立与在全国的推广应用,使资金汇划速度加快,也相对降低了广大客户对扩大支票使用范围的需求。
2、使用客体方面
(1)现行的支付结算体系不健全,支付系统覆盖面不大,相比现金结算,非现金支付结算工具和结算方式环节相对较多,在途时间长,难以适应快速变化的市场运作。(2)一些票据,如银行汇票、商业汇票,其要式性和文义性较强,填写签章稍有不慎,便会导致票据无效或票据权利丧失。
(3)信用卡等非现金支付工具常常由于计算机硬件和软件系统的欠缺,在运行中容易出现交易和清算的阻塞现象,给客户带来了不必要的麻烦。
(4)支票使用范围受到很大的限制。由于种种条件制约,支票基本上只能在同城范围内使用,个人支票的社会认知度较低,使用较少,还未成为居民的日常支付工具。
3、管理监督方面
金融机构之间的竞争淡化了现金管理。从目前的情况来看,开户银行作为现金管理的中心环节,其作用没有充分发挥。有的开户银行对开户单位支现用途的真实性和合规性不把关,登而不审,敞开放行,对开户单位违反现金管理的行为不敢抵制,致使企业坐支、超限额使用现金的现象普遍存在。
同时,为了完成由上至下的存款考核任务,金融机构大多奉行客户至上的经营理念,以松散的现金管理换取客户和存款的稳定,具体采取允许非基本账户提现,超范围使用现金,大额提现不审批等诸多形式去迎合客户,使现金结算量居高难下。
非现金支付工具体系的建设措施
1、尽快修订现有的现金管理法规制度
现金管理法律法规滞后,不能适应当前经济生活的客观实际情况。目前,我国现金管理的基本规章制度是1988年国务院颁布的《现金管理暂行条例》及人民银行相应制定的现金管理实施办法。为了有力地强化现金管理,推广非现金支付结算工具,应尽快修订《现金管理条例》等法规制度,重新规定金融机构对企事业单位现金管理的职权、范围及要求,适当降低非现金支付结算金额的起点,同时逐步推行现金结算的收费控制措施,使现金管理规定更加适合推行非现金结算工具发展的需要。
2、严格落实有关现金管理的制度规定
(1)企业单位要落实对现金使用的计划控制。企事业单位必须根据《现金管理条例》的规定使用和开支现金,不属于现金开支范围的业务必须通过银行办理转账结算;各金融机构应严格实施计划控制,并建立、健全现金收支监测分析制度,对现金收支、存取等情况随时进行调查、统计、分析。
(2)金融机构要严格落实柜面结算监督工作。金融机构要认真审查现金支出的范围、用途、程序、额度等情况是否符合政策规定,是否符合结算标准,对不合法、不合规的情况一律拒绝办理。对大额现金支付要严格执行现金、账户管理和反洗钱的有关规定,现金存入要审查资金来源,现金支取要审查资金用途,发现问题要及时向上级银行和人民银行报告,制止和纠正资金使用上的违规、违纪行为。
(3)人民银行要切实强化现金管理和支付结算管理工作。人民银行作为主管机关,要加强现金管理和支付结算管理工作,加大对违反现金管理规定行为的处罚力度,提高现金管理工作的时效性和准确性,为非现金支付结算工具的推广创造良好的环境。
3、积极规范、创新非现金支付工具
(2)积极鼓励支付工具和结算方式的创新。通过深入研究,以电子货币为发展方向,不断创新和规范支付工具,为市场提供更多方便快捷的支付结算工具和支付结算服务,最大限度地满足市场经济和社会发展的需要。
一家汽车修理公司的客户抱怨该公司的服务时间比承诺的时间长。 该修理公司决定分析前几个月的实际修理时间以便为客户提供更准确的服务时间。
确定中心值(如均值或中位数)是了解数据的首要关键步骤
用法 2: 评估变异程度
一家零食公司希望评估新的填充机器的性能。 尽管平均状态下此机器看上去以正确的重量填充薯片,但此机器性能也存在很大的差异。
许多薯片袋会出现填充不足或填充过多的情况。
了解数据的变化程度对于了解产品或服务是非常重要的。 不仅如此,理解变异性测量指标同时也会影响您对其他统计量(如均值)的认识。
用法 3: 研究可能的组间差异
一个营销团队研究对他们的电子简报进行的读者调查的结果,以了解该简报是否递送给目标受众。
该团队想知道被调查者的特定特征(性别、年龄和职业)是否与希望更频繁地阅读此简报或对此简报的评价更高有关。
Minitab 可以为每组数据计算单独的描述性统计量,以便您更好地了解这些数据组之间的差异。
需要什么类型的数据?
必须使用数字数据。 例如:
一个月中每个班次发现的缺陷部件数
班级中学生各自的测验分数
服务提供商的机器维修成本
可选的分组列(也称为“按”列)可以是数字、文本或日期/时间。 Minitab 将为此按变量分组中的每个值显示单独的描述性统计量。
例如:
按性别分组的调查反应
按班次分组的客户服务来电
按分支机构位置分组的客户满意度
请考虑要使检验具有实际意义需要多少数据。 尽管您可以仅对一个或两个数据值显示描述性统计,但您拥有的数据越多,结果所能提供的信息量就越大。
我的工作表的外观如何?
测量值数据和所有按变量分组都必须位于单独的列中。 在本示例中,房价是测量值数据,而卧室和外墙则可以用作按变量分组
方案
一位热心的年轻气象学者收集了她家乡一年内的气象数据。 这些值显示了每个月中具有明显降雨的天数。
选择适当的分析方式
由于这是她首次查看这些数据,通过回顾描述性统计量可为她提供一些最重要特征的总览,例如中心趋势和展开的度量。
输入要分析的数据
对于在变量中输入的每个变量,您都将获得一份单独的分析结果。 在本例中,只有一份分析结果。
指定按变量分组(如果有必要)
按变量分组(通常)是一个可用于将分析分为多个可比较和对比部分的类别变量。 例如,如果您将性别指定为按变量分组,您将分别获得男性观测值和女性观测值结果。
但是,此分析不包含按变量分组。
指定选项此分析无需进一步修改,但您可以选择其他选项。 单击统计量可以更改分析中生成的默认统计量。
单击图形可以添加数据的图解。
大数据分析工具minitab (共1篇)
人力资源专家乔治•T•米尔科维奇和约翰•W•布德罗在其《人力资源管理》一书中,就提出,建立外部招聘选拔策略要进行一下选择:在评判申请者的选拔信息时应运用什么选拔标准和证据?应运用哪些特定的信息收集技术?
在选拔过程中,信息将如何被运用?如何衡量选拔结果?
“人之难知,江海不足以喻其深,山谷不足以配其险,浮云不足以比其变”,所以我们在面对任何一个人的时候,所能看到的只是浮在水面的冰山一角。而我们招聘的任务则恰恰是运用这“冰山一角”的信息来预测申请者的未来行为,并以此来衡量申请者的“冰山”能量。
“倒冰山”成为一种被普遍应用的工具和策略,其包括:(1)知冰山,即研究什么样的行为或能力可以导致企业优良的业绩,发现企业员工胜任力要素工作原理和运行规律。
(2)破冰山,即选用什么样的技术与工具,才能科学、全面和深入地测评每个申请者的能力素质状况,破解其能力“冰山”,衡量每个申请者所具备的优势能力与岗位要求的匹配程度,确定最佳入围人选。
(3)倒冰山,即如何变优势能力的个人“所有”为企业“所用”,即所有权和使用权的高度合一;这主要把能力冰山倒置,看个人优势能量和能力可以输出多少在招聘岗位上,以激励其最佳的绩效贡献和在公司的持续发展。
在“倒冰山”策略的指导下,我们可以针对性的选取或开发适当的工具,以增强企业招聘选拔工作的有效性,即有效的预测每个求职者在企业未来的业绩表现和贡献。
知冰山
目的是探寻员工能力与企业成功的对应关系。因此,许多公司已经开始使用胜任力模型(又称“素质模型”)来帮助识别,要在一个职位上实现良好的业绩必须具备哪些技巧、知识以及个性,并且使用胜任力模型来保证人力资源体系能够把精力集中在这些技巧、知识和个性的开发上。
胜任力模型有很多的定义,但总的来说,描述的是驱动员工产生优秀工作绩效的各种个
性特征的集合,它反映的是可以通过不同方式表现出来的员工的知识、技能、个性与内驱力等。它是判断一个人能否胜任某项工作的起点,是决定并区别绩效差异的个人特征。胜任力模型常被当作一种人力资源工具来解决关于员工的甄选、培训与开发、评估和继任计划等方面的问题。
根据每个员工的个体素质的不同表现形式,将其分为可见的“水上部分”和深藏的“水下部分”。其中,“水上部分”包括基本知识、基本技能,是人力资源管理中人们比较重视的方面,它们相对来说比较容易改变和发展,识别起来也比较容易见成效。而“水下部分”包括内驱力、自我形象、个性和价值观等,这方面处于冰山的最下层,是比较难于评估和改进的。但在人才选拔中,这部分内容却最具有选拔的预测价值,同时它也是“水下冰山理论”的核心内容。
识冰山有两个很重要的工作:第一,识别胜任力能力要素;第二,要明白各要素之间的关系和相互作用机制。笔者将重点阐述后者。
岗位胜任规则和胜任力的作用机制
一个人做好一项工作,或是我们期待员工能够在工作中有着优秀表现和优秀业绩,其前提条件是什么?请试着根据你的经验来回答:
你的答案:
不是管理环境和条件,也不是物质条件,是他对工作的一种胜任感,这胜任感支配和决定着胜任力发挥的大小和多少。这胜任感包括这“冰山”水面下的各个部分:(1)做他喜欢的,比如,他喜欢做计划;(2)有能力做的,比如,他拥有做计划的能力;(3)可以运用他习惯的思维和行动方式的,比如,他习惯做计划,拥有计划性;(4)是他愿意投入的,比如,他愿意做计划;(5)他能从中获得对自己来说是最重要回报,比如,他能从计划中得到一种掌控感和安全感;(5)他懂得或知道的,比如,他知道做计划步骤和要点。
由此可见,知识和技能的重要性就要排在后面了,这对我们企业人力资源工作者很显然是一个挑战。因为,很多企业的招聘选拔工作以前都是重点放在这两个方面,不是他们不想了解冰山下的部分,是因为他们不知道冰山下的部分是如何运行的。
人是一个完整的整体,我们从来都不能把人割裂开来看他的任何一个部分。既然是一个完整的系统,那么它的各个组成部分就必然彼此依赖,相互作用。
如果知识与技能、天赋与能力是水的话,那么个性就是水渠,组织绩效和价值回报就是大海;水向大海流,水渠决定了水的流向及流量。内驱力和成就动机给水以牵引力,价值观给予水使命感的感受力,兴趣给予水以快乐的支持力,自我形象和角色概念给予水以压力。各要素综合作用,形成了水的起点与重点之间形态各异的水渠和流域。
胜任力模型的建构应该从两个方面来着手:一是探索“能力-职业”的相互作用原理和机制,这需要研究者很熟悉构成胜任力各要素的特点和综合作用,换个说法,就是对胜任规则的探知。二是岗位绩效优秀者们的特质,这就要针对具体的企业、岗位和具体的人了,属于
个性化的胜任表现。由此可知,这两个方面就跟理论指导实践,实践修正理论的关系一样。
摘要:
本文分析了目前国内企业MIS应用的的现状,分析了今后企业信息系统的应用需求,根据目前状况和需求介绍了一个商业智能工具软件的设计。
关键词:MIS DSS 商业智能 OLAP 数据仓库
一、企业MIS应用现状
随着国内企业改革的不断深入,企业管理也随之深化,企业领导、管理人员和专业技术人员都更加充分认识到了信息资源只有通过信息系统的加工处理,才能得到更有效的利用。信息系统的建设在社会经济活动中起着越来越重要的作用。经过几十年的探索与实践,我国各企事业信息系统的建设也由单项应用、小系统应用向大型化和网络化方向发展。
但是,我们也清楚地看到目前MIS的建设仍有许多不尽人意之处,如:许多MIS往往只限于对数据的统计分析,而真正涉及到预测、决策及优化方面的工作较少,结果是只能代替一部分繁重的手工劳动,并没有充分发挥MIS的效益。当前的MIS所必须解决的一些较普遍的问题有:
涉及的数据种类多、数据量大,而且数据往往分散在各业务部门,每个业务部门对信息的收集方式、分析方法、统计口径、报表输出形式等都有各自独特的处理要求。
具有明显的时变性。管理制度的不断改革和经济形式的不断变化,引起信息处理方法频繁变更,各业务口采集的数据,及对基础数据的分析统计方法,报表输出格式都会随着形势的发展而有新的变化和侧重。这些修改必须由专业程序员利用较长的时间才能完成,远远无法满足对系统数据灵活查询,随机查询的要求,浪费了宝贵的数据内在的价值。而且由于系统不停地被改动,稳定性也大大降低。
新、旧系统的继承与发展。有的企业原来就有MIS,但是旧的系统不能满足各业务部门自身的业务需求,而且早期的系统多采用单机环境,所采用的应用平台及数据库系统也各不相同。怎样将这些现有的、零散的、独立的信息继承起来,有效地利用,也是企业信息化建设的重要课题。
缺乏辅助决策支持功能。许多MIS往往只限于解决一些具体的业务处理问题,对数据的统计分析较少,而涉及到多维分析、决策支持及数据挖掘方面的工作则更少,使大量数据不能充分发挥效益。
二、企业通用管理软件现状
我国中小型企业占国内企业总数的94%,它们在市场中最具活力。在大型企业对计算机的需求已经趋于平稳的时候,中小型企业用户就显得格外的突出。中小型企业由于企业自身的规模有限,没有能力自己独立开发内部管理软件,而并不十分健全的内部经营体系又急需系统化的管理,这就为企业管理软件的发展打下了坚实的基础。
当前,建立竞争优势,提高市场竞争力已经成为企业管理的核心,而原有的管理软件已经越来越不能适应管理实践的要求,新的时代需要新一代的管理软件。我国企业管理软件的发展,在经历了单项管理系统、MRP/MRPⅡ应用之后,正朝着更先进的ERP模式发展。ERP(企业资源计划)是管理信息系统在九十年代的最新发展,近年来被引入到中国后,受到国内的广泛关注。ERP不仅集成了企业运营和管理的各主要部分(财务、分销、制造、人力资源、决策支持),更代表了先进的管理思想和管理方式。我们可以预见, ERP将作为管理现代化的重要工具,在我国企业等组织得到越来越广泛的应用。
但是,当前国内ERP 系统的数据分析能力大都不够强大,而ERP系统启动运行之后,其数据分析能力是决定性能的重要指标。面向ERP软件的数据分析功能被称为“商业智能”,其主要功能是对ERP系统积累的数据进行分析处理,形象地说就是帮助用户发现ERP系统积累的数据的潜在价值。可以这么说,普通的ERP 系统能够帮助用户规范企业的管理,而拥有强大数据分析功能的ERP 系统则能够使用户从这种规范的管理中获得更大的效益。因此,如果企业要采用ERP系统,一般需要一个强大的数据分析部件。这个数据分析部件能够与ERP系统集成,在ERP系统运行过程中采集数据进行分析,并能将样本数据和分析结果存入数据仓库以便用户查询采用。
三、企业信息系统应用需求
1、企业对数据仓库的需求
调查研究表明,大多数企业并不缺少数据,而是受阻于过量的冗余数据和数据不一致;而且它们变得越来越难于访问、管理和用于决策支持;其数据量正以成倍的速度增长。这样,信息中心面临着不断增长的决策支持的需求,但是,开发应用变得越来越复杂和耗费人力。那么怎样把大量的数据转换成可靠的、商用的信息以便于决策支持呢?数据仓库正广泛地被公认为是最好的解决方案。
数据仓库化是企业范围内数据的处理过程,它将企业内分散的原始操作数据和来自外部的数据汇集和整理在一起,为企业提供完整、及时、准确和明了的决策信息,使最终用户能够真正利用DSS工具直接从企业信息池中随机地提取、分析数据,有效地服务于企业的全方位决策。作为一个决策支持环境,DW(Data Warehouse)收集存储了各种不同数据源中的数据。通过数据的组织给决策支持者提供分布在整个企业内部跨平台的数据。
再下一步,现有的管理系统和现有的数据仓库将得到扩展,一是使数据仓库从一种局部的企业解决方案扩展到企业外部,扩展到企业的用户中去,使企业用户的数据仓库使用面更加广泛,这些可以通过Internet/Intranet的帮助来实现,这是数据仓库与电子商务相互融合的一点;二是使数据仓库从一种企业数据管理工具扩展到企业辅助决策工具,能够充分利用数据仓库中的数据资源,为企业的发展起到辅助决策的功能,使企业用户的数据仓库得到更加深入的使用,这些可以通过数据库厂商提供的工具来实现,也可以由其它软件公司提供的独立工具包来实现,这是数据仓库与商务智能相互融合的一点。
2、企业对Internet/Intranet的需求
企业决策系统与互联网的结合,正成为企业亟待解决的焦点问题之一。因为随着企业内部和企业间的信息交流量的增大,用户已不再满足于简单的文件共享方式,而是追求一种更灵活、更方便的数据共享策略,这便是大批企业用户将自身以数据库为核心的MIS系统从客户机/服务器计算模式向Internet/Intranet的系统架构转变。另外,发展到一定规模的企业,其自身的国际化已成为必然,一些分支机构可能是跨地区、跨国界的,因此,在数据传递、信息共享和发布时,Internet成为这些跨地域企业的必然选择;激烈的市场竞争,也要求企业对市场变化做出快速的反应,用户的需求也不再是对离散的单个信息做简单的查询,而是要求能够提供一种对企业大量数据做出汇总的、多层次的、多侧面的快速灵活的查询、分析及报表制作手段。因此,市场上最需求的是如何使数据库中的大量信息满足人们不断变化的业务需求,并能及时为管理决策支持提供服务。如何将企业决策支持系统与Internet/Intranet技术有机地结合起来,提供基于Web,集查询、报表、OLAP(On-Line Analytical Processing)分析及数据挖掘为一体的企业级决策支持解决方案,已经成为一个重要课题。
四、企业智能数据处理工具的设计
针对企业应用需求,我们分别在一九九五年和一九九七年开发出“科力MIS―多媒体MIS系统生成工具软件”DOS版和Windows版本,这个工具软件主要解决用户不写程序,通过可视化交互设计工具建立管理系统的需求,它还支持声音、图像和AVI活动图像的数据库存储和显示等的多媒体应用。经过几年来的实践,我们认为企业迫切需要一种智能化的数据处理工具,这类工具将解决如下问题:
建立在企业已有MIS系统或ERP系统的基础之上,利用已有的数据。现在有许多中小型企业已经有了一些MIS系统或ERP系统,但由于形势的变化,很快就会有进一步的需求,因此迫切需要新的软件,既能解决出现的问题,又能利用已有的数据。
为部分中型企业提供基于数据仓库的解决方案。对小型企业,出于各方面的考虑,一般都不采用基于数据仓库的解决方案,而对于中型企业,则应该给他们一个建立自己的数据仓库的机会。如果能建立数据仓库,就能更好地组织企业的数据,智能决策工具也能发挥更大的功效。
可以为小型企业提供通用MIS系统生成工具。对一些需求比较简单的小型企业,不用用户编程,就能通过可视化的方法实现一个MIS系统,再结合智能决策系统,将能实现更灵活、更强大的功能。
既可以实现传统的查询及统计报表功能,又可以实现多维数据分析、决策支持及数据发掘等高级功能。智能决策工具可以实现极为灵活的查询和报表,而且内嵌了部分分析功能,可以称之为交互式的查询和报表。另外,即使在较大型的MIS系统甚至ERP系统中,都很难找到多维数据分析、决策支持及数据发掘等高级功能,智能决策工具内却提供这些功能,这样就可以很好地利用原有的数据,大大加强原有系统的能力。
全面支持Internet/Intranet.绝大部分的输出都可以定向为HTML文件,这中间包括查询结果、报表、分析和数据挖掘的结果等;另外,还提供部分功能在基于浏览器的环境中实现,使用户可以通过浏览器来进行诸如查询数据、浏览报表、简单分析等功能。
五、系统的结构
系统分为两大部分分析设计部分和应用系统部分,分别面向企业IS(信息系统管理员)人员与企业管理人员,IS人员除了负责高级数据分析工作以外,还负责为管理人员设计具体应用系统,由于大部分具体的应用工作可以由管理人员来完成,所以从另一个方面缓解了信息人才缺乏的问题。应用系统部分的功能结构图见图一,设计部分功能结构图见图二。系统中最重要的是“描述层”的设计。
在一般的商业用户访问数据时,他们最担心的往往是复杂的数据库术语和繁复的数据库操作。如何才能赋予这些商业用户自主访问数据库和数据仓库中信息的能力,使他们可以把那些数据库术语和操作抛之脑后呢?我们在此使用了一种称为“描述层”的技术来解决这个问题。在使用了“描述层”技术后,不但解决了一般商业用户担心的问题,而且同时也提供了IS人员控制和管理数据访问所必须的工具。这一技术把复杂的`数据库结构描述成易于理解的业务术语,把商业用户同技术性的数据库术语以及复杂的SQL访问语言分离开来。它就像一个透镜,用户可以通过它来看数据仓库。这样最终用户无须具备计算机专业知识,更不必是数据库方面的专家,就能够自主地访问公共数据,分析信息,从而更好地理解企业发展的趋势,作出明智的决策。
“描述层”可以被称为一个覆盖在数据库内部数据对象之上的一个解释层,是用户和数据库之间的一个代码翻译层,也就是将数据库中比较凌乱、复杂的数据对象(例如:存储在数据表中的各个字段的记录)通过预先定义好的规则(“描述层”)过滤转换成实际使用的业务对象,例如:人员姓名、物资类型等等。同时,“描述层”的功能不仅仅在于过滤和映射,还可以对数据通过预先定义好的规则进行重组,例如在数据库中没有的高层数据(比如:通过价格和销售量在本地提取销售额),所以我们可以通过“描述层”给数据库增加一些不存在而又有实际意义的内容。另外,我们还可以利用“描述层”来增加数据库中数据所包含的信息量(比如:建立某一字段的分类规则,使数据库中的记录可以分属于不同的类别,具体的例子是,按销售业绩多少分为优、良、中、差,用户就可以直接用诸如 “销售业绩=优”之类的条件进行查询;类似的还有分层规则等其它许多规则)。最后,我们还可以在“描述层”中加入一些预定义的条件,在以后的查询或分析时,就可以直接从“描述层”中提取条件。使用“描述层”重组数据的实际意义在于:数据库内大量珍贵的数据资源不再是只有数据库开发人员才能理解的“天书”,通过“描述层”的解释和组织,大多数不具备计算机专业知识的业务人员,可以直接使用这些数据。
在这个部分,主要的工作就是两点,即“描述层”的定义与解释。在“描述层”的定义部分,要进行各种不同类型的定义,具体来说就是上一段提到的几种类型,然后将各个类型的定义作为元数据进行存储。在定义的过程中,必然要通过数据库连接工具来对数据库或数据仓库进行访问,再按照数据库的结构和内容来设计各个不同的“描述”.另外,在以后使用本系统的其它主体部分如查询、报表、分析和数据挖掘部分时,将用到“描述层”中定义的“描述”,这是就需要“描述层”的解释部分来进行解释,将“描述”语言翻译为数据库能够接受的语言。
本软件设计中的另一个重点是体现商业智能化的数据挖掘功能,随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,可是目前用于对这些数据进行分析处理的工具却很少。现在所能做到的只是对数据库中已有的数据进行由人驱动的分析,人们通过这些数据所获得的信息量仅仅是整个数据库所包含的信息量的一部分,隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述及对其发展趋势的预测,这些信息在决策生成的过程中具有重要的参考价值。
数据库中的知识发现(KDD)就是利用机器学习的方法从数据库中提取有价值知识的过程,是数据库技术和机器学习两个学科的交叉学科。数据库技术侧重于对数据存储处理的高效率方法的研究,而机器学习则侧重于设计新的方法从数据中提取知识。KDD利用数据库技术对数据进行前端处理,而利用机器学习方法则从处理后的数据中提取有用的知识。KDD与其他学科也有很强的联系,如统计学、数学和可视化技术等等。
在我们的系统中,将实现一个完整的KDD工具,也可以称为数据挖掘(Data Mining)工具。因为我们要面向广大商业用户,所以我们的系统特别注重对用户与数据库交互的支持,由用户根据数据库中的数据,选择一种模型,然后选择有关数据进行知识的挖掘,并不断对模型的数据进行调整优化。整个处理过程分为下面一些步骤:
数据发现:了解任务所涉及的原始数据的数据结构及数据所代表的意义,并从数据库中提取相关数据。
数据清理:对用户的数据进行清理以使其适于后续的数据处理。这需要用户的背景知识,同时也应该根据实际的任务确定清理规则。
模型的确定:通过对数据的分析选择一个初始的模型。模型定义一般分为三个步骤:数据分隔,模型选择和参数选择。在我们的系统中,主要引入了关联规则模型和分类模型。
数据分析:对选中的模型进行详细定义,确定模型的类型及有关属性;通过对相关数据的计算,计算模型的有关参数,得到模型的各属性值;通过测试数据对得到的模型进行测试和评价;根据评价结果对模型进行优化。
输出结果生成:数据分析的结果一般都比较复杂,很难被人理解,将结果以文档或图表形式表现出来则易于被人接受。
在KDD过程中,最重要的是其中的数据挖掘部分,即模型和相关属性的确定。我们计划采用其中应用最广泛的两个模型,分别是关联规则和分类规则,以下作详细的介绍。
关联规则是形式如下的一种规则,“在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油=>牛奶 )。用于关联规则发现的主要对象是事务型数据库,其中最典型的应用则是售货数据,一个事务一般由如下几个部分组成:事务处理时间,一组顾客购买的物品,有时也有顾客标识号(如信用卡号)。如果对这些历史事务数据进行分析,则可对顾客的购买行为提供极有价值的信息。例如,可以帮助如何摆放货架上的商品(如把顾客经常同时买的商品放在一起),帮助如何规划市场(怎样相互搭配进货)。由此可见,从事务数据中发现关联规则,对于改进零售业等商业活动的决策非常重要。随着应用的推广,关联规则已经在许多领域发挥作用,成为最典型的数据挖掘应用。
分类也是数据挖掘中的一项非常重要的任务。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类的应用实例也很多,比较典型的由保险公司的保费设置。保险公司成功的一个关键因素是在设置具有竞争力保费和覆盖风险之间选择一种平衡。保险市场竞争激烈,设置过高的保费意味着失去市场,而保费过低又会影响公司的赢利。保费通常是通过对一些主要的因素(如驾驶员的年龄、车辆的类型等)进行多种分析和直觉判断来确定。由于投资组合的数量很大,分析方法通常是粗略的。采用分类进行数据挖掘以后,就可以利用计算机处理海量数据的能力来进行合理的分类,定出合理的保费,使保险公司得到最大收益。
六、结束语
【运营数据分析工具】推荐阅读:
游戏运营数据分析10-03
运营数据分析员求职简历01-25
资金运营情况分析10-26
运营系统分析报告01-20
电子商务网店运营分析12-16
运营商各种渠道分析12-28
苹果公司运营管理分析11-25
专业网站的信息运营模式分析12-10
二手房行业运营管理分析02-01
全业务运营商宽带接入网建设模式分析06-15