行业大数据建设方案(精选8篇)
党的十八大把生态文明建设放在了突出地位,纳入了“五位一体”总体布局,并首次把“美丽中国”作为未来生态文明建设的宏伟目标。2015年新修订的《环境保护法》将“推进生态文明建设、促进经济社会可持续发展”列入立法,以法律的形式将生态文明建设提升到了国家的战略高度。国务院出台的《水污染防治行动计划》“水十条”,对生态文明中水环境和水质保护方面的提出了重点管理要求。与此同时“互联网+”和“大数据”应用也上升为国家战略,国务院出台的《关于积极推进“互联网+”行动的指导意见》、《关于促进大数据发展的行动计划》和环保部发布的《生态环境大数据建设总体方案》,将“互联网+绿色生态”作为11个重点行动之一而提出,要求未来的环保工作必须紧密地与大数据建设结合起来,高度重视大数据在推进生态文明建设中的地位和作用。建设目标
以往信息化发展基本都是着眼于各个业务部门各自的业务需求,“管什么、想什么、干什么”,数据多头采集、相互矛盾的现象普遍,难以从环保工作全局层面支撑决策和管理。很多环境问题还处于现状不清、底数不明、原因不详的困局之中,环保部门在回应重大环境污染事件和解决人民关切的环境问题方面容易陷入被动。
通过以水环境综合大数据分析建设为契机,树立环保工作的大局观和整体观,将流域各方面相关环境管理数据整合起来,形成合力打造对内的统一的水质大数据智能分析平台,用全局性的战略眼光来谋划整个水域环境质量、影响流域污染源监控数据管理建设。3 系统建设内容
3.1 水环境大数据采集
大数据时代的环境信息化建设是以数据为核心,环境大数据管理与应用是在“十三五”期间最重要的发展方向,所以环保部门未来建设重点将紧紧围绕大数据进行。而要实现大数据的智能化应用,首先要解决的就是大数据收集获取问题,因此需要夯实应用基础,全面收集内外部数据资源,整合、共享、联动、开发数据,努力实现全数据采集管理。
3.2 水环境大数据管理
获取流域水质大数据分析需要的相关环境大数据资源后,建立大数据综合服务库,将采集的海量数据汇聚进入到库中,聚合原有分散在各个政务系统中的数据,并按照大数据管理标准及要求,进行集中管理与维护。
3.3 水环境大数据分析应用
1 国内外研究现状
目前, 各国对大数据产业十分重视, 纷纷开展大数据研究。其中, 美国作为大数据的发源地和创新引领者, 一直走在世界的最前端。2012-03-29, 美国颁布了《大数据研究和发展计划》, 标志着美国成为第一个将大数据上升到国家战略并制订行动计划的国家。2013-06, 日本公布了《面向2020年的ICT综合战略》, 全面阐述了在2013—2020年期间以发展开放公共数据和大数据为核心的新IT国家战略, 提出将日本建设成为具有世界最高水准的广泛运用信息产业技术的国家。加拿大计划以宽带建设和数据中心建设为支撑, 为大数据的发展提供前提条件。英国力推数据公开, 为商业、研究机构所用, 并支持大数据在医疗、农业、商业和学术研究等领域的发展。法国则以新兴企业、软件制造商、工程师、信息系统设计师等为目标, 以一系列投资计划来促进大数据技术的发展。此外, 德国、西班牙、俄罗斯、韩国、澳大利亚、新加坡和印度等国家也纷纷从宽带网络、智慧城市、基础设施、数据中心等方面布局大数据产业, 希望抢占大数据领域的技术制高点。
我国大数据布局开始于2012年, 包括“十二五国家政务信息化建设工程规划”、国家发改委和中科院“基础研究大数据服务平台应用示范”项目、广东启动大数据战略推动政府转型、北京探索政府公布大数据供社会开发和上海大数据研发三年行动计划等。此外, 在技术层面上, 国内大数据的关注重点为“信息集成”, 即利用一个集成的、可缩放的、可扩展和安全的信息基础设施来推动大数据的应用实践。在商业上, 各商业帝国也开始纷纷打造自己的大数据“战场”。比如, Google在海量数据存储方面提出了分布式计算的方式, 实现了海量数据的存储和管理。Yahoo将大量资源投入到Hadoop的研究中, 以推动Hadoop的发展。阿里巴巴以大量商业数据为基础进行统计、分析和挖掘, 形成规范的实体明细数据和指标数据, 对外提供数据服务, 并获得了较好的利润。其中, 具有代表性的为阿里巴巴的“数据魔方”。在图书馆行业, 美国哈佛大学图书馆已将“大数据”服务引入图书馆并付诸实践, 将图书馆大数据向读者公布, 其中包含1 200多万种资料, 有书目数据、地图、手稿、音/视频等, 并在美国数字公共图书馆中提供下载服务。
2 图书馆行业大数据建设的必要性
据2014年中国电子技术标准化研究院出版的《大数据标准化白皮书》显示, 目前我国的大数据应用主要集中在涉及社会管理和公共服务领域的政府部门, 其中, 关注度位列前三的分别为“智慧城市”“政务”和“公共服务”。但是, 随着数字图书馆建设的不断深入, “智慧图书馆”应运而生。一方面, 图书馆拥有的数字资源和数据呈爆炸式增长。以国家图书馆为例, 截至2014年年底, 数字资源总量达到1 024.45 TB, 数字资源长期保存量达到897.86 TB, 数字资源服务量达到734.52 TB。除此以外, 全馆几十个应用系统每天产生的结构化、非结构化数据也已达到GB级, 比如用户行为数据、资源数据和系统日志等, 为图书馆大数据建设提供了数据基础。另一方面, 为读者提供个性化服务也是图书馆的现代化需求之一。
3 图书馆大数据建设
本文以国家图书馆数字图书馆建设为背景, 在研究现代商业应用成功案例的基础上, 将部分先进理念引入图书馆行业, 分别从确定需求、建设数据、制订标准、搭建共享平台和构建大数据生态圈五个方面, 阐述图书馆大数据建设的内容, 为大数据技术在图书馆行业落地提供一定的参考。
3.1 确定需求和业务场景
在大数据环境下, 数据的有效价值率是很低的, 有用数据或核心数据占有的比例很小, 过多地收集数据会导致核心数据被埋没在大量的无用数据或死数据中。因此, 前期业务数据的收集并不是盲目的、无边界的, 而是需要我们明确自身的业务需求, 从业务驱动的角度选择最主要、最基础且需要解决或产生的业务场景, 并根据这些需求和场景选取所需要的数据, 收集与之相关的数据作为大数据的数据基础。
对于图书馆来说, 基本业务需求就是读者服务和资源建设两个方面。无论现代技术如何发展, 发展到何种程度, 这两个方面始终是图书馆业务的核心。只有牢牢抓住这两个核心, 才能抓住图书馆的核心业务。因此, 图书馆大数据的建设首先需要收集与读者服务和资源建设相关的数据。与之相关的数据包括读者属性数据、行为数据、资源属性和资源数据等。此外, 还需要提供对内和对外两种业务场景, 对内为图书馆行业的管理决策提供科学依据;对外主要为读者提供个性化、精细化服务, 以及为机构用户提供增值数据服务。
3.2 收集整理数据, 建设数据中心
在大数据环境下, 需要对收集到的海量数据进行有效的管理和筛选, 构建数据应用平台, 即建设数据中心。对于图书馆来说, 需要处理的数据不仅包括读者属性、读者行为、服务政策、资源属性、资源内容、资源管理方式等数据, 还包括图书馆业务规划, 资源采购情况, 服务政策, 国家文化走向, 当地的社会、交通管理和经济发展水平等其他外部数据。要想做好数据的收集整理和数据中心的建设, 以下几方面的工作不容忽视。
3.2.1 人才培养
随着大数据时代的到来, 图书馆传统的工作方式、管理办法和工作内容都会发生变化, 数据服务模式的比例将会增加, 原有图书馆的服务模式也将会由单一的图书服务模式逐步演变为图书服务和数据服务并存的模式。图书馆除了需要拥有一批精通传统业务的图书馆员外, 还需要培养一批掌握数据收集、数据分析、数据管理、数据服务和数据研究的人才, 将数据的收集整理、分析建模、存储管理、应用服务和研究创新贯穿起来, 形成一条完整的主线。这是图书馆大数据建设成败的关键所在。
3.2.2 数据估值
在大数据时代, 数据是具有价值的, 充当“生产原材料”的角色, 任何企业或组织在收集原材料时, 都会对其进行估值, 数据也不例外。从数据的角度来看, 数据估值就是从不同的角度、不同的维度思考数据的价值。只有明确了数据的价值, 才能做到数据的有效收集、整理和筛选, 否则收集到的数据中就会存在大量低价值或无价值的数据, 从而无法筛选出我们需要的核心数据。
数字图书馆发展到今天, 已经积累了不少结构化和非结构化数据, 以国家图书馆为代表, 数字资源总量已经达到1 024.45TB。此外, 数字图书馆工程所涉及到的几十个系统每天产生的数据增量也以GB来计。这些数据增量的数据输入标准、数据格式、数据类型、表现形式和存储结构千差万别、形式各异。在现有技术条件下, 完全收集、整理和处理这些数据是一件几乎不可能完成的事情, 因此, 必须要制订图书馆数据价值评估标准, 对数据价值进行量化评判和评估, 按照数据的重要性排序和分类, 并建立数据价值信息库。这样, 不仅有利于收集核心数据, 还有利于了解数据价值分布情况, 便于数据的后续收集、保存和使用。
3.2.3 数据分类
在面对大量碎片化数据时, 如果没有对收集的数据进行科学、有效的分类、存放和管理, 就会出现放进去时很轻松, 但等到要找出来时就会浪费大量时间, 甚至可能找不到的情况。因此, 在收集数据时, 需要对收集的数据进行合理分类。笔者认为, 可以按照存储层次、业务归属、隐私安全和数据价值等进行划分。
3.2.3. 1 按照存储层次划分
从数据的存储角度出发, 数据可以分为基础数据、中间数据和应用数据三种。其中, 基础数据即为原始数据, 仅存储收集到的最基础、最原始的数据, 不作任何加工和统计汇总, 作为其他数据的基础;中间数据是由基础数据发展而来, 在基础数据的基础上进行加工, 包括统计分析、分类汇总等, 形成数据仓库;应用数据则是针对具体业务问题, 经过一系列的数据分析和数据挖掘得来的数据。
3.2.3. 2 按照业务归属划分
按照业务归属划分时, 需按照不同的业务主体分门别类地归纳。对于图书馆行业来说, 业务数据可以分为读者数据、资源数据、借阅类数据、行为数据和资源管理数据等。
3.2.3. 3 按照隐私安全划分
按照隐私安全划分, 图书馆数据可以分为隐私数据和非隐私数据。其中, 隐私数据包括个人级别的隐私数据、资源级别的隐私数据和行为级别的隐私数据。个人级别的隐私数据是指涉及到读者个人隐私信息的数据, 包括读者个人的姓名、住址、工作单位、身份证号、用户名和密码等;资源级别的隐私数据是指资源的保密性元数据, 包括图书、音像资源的保密性要求, 可公开级别等信息;行为级别的隐私数据是指个人在图书馆借阅行为中产生的不宜对大众公开、或公开后可能会对个人造成不良影响的数据, 包括个人的借阅记录、逾期记录等数据。
3.2.3. 4 按照数据价值划分
数据是有价的, 且每种数据的价值不同。人们在使用数据时, 总希望优先使用高价值数据, 忽略或放弃无价值数据, 因此, 在数据估值的基础上, 需对数据价值分类。其中, 按照表现形式来分, 可以分为显性价值和隐性价值;按照作用方式来分, 可以分为直接价值和间接价值;按照时间范围来分, 可以分为短期价值和长期价值;按照空间范围来分, 可以分为局部价值和整体价值。
3.2.4 数据培养
对数据进行培养即为阿里巴巴大数据中所提到的“养数据”战略, 也就是改变过去传统的对已有数据单纯的、“被动式”的收集行为, 开展从无到有的“生产”或“寻找”数据的“主动式”行为, 这是基于业务的深入理解和更高层次决策的需要, 也是数据收集的更高层次。数据的收集不应该仅仅考虑有什么数据就收集什么数据, 而是要决定收集哪些数据, 从解决问题的角度出发, 在实际研究中了解需要哪些数据, 缺少哪些数据, 哪些数据的精度还不符合我们的要求, 从而主动地去收集、补充和生产这些数据, 实现从数据化运营向运营数据的转变。
3.3 制订图书馆行业大数据建设标准
目前, 大数据技术相关标准的制订还处于起步阶段。就图书馆行业来说, 需要尽快制订图书馆行业大数据标准体系, 分别从基础框架、数据格式、数据价值、工作流程和使用方式等方面制订相关行业标准, 并作为行业引领规范, 这对图书馆行业内部数据交换和共享具有极大的促进作用。
3.4 搭建大数据共享平台
我国研究大数据的著名学者、电子科技大学的周涛教授曾有一个重要观点, “进行据收集无外乎两个方面, 一方面是自己用——用其他数据来提高自己手上数据的精准度, 为我所用;另一方面就是给别人用——把自己的数据贡献给他人使用, 提高他人的数据精准度。”
图书馆行业不同于其他行业, 各级图书馆、各地图书馆以合作为主, 资源共享、联盟合作是各图书馆关系的主线, 文献传递、馆际互借也早已深入人心。在大数据时代, 建设图书馆行业大数据共享平台, 就是以建立大数据共建共享机制为基础, 采用直接提供数据集和开放数据接口两种方式, 联合各级图书馆、各地图书馆共同参与大数据共享平台建设。这样, 不仅能够促进图书馆行业大数据的合作共建、成果共享, 还能够加快大数据产业在图书馆行业的价值转化。
3.5 构建图书馆大数据生态圈
所谓“生态圈”, 其实是借助了生态学的概念。图书馆大数据生态圈是指在图书馆行业环境下所有与大数据产业相关的个体总和, 包括图书馆的整个行业环境以及在此环境下的大数据涉及的各个层面, 比如数据源层、数据存储层、数据分析层、应用层、支撑保障体系等。在整个生态系统中, 图书馆的优势和核心为数据源层, 关键为数据分析层。因此, 在构建图书馆大数据生态圈时, 我们需要在把握优势层和核心层的基础上, 开放其他层, 并走联合合作的道路, 将各个层面上的行业、企业和用户吸纳并连接起来, 共同打造图书馆系生态圈。
4 总结
大数据已经成为信息产业界的研究热点, 是未来新技术产业发展的趋势之一。图书馆行业的发展, 尤其是随着数字图书馆的不断深入, 大数据建设是必不可少的。但是, 图书馆行业大数据建设也绝非易事, 它需要我们从自身业务出发, 整体规划、合理布局, 从确定需求、建设数据、制订标准、搭建共享平台和构建大数据生态圈几方面入手。只有这样, 才能走出一条传统图书馆与现代技术相结合的道路, 才能将大数据技术真正长久地应用于图书馆行业, 为图书馆的现代化建设服务。
摘要:主要研究了图书馆行业大数据建设的内容。根据国内外大数据商业应用实例, 从需求、数据、标准、共享和环境建设等方面阐述了大数据技术是如何在图书馆行业落地的, 并最终确立了图书馆大数据建设的内容, 包括确定需求和业务场景、建设数据中心、制订行业标准、搭建共享平台、构建图书馆大数据生态圈五方面。
关键词:图书馆,大数据,共享平台,大数据生态圈
参考文献
[1]李纪舟, 苏晓娟, 叶蕾.大数据技术及其国外发展情况[J].电信技术研究, 2013 (2) .
[2]宋荣华, 李宗富.部分国家大数据发展对我国的启示[J].科技情报开发与经济, 2014, 24 (22) .
[3]邹捷.大数据技术发展研究综述[J].科技风, 2014, 7 (14) .
[4]陈新明.淘宝网数据平台数据仓库建设[D].大连:大连理工大学, 2013.
[5]程莲娟.美国推进大数据的应用实践及其有益借鉴——基于图书馆视角的分析[J].情报资料工作, 2013 (5) .
[6]张新娜.大数据时代智慧图书馆建设路径分析[J].图书馆研究, 2014 (1) .
当下,大数据已全面嵌入产业、商业中,释放出巨大的革新动力。随着移动互联网技术的创新性发展,大数据金融也将进一步颠覆传统行业,构建成本更低、效率更高的行业新格局。
普惠金融提速
“从事金融行业多年,始终在关注新技术,但大多都是隔靴搔痒。只有大数据让人眼前一亮。”正德人寿保险公司CIO裴兆旭说,大数据金融就是那只能伸进靴子里的抓手。
国内首家互联网保险公司——众安保险CEO陈劲也公开表示,自己面临的最大考验便是跳出传统金融思维,以技术创新和开拓性眼光规划未来。众安的互联网生态、直达用户以及开发空白领域这三大定位,抓手均是大数据技术。
马云要打假,靠的是大数据,通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。而阿里小贷的运营乃至开设民营银行,更需要大数据的支撑。
阿里人常说,淘宝上每一笔交易的背后都有无数技术细节和信息抓取,有8000多个工程师在组织和修正模型——消费者的消费偏好、上网时长、登陆IP、发退货、信用评价、维权记录和社交媒体数据等16个维度、上千个数据变量被提取和交叉分析。
“住址、手机、证件号等基础搜集相对简单,阿里更看重个人习惯的微妙变化,比如输入密码时习惯停顿,或者某个字母常用左手。”支付宝一位技术部门主管称,互联网银行旨在精准定位,比贷款者更了解贷款者。
同样,在阿里小微金融服务集团副总裁俞胜法看来,大数据就意味着无极限。他认为,所有看似毫无关联的数据皆可用作信用评级。之于个人,是对其细微行为的全画像;之于企业,是对其现金流、贸易流、订单流等的全维度描述。
之于个人,阿里等大数据公司会从微博、社交平台、同学录等获取大事记、信用卡限额、诉讼信息、朋友圈、中小学教育甚至既往病史等等,还可能获取婚姻状况、投资偏好、配偶、担保人、房贷车贷、个人和家庭年收入等信息。
一些大数据公司还会利用个人浏览器中的痕迹,发现浏览足迹和生活习惯,描绘出一幅包括社会关系、网络关系和企业关系的全图谱。
“不同于传统征信关注还款、负债、抵押等资金流动信息,大数据对个人行为的刻画无孔不入。”俞胜法说,这一切几乎完全自动化,人工部分仅限于事后的模型完善。
这样的原理也被运用在对企业的考察中。
“我们给多家银行提供服务,统计对象已达1亿规模,既包括资产负债表和水表、电表、报关表等传统信息,也包括企业订单、库存、物流和联保互保等数百个变量。”金电联行(北京)信息技术有限公司董事长范晓忻介绍,数据一有异动就会生成风险提示,比如某笔订单收货期被拖延,系统会立即关注其联保、互保企业。“风控方式从传统金融的事后降低不良率,变为了事前提高风险抑制率”。
截至2014年上半年,淘宝已拥有900多万店铺,针对其提供信贷的阿里小贷从2010年起,业务规模每年数倍翻番。其微贷事业部累积客户数已达60万人,贷款余额150亿元,且全年预计超过250亿元,累计放款超过1900亿元。
同样,微众银行的贷款业务原理趋同,数据偏重社交信息,但最终殊途同归。
近年来,国务院多次针对融资难、融资贵问题发文,将其作为新常态下金融改革的重中之重。一部分无法在传统金融中找到位置的“小微”们,在大数据上终于尝到了普惠金融的甜头。
征信监管新局
“所有领域中,最早使用大数据的是征信行业。”信而富小贷公司创始人王征宇表示。消费信贷、信用卡等需要大量数据积累,庞大的受众又需要大型运算功能和存储体系,且资金流动风险亦亟须深度把控,使得金融征信业理所当然地成为享用大数据技术红利的首个行业。
例如,针对额度10万元以下的信用卡客户,银行会盯住三个问题:还款能力、还款意愿和收入稳定性,尽管央行征信系统能囊括90%,但坏账率却随着经济下行而不断上升。解决之道,便是用社交、电商等大数据来深入分析剩下的10%,丰满用户“全画像”。
目前,征信数据来源于多个方面:
一是电商,即阿里等的风控数据挖掘系统;二是银行信用卡类,其申请年份、审批、授信额度、还款情况等均为信用参考数据;三是社交网站,以美国LendingClub为例,搭建借贷双方平台,将借款人分为若干信用等级;四是小额贷款类,例如信贷额度、违约记录等,但目前单一企业数据地域性强、数量级低,亟须建立业内共享模式;五是第三方支付,其资金入口和结算通道的角色,使其用户支付方向、月支付额、消费品牌等均可用作评级参考;六是生活服务类,例如水、电、煤气、物业费等传统金融中的基础信息。
要致富、先修路,这是常识。
1月5日,央行印发《关于做好个人征信业务准备工作的通知》,要求阿里旗下的芝麻信用管理有限公司、腾讯征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司等8家机构做好个人征信业务的准备工作。这一举动,被视为央行架构个人征信“高速公路”的开始。
央行人士称,大数据征信既防范风险,又能提高银行净收益,且随着信贷行业和消费行业的发展提速,将催生出征信业的巨大需求。《中国征信业发展报告(2003—2013)》显示,目前我国拥有约150家征信机构,总规模仅20亿元左右,与美国和日本分别近800亿元和40亿元的规模相去甚远。以现有规模和征信产品价格计算,我国仅个人征信的市场空间就将达1000亿元,未来将以50倍的力量飙涨。
央行旗下征信机构上海资信有限公司的数据也显示,该公司网络金融征信系统(NFCS)共接入203家P2P平台,日均查询量达2000次。而北京安融惠众征信有限公司的小额信贷行业信用信息共享服务平台,上线一年半内,会员机构达405家,会员间信用信息共享查询量日均约9000次,有信用交易记录的个人更是突破了100万。
监管层真正的顾虑在于,征信市场一旦开放,寻租空间可能难以估量。但大数据时代已大势所趋,在顶层设计上逆势蹒跚不如顺势而为,摸索出一条正道。
当然,不能任由各种民间征信机构扒掉民众的“衣服”,如何对隐私保护拿捏得当,还需司法部门尽快跟上。
摘 要 在大数据时代背景下,大数据成为推进教育创新发展的重要力量。现阶段,传统留学行业面临信用缺失、供求信息不匹配等问题,而将留学咨询搭建在大数据的平台上,依靠大数据确定留学咨询方案,那么资讯信息的深度更是今非昔比。本文通过对留学市场的调研,为传统留学行业在“互联网+”时代下的变革提出相应的建议。
关键词 大数据 留学 市场 中介
一、调研背景
(一)出国留学进入常态化
根据教育部涉外监管信息网的数据统计,2016年我国出国留学人员总数为54.45万人,其中国家公派3万人,单位公派1.63万人,自费留学49.82万人。与2015年相比,出国留学人数增长了3.97%,从数据的大幅增长可以看出,出国留学越来越热。同时,全国高考报名人数呈现出下降的趋势。而中国出国留学总人数从2007年开始呈现“爆发式”增长态势,留学低龄化的趋势愈加明显,硕士留学在中国出国留学总人数中所占的比例明显下降,而本科留学的人数迅速增加。优秀生源、平民家庭快速加入留学大军,留学进入常态化。
(二)优秀回国人才就业窘境
教育部数据显示2015年中国输出留学生52.37万人,各类留学回国人员总数为40.91万人。其中很多人从选择出国到回国就业,却都是父母的安排,留学费用高,可是用人单位对回国人才要求也越来越高,明确设定学制等门槛,起薪较低。随着留学生越来越多地回国就业,不少“海归”成了“海待”。对用人单位而言,留学人员不再像以前一样稀缺。
(三)大数据背景下留学行业的目前发展
大数据是推进教育创新发展的科学力量,留学教育大数据是整个留学教育活动中所产生的以及根据留学教育需要采集到的一切用于留学教育发展并可创造巨大潜在价值的数据集合。与传统留学教育数据相比,留学教育大数据的采集具有更强的实时性、连贯性、全面性和自然性,分析处理更加复杂和多样,应用更加多元、深入。而现阶段市面上的留学中介机构同质化严重,主要通过信息垄断来盈利,缺少真正有附加价值的服务。
二、调研目的
随着出国留学人数的剧增,以及留学市场竞争愈演愈烈,留学中介应做出相应的业务调整。此次调研活动是为了更深入的了解传统留学行业的发展及学生的留学意愿,从而为留学机构在大数据背景下的新发展提出合理的建议。
三、调查区域与对象
此次调研区域为保定市,调研对象分分别为保定市各大高校在校大学生与保定市留学中介机构。
第一,保定市各大高校学生:河北大学、华北电力大学、河北农业大学、河北金融学院、保定学院学生;
第二,保定市留学中介机构:保定市环球雅思、保定河大国际教育服务中心、保定农大出国留学服务有限公司、河北金石国际人才服务有限公司。
四、保定市留学市场和留学中介机构现状及成因分析
(一)保定市留学市场现状分析
现状一:潜在留?W客户相对集中。
在所调查的样本中,一直有出国留学意愿的学生占总体的18%,无出国留学意愿的学生占总体的82%,但当提出留学中介可以提供一些便利条件及优惠政策后,39%的学生愿意重新考虑是否留学,表明在有留学意愿的客户中,有一半为潜在客户。而男女生在出国留学意愿上存在显著性差异,女生潜在留学意愿更为强烈。
现状二:影响留学的主要因素。
在无意愿留学的学生中,最多的考虑因素是经济因素,80%接受的出国留学费用为15万元及以下。经济因素是无意愿留学者、重新考虑出国意愿者的主要因素。在明确留学意愿者中,除了考虑经济因素外,最担心的是能否得到国外大学优质大学的录取通知书。而重新考虑留学者更看重留学中介提供的优惠政策。
现状三:学生的留学意向
选择出国去英国的人数最多,选择留学美国、澳大利亚的人数次之,可见英、美留学受学生青睐。对于出国留学的专业,45%的人倾向于选择商科,出国想主修的专业与出国留学意愿是显著相关的。
(二)留学中介机构现状分析
现状一:学校不能满足,留学机构具备优势。
有出国留学意愿的学生普遍认为目前学校所提供的途径不能满足自己的需求。而留学中介所提供的条件在很大程度上可以解决学生的困扰,并且85.60%的学生在愿意选择对留学该机构进行深入的了解。
现状二:保定市现有留学中介机构市场相对成熟。
保定市留学中介机构在保定市具有较高的知名度和认可度,在保定市现有留学市场中占比较高现有市场占比高,且与各大高校开展合作。
五、保定市留学中介机构综合情况分析
(一)保定市留学中介机构基本情况
1.雅思、托福培训方面服务。根据调查访谈结果显示,通过简单的测试,估计客户的英语水平,给予课程的建议与安排,主要有大班统一教学,以及收费较高的一对一单独辅导。
2.出国方面服务。首先工作人员会向客户简单询问客户的基本信息,包含姓名、年龄、学校、专业以及在校成绩,然后询问客户留学倾向的国家、学校排名、专业,最后向客户提出意见和建议。
3.收费问题。在与客户双方签订合同后,客户需花费的所有费用应当即全部付清,费用一般在3至5万。如果最终出国失败,会扣除一定比例的费用,其余费用退还。
4.市场占比。根据我团队的对保定市现有留学机构的调查研究,发现他们的市场占比分别为环球雅思29%,保定河大国际教育服务中心33%,保定农大出国留学服务有限公司23%,河北金石国际人才服务有限公司10%。
(二)保定市留学中介机构优势
目前保定市留学中介机构具备的优势有以下几个方面:
1.现有市场占比高。我团队调查的几家中介公司在保定市都已经开办多年,在保定市具有较高的知名度和认可度,在保定市现有留学市场中占比较高;
2.与各大高校开展合作。例如,保定河大国际教育服务中心与河北大学合作较多,保定农大出国留学服务有限公司与河北农业大学合作较多,河北金石国际人才服务有限公司与河北金融学院开展深度合作。
(三)保定市留学中介机构存在的问题
在所调查的保定市留学中介机构中,存在很多相同的问题。
问题一:推荐的学校质量普遍较低。
根据我团队的调查发现,目前保定留学中介机构所提供的大学质量参差不齐。其目的只是通过海投,最终使客户成功出国留学。而排名靠前的学校一方面留学中介想要与其联系的难度较大,同时对报考学生的要求也更高,例如美国排名前50的顶尖大学,保定市的大学生报考难度较大。这些名校会综合考量学生的教育背景,在校情况,雅思成绩。因此,选择的学校排名越低,?t成功率越大;
问题二:推荐的学校与专业不合适。
留学中介机构往往没有根据学生的自身特点给与学生最优、最有利的选择。根据学生的自身情况、特点以及未来的就业方向,对学生进行一个专业的评估,选出最适合他们的专业以及学校,这样的领域依然空白;
问题三:信用缺失情况普遍。
就目前的这些企业和机构来说,普遍存在信用缺失、对客户不负责任的情况。一旦客户成功出国,则该机构的服务终止。并且在与客户的沟通过程中,他们给出的方案中提供的学校、专业最终一般都是通过海投的方式决定,在学生真正出国留学后,会发现其实并不能满足他的真正需求。
六、建议
通过本次调研,对保定市大学生出国留学市场的现状和发展有了一定的了解。结合调研数据的分析结果,提出以下几条建议:
(一)挖掘潜在客户,普及留学相关知识
由于在经济、家庭、个人、语言文化方面存在各式各样的问题,很多学生都表示无出国意愿,在这些人群中,有半数认为如果该机构可以提供一些便利条件及优惠政策、优质的海外大学,则愿意重新考虑是否留学。这些潜在客户的留学市场相当大,而要让其转变成我们的真实客户,就需要留学机构将女生、大一学生作为宣传的主要对象及目标客户,定期开展留学知识普及活动,如赞助社团举行“留学知识知多少”的知识竞赛活动、开展留学知识讲座,让同学们了解到留学并没有想象中的那么难。
(二)创建微信社群,利用社群营销
通过社群的方式聚拢保定市具有明确出国留学意愿或者潜在意愿的客户群体,包括在校大学生,高中生以及学生家长。中介机构借助社群的营销优势进行营销及品牌推广,通过社群进行公司服务介绍,营造公司与客户、客户与客户之间良好的交流沟通氛围,以此来树立品牌形象,挖掘客户。
(三)利用大数据建立综合评估系统
留学机构可以利用大数据为前来咨询的客户提供最详细的出国资料,同时为客户建立一套综合评估系统,该系统包括学业和择业评估两大方面,包含客户的基本信息、性格、兴趣爱好、家庭状况、在校成绩、英语水平等,最后结合以上所有信息对客户进行综合评测,同时考虑客户的出国选择,包括国家、学校排名、专业、出国时间等,以及综合客户未来的就业方向、居住国家与城市,可为客户匹配到最适合的出国方案,包括留学国家、学校、专业、出国机构等,为每一个客户提供私人订制的优质服务。
(四)构建出国留学客户资源平台
留学机构可以与出国中介机构合作,在客户选择了出国方案后,与该方案中的出国机构联系,并进行全程监督,确保客户正当权益。留学机构在此过程中不直接收取客户任何费用,在客户与出国机构签订合同并成功出国后,抽取该机构纯利润的5%至10%。
(五)建立人才积累库
该信息库分为前中后期,前期为客户最开始的综合评估信息,中期为客户在留学期间的在校成绩、获奖情况、社会活动与实习情况等全部信息,后期为正式工作经历。而留学机构可以结合以上所有信息对客户进行能力值评定。
(六)构建回国优秀人才资源平台
留学机构可以与国内众多企业合作,公司包括各类大中小微型企业。在此平台,既有众多优秀留学人才信息,同时也有所有与留学机构合作的企业招聘信息,使双方信息得以充分互通,优秀的留学回国人才可以寻找到心仪的企业,同时众多企业也可以不再依靠收取昂贵费用的猎头公司,直接搜索到海量接受国外优秀教育的杰出人才。在平台建设过程中,引进信息真实度认证系统,确保平台信息真实有效,以及引进个人信息保密系统,客户私人信息确保安全不泄露。
此平台人才积累库建立,全程不对客户收费,且客户能搜寻到所有的企业招聘信息。但平台会对企业收取数额不等金额的年费,使企业成为平台企业会员。一些高能力值的优秀人才资源对企业会员等级有要求,公司年费越高,则能获取的客户评定能力值越高。且在企业正式与客户签约后,留学机构将收取一定费用。
(作者单位为河北金融学院)
[作者简介:谢欣欣(1995―),2014级学生,市场营销专业。肖念念(1995―),女,2014级学生,市场营销专业。成城(1996―),女,2014级学生,市场营销专业。杨建辉(1997―),男,2015级学生,市场营销专业。基金项目:本文系2016河北金融学院校级大学生创新创业训练计划项目,项目编号:201611420039。]
参考文献
拉斯维加斯的Switch通信公司拟投资10亿美元建立一个27.9万平方米规模的数据中心“SuperNap”。在Switch计划中,整个工程将耗时5到时间完成,但是数据中心的第一期将在第二个季度完成。
英国近百个数据中心获减税 为了提高能源的利用效率,英国政府已经开始对近百个数据中心进行几乎全免的税务减免。这些运行商的参与者包括:Digital Realty、 Equinix、TelecityGroup和IBM等。 这份名为气候变化协议的豁免主要针对的是密集型产业,让政府来帮助企业提高竞争力和避免被外国收购。目前如果后者能够承诺改进能源的使用效率,该行业的征税将削减90%。
Telx公司完成两个数据中心的扩建项目
美国云托管提供商Telx公司已完成曼哈顿和纽约两个数据中心的扩建项目,这也是这两个数据中心历史性的扩张。Telx公司创始人亨特纽比最近推出了一个数据中心合并计划,目前正在计划与Amerimar公司进行合作。Amerimar公司目前拥有四个数据中心,其中一个在纽约,公司也正在寻求在休斯敦新建数据中心。
IBM宣布在全球新增12个云端数据中心
据国外媒体报道,近日,IBM宣布将在全球新增12个云端数据中心,以此支持越来越多的想要将信息数据移到云端的企业用户。据悉,IBM在全球范文内的云端数据中心,若加上此次计划新增的12个,总数将达到40个。
随着我国经济社会的发展,对行业信息化建设不断提出新要求,对观测手段和方法以及水行业的监测技术的研发和应用提出了越来越高的要求;现代电子技术、传感技术、通信技术和计算机技术的迅速发展,也促进了水行业监测技术自动化的发展。在此方面易维就走在了水行业信息建设的前端。
一、水行业监测自动化技术的应用
1、水行业监测的范围与内容:
水行业的监测是传感器技术与采集、存储、传输、处理技术的集成。
监测范围:江、河、湖泊、水库、渠道和地下水等。
监测内容:水位、流量、流速、压力和水质等。
2、水位的采集和传输
用于自动化监测的水位传感器主要有浮子式水位计、压力式水位计、电子水尺和超声波水位计等。这些传感器可以直接接到PLC上,自动监测水位参数。地下水位的监测与地表水相同。目前,省水文监测站与各采集点之间的数据通信主要采用手工抄录或PSTN电话线传输。采用电话线传输数据时,由于每次拨号都需要等待,速度慢,而且费用也较高。同时,由于各监控点分布范围广、数量多、距离远,个别点还地处偏僻,因此需申请很多电话线,而且有些监控点有线线路难以到达。
GPRS具有速度快、使用费用低的特点,其传输速度可达171.2kb/s。与有线通讯方式相比,采用GPRS无线通信方式则显得非常灵活,它具有组网灵活、扩展容易、运行费用低投,维护简单、性价比高等优点因此,目前正考虑采用GPRS无线传输方式解决污染源监测数据的实时传输问题。
二、解决方案介绍:
(一)系统结构
(二)GPRS无线网络与中心软件的连方式:
A、公网方案:
中心用一个服务器组作为中心接收,中心采用ADSL等INTELNET公网连接,采用公网固定IP或者公网动态IP+DNS解析服务。此种方案先向INTERNET运营商申请ADSL等宽带业务。
1)中心公网固定IP:监控点直接向中心固定IP发起连接。运行可靠稳定,推荐此种方案。(当然固定IP费用比较贵,视客户财力决定)
2)中心公网动态IP+DNS 解析服务:大部分IP都是动态的,而且费用相对便宜。客户先与DNS 服务商联系开通动态域名,动态域名解析软件网址如下:(可以先申请免费的二级域名)88IP名解析http:// 监控点先采用域名寻址方式连接DNS 服务器,再由DNS 服务器找到中心公网动态IP,建立连接。此种方式可以大大节约公网固定IP的费用,但稳定性受制于DNS服务器的稳定,所以要寻找可靠的DNS服务商。
如上图所示水文远程测控调度系统由调度中心、无线GPRS网络、远程终端单元(GPRS无线传输设备,PLC)几个部分组成:
1.远程终端单元
远程终端单元分散的分布在远程各个遥测点上,主要由GPRS模块、电源、天线、PLC及各种水行业传感器等几部分组成。PLC与现场仪表(传感器)相连,对现场仪表(传感器)的开关量、模拟量信号进行数据采集、处理、存储并通过GPRS模块向调度中心传送数据,接收并执行调度中心的命令。
PLC:根据客户要求选择使用品牌,如LG、西门子、三菱、欧姆龙等。
无线传输设备: LQ1200 GPRS DTU透明无线数据传输终端,通过RS232/RS485/TTL与水行业设备采集点的各个PLC连接,通过 GPRS网络,把数据传到调度中心。
2.调度中心
调度中心计算机处理系统是一个开放式实时应用系统,实现全部的数据处理工作。中心的功能有:数据收发管理、站点管理、水行业数据管理和系统管理。
数据遥测功能:定时巡测、手动巡测、随机抽测、分组召测。
遥控功能:控制RTU 开关量输出点的开、关状态、遥信开关状态。
参数状态管理功能:设置修改各测量数据上、下限值,通讯参数。
在线组态功能:新增数据采集点等参数通过组态定义即可完成。
数据库管理功能:对测得的数据建库,对数据进行处理,查询历史数据,报表打印。
数据显示功能: 能显示测量的各种数据、遥信开关状态、各种系统图形等,具有图形功能,模拟显示管网图、水厂工艺流程图等。
抢修修理、停水、管网冲洗等数据录入及统计。
数据共享功能:提供一个WEB站点,该WEB站点使公司宽带内部网的任意一台工作站只通过WEB浏览器就可以登陆查看所有监控点的实时数据和存储的任何时间段的历史数据。WEB 站点通过用户身份认证授权方式控制该用户可访问那些监控点的实时监控数据和存储的任何时间段的历史数据。调度中心系统管理员能增加、删除可访问用户,并对用户进行不同权限的授权。该WEB站点应能通过超链接方式联入公司统一平台。
为此, 曙光以坚实的大数据技术积累为基础, 推出了针对广电行业的大数据解决方案, 可以帮助广电行业高效分析海量传播数据, 深入发掘用户需求, 在大数据时代获得更强大的前进动力。
1 从“大众覆盖”到“大众互动”广电行业的融合之道
借助网络化、全球化、全民化、移动化、社会化发展的新媒体, 广电行业再凭借传统覆盖受众数量上的优势, , 可以成为强势的信息传播载体。而大数据恰恰可以绑定内容与价值锁链中的核心地位, 大兴融合之道, 助力广电行业演绎出从“大众覆盖”到“大众互动”的精彩。
从美剧《纸牌屋》的实践证明, 新媒体在大数据信息高速流转的平台上, 作为电视内容生产的服务对象, 受众在接收传播内容中将产生大量的互动内容, 如节目观感、评论, 甚至自制的内容文本等, 这些信息迅速聚集并传到电视播出平台, 这不仅能丰富内容产品的互动性, 提升受众积极性, 更是对传统电视内容生产方法的增益。但广电行业又有别于新媒体中的大数据技术应用模式, 在推送中需要更精准地分析出这个群体的结构需求, 而不再像以往的收视率调查采用样本分析的方法。
海量、增值、全息可见、融合复用是新媒体时代大数据的四大特征, 但并不是所有的数据都同样有价值, 只有能带来增值的数据才是有意义的。在新媒体时代, 最显著的特点就是数据总量正在发生巨大变化, 但广电行业对于新媒体海量数据的分析处理、筛选、过滤信息的能力并没有得到提高。用户的信息饥渴感在与日俱增, 希望利用碎片化的时间获得有价值的信息。同时用户对非关联信息的容忍度却在与日俱减, 用户变得越来越不耐烦, 如果推给他不相关的广告信息, 用户体验会迅速下降。
另外, 从信息消费的角度看, 各种媒体平台都是信息消费的载体与中介, 而手机、PC、PAD具有明显的个人消费平台特征, 因此, 不管是微博、微信等, 都是个人新媒体平台的应用, 而作为大屏幕的电视, 通常作为群体的信息消费平台而存在。从个人向群体 (如家庭) 的变化, 不仅是信息消费者个数的改变, 消费模式与特征也发生了变化。在电视大屏前, 用户行为不再是简单的碎片化与去中心化, 而出现了一种群体性的选择偏移, 即大屏幕前的用户行为成有选择的积聚趋势, 但积聚中又有个性化。那么, 要抓住个性化的趋势和群体需求特征的结合点, 就必须依赖于大数据技术。
2 以高性能计算为根基聚焦广电行业海量数据特点
当下, 广电产品的形态在移动、社会化、个性化的阅读习惯下亟待创新, 同时需要具备对海量素材多维度的应用能力。而在大数据时代来临的大环境下, 我国的广播电视行业正在进行自适应调整, 它既是信息数据的生产者、拥有者, 同时也需要逐渐成为信息数据的使用者、受益者。
为此, 曙光凭借多年在高端计算领域的坚实技术积累, 在全国进行了大数据时代的战略布局。在“大数据元年” (2013年) 之前, 曙光公司就已经洞察大数据时代的到来, 早在2006年, 就以其深厚的技术积累和卓越的分布式计算经验, 开发了一款通用的海量数据处理平台。该平台能够提供对结构化及非结构化海量数据的存储组织和查询处理, 能够满足用户对海量数据的过滤性查询、统计分析类查询和关联分析的处理需求, 可以帮助政府与企业构建海量的数据流处理系统。
近年来, 曙光以创新的理念为基础, 在原有的海量数据处理平台中融合了最新的Hadoop分布式框架, 使其能更高效地处理结构化和非结构化数据。曙光推出的大数据一体化解决方案更是采用了创新数据处理技术和开放式架构, 可以实现海量数据的快速加载、查询和分析, 可以实现对多种类型数据的统一存储和处理, 可以为深度挖掘数据价值提供一站式服务, 可以为大数据应用构建真正高效、智慧、易用的整体解决方案。在应用体验上, 它能够帮助客户快速、智能地分析海量数据, 以提高洞察力并做出明智决策, 并为客户从大量数据中挖掘出体现价值的“金矿”。目前, 曙光大数据解决方案已经率先在金融、电信、教育、国防等领域实现了大数据的成功应用, 并为广电行业量身打造出了特有的大数据应用方案。
3 大数据精准评估“关系”七大模块赢在全媒体时代
大数据时代, 电视收视和网络电视、微博热度越来越呈现几乎相关的对应关系。因此, 结合电视、网络、新媒体多元数据样本的全媒体收视评估体系, 将有可能成为一种趋势。针对大数据在广电行业的潜在应用, 曙光凭借其在大数据应用领域的经验推出了广电行业的大数据解决方案。
该方案 (采用曙光XData-hadoop优化版软件) 基本可以分为以下7个大模块:数据采集模块、数据计算模块、数据存储模块、应用分析展现模块、系统监控管理模块、大数据仓库和主干互连模块, 如图1所示。
(1) HDFS为主的存储模块和Map Reduce为主的计算模块只采用直通的方法, 其它模块的数据和管理通信都通过主干互联平台。
(2) 数据源采集模块主要包含三种数据类型:样本机顶盒数据、VOD视频采集数据, 以及机顶盒操作日志数据采集和分析, 通过采集策略来控制采集。
(3) 数据计算模块主要负责所有数据的ETL、清晰、封装及其装载的服务, 同时分析任务的执行也在此模块中进行。
(4) 应用分析展示模块主要负责B/S数据分析结果展示, 和相关数据应用的部署。
(5) 系统监控管理模块负责该平台软硬件组件的监控管理工作。
该解决方案基于服务器集群搭建大数据平台, 可以改善现有非结构化数据离线服务水平;突破在传统技术手段下无法解决的海量数据存储弹性扩展能力差、备份恢复难度大的问题;利用结构化与非结构化历史数据资源集中优势, 为业务提供更集成、更长时间跨度、更多维度的数据查询服务, 提升相关业务的查询访问效率, 改善客户体验;使离线数据真正上线并得以充分利用, 提高大量半结构化非结构化数据利用率, 为业务发展提供基础。
随着近年来业务的发展, 产生了结构化数据与非结构化数据整合存储与联动查询的新需求。作为广电行业中的用户, 可以利用曙光广电大数据解决方案, 搭建一个性能优越的大数据平台。该平台不仅可以对海量数据进行整理、分析, 并对受众的需求进行精确预测;还可以对数据资源进行整合以提供统一的数据访问入口, 为应用提供服务。现在, 该解决方案已经在众多重要广电单位中得到了深入应用, 实现了对数据资产的优化与合理利用, 增强了目标广电单位在大数据时代的竞争力。
4 广电行业呈现“两大”应用趋势大数据成为营销利器
虽然大数据受到了广电单位的普遍重视, 但是由于发展时间较短、大数据生态链不成熟、主观认识存在缺位等原因, 部分广电用户在大数据应用环境上更侧重在信息系统建设。而通用的大数据应用模式, 还没有深入考虑到广电行业的特殊性, 在传播环境分析、受众需求预测方面的变革性力量还没有真正体现出来。在曙光看来, 2014年广电行业大数据的应用趋势可以分为以下两类:
(1) 收视率预测和节目营销
电视节目收视率和微博讨论量存在着正向关系。微博讨论量, 可以成为预测电视收视率的重要指标。今年下半年, 市场分析公司尼尔森除了提供传统的电视收视率数据以外, 还将同时提供“Twitter电视收视率”数据。这一新增的数据将会显示有多少人对某个电视节目发布Twitter消息感兴趣, 从而帮助广告主和电视节目提供商了解Twitter对电视节目的影响。
同时, 对于节目推广而言, 参与节目话题讨论的用户, 不是电视观众, 就是网络视频观众。这些用户ID, 都是此节目的受众。以“中国好声音”为例, 参加第二季“中国好声音”话题讨论的用户, 如果通过新浪微博“用户画像”体系, 都被打上“中国好声音”的标签, 在明年“第三季”启动的时候, 针对这些用户投放广告或推送内容, 效率肯定会很高。
(2) 台网联动的跨平台营销
随着电视与网络平台的互补价值不断凸显, “台网联动”已成为网络媒体与传统电视媒体走向融合的重要特征。之前, 微博已经在尝试台网联动的营销解决方案。具体为, 微博将热门电视节目设定为“热门话题”, 在PC端和移动端设置话题入口, 吸引网友进入“热门话题页”, 引发网友分享与互动, 进一步放大冠名电视节目的企业营销权益。
此外, 节目直播的同时, 微博会同步在信息流中对节目话题进行话题推荐, 保证该时间段内的展现机会, 再次加强企业推广效果;通过用户获取信息的核心区域——信息流与话题榜的推荐, 将话题的热度最大化, 从而达到提升品牌知名度的目的。
大数据产生价值的
关键在于数据之间的连接
近几年大数据方兴未艾,全球各大企业对大数据也已经进行了大量的探索性和商业化实践。但对于大数据,无论是普通民众还是业界专家,都还有着这样那样的疑问,其中比较普遍的一个问题就是大数据的开放性。在一些发展中国家,当然也包括中国,数据的封闭性问题普遍存在。政府数据,甚至政府部门之间数据互联互通也并非十分顺畅。社会性企业之间也多是各扫门前雪,相互之间的交流互动、信息共享还处在比较初级的阶段。
在维克托·迈尔-舍恩伯格看来,数据公开在近两年已取得很大进步,一部分原因在于公众关注度的提高,变相推动政府数据公开的深度和宽度。目前国家经济运行数据的开放性已经达到了较高的水平。一些大数据创业性公司也开始运营,并且取得了成功。讲到经济补助,政府预算是有限的,政府可以数据方面的补助,即企业可以获得某一些数据,比如经济和生态的数据,借此预测国家生态经济政策,指引企业的发展。于是在美国,民众希望修订现有政策法规,要求企业在获得政府数据和补助的同时,开放某一些数据,实现与社会之间的互惠互利。这样最终会形成一个大的数据市场,促进数据流通性。维克托认为,数据流通性也是整个大数据时代最为重要的一个元素。
对此,百度营销研究院常务副院长侯丽斌表示,“百度自诞生以来就是含着一个金钥匙,这个金钥匙就是大数据,每天网民查询搜索都有一百亿次搜索,每次搜索都是人们渴望的诉求。每一次搜索都有巨大的商业价值,而这些搜索行为数据,在不破坏个人的隐私情况下,百度可以在数据开放上为我们社会,为我们客户做些什么呢?”
其一是百度大数据研究中心,其二是百度深度学习研究院,最终将海量的数据转化成社会价值。在大数据应用方面,百度先后和政府部门进行了多次合作,提供了交通管理、教育管理以及疾病预测等一系列社会化应用。这其中最为出名的要属年初春节期间的迁徙图,将人们在春节期间归家的路线,以大数据特有的方式呈现出来。此外,百度在商业应用方面也多有涉及,正吸引越来越多的顶级客户,如宝洁、雀巢,以及很多新兴客户。百度正在从最初的搜索平台,向信息服务提供者,向连接人与服务之间的媒体平台转变,为产品设计、服务升级以及产业化优化运营带来更多帮助。
谈及大数据的开放问题,张焕杰表示德比软件在创立之初有两个核心假设,第一个假设是未来的世界一定是个更开放的世界,第二个假设未来是一个全球化的世界。德比在全球十大酒店集团系统整合上的成绩是有目共睹的,同时跟全球最大的OTA系统实现对接,比如艺龙、携程,为他们提供数据服务。这些工作在某种程度上也证明了世界是越来越开放的,而开放也是互联网发展的大势所趋,没有任何人能够阻挡这种潮流。最后,张焕杰强调,开放对每一个企业意义深远,“当你拥抱世界的时候,世界才会拥抱你。只有这种开放的心态,我们才能真正的拥抱世界。”他坚信,“开放是未来,开放势不可挡。”
对于大数据的开放性问题,comScore蔡芳和德比软件张焕杰持有相同观点,认为“开放对所有人是有好处的”,因为大数据产生价值的关键是数据之间的连接,比如百度有很多搜索数据,没有交易数据,阿里巴巴有很多交易数据,但是没有搜索数据。作为全球知名互联网统计公司、互联网流量跟踪分析公司和市场调研公司,comScore会接触到海量的数据,拥有三百多万样本和多个网站,并把用户在不同网站、不同平台的数据串联起来,完整捕捉用户的上网行为,比如在购买商品的时候,场景是什么,推荐什么样的信息更合适。这些都需要大数据的作用。在进行数据搜集、汇总和应用的时候,如何避免隐私信息泄露是一项很重要的工作。
隐私数据承载的是一种信任关系
我们享受着大数据时代给我们带来的诸多好处,也承受着它在个人隐私,数据安全方面带来的诸多挑战。层出不穷的骚扰电话就是一个明证,这其中涉及用户信息的非法获取,非法贩卖。在大数据时代我们怎么样做?行业自律显然已经不能很好地规避,我们亟需更为健全的法律,以此保护用户隐私数据。
侯丽斌表示,在数据安全方面,百度有专门的数据安全专家,有安全软件,同时百度大数据部门也会根据国家政策制定相应的数据保护规则,包括可能参与到政府的数据保护规则制定之中。侯丽斌以百度营销研究院的数据库为例进行了详细阐述,“我们不会对单个个体进行监控,而是通过海量数据标签进行族群分析,研究的重点是消费趋势和网络行为,然后再去挖掘出数据本身的商业价值,为我们的客户服务,同时又不触犯个人隐私权和人权。”
斯洛登事件让我们认识到了世界的复杂性,“我们觉得是朋友的人可能是我们的敌人”,维克托·迈尔-舍恩伯格如是说。国家和企业需要在数据安全方面投入更多精力,提高安全意识,因为“并不是网上的每一个人都是很友好的”。从某种程度上来讲,安全意识的提高意味着用户在成长,“成长的一部分就是我们意识到这个世界并不是很友善的”。这就要求企业加大对用户隐私的保护力度,“个人的隐私代表着一种信任,一旦用户认为自己的隐私被侵犯了,他们对于整个网络服务就会失去信心。”因而所有的网络服务都需要帮助用户建立并确保对于互联网的信任关系。“那么我们需要规则,不仅仅是在中国,在美国、在欧洲、在各个地方保护数据、保护隐私都是非常重要的,”维克托也毫不留情地指出,“全球现在数据保护方面的技术还比较落后。”因此,在当下,不仅数据收集行为需要透明化,数据的使用也需要透明化,这样才能明晰数据是否被恶意使用。
大数据所带的隐私问题让用户对于整个互联网的信任遭遇了前所未有的挑战,甚至动摇了互联网赖以存在的根基。我们之前所推崇的,“在互联网上,没人知道你是一条狗”大有被改写的可能。“可悲的是,全球在这一当面的立法进展还是比较缓慢,在很大程度上还要靠企业的自律,”维克托的观点直白,却一语中的。
而在张焕杰看来,隐私保护不是技术问题,更多的是文化问题。他以中美高速公路应急车道的占用为例,强调构建互相监督,相互尊重的文化氛围的重要性。这与维克托所说的设立规则可谓殊途同归。
“comScore在技术层面可以收集到大量用户隐私数据,但全部会经过数据脱敏手段进行过滤,去除用户隐私数据,”蔡芳表示,“我们用到很多跟用户有关系的信息做连接的串点,这是通过其他被信任的第三方在黑匣子完成的,我们拿到的信息是去除了这部分信息之后的数据。从营销角度来讲,我们不知道用户是谁,我们只知道他在网上的行为就OK了。”
大数据就是
帮助客户制定最优的旅行计划
除了大数据的开放性和安全性问题,诸位嘉宾也对大数据在旅游行业的发展现状,以及大数据在旅游产品研发、用户服务等方面的价值所在。
侯丽斌表示,旅游行业是百度的重要业务之一,同时也是百度上升最快的行业之一。对于旅游行业大部分OTA或者所有中国OTA行业,百度已经成为首选的宣传和推广渠道,订单贡献率占到30%以上。“首先百度有天然的与旅游行业有着极高的契合度,”侯丽斌解释道,“另外百度有商业智能的优势,我们有技术优势,我们有大数据优势,所以我们也会越来越多的联合我们的商业合作伙伴,共同研发一些基于大数据旅游行业的预测工具,旅游行业的品牌监测工具,以及相关的市场分析等等,这些都会为我们的企业无论是旅游行业的管理,我们旅游行业的品牌营销,甚至我们旅游行业的信息基础架构,都会起到积极促进作用。”最后,侯丽斌特别强调了百度与四川省旅游局在大数据上的合作。
“大数据是什么呢?就是更好地做决策。这也是大数据的意义所在。”维克托从大数据的核心问题出发,解读了大数据在旅游行业的应用,“而对于我们每个人而言,最重要是时间,因为生命都会走向完结,所以时间是非常重要的,我们想要到最好的地点、最好的酒店去入住,但是我们需要确定的是我们需要做最好的决定,要看什么、要经历什么,这个可以通过大数据得到。”这也是维克托所描绘的旅游行业未来的发展。维克托指出,尽管现在的互联网OTA拥有很多的信息,但还没有做到信息的互联互通,并没有厘清数据信息的关联性,因为对于最终的用户而言,“信息体量的大小并不是关注的重点,用户所需的仅仅是能够作为决策依据的很小一部分数据,他们并不需要看过很多很多数据但是最终不能作出决定。”这也是维克托为旅游行业的从业人员提出的一个待解的难题,即帮助客户合理安排休闲时间,作出最好的决策。
“全球最大酒店集团之一希尔顿酒店集团,通过德比接入了谷歌,谷歌所展示的房间价格,房源信息都是通过德比提供给谷歌的。为什么两个全球大佬,包括携程、艺龙等等要通过德比这个中间者接入呢?最根本的一点是德比能够保证数据的准确性,这就离不开大数据的功劳。”张焕杰用案例阐述了大数据在旅游行业的应用,“传统的办法保证数据的准确性达到90%,谷歌要求是95%以上,低于95%就会下架。我们跟酒店分析,怎么样同步数据才能保证数据最准,我们服务器放在美国、英国、香港、上海、北京,我们把数据缓存到全球服务器上,一个酒店什么时候同步数据,保证数据最准确,然后服务于我们行业。”
“旅游行业是一个体验性的商品和服务,”蔡芳从自身的经历出发阐述了对于旅游行业的新见解。“在很多时候自己的旅游是被社交网络所触发的,比如Facebook上朋友分享过的景点具有很强的感染力,会做社交网络的语义分析,在蚂蜂窝查看攻略,然后自己进行判断,把旅游变成不同的场景体验。”
总结
【行业大数据建设方案】推荐阅读:
大数据行业分析报告10-10
化肥行业大数据分析12-12
行业信用体系建设09-07
医院行业作风建设11-22
品牌建设行业市场分析10-16
保险行业策划方案12-15
疾控中心行业作风建设事迹材料06-02
电信行业解决方案06-07
卷材行业实施方案06-15
教育行业活动营销方案09-07