大数据总结报告(精选8篇)
电影大数据报告:大数据时代的电影消费洞察
近日,猫眼电影发布了关于“大数据时代的电影消费洞察”的报告(以下简称报告),报告数据分析来源于超5亿人次的猫眼电影消费数据和4000家影院数据。报告显示,2015上半年全国电影票房线上化率超过50%,最受好评的国产片是《战狼》,进口片是《速度与激情》。
公开数据显示,2015上半年中国电影票房同比激增49%,达到202亿元。其中,中国电影市场的高速互联网化趋势明显,3月份线上出票占大盘比超过50%。报告指出,目前国内三四线城市的票房增速明显高于一二线城市,2014年上半年一二线城市票房为93亿元,2015年上半年增至135亿元,同比增长45%;2014年上半年三四线城市票房为43亿元,2015年上半年增至67亿元,同比增长56%。
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
一个属于调研行业的B2B网站
国内最具权威的市场调研门户网站之一
学数据分析、找行业报告、招调查人才可移步一起调研网
随着大数据、云计算、移动互联网等信息信息技术的不断发展, 人类社会被带入到了一个数据信息时代, 信息技术渗透到社会、经济等各个领域, 引发了一场生活、工作与思维的大变革。当谷歌 (Google) 、脸谱 (Facebook) 、百度 (Baidu) 等运用其大数据技术在与许多传统领域的结合中展现出其强大的预测能力时, 人们感受到了大数据时代的力量。“世界的本质就是数据”、“大数据的核心是预测”、“凡是过去, 皆为序曲”、“一切皆可量化”、“让数据说话”等成为了大数据时代的特征。2008年, 《自然》杂志推出了大数据专刊, 引发了全球范围内关于大数据问题的关注。2012年, 《纽约时报》在一篇专栏中称, 大数据时代已经降临, 在商业、经济及其他领域中, 决策将日益基于数据和分析而作出, 并非基于经验和直觉。《华尔街日报》则将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。
在过去, 我们无法想象沟通也会成为数据, 大量的非结构化数据无法被利用, 我们认为数据只是静止和陈旧的, 而在云计算和大数据的新变革中, 数据被赋予了新的生命力, 由量变产生了质变。大数据的概念最初来源于天文学和基因学的研究领域, 维基百科和百度百科定义大数据为巨量数据、海量数据, 指的是所涉及的数据量规模巨大到无法通过人工, 在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。权威IT研究咨询公司高德纳 (Gartner) 将大数据归纳为数量大、变化快和多样化的信息资产, 需要新的处理形式, 从而强化决策, 促进洞察力以及优化流程。大数据具有数量 (Volume) 、速率 (Velocity) 、种类 (Variety) 以及价值 (Value) 的4V特征已经形成共识。在数据规模上, 从千字节 (KB) 、吉字节 (GB) , 跨入到了艾字节 (EB) 、泽字节 (ZB) 指数增长的时代;在数据类型上, 从结构化数据转向对半结构化以及非结构化的数据进行研究。大数据已经撼动了世界的方方面面, 从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。作为承载企业最具价值信息的财务报告在大数据时代又有怎样的贡献呢?目前, 提升大数据在财务和金融领域的价值已经引起了世界范围内财务专业人士的关注, 特许公认会计师公会 (ACCA) 、美国注册会计师协会 (AICPA) 、特许管理会计师公会 (CIMA) 、四大会计师事务所毕马威、德勤、普华永道、安永 (KPMG、Deloitte、PWC、EY) 等都已经开始研究大数据带给会计师们的新的机遇和挑战, EDGAR Online也开始关注和研究大数据的趋势和财务、金融领域的融合, 国内外金融服务机构纷纷开始瞄准全球大数据市场, 未来的财务和金融终将与大数据技术密不可分。
二、大数据与财务报告模式的重构
(一) 财务报告模式的几种构想
上世纪在新技术革命浪潮的冲击下, 一些学者开始探索如何利用信息技术改进报告模式, 以满足不同用户的报告信息需求。有Sorter等 (1969) 提出的事项报告模式, 该模式将企业活动中的经济事项 (包括货币计量和非货币计量的经济业务数据) 进行列示, 不以计算收益和价值为目标, 不进行会计加工, 充分保留经济业务数据的原貌, 信息使用者利用信息技术和工具, 根据决策需要进行加工、提炼与分析。Colantoni等 (1971) 提出的数据库报告模式, 该模式将企业的所有经济活动都以基本信息单位储存, 没有固定的报表格式, 以开放的数据库供用户根据需要进行提取。Mc Carthy等 (1982) 提出的REA报告模式, 该模式将经济业务分别设定为资源 (Resource) 、事项 (Event) 、和参与方 (Agent) , 每一个参与方可视为是一个经济单元, 事项包括资源在经济单元之间的流动关系 (货币指标) , 也包括参与方对资源的控制关系 (非货币指标) , 企业应该将事项的这两种属性关系作为基本单位存储, 财务报告没有固定格式。Beattie等 (1999) 提出的多层界面报告模式, 这种模式是提供一种能兼顾信息、材料和产成品的电子财务报告模式。基本思想是以通用财务报告为第一层界面, 以信息组件为第二层界面, 以信息元素为第三层界面;信息元素是可以为决策提供有用信息的最小单位, 信息组件由不同的信息元素组成, 提供某一类信息, 从信息组件的综合中抽象出财务报告。普华永道 (1997) 会计公司积极推广的价值报告模式, 该模式是一种以价值导向为框架的新的财务报告体系, 强调经济增加值、智力成本、资本成本、企业股权价值与市场价值应是企业价值报告的重点内容。通用财务报告模式的改革一直面临着两大难题:一是为了解决信息不足和信息超载矛盾的问题, 使报告既能满足专业投资者对于多样化的信息需求, 又不能长篇累牍, 给非专业的投资者带来困扰。二是解决财务报告供应链重新设计的问题, 提供动态的、按需生成的报告, 对于信息技术的依赖程度较高, 要求企业业务系统全面实现信息化, 数据流动安全且不受限制。
(二) 财务报告的最新进展
一直以来, 无论是国际会计准则理事会 (IASB) 还是美国财务会计准则委员会 (FASB) 都在为着眼于用户为出发点的改进财务报告而努力。2010年, FASB第8号财务报告概念框架正式发表, 通用财务报告的目标 (The Objective of General Purpose Financial Reporting) 和有用财务信息质量特征 (Qualitative Characteristic of Useful Financial Information) 最先取得了趋同, 与此同时, IASB也发表了新的财务报告概念框架。SFAC No.8将财务报告的目标定义为:为现有和潜在投资者、贷款人和其他债权人提供关于报告主体的财务信息, 以帮助他们做出向报告主体提供资源的决策。我国在《企业会计准则》基本准则中规定:财务报告的目标是向财务报告使用者提供与企业财务状况、经营成果和现金流量等有关的会计信息, 反映企业管理层受托责任履行情况, 有助于财务报告使用者做出经济决策。2013年, 国际综合报告理事会 (IIRC) 颁布了国际综合报告框架的征求意见稿, 提出了一套包含财务资本、制造资本、知识资本、人力资本、社会关系资本以及自然资本六项资本的综合报告框架。综合报告框架涵盖了公司战略、治理、财务业绩、并反映它的商业、社会、以及环境的重要信息。综合报告被认为是未来财务报告演进的必然趋势, 旨在将财务信息与非财务信息整合在一起, 为利益相关者提供更加全面、相关、准确的决策信息, 并有着清晰、简洁、易懂的特点。
根据国际财务报告准则 (IFRS) 最新征求意见稿的修订建议, 由于现有财务报告并没有向财务报表使用者提供充分的信息, 以便他们了解公司的财务业绩、财务状况、现金流量前景以及风险提示, 因此要求按照适当水平的重要性标准对财务报表进行分解, 并且强调, 编制对投资者有用及相关的财务报表非常重要, 而不应认为编制财务报表只是为了遵从合规要求。财务报告将面临着新一轮的改革。随着大数据时代的到来, 数据资源被确认为一项新的企业资产类别, 其计量和估值也给财务报告的编制提出了不小的挑战。如果财务报告所提供的信息内容和呈现形式不能满足投资者的需求, 或者过于复杂难以利用, 那么财务报告的改革就不会停止。当然, 这的确考验了会计师们的智慧, 能够充分运用信息技术将充满专业语言的财务报告编制的精简、及时, 并保证信息的重要性和相关性。大数据、云计算、物联网带来的技术变革和思维变革使得财务报告领域的研究获得了新的契机, 可以预见财务报告模式的重构已经是必然趋势。
三、大数据与信息披露体系的改革
(一) 分层信息披露框架
信息是资本市场有效运行的基石, 而在公开的资本市场参与者之间沟通信息的平台主要来自于以财务报告为核心内容的信息披露制度。因此, 信息披露成为了学术界研究的又一重要领域, 研究内容非常广泛。国外学者关于信息披露的研究主要以制度经济学为理论基础, 围绕行为动机、专有成本、信息不对称、代理理论等展开。国内学者则较多关注企业社会责任、环境等非财务信息披露的视角、内部控制等管理会计信息披露的需求, 强制性披露和自愿性披露的内容等。近年来, 我国的会计准则体系和上市公司信息披露规范体系得到了不断完善, 已经形成了《公司法》、《证券法》、《上市公司信息披露管理办法》、《公开发行证券的公司信息披露内容与格式准则》 (2012年修订) 、证交所相关具体规则等多层级的信息披露规范体系。
国际评级机构标准普尔 (S&P) 最近表示将敦促IASB与FASB共同开发分层信息披露框架, 所谓分层信息披露框架是指将信息的披露分为三部分:第一层级, 主要包括延展信息和表格信息的披露信息;第二层级, 根据现有国际财务报告准则 (IFRS) 编制的披露信息;第三层级是公司根据相关性和重要性原则提供的、便于财务报表使用者正确理解公司财务业绩、财务状况、现金流量前景以及风险的信息。对此, 我国会计学界也曾提出过基本财务报表和其他财务报告的设想, 基本财务报表是整个财务报告系统的核心, 仍然以历史成本为基础, 满足经济社会信任需求。其他财务报告“按需订制”, 满足不同使用者的差异化需求, 它可以脱离交易基础, 运用重估价等方法, 采用包括公允价值等在内的非历史成本计量属性 (刘峰和葛家澍, 2012) 。将财务报告信息进行分层披露是根据不同投资者的需求对信息内容的一种细分, 由最基本的财务数据扩展到决策相关的其它信息。
(二) 互联网时代的信息披露和风险监管
随着互联网和移动互联网技术的发展, 信息披露已经迈入网络时代。大数据技术发展受到的限制主要来自于数据的流动性和可获取性, 而上市公司的信息披露制度突破了这一障碍。信息披露制度不仅改善了上市公司的信息不对称问题, 提高了资本市场的效率, 同时促进了投资者关系管理的发展, 为投资者提供了互动和交流的信息平台。企业过去或许对于数据公开和信息共享心存疑虑, 未来企业会逐渐意识到分享企业信息能够创造竞争优势, 怀着开放的态度, 让客户、投资者等共同参与企业的战略决策, 积极探索通过开放数据和数据共享能够带来的商业利益。
尽管大数据技术给企业带来了新的机遇, 但是不可否认其同样隐藏着风险, 云计算数据处理的可靠性、网络信息披露的安全性受到挑战。我国上市公司网络财务报告信息的监管方面还比较滞后、企业在自身信息安全保护方面还需要加强。Garner公司就大数据的安全问题提出了警告, 至2016年, 有80%的大型机构和组织将遭受到大数据带来的重大安全问题, 大数据、云储存环境改变了原先数据存储、访问和处理的方式, 企业需要设立如首席信息安全官 (CISOs) 及其团队来负责制定企业数据管理和数据安全的相关策略。
四、大数据与XBRL技术的推进
近年来, 网络财务报告的研究得到了国内外众多学者的关注, 网络财务报告 (Internet Financial Reporting, 简称IFR) 是在信息技术环境下一种新型的财务呈报方式, 使得财务报告信息更加及时、透明 (张天西, 2003) 。可扩展商业报告语言 (Extensible Business Reporting language, XBRL) 作为第二代 (Second Generation) (ICAEW, 2004) 网络财务报告语言得到了世界各国的认同并得以推进, 美国、英国、澳大利亚、加拿大、德国、西班牙、荷兰、丹麦、印度、以色列、日本、韩国等世界各国都已经开始发展XBRL相关技术的推广, 未来XBRL将成为资本市场上的世界语 (李为, 2009) 。XBRL是在XML基础上发展起来的一种标记语言, 由规范 (Specification) 、模式 (Schema) 、分类标准 (Taxonomy) 、实例文档 (Instance Documents) 四个组成部分构成, 是目前应用于非结构化信息处理尤其是财务信息处理的最新技术。XBRL能够对财务报表以及附注所包含的数以千计的数据进行精确的标记, 这种标记可以满足投资者对财务数据进行电子化搜索、组合与处理, 使得投资者、分析师、监管机构能够便捷的获取和分析数据。一直以来, 美国证监会 (SEC) 对互动数据的态度非常积极, 出资应用XBRL技术重建其公共信息披露系统 (EDGAR) , 开辟了企业财务报告在美国大数据平台的应用, 在XBRL的技术规范、分类标准、实例文档报送方面走在了世界前列。
在XBRL应用研究方面, 我国也取得了阶段性的成果。上交所、深交所分别于2004年、2005年开始试点, 证监会于2005年制定了中国首个分类标准, 并获得了国际组织认证。2010年10月, 财政部又发布了基于企业会计准则的XBRL通用分类标准、国家标准化管理委员会发布了XBRL技术规范系列国家标准。通用分类标准体现了我国企业会计准则和内控规范的要求, 实现了国际趋同, 可扩展性强, 是完全开放的统一数据标准, 其推广应用将大幅提升企业管理效能, 同时极大的方便外部会计信息使用者对会计信息的深度分析、利用, 并提出了推广应用XBRL的工作安排与具体措施 (刘玉廷, 2010) 。虽然在分类标准方面, 国内已经取得了实质性的进步, 但是从信息技术层面的实际应用及实例文档的研究方面, 我们与国外还有一定的差距。大数据时代推动了信息技术的发展、促进了跨学科领域的结合。从企业内部的全面信息集成到企业外部的网络信息的动态传输, 在标准、技术、安全等一系列条件成熟之后, 建立运用于交易层面的XBRL-GL分类标准和运用于财务报告层面的XBRL分类标准结合的双层分类标准, 通过web服务动态传送数据, 形成柔性按需报告模式最终将可能实现 (潘琰和林琳, 2007) 。目前, XBRL技术由于受到不同准则基础的分类标准复杂性的影响, 数据信息的准确性有待提高。除此之外, XBRL的推进目前遇到的最大的难题除了技术以外还有长期以来企业对于传统文本报告的依赖, 而这一点不亚于当初计算机会计代替手工会计的变革一样。
五、结论与展望
互联网时代正悄然地改变着人们的行为方式, 未来10年, 拥有大数据技术和大数据思维的企业必将在新一轮的竞争中占据优势, 而现阶段面临的难题来自于如何处理大量的数据和如何运用这些数据。基于云计算的企业内部资源计划平台、客户关系管理系统、基于互联网的电子商务、社交媒体等产生了大量的数据, 而大部分的数据价值都是潜在的, 需要通过创新性的分析来释放。美国对冲基金已经通过剖析推特 (Twitter) 社交网络的数据信息来预测股市的表现, 而中国的投资者互动平台的建设才刚刚起步。事实上, 大数据时代所推崇的相关关系的研究早已在财务报告的领域中得以应用, 如财务报告与资本市场的效率、财务报告与股票价格同步性的研究等, 只不过过去的研究主要集中在财务报表等结构化的数据层面, 较少的涉及如新闻事件、互动信息等非结构性数据的研究。大数据时代我们不再将世界看作是一连串我们认为或是自然或是社会现象的事件, 我们会意识到本质上世界是由信息构成的。网络信息时代的大环境给企业的发展提出了新的机遇和挑战, 作为承载企业最具价值信息的财务报告将是资本市场发展和完善过程中的重要内容, 在这一次的变革中, 中国与世界同步, 期待大数据分析在全球财务报告的改进中有所作为。
参考文献
[1]维克托·迈尔·舍恩伯格 (Viktor Mayer-Schnberger) 著, 盛扬燕, 周涛译.大数据时代 (Big Data:A Revolution That Will Transform How We Live, Work, and Think.浙江.浙江人民出版社.2012:1-23
[2]ACCA.Big data:its power and perils[EB/OL], http://cn.accaglobal.com/accanav/feathers/f_2758.asp
[3]FASB.SFAC No.8:Chapter 1, The Objective of General Purpose Financial Reporting, Chapter 3, Qualitative Characteristic of Useful Financial Information.2010.9
[4]Brad J.Monterio.Integrated Reporting and the Potential Role of XBRL, Strategic Finance.2013 (6) 62-65
[5]中国会计视野.IFRS新规获标准普尔好评[EB/OL], http://thenationonlineng.net/new/new-ifrs-provisions-will-improve-financial-reporting-says-standard-poors/
[6]刘峰, 葛家澍.会计职能、财务报告性质、财务报告体系重构.会计研究.2012 (3) 3-8
[7]张天西, 薛许军, 林进安.信息技术环境下的财务报告及信息披露研究.会计研究.2003 (3) 47-52
[8]潘琰, 林琳.公司报告模式再造.基于XBRL与Web服务的柔性报告模式.会计研究.2007 (5) 80-96
[9]李为.XBRL—监管的革命.证券市场导报.2009 (1) 4-8
[10]刘玉廷.推广应用XBRL推进会计信息化建设.会计研究.2010 (11) 3-9
虽然这是一部科幻片,但其中描述的场景正在一步步变成现实,而背后的技术原动力就是大数据。实际上,不少行业已经从大数据中受益。比如,不少电商网站开始采用基于Hadoop的商品推荐系统或商品推荐服务。它根据访客的历史交易数据、访客在该网站的浏览数据、在其他合作伙伴网站的浏览信息,以及用户的评论行为来综合评估推荐访客可能感兴趣的产品。这样的场景还有很多,正是有了大数据的分析,我们可以更全面、更准确地了解这个世界,做出更为精准的决策。为此,不少业内人士预言,大数据将引发全球范围内深刻的社会与商业变革。
IT厂商早就注意到了大数据市场的兴起,IBM、Oracle、微软等IT巨头都是大数据市场的积极推动者,它们不仅推出了自己的Hadoop版本,同时,还推出了各种接口和工具来打通自己的传统数据库、数据仓库与Hadoop之间的联系。而BI厂商更是不敢轻视,如数据仓库的技术供应商Teradata甚至专门收购一家从事大数据业务的公司。在大数据市场,存储厂商也是一支非常活跃的生力军,如EMC、HDS等都有大数据解决方案推出,其中EMC走得更远,已经超过数据的存储而把业务延伸到数据的分析领域。值得一提的是,一些厂商还推出了大数据的一体机,作为抢占市场制高点的有力武器。刚刚过去的2012年,我们看到IBM、Oracle都有大数据一体机推出。
展望2013年,随着大数据的应用不断涌现,大数据热仍将持续,更多的企业将会关注甚至使用各种大数据解决方案,市场上也会出现更多的相关产品和方案。不过,从技术发展阶段而言,大数据仍将处于在市场培育期。
这其中最大的挑战包括Hadoop生态系统有待逐步完善,以及大数据人才的缺乏。众多周知,Hadoop并不是一个商业化的产品,而是一个开源软件。它的产品规划以及软件更新都有很大随意性,产品本身也有待于完善。虽然已经有公司(如Cloudera)能提供Hadoop的技术支持,但用户主要的技术支持仍然来自社区。2013年里,技术支持的问题如果不解决,用户对于使用Hadoop仍然会顾虑重重。
另一个问题是大数据相关的人才紧缺。在国外已经有企业开始尝试设立类似“数据科学家”的职位(有的称其为“数据分析师”或者“数据工程师”),与一般商业智能分析师不同,这些专家不仅能找到和提供数据,他们还要使用它进行大量预测。其理想的候选人对分析和市场营销都非常熟悉,此外,最好还能懂数据挖掘、统计甚至人工智能。
火车票
超四成人将坐高铁
铁路向来是春运客运量最高的交通工具,据去哪儿网大数据预测,2017年12月15日将进入旅客春运抢票高峰,此轮去程购票高峰将和去年一样,一直持续到春节前结束。
今年春运,铁路最热门的出发地集中在北京、上海、成都、重庆和杭州。这些城市多属于超一线和新一线城市,外来人口集中,也是多条铁路线路的起始地。一个显著的变化是,购买快速铁路车票的用户比例不断增加,选择乘坐高铁的人数占比达到了41.5%,选择乘坐城际铁路的人群比例也达到了10.3%,整体超过了总数的一半。乘坐上海出发的高铁线路人数最多,杭州、长沙、北京、广州的票量紧随其后。
飞机票
北京飞佳木斯特难买
2017年春运出发最集中的日期是2017年1月24日,已经进入了乘飞机回家旅客的人数峰值期,全国重要的机场将进入到繁忙状态,返程高峰则从大年初六即2017年2月2日开始。
北京至成都、深圳至重庆、上海至哈尔滨、北京至三亚、广州至重庆、深圳至成都、成都至北京、重庆至广州、北京至哈尔滨、上海至成都,这十条是往年最热门的空中回家路。据去哪儿网大数据统计,北京至佳木斯的航线,在众多热门航线中并不起眼,但订票时间却比其他航线早很多,平均会提前36天。而从深圳回海口更早,一般提前43天,堪称最难买航线。记者注意到, 在“春运期间十大最难买线路”中,北京起飞地就占了一半。
接送站
4点到11点为乘车高峰
春运期间,95%的旅客会有行李箱、背包并携带各种礼品,专车接送机/站成为热门出行工具。北京、成都、深圳、上海、三亚、广州、昆明、西安、哈尔滨、厦门等10个城市成为去哪儿接送机使用率最高的城市。
在接送机/站的用户中,25至35岁年龄段人群最高,占比48%,35至45岁占比也超过两成。在预约时间上看,男性一般提前在出发前3.5天至4.1天预订接送机服务;女性用户明显准备更加充分,其预约时间在4.1天至5.6天。
从出行时段上看,4点至11点为旅客乘车去机场、火车站高峰,其中5至6点出发人群最高,高达6.9%;10至11点又会出现小的高峰,出行占比为5.1%。
发福利
买火车票最高减100元
由华润怡宝饮料(中国)有限公司和去哪儿网发起的2017“怡起回家”春节活动于昨天正式启动。即日起至2017年2月11日,旅客打开去哪儿网APP找到“怡起回家”专题可以参加红包抽奖,覆盖去哪儿网旗下机票、火车票、汽车票、接送机租车、度假、门票、酒店等全线产品。
其中,活动力度最大的是乘坐比例最高的“火车票”,活动为旅客提供了最高金额达100元的火车票减免优惠券,并可直接用于购票抵扣,还有千张“1元机票”秒杀、4000份车车代金券、4万份出游保险等多种优惠。过年期间,旅客还将享受到国内外12条免费度假线路、3万份怡宝定制红包和1万份出游保险的额外奖项。
相关
北京至昆明高铁首发
记者从北京铁路局获悉,自2017年1月5日起,北京将首开昆明、福田和绍兴方向高铁列车,北京西至昆明南最快旅行时间较现行直达特快压缩约21小时,实现“朝发夕至”。
铁路部门提示,为了配合此次运行图和下一步春运运行图的调整,12月30日以后的火车票预售期调整为30天。按此计算,今日最远可以买到2017年1月4日的火车票,有出行需求的旅客,可登录中国铁路客户服务中心网站或通过车站窗口、火车票代售处、拨打北京铁路局订票电话(95105105)购买车票。
列车调整
首开北京西至昆明南G403/4次、G405/6次高铁列车2对;
首开北京西至福田高铁列车2对,G71/2次、G79/80次;
首开北京南至绍兴北高铁列车1对,G39/40次;
增加1对北京南至商丘G1567/8次高铁列车;
一、大数据概念
“大数据”是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。“大数据”首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。
二、大数据特点大数据特点
要理解大数据这一概念,首先要从“大”入手,“大”是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。
1、数据体量巨大。从TB级别,跃升到PB级别。
2、数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。
3、价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
4、处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
三、大数据分析
从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。
四、大数据作用
五、政策倾向和市场需求
大数据产业在中国已经被提高到国家战略层面,在国务院印发的《促进大数据发展行动纲要》中就明确指出要以企业为主体,营造宽松公平环境,加大大数据关键技术研发、产业发展和人才培养力度,着力推进数据汇集和发掘,深化大数据在各行业创新应用,促进大数据产业健康发展。发展大数据在工业、新兴产业、农业农村 等行业领域应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。
贵州省在着力打造大数据产业发展应用新高地,推动大数据产业成为贵州经济社会发展的新引擎,建成全国领先的大数据资源中心和大数据应用服务示范基地。按照‚基础构建、集群聚集、创新突破‛的思路,科学规划大数据产业布局,建基地、引人才、聚企业、抓应用、保安全、促创新,建设信息资源聚集地。2014年2月,贵州印发《关于加快大数据产业发展应用若干政策的意见》。明确从2014年起连续3年,省和贵阳市、贵安新区每年各安排不少于1亿元资金,用于支持大数据产业发展及应用。到2017年,贵州将形成1―2个大数据产业示范园区,引进和培育30户大数据龙头企业,聚集500户创新型大数据相关企业,通过大数据带动相关产业规模达3000亿元,引进大数据领军人才100名,引进和培养高端人才5000名。
2014年,贵州以大数据为引领的电子信息产业实现规模总量1460亿元,同比增长62%;电子信息产业投资230亿元,增长225%;大数据信息企业共1721家,较2013年底增加了410家,增长31%。
贵州提出把大数据产业作为重要战略来抓,制订发展规划,出台支持政策,成立产业发展领导小组,统一建设系统平台。阿里巴巴、IBM、英特尔、惠普、戴尔、百度、浪潮、神州数码、中国普天、中兴通讯等信息产业龙头企业,现今纷纷与贵州开展合作。
围绕大数据全生命周期,贵州重点打造‚基础设施层、系统平台层、云应用平台层、增值服务层、配套产品层‛五个产业链层级,建设大数据‚内容中心—服务中心—金融中心‛三个中心。
发展蓝图一经确定,贵州立即付诸实践:建成省级政府和企业数据统筹交换共享的基础性、系统性云服务平台——云上贵州;启动wifi免费无线城市建设,今年5月1日,16个热点公共区域的免费wifi投入试运行;贵阳大数据交易所投入运营。
今年初,工信部批复同意创建‚贵阳·贵安大数据产业发展聚集区‛。按照规划,2015年,贵州大数据信息产业实现规模总量将达到2000亿元,同比增长37%。同时,力争10个国家级、行业级、龙头企业数据资源存储贵州。
六、大数据产业人才需求
一方面,根据IDC的调查报告,全球从2012年至2015年的3年之间里,云计算的相关工作需求将出现26%的年增长率,超过1/4的增长率再次证明了企业对云计算人才的巨大需求。IDC的预测还表明,2012年有约170万的云计算相关岗位出现真空,而这方面的求职者也都缺乏云计算方面的实践经验,并且不具备完善的培训机制;值得警醒的是,到2015年,这个数字将有170万上升到700万,云计算产业面临着更大的人才缺口。若以地区来看,亚太地区的云计算人才缺失要更加严重一些,根据IDC预测,亚太区的云计算相关人才需求年增长率将达到32%,超过欧洲、中东等地区8个百分点,到2015年的人才需求是230万。这其中,中国地区也占了很大比例,尤其中国还是一个拥有巨大发展潜力的市场。
另一方面,根据麦肯锡报告,仅仅在美国市场,2018年大数据人才和高级分析专家的人才缺口将高达19万。此外美国企业还需要150万位能够提出正确问题、运用大数据分析结果的大数据相关管理人才。
然而,目前在云计算和大数据行业打拼的从业者中,大部分都是半路出家,极少有人受过系统化的培养和教育。在信息周刊的调查显示BI、数据分析和信息管理人才认为技术培训、认证课程和统计/分析培训是最重要的三种培训课程选择。有趣的是,数据分析人才对财务、营销等商务技能课程的兴趣远高于其他IT专业人士。
我国大数据所需人才储量小,符合条件的人才严重不足,供需矛盾明显。我国能否在云计算和大数据时代这一轮新的竞争中取得先机,人才是关键。在一个产业来说,高端科研和开发人才其实需求量并不大,市场需要的更多是基础开发、项目实施和维护人员,这就给我省大数据人才培养和大数据产业弯道取直提供了一个非常好的机会。
七、公司大数据产业发展落脚点
公司对目前国内外大数据产业发展形势结合自身优点,着力从四个方面落脚引领大数据产业发展。
1、云端大数据产业应用研究院,建立一套运行机制。大数据建设是一项有序的、动态的、可持续发展的系统工程,必须建立良好的运行机制,以促进建设过程中各个环节的正规有序,实现统合,搞好顶层设计。
2、云端大数据产业标准研究院,规范一套建设标准。没有标准就没有系统。应建立面向不同主题、覆盖各个领域、不断动态更新的大数据建设标准,为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。
3、云端大数据项目建设部,搭建一个共享平台。数据只有不断流动和充分共享,才有生命力。应在各专用数据库建设的基础上,通过数据集成,实现各级各类指挥信息系统的数据交换和数据共享。
4、云端大数据产业人才培养基地,培养一支专业队伍。大数据建设的每个环节都需要依靠专业人员完成,因此,必须培养和造就一支懂指挥、懂技术、懂管理的大数据建设专业队伍。
八、云端大数据优势
1、携手全国首个大数据学院贵州大学学院和贵州大学六度众创空间共同成立大数据产业人才培养基地。
2、结合贵州省大数据产业应用研究院联合组建大数据产业应用研究院和大数据产业标准研究院。
3、联合欧美同学会和国内知名企业利用贵州大数据发展大势,落地或引进大数据项目。
九、大数据应用案例
1、Hadoop大数据分析
2、行业案例
3、贵阳大数据应用案例
(1)‚用数据说话‛提升政府治理能力
在贵阳市公安交通管理局,民警向记者展示在日常酒驾查处过程中,利用信息化系统平台对执法过程进行全程记录:只见测试人员对测试仪进行吹气,显示的测试数据立即传入贵州省酒驾管理信息系统。由于数据实时传输且无法更改,民警在权力运行过程中成为‚透明人‛。
据贵阳市监察局局长王军介绍,借助于大数据,贵阳市率先在交管、住建部门建‚数据铁笼‛。‚运用大数据编制制约权力的笼子,能上网的行政权力全部上网。保证权力运行全程电子化、处处留‘痕迹’,让权力在‘阳光’下清晰、透明、规范运行。‛王军说。
贵阳‚数据铁笼‛只是贵州运用大数据提升政府治理能力的一个缩影。2014年底,贵州建成省级政府数据集聚共享的统一云计算平台——‚云上贵州‛。‚云上贵州‛之上开发了一系列基于政府数据的应用系统,不同程度满足政府、企业和个人应用,一些对政府数据有需求的企业也将系统平台建在‚云上贵州‛平台上。
目前,‚云上贵州‛日均访问量近2亿次,最高峰值达10亿次以上。马宁宇说,大数据提升了政府的决策能力、管理能力和服务能力。比如,今年初蓉遵高速习水段发生塌方,有关部门对路过该路段车辆快速实现精细化排查,在最短时间内准确锁定被掩埋车辆为1台,为抢险救援提供了科学精准的决策依据。(2)‚大数据‛走进寻常百姓家
贵阳市民陈军从超市购买了一包茶叶,然后,他打开手机软件‚食安测‛扫描商品条形码,只见食品信息、食品检测结果等立即出现在屏幕中。
贵州科学院院长谭红介绍,‚食安测‛是贵州食品安全云的一款产品。食品安全云是将原来分散在政府部门、检测机构、企业、公众等各个环节的数据汇聚起来,搭建起监管平台、大众门户、食品安全测试信息管理平台等互相联通、支持的平台系统。
据统计,食品安全云已汇聚食品安全监管、检测、标准、知识信息等数据1000余万条,涉及食品1.14万余个,检测报告1.86万余份,国家标准420余份,1000余家龙头企业参与应用示范,35家规模超市成为数据采集试点单位。目前,已在广东、北京等9省市推广应用。
‚食品安全云使更多人步入了数据生活时代,消费者可以利用数据去衡量产品品质,从而购买到最适合自己的产品,提升‘舌尖上的安全’。‛谭红说。
除了食品安全云,贵州还建设了智慧旅游云、交通云等,为民众和企业提供更加个性化和精准化的服务。
贵阳大数据战略重点实验室主任连玉明说,大数据在生活中随处可见,应用潜力巨大。‚数据时代是一个融合的时代,运用好大数据,将发展指数、生活指数等覆盖到生活的各个方面,将对城市管理、公共服务等提供巨大帮助。‛连玉明说。
附件
一、大数据技术
大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。目前所说的“大数据”不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。大数据研发目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展。因此,大数据时代带来的挑战不仅体现在如何处理巨量数据从中获取有价值的信息,也体现在如何加强大数据技术研发,抢占时代发展的前沿。
1、数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
2、数据存取:关系数据库、NOSQL、SQL等。
3、基础架构:云存储、分布式文件存储等。
4、数据处理:自然语言处理(NLP,NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
5、统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。
6、数据挖掘:分类(Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
7、模型预测:预测模型、机器学习、建模仿真。
8、结果呈现:云计算、标签云、关系图等。
大数据时代,一个被嚼烂的词汇,不知从何时起,兴起了数据科学的狂潮,本书核心论点,第一,要全体不要抽样,第二,要相关不要因果,第三,要效率不要精确。弊端:产业生态环境,数据安全隐私,信息公正公开。本书实例众多,理论残缺,可以说是举了一系列的例子要论证观点的,我们知道这种论证方式逻辑上存在谬误。故而,本书可以说是一本数据科学的正面的背景教学,供谈资。数据科学基础:云计算,人工智能和机器学习,大规模处理结构数据算法,日渐增长的计算速度和数据规模的指数增加。
从硅谷到北京,大数据话题正在被传播。随着智能手机以及“可佩带”计算设备的出现,我们的行为,位置甚至身体生理数据等每一点变化都成了可以被记录和分析的数据。以此为基础,反馈经济等新经济,新商业模式也正在开始形成。
大数据时代,我们可以有更全面的数据来研究,如楼上所说,甚至可以认为是样本=总体,那么,就不用再做一些统计上随机采样的工作了,基于大数据的研究可以关注到统计研究上难以关注到的一些小的、个别的情况,这些情况往往会呈现出更大的价值。
在数据量很小的时候,研究往往会对精确度做很严格的要求,而大数据时代会把这些条件放的更加宽松,不然大数据很难应用于研究,这种情况下,尽管数据的准确度降低了,但大量的数据会给我们带来额外的收益
基于前两个转变,我们不再寻找因果关系,而是去关注关联关系,即倾向关注“是什么”,而不是“为什么”(翻译此书的周涛不太认同这个观点,他认为是现在一些基于机器学习的算法得出的结果驱使我们去仅仅关注关联关系,因为我们现在很难把这些复杂算法转换成因果关系了)
现在谈论大数据的人真的很多,但是能全面的讲述大数据的人我个人的感觉是不多的。作者从非技术这个角度,从思维、价值、隐私、管理这些角度来细致的讲述大数据,这点我觉得是值得我们学习的,而且书中例子的结合,也很能看出作者的功力。
结合产品来谈数据的话,我个人觉得产品的设计是可以融入数据元素的,从数据废气到数据的可扩展性,到挖掘数据的价值完善自身的产品,这些都是可以思考的点。很自然的冒出来的一个想法,在我们的产品设计里面,可以突出用户留言之类的功能,通过这些功能的设计,收集对产品存在的问题、改进建议等等,或者说,这些功能以前也是有的,但是真正利用这些数据完善产品的思维却是丢失的。大数据的意义,也就是从这些已存在的数据中发觉价值,利用这些数据完善自身产品、业务是数据的基本功能,对数据的二次利用,也是我们可以考虑的。结合《大数据时代》这本书,我觉的书中提到的数据创新的思路是我们很值得学习的。
跟个人比较紧密相关的,我比较感兴趣大数据时代的角色定位,既有个人的定位、也有公司的定位,这个或许也是需要我再好好领悟的点吧。
至于《大数据时代》中提及的风险和掌控,这两张特别是掌控,我想是大多数谈论大数据人都很少去思考的,人人都想从大数据中分杯羹,但是大数据发展到一定阶段,这些问题都会是比较突出的问题。
大数据时代的知识能轻松获得,也并不意味着就能真正掌握知识。大数据时代的知识仅仅是一种资源,好比家中存放成百上千的书籍,如果不去研读,知识和人依然无关。不管处于怎样的一种时代,知识需要人们花苦功夫钻研,否则再多的知识也无意义。另外,现在不少人,凡是有不懂的问题,习惯性地上网搜索,不做任何甄别地将网上的知识和答案奉为宝典。长此以往,久而久之会使大脑变得懒惰,思维变得迟钝。大数据时代的知识,究竟是令人变得聪明还是愚笨?
《大数据时代》作者认为:“由大数据带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中,认识你自己。”我们从昨天的数据作用中认识自然、认识宇宙到今天通过大数据更多地认识网络和社会,我们的认识更加全面、更加深刻、也更加广泛。但是成就大数据的是无数努力造就小数据的人,他们探索大数据技术,认知大数据文化,并怀揣着对数据的敬畏和对规律的尊重。
我们本学期正在学习概率论与数理统计这门课,有人总是把大数据和统计学摆在两个对立面,认为有了大数据之后统计学就会逐渐消亡,而我并不这么认为。首先,数据量的增加,有助于减小数据的误差,如抽样误差等,能够极大地提高各类分析的精准度,这是大数据对于统计学的直接影响之一。
尽管当今的”大数据“潮流使得我们获得了海量的数据,但掌握这些海量的数据本身并无意义。真正的意义体现在对于含有信息的数据进行专业化的处理。要对大数据进行处理,即在样本几乎等于总体的情况下,以目前的分析方法以及分析设备成本较高,耗时较长。
相比之下,统计学的抽样方法似乎显得更加”经济实惠“。在实际的运用中,统计学能够以较低的成本,较少的数据,对数据进行精确度相对较高的的分析,这是大数据分析所无法替代的。
甚至有学者指出,很多情况下,只要有一定的数据,无关数据数量,分析结果不会有太大差别,因此大数据也就显得不重要了。不敢说这话完全正确,但很大程度上说明了统计学对于数据分析处理的意义。通过一定的数据即可满足人们对于数据处理的需要,统计学极大地提高了人们对于数据处理的效率。
关键词:互联网+,物联网,大数据应用技术,发展前景,社会价值
随着物联网的迅猛发展, 处理并应用物联网中杂乱无章的海量的大数据已成为物联网产业必须面对的一个重要课题。“互联网+”时代的来临, 使物联网大数据应用有了一个重要的技术平台, 它不仅改变着物联网企业的大数据应用模式, 而且还引起运作模式的变革, “互联网+”物联网大数据应用技术也应运而生。
1本课题研究的意义
“互联网+”物联网大数据应用技术是利用大数据技术, 通过优化互联网、物联网中资源的配置, 创新物联网信息处理与应用模式。浙江省作为国内经济最具活力的省份, 物联网企业数量众多, 物联网信息服务业比较发达, 同时, 汇聚浙江大学等一批高校和科研机构, 物联网应用人才储备充足。可以说, 对“互联网+”时代浙江省物联网大数据应用技术的发展前景及社会价值进行实证研究不仅可以基于“互联网+”和“大数据”思维对物联网中高度复杂的海量数据进行处理、应用, 并通过分析获取更多智能化、深层次、商业价值高的物联网信息资源, 最终为浙江省物联网行业提供有价值的发展决策依据, 更重要的是可以促进浙江省物联网企业商业模式、社会经济发展模式的根本性改变。因此, 本课题具有独到的学术价值和应用价值。
2浙江省物联网大数据应用技术发展现状
一是浙江省“互联网+”物联网大数据应用技术平台建设走在全国前列;
二是拥有较多专门从事“互联网+”物联网大数据应用的企业, 支撑“互联网+”物联网大数据应用的基础信息产业发达, 建设了支持“互联网+”物联网大数据应用技术发展的基础设施和完整的物联网大数据应用产业链;
三是“互联网+”物联网大数据应用服务专业人员力量较为雄厚, 这些技术力量不仅催生了众多的创新型物联网信息服务, 而且升级、优化了浙江省信息产业整体发展格局。
3“互联网+”时代浙江省物联网大数据应用技术发展前景
在未来, 浙江省“互联网+”物联网大数据应用技术包括互联网Web数据集成、物联网数据空间管理、物联网数据外包、移动互联网上的数据应用以及安全寻址等方面。
浙江省“互联网+”物联网大数据应用技术产业将蓬勃兴起, 技术投资活动日益活跃, 浙江省“互联网+”物联网大数据应用技术广阔的发展空间将进一步吸引大量国内外资本。“互联网+”物联网大数据应用技术的相关硬件制造、软件开发、应用服务等领域将会呈现前所未有的良好发展格局, 从而将会成为浙江省战略性新兴产业发展的推动力, 引领产业聚集发展的新动向。
4“互联网+”时代浙江省物联网大数据应用技术社会价值
“互联网+”物联网大数据应用技术将任务分布在大量物联网资源池上, 使各种物联网大数据应用系统能够根据需要获取存储空间和信息服务, 打破了物联网中数据不能有效处理的局面。“互联网+”时代浙江省物联网大数据应用技术有可能完全改变物联网行业现有的以桌面为核心的数据应用习惯, 从而导致物联网转移到以互联网Web存储与应用为核心。在浙江省基础实施服务领域, “互联网+”物联网大数据应用技术可以整合省内基础设施资源, 大规模、高效地提高IT基础设施, 可以增强物联网大数据应用业务的性能, 降低业务成本。
5结语
对“互联网+”时代浙江省物联网大数据应用技术发展前景及社会价值进行实证研究将促使浙江省进入了信息技术变革时代, 深刻影响浙江省人民的日常生活, 转变经济发展模式, 对浙江省社会发展具有重大意义。但是, 由于物联网中大数据的高度复杂性, 本文研究仍然存在一定的局限, 并没有完整地探讨“互联网+”时代浙江省物联网大数据应用问题, 这也是本文作者要继续探讨的地方。
参考文献
[1]张方风.大数据应用技术发展思考[J].计算机时代, 2014, 27 (06) :123-124.
[2]宁焕生.“互联网+”思维的应用[J].计算机教育, 2015, 34 (01) :34-35.
[3]杨震.浙江省物联网大数据应用的发展前景[J].网络技术, 2015, 12 (03) :111-113.
科幻迷+大数据
星图数据今年上线首款产品,8月份就完成了数百万美元的A轮融资。谷熠说,自己带着对产品和大数据的梦想走上了创业这条“不归路”。作为一家互联网大数据服务公司,星图数据基于海外技术团队的研究成果开发出了一套适合中国企业的数据应用服务产品,主要为传统制造业公司提供完整的线上渠道数据,通过数据可视化的方式进行直观的呈现,帮助企业通过数据发现在拓展线上渠道过程中产生的问题,从而进行精准经营与决策。
目前,星图数据的主要服务领域包括快速消费品、3C与家电以及家居家装等,美的、苏泊尔、九阳等知名家电品牌都是星图数据的合作对象。根据官方网站的介绍,星图数据的数据积累超过24个月,拥有超过2400个品类、12万个品牌和600万个商品的线上零售数据,产品服务主要包括D-Matrix(数据矩阵)大数据分析系统、SkyScope(天镜)线上渠道巡检系统、AtomPower(原子力)SKU单品分析系统、SARK(星舰)大数据代运营服务。
从产品名字上就不难看出,星图数据的团队里,不仅谷熠是科幻迷,其他很多人也都是科幻迷。《星际穿越》上映的时候,公司组织大家一起去看电影,看完后还开会进行了一番热烈的讨论。谷熠说,原来,零散的数据就像星星一样散落在各个角落,他们希望可以用大数据将它们串联起来,真正发挥它们的意义和价值,这也是公司取名为“星图”的原因。
直播“双十一”
在上个月的“双十一”网络购物狂欢中,星图数据进行了全网销售数据直播。作为国内唯一一家直播全网销售情况的公司,星图数据是如何做到这一点的?谷熠说,当然还是依靠技术的力量。区别于传统市场调研机构的“抽样推总”方式,星图数据采用的是“全网普查”方式,对全网18家主流的综合型B2C电商和垂直型B2C电商进行实时监测。“我们自主研发了两套底层系统——iNebula(数据星云)和WarpEngine(曲速引擎),这是我们基于大数据技术自主研发的数据获取和存储系统及数据处理与分析引擎,保障了我们所产出数据的及时性和准确性。”
不过,谷熠也提到,现在的数据处理过程还需要3个小时左右的延迟,希望在明年的“双十一”可以做到实时的数据播报,也就是真正意义上的“直播”。
成立之后没多久,星图数据就推出了“超新星+”计划招募活动,通过申请的企业可以免费享用星图数据D-Matrix产品6个月的服务。被问及原因,谷熠说,在和传统企业的多年接触中,他们发现真正能够理解大数据、使用大数据的企业少之又少:“我们希望能够通过这一计划,让更多的企业了解大数据,体会到大数据给大家带来的好处和便利;也希望更多的大数据公司能够和我们一起扮演大数据传道者的角色,推动行业更快地发展。”
提到“大数据”,人们往往会想到数据安全,谷熠也被无数次问到这个问题。他说,如果从个人数据隐私的角度来讲,数据的来源和范畴其实需要一个比较清晰的界定:什么样的数据属于隐私数据?什么样的数据属于公开数据?行业中对此有很多争论,到现在也还没有一个最终的标准和结论。“除了企业在道德层面的自律之外,也希望尽快能有相关的法律和行业规范出台。”
一个刚刚开始的崭新时代
而“大数据”这个概念在国内火起来也不过两三年的时间。谷熠认为,这个崭新的时代才刚刚开始。他说,虽然很多人都在讲这个概念,但是真正能理解的、能够应用好的还并不多。可以说,大数据的技术和商业化的进程都还在摸索和演进之中,市场也才开始逐步地开放。另外,也不应该只把大数据理解为一种技术或者是一种业务模式,它应该是一种能力、一种资产、一个崭新的市场,或者说是代表着一种新的生活与工作的方式。
那么,“大数据”这个概念会一直火下去吗?谷熠反问:你觉得“电力”这个概念现在还火吗?但是它已经改变了人类的工作和生活,而且它的影响也会一直持续下去。
在谷熠看来,大数据带来的改变一定会在未来极大地影响企业的运作模式和个人的生活方式。因此,星图数据也在考虑如何让自己的数据给消费者提供价值,换言之,B2B之外,星图数据或许会在以后推出B2C的产品。
谷熠曾有10年的产品开发与管理经验,算是资深产品经理了。他曾在知名互联网企业主持设计并研发了一系列基于云计算的信息服务产品、智能分析系统,并分管产品销售及市场工作,还曾参与中央部委的公共服务系统开发,并作为科研院所的专家组成员参与了多项国家标准的编写和制定。被问及创业原因,他说是因为自己有一个用大数据改变世界的梦想。