当前位置:首页 > 全部子站 > 论文网 > 财务管理论文

阿里数据到底有多美?

来源:长理培训发布时间:2019-02-21 12:33:53

  彭蕾和自己女儿同学的妈妈打赌,因为对方不相信孩子的专业课本――《天目山植物学实习手册》能在淘宝上买到。结果,同学妈妈搜到了此书的25个卖家链接后,瞬间折服。 
  接下来,这位妈妈只要一登录淘宝或阿里旺旺,天目山、莫干山等各种“山”,植物学、动物学等各种“学”,甚至从大学英语到旅游手册,无数相关商品扑面而来,所有的依据,就是其仅有的一次搜索。 
  她感慨自己瞬间就“被大数据”了。而参与打赌的彭蕾,正是阿里小微金融服务集团CEO。 
  在历时近一个月的调研活动中,《财经国家周刊》记者所见阿里金融剑之所向,是成为环境舒适安全、人流络绎不绝的全维度大“超市”――无论银行、证券、保险,抑或拥有数据和技术的互联网公司,将统统会在该“超市”上架。 
  而整个阿里集团,也将转向定位于大数据服务商和技术提供商,不卖数据卖分析,不卖硬件卖服务。“马云想要的,是下一个IBM。”阿里一位高管说。 
  不过,在央行一位官员看来,阿里能提供给客户的大数据产品,瑕疵不少而且安全难保,“一切并非所见的那么美好”。 
  “毛细血管”的野心 
  阿里原安全部技术总监蒋韬说,阿里的大数据技术至少全球前三,甚至已超过另两位――亚马逊和谷歌。8000多人的技术团队,从2003年底第一笔支付宝交易以来的10年内,他们已铆足劲头,等待爆发。 
  阿里大数据之战的战略核心,就在于此。 
  阿里小微金融服务集团副总裁俞胜法给出一组调研数据,称传统银行的客服、柜台和客户经理人数占比达80%左右,数据工作人员不足10%,而阿里微贷事业部采用数据化决策,60%从事数据相关工作,余下则主做数据底层架构搭建。整个阿里的金融团队,90%的人每天与数据打交道。 
  目前,阿里拥有全国最大的Hadoop分布式计算集群,日增数据50TB(数据存储单位,1TB=1024G),有40PB(1PB=1024TB)海量数据存储,分布于全国80多个节点的CDN网络,支撑流量超过800Gbps,即同时支撑对数十亿商品的实时搜索和记录。 
  关键的是,所有访客行为都被如实记录。部分数据采用1:120的高压缩极限存储技术,通过由3000多台服务器组成的“云梯”超大规模数据系统,以及阿里自研的ODPS数据系统,持续挖掘和分析。 
  “有人说我们要卖数据,也有银行来洽谈,但其实数据是不卖的。”俞胜法很直接,说阿里倾尽全力打造的大数据库,难以定价。 
  他表示,阿里每一步的初衷都很简单,成立支付宝,意在解决网购双方信誉和担保问题;余额宝,是为减少网购涉及的银行备付金及其利息;涉足小贷,则是为了让无厂房、无固定资产、无财务报表的淘宝卖家们,能有融资和生存之路。而眼下的大数据金融,是意在满足市场对高效金融服务的需求,并带动淘宝卖家实现电算化。 
  那么,捂着这些数据黄金,马云究竟想做什么? 
  “�R云要自己动手取代IBM。”前述阿里高管告诉《财经国家周刊》记者。 
  具体的商业模式,是阿里将拿出5000台服务器的系统处理能力作为基础,将大数据库作为核心竞争力,免去银行建机房、造系统的成本,只出具少量服务费就能享用阿里式服务。 
  “银行将继续做金融系统主动脉,阿里一边做毛细血管,一边做数据和技术服务商。”前述高管勾勒出一幅蓝图――待纳入基金、证券、保险等机构后,拥有巨量金融信息的阿里平台就将诞生。 
  局限性质疑 
  对此,有人提出异议。 
  央行一位司局级官员指出,阿里前述商业模式明显有三点局限性―― 
  首先,阿里90%以上的数据来自含淘宝、天猫在内的“大淘宝”,支付宝实名制用户2013年底接近3亿人,但与“大淘宝”高度重叠。阿里只能驾驭自有平台的数据,之外则无优势。 
  “我们确实在数据采集上存有局限。”前述阿里高管也坦言,他本人就少有网购行为,“数据库中可能找不到我的信息”。 
  加之京东、1号店等电商崛起,同一客户在不同电商平台的表现是否一致,不同平台的分析结果谁更准确等问题,还有待商榷。并且,阿里的客户群相对单一和同质化,一旦风险袭来则很难把控。相比之下,银行却拥有众多细分市场和细分风险模型,小微业务即便做砸了,也不至全盘皆输。 
  其次,阿里宣称其具备确认支付宝用户信息的能力,但其实,开设支付宝账户必须链接至少一张银行卡,身份确认的工作和成本,早已由银行付出,阿里只是借力而已。 
  不仅如此,阿里也不应具有对客户数据的交易和处置权,至少应该在征得被搜集人许可后才能进行买卖。相比之下,银行线上线下的业务办理,均会书面通知客户信息将被部分抓取,行为明显规范得多。 
  其三,阿里目前呈现的数据产品,不包含细节信息和分析过程,仅是所谓评分系统给出的信用评分,不但真实性、可信度打上了问号,其评分标准亦可能各执其词。 
  例如,全球银行普遍使用的美国FICO个人信用评分系统,是在依据高达100万的大样本数据进行验证与核对的基础上,才开始使用的。阿里的大数据模型,却尚未经过数据检验和修正。 
  “金融数据必须足够准确。阿里的产品缺乏标准,如何负起不良率的风险连带责任?”一位有着阿里背景的高盛人士质疑,“一个负责任的银行,绝不会轻易购买。” 
  是故,一些数据源匮乏的中小银行,就算高价买来阿里数据也难以二次使用。P2P和小贷公司等机构,则往往囊中羞涩,掏腰包也会“货比三家”。 

责编:荣秀

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

国家电网校园招聘考试直播课程通关班

  • 讲师:刘萍萍 / 谢楠
  • 课时:160h
  • 价格 4580

特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关

配套通关班送国网在线题库一套

课程专业名称
讲师
课时
查看课程

国家电网招聘考试录播视频课程

  • 讲师:崔莹莹 / 刘萍萍
  • 课时:180h
  • 价格 3580

特色解密新课程高频考点,免费学习,助力一次通关

配套全套国网视频课程免费学习

课程专业名称
讲师
课时
查看课程
在线题库
面授课程更多>>
图书商城更多>>
在线报名
  • 报考专业:
    *(必填)
  • 姓名:
    *(必填)
  • 手机号码:
    *(必填)
返回顶部