阿里1111交易创全球新记录 专业技术Hold住全场

2012-11-14

 阿里1111交易创全球新记录 Hold住全场靠的就是专业技术:“11月11日零点,中国网民对国内最大的C2C交易平台淘宝网和B2C交易平台天猫网,发动了猛烈的DDoS攻击,疯狂购买刷新支付页面,发动攻击10分钟后,支付宝交易额瞬间就突破2亿5000万,目前攻击还在继续......”微博知名网友“互联网的那点事”以“DDoS”攻击来形容凌晨的交易状况。

在经历了过去24小时的网友猛烈“攻击”后,在1111购物狂欢节中2.13亿消费者最终成交191亿,这远远高出美国网络星期一全美网购销售额人民币78亿元人民币的记录。支付宝的成交笔数也以1.058亿的规模再创下全球记录。在技术层面而言,这是国内协同面最广、规模最大的一次互联网巅峰实战,也是互联网技术的一大胜利。

史上最可怕“DDoS”攻击袭来 系统保持坚挺

“11月11日零点,中国网民对国内最大的C2C交易平台淘宝网和B2C交易平台天猫网,发动了猛烈的DDoS攻击,疯狂购买刷新支付页面,发动攻击10分钟后,支付宝交易额瞬间就突破2亿5000万,目前攻击还在继续......”微博知名网友“互联网的那点事”以“DDoS”攻击来形容凌晨的交易状况。

事实上,这很可能是有史以来最大规模的“交易攻击”。1分钟内,超过1000万人涌入天猫,带来了上亿的PV,网站交易系统的订单创建峰值达到了惊人的 1秒45万笔订单,其瞬间并发量也创造了历史。24小时内有2.13亿消费者上天猫网站,整体系统经受了最高每秒2.1Tb的网络流量。在这样规模冲击下,天猫与支付宝系统均未出现宕机等事故,保障了交易进程的完整与可靠。

“进步非常明显,2010年的时候网银宕机还比较多见。2011年的时候部分网页刷新变缓,而今年购物除了凌晨的半小时之外较为畅通。”一些技术人士在微博上表示。

经过3年的积累,从活动策划到商家沟通、网银协调以及技术保障等都有了成熟经验。“我们比较早在开始相关的技术筹备,在自有系统层面,约有3000多位工程师参与。硬件上有十多万台服务器,部署了150多个CDN节点。预防一些特殊(比如突然断电、空调坏了、网络中断等)的发生,以及处理各种外来攻击。更重要的是作为平台,1111也有各大网银、电信运营商、ISV、以及数万商家的工程师们的参与协同。所以这是一次国内互联网技术的综合大考验”。阿里集团技术共享平台负责人刘振飞表示。

据了解,为了支撑天猫与淘宝庞大访问,阿里集团在全国部署了可每秒传输数Tb的CDN系统,而随着业务需求的增长,当前阿里自建的CDN体系规模与性能已经超越大部分专业CDN厂商。预计年底还将通过阿里云将该部分服务能力予以开放。

在这些技术准备下,仅仅37分钟,支付宝交易额突破10亿大关!最终在24小时内,天猫和淘宝一共产生191亿支付宝成交额。

高并发下的弹性恢复

不过,强大的消费力远远超出了原先的预期。凌晨开始后,便有1000多万用户同时提交订单,这让整体系统在0:01分遭遇了史无前例的高并发冲击,部分用户出现购物车创建订单不及时、支付困难等不良体验。

“我们设计的3代架构24小时处理交易订单的能力是1亿级,但在0:01分瞬间我们接到了远超设定的订单量,我们抗住了没宕机。为确保在我们后方的网银等整体支付系统的稳健,随后采用了弹性措施,半小时之后平滑运行。”支付宝CTO李静明对记者表示,超预期与瞬间高并发是最大难题。

据了解,对于1111狂欢节,阿里集团在技术方面准备了2倍以上的冗余设计。但事实上,汹涌的消费者带来的是5倍以上的需求。对此,工程师随即采用了弹性扩容等方式予以应对,服务器未宕机、功能模块正常,整体系统表现健壮。

据悉,瞬间高并发处理在电商领域特别典型。在诸如“秒杀”、“1111狂欢节”等大规模的促销活动时,电商面临的瞬间压力更为严峻。这与搜索引擎网站、IM通讯工具以及游戏视频等网站情况有所不同。

“我们验证了一些新技术,也发现了极端交易量带来的罕见异常。好比登山看雪莲一样,既有雪山的冰寒也有异乎寻常的成就感,这要是在平原不可想象。”刘振飞表示,在总结相关经验后,会积极与同行作交流。

尽心做到细节才有1111

事实上,技术的高低往往在极端情况下才会显露。

一些网站应用在平时交易场景下毫不起眼,但一旦进入到1111这样的节日,一些变量会急遽放大,从而影响部分组件性能,引发系统的自动过载保护。天猫产品技术部一位工程师从交互日志中敏锐地发现部分调用过频,赶在活动前完成修正,从而避免了成为系统不稳定因素。还有工程师反复推敲容灾机制启动时的逻辑,发现了异常,解决了极端流量下可能引发商品价格变回原价的潜在风险。

“双十一没有伟大的IDEA,只有伟大的细节,那些尽心去做细节的人是伟大的。”天猫产品技术部负责人王曦若表示,只有不断反复推敲技术方案,在平日琢磨反思细节,才可能做好技术。

聚石塔处理20%天猫订单 实现零故障

在服务商家的后台IT系统方面,天猫聚石塔电商云等对外服务也得到来自电商和ISV(软件服务商)的好评。“双十一疯狂流量和暴增的预售订单使客户的传统服务器和网络访问压力巨大。我们五分钟内将用户的系统从传统服务器切换到聚石塔,订单等数据无缝迁移、流畅下载!!客户开心的庆祝!”ISV富润科技在1111启动后火线协助客户迁移至云端,避免系统崩溃。

聚石塔成为电商避风港。1111购物狂欢节成为百胜,商派,管易、又一城等ISV秀能力的最佳机会。这与2011年时遭遇订单丢失商家满头包的场景不可同日而语。

据聚石塔负责人王文彬透露,在今年启动聚石塔服务之后,当前约有20%的天猫订单在塔内的商家后台系统处理完毕,实现零故障,零掉单,预估明年双11会实现100%天猫订单在聚石塔内处理。

自研与开源并重 推进绿色定制硬件

在1111狂欢节中应用到的技术,既有自行研发的飞天系统,也有大量的开源软件技术。事实上,阿里集团还是国内最活跃、贡献最大的开源组织。

截至当前,阿里巴巴集团已经对外开源了包括TFS分布式文件系统、Tair存储系统、OceanBase分布式数据库、Tengine、TBSchedule、KISSY等几十个重量级的开源软件和框架,为Linux内核提交了150多个patch,是国内提交patch最多的企业。阿里集团还维护了自己的Hadoop、MySQL、JVM等大型开源软件的分支。

为了做到可靠性更高、整体能耗以及单位交易成本的降低,阿里巴巴集团也从系统研发向定制硬件、设计服务器、自建数据中心等方面推进。

在本次1111当中,已经应用到多个采用了创新的高压直流技术的成熟绿色云数据中心,这些数据中心还采用了自行定制交换机,基于Atom处理器定制的低功耗服务器的单机功耗仅为普通服务器的1/6,整体能耗表现比传统数据中心节能13%以上。这些定制服务器规格目前已经完全对外开源开放。

关键词索引:阿里 1111 交易 记录 技术 全场 活动策划

推荐阅读

  • 关于我们ABOUT