携程与支付宝“宕机”事件一出,便引起轩然大波,但这并非偶然事件。在更早之前的2014年,国内知名漏洞报告平台“乌云网”便公布了携程由于支付漏洞导致的用户信息泄露事件,泄露信息包括用户姓名、身份证、银行卡号等个人信息。近年来,每个人都能感受到互联网带来的方便快捷,但持续的安全事件也暴露出互联网公司滞后的安全措施。
系统瘫痪后,为何会有长达12小时的恢复时间?携程对此解释为后台提供支持和服务的子系统众多,技术人员需要恢复并确保每个子系统及Web Service的功能正常,还要同时确保每个子系统与WebService之间的调用关系得以正常执行。因此需耗费长时间来进行调试。
携程的技术架构代表着现在主流的IT架构方向。随着技术的发展,用户在使用互联网服务时,后端的技术越来越不可见。但是在后端,每一个服务可能都有数百上千台服务器同时提供支撑服务,还包括因为关联关系产生的其他子系统的调用。用户量越大的系统,其IT系统的复杂程度越高。这样的IT环境也决定了在做安全防护时需要注意的事项更多,需要在安全上的投入更多。
但是作为一个不产生直接经济效益的岗位,长期以来,系统运维和安全防护在企业内部得不到太多的重视。在乌云漏洞平台上,可以直观看到每天被提交公布的漏洞数量,其中不乏知名公司。
如携程这般SOA架构的网站,后台有上千个应用子系统组成。由于现今互联网架构本身就是各种松散耦合的系统,彼此之间相互依赖,相互调用,因而任何一个系统甚至组件出现问题,都有可能影响到整个系统的安全。当初OPEN SLL漏洞造成全球范围内影响的案例,如今并不鲜见。因此,企业对于安全人员的技术要求也在不断提高,需要时刻保持信息更新。安全问题本身永远没有尽头。
笔者曾经服务于一家提供容灾软件(即在遭遇灾害时保证信息系统正常运行,帮助企业实现业务连续性目标的软件)的服务商。一般在容灾方案中都会列有相应的容灾演练方案,但实际的情况是,超过90%的客户不会进行相应的容灾演练。因为这样的演练在任何一家公司都是耗时耗力的过程,不仅牵涉所有系统依赖关系的梳理,还涉及到每个业务部门的管理协调。在没有发生事故之前,这样的演练很难形成长期制度。由此也可以理解,为何携程在事故发生后花费长时间才能恢复。只有在企业内部形成完整的安全流程,并彻底执行之,才能最大限度减少安全事件的危害。
互联网发展至今,已愈发成为日常生活中不可或缺的基础服务,处于行业主导地位的互联网企业为用户提供了绝大多数的信息服务。他们对用户的价值,实际上已不亚于类似电信、电力这样的企业,他们的崩溃也将是一个普遍性的灾难。但是,从行业层面而言,企业大都把目光投向新的业务、新的增长点,对于系统安全不加以重视;从法律层面而言,没有相应规定或者法规对互联网服务提供者的安全行为加以规范。任何行业的安全,都需要企业花一百分的精力去防止万分之一的可能。在此之中,需要企业的社会责任感,还需要监管机构的力度。
张俊峰
……
关注读览天下微信,
100万篇深度好文,
等你来看……