博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 1917|回复: 1

云计算之漫谈

[复制链接]
发表于 2010-3-2 13:57:48 | 显示全部楼层 |阅读模式
一,风起云涌
08年,一片云飘到IT界原本就日新月异的上空,犹如山雨欲来风满楼。随后,业界大鳄之如Google,IBM,Amazon,Yahoo, 已被收购的SUN,Microsoft,Intel,HP等,学界如UC Berkeley,UIUC纷纷攻城掠地,各自推出自己的云计算平台或者开始尝试新构建、运作以及安全策略。咋看之下云计算之天下似已初分。

小文余下部分如此结构,不对已有知识做过多叙述,比如云概念啊,云特点啊,这些去读第一手的资料比由我介绍来的强,博文么,就写写自己的想法吧。第二部分对耳熟能详的云计算谈谈其云概念;第三部分,说说已有云平台技术及一些学界研究动态;第四部分,对云计算之云安全方面述说一下学生的浅薄了解;第五部分,叙说云计算的前景以及发展之云策略。由于学生初识云计算不久,对许多技术细节仍一知半解,叙述带有一定的主观性,其中不妥之处,还望不吝指教。

二, 云卷云舒之云概念

时至今日,学界已经不甚讨论云计算的概念,云计算的概念,在听过的一个讲座上,演讲人说可谓各家自有其说,学生断然不敢自己定义亦不敢擅自引用,但是云计算应该具有的性质特点倒是可以集众家之说:超大规模,虚拟化,高可扩展性[1],对计算资源进行动态切割、动态分配,交付的是服务[2],按使用量付费[3]等。

从分布式计算和并行计算到网格计算到云计算,看上去是一条越走越宽的路。但是任何发展——前进的或者后退的——都有自己背后的规律,云计算之横空出世,是硬件计算能力、存储能力,文件系统处理能力、网络技术、虚拟化技术以及用户需求空前强大背景下的必然。分布式计算和并行计算的提出使得人们可以共享和并行处理计算资源,在单机计算能力一定的限制下通过计算单位数量的累加以及软件结构的支持(如CORBA)取得计算吞吐量上的增长;网格计算比分布式计算更加强调连接[2,4];而云计算,在关注计算资源和计算能力的分享后,强调计算中心交付的应该是服务,而且这种服务是可以是互动的,动态调整的。

企业应该提供的服务能力不是针对平均用户存储要求和计算能力要求,而应该能满足最大用户的要求,而超过普通用户资源要求水平的服务请求在可预见的未来会只增不减。用户对资源的要求,首先应该是大规模甚至超大规模的存储,而后才应该是超大规模的运用存储资源的能力,比如计算,修改,更新,传输等。无论是分布式计算、网格计算还是云计算,都企图对整个网络上的资源进行大而化一管理,犹如在单个机器上通过操作系统对单机资源进行无二义性管理,但是由于网络中单个节点的异构性,并发要求,乃至独立占有资源的请求等特性,这个最优化管理全部资源的宏伟愿望,其实现只有严重依赖可靠的软件技术,通过对硬件层次的不同层次的抽象来掩盖异构性和异地性,又通过赖为核心的软件技术通过文件系统的映射等技术实现资源的统一管理和定位。在这种需求和产品的博弈中,很难概括说究竟是需求推动了技术还是技术推动了需求。云计算的出现,也是如此。

在业界,概念的提出、技术的实现和市场的占有有着巨大的区别,纵使在云计算概念早已深入人心且已有可供使用的云计算平台,关于企业是否应该采用云计算以及在租用云平台和搭建自己的云平台之间,仍然不是人人有统一的答案,而Campbell等在[5]中给了他们的答案:在给出Amazon AWS的单位存储和单位计算的月租金以及按照hardware:power:network = 45%:40%:15%的比例搭建自己云平台费用,可以得到,如果使用平台的服务持续超过12个月,适合拥有自己的云平台,而服务时间多余6个月,就已经适合拥有自己的存储平台。

一项服务被用户所欢迎,技术功能是最主要的,下面,我们看看已有的云平台和可能的云计算新技术。

三, 在云端之云平台

自Amazon首先推出其云计算服务以来,IBM有了自己的蓝云,Google有App Engine,Microsoft有Azure,Salesforce有Force.com,被Oracle收购的Sun也曾有自己的Network.com,硬件厂商Dell也在08年申请与计算商标,欲使用硬件上的定义上从这一领域分一杯羹,Intel,HP,EMC等厂商也不甘落后,提出或参与云计划。而Open Cirrus[5]更是一个由HP,IDA,Intel,KIT,UIUC,Yahoo共同参与尝试的分布面更广、可测试更多运用的云计算测试平台。国内企业阿里巴巴,趋势科技等也分别提出自己的云计算理念并展开相关研究。那么一个成熟的云计算平台应该具有哪些基本功能呢?

云计算,首先是云存储,这一点上Google似乎更有先见之明,现在已经在利用其广泛的用户群占领市场,提出了Gmail之外的“Google文档”服务,虽说由于某些限制现在只能提供文档上传和共享等服务,但是随着技术攻关的突破,越来越大的存储量和越来越好的安全性能不是没有可能。云存储之后,是对资源的共享访问等管理操作。就对文件系统的管理来说Google的GFS,及其某种意义上的克隆品HDFS和Kosmix的KFS,虽说没有提供POSIX接口,但是也各自被广泛运用。

毫无疑问,Web是支撑云计算框架的基础,但是在云计算框架内部,仍然有许多问题需要解决,对物理资源的直接访问的,任意节点对全局服务的获取[5],巨量增加节点时框架内部的过渡调整,资源访问的粒度和安全粒度,资源的备份和硬件资源之间的平衡,对标准接口的实现,用户或者第三方自己可能使用接口做的自我扩展等等等,这一技术无一不约束着云计算的发展。

对一个企业来说,拥有自己的云平台,有着极其重要的意义,可以自主地进行自己的研究和测试,也可以给客户提供体验的平台,最重要的是,在技术上不受其他平台提供商可能的限制和威胁,这一点对国内的企业来数,尤为重要。

在平台的搭建上,Google可谓是领头羊中的榜样,其GFS(Google File System)、MapReduce,BigTable三驾马车可谓是能够用来开天辟地的利器,从Google依次实现的这三种技术,也可观Google在背后的计谋和野心,GFS实现了超大量存储的管理,使得云存储成为可能,而MapReduce则实现了在超大量存储上的数据处理,MapReduce使用其自身提供的编程模型,可将大量乃至超大量计算任务抽象后使用分治(Map)分别实现为中间结果,在使用规约(Reduce)对中间结果进行合并来完成处理。而Big Table实现了结构化数据的存储。这三种技术结合着就完成了云的构建、管理、操作和操作结果存储一揽子服务,针对存储空间和计算时间这两个核心和致命角度入手,铺平了后续研究和拓展的道路。由此也可见Google的战略眼光,不局限于任何一步,而是有系统地为后续步骤垫步。

单从平台搭建上来说,已通过Web或者操作系统或者存储技术在先前在其他领域占有市场的企业无疑具有先机,如Google可利用其搜索引擎市场用户占有份额在其搜索业务之外顺便地提供云服务,比如Google文档;IBM可利用其广泛的用户市场和技术背景快速的布置其云平台和相应服务,Microsoft、Amazon,Yahoo,HP,EMC等等都可在其已经拥有的存储和计算平台上进行拓展或者添加,就可以很快的实现云平台的搭建和运行。在这一点上,国内IT企业,就有了明显的不足。首先,具有大市场接触面和超大量存储能力和广泛存储资源分布的企业少之又少,翘楚如阿里巴巴,百度,拥有巨大用户面的腾讯,网易等在云平台搭建方面还没有长足表现。没有大范围搭建存储平台,没有整理和管理内部的计算资源,更没有协调一致地,如Google那样地有自己的运作体系。或者,还徘徊在云计算和云安全的概念上,没有具体的可行的动作。更不见有业界内的交流和合作,比如利用各自的已有资源,共同开发具有统一接口的平台供内部研发和测试以及供潜在用户体验。这些,都是可见的落后,而背后则隐藏着国内IT企业的战略目光的落后。这个稍后在云策略里给出自己的思考。

四, 不知所云之云安全

在信息就是价值的信息社会,像先前的任何一种基于网络的服务一样,云平台由于其潜在直接和间接价值,必然会在信息安全上受到威胁,而要做到让攻击方不知所云,就需要出色的云安全技术。

传统的分布式计算系统和数据库、数据仓库技术已经具有一定的安全技术和较成熟的安全防御体系,但是,在新的云计算的平台里,仍然需要新的安全技术,云计算一个显著的隐患是一旦用户将数据上传至云平台,用户将对数据失去控制。这将从根本上影响云计算的研发和推广,其他隐患包括信息完整性,对数据访问的独立性等。

在Open Cirrus[5]中,Camphell等提到在他们的云测试平台里,只有通过两方以上的授权,才可访问和操作云平台数据。但是这一方法在出现“内鬼”时怕是难以防范了,可参照经典的拜占庭将军问题[7]。John Krautheim在[6]中提出一种新的安全策略,Krautheim将其提出的私有虚拟结构(Private Virtual Infrastructure:PVI)分为两层,对应着将安全职责分划到云服务提供商和使用者的两个方面,其中云服务提供商承担云服务的物理层安全和逻辑安全。云服务使用者负责为他们的虚拟结构提供合适的防火墙、入侵检测系统以及必要的监控和日志记录来保证信息的保密性。通过安全任务的”分治”和安全验证时的“规约”来实现云安全。

[6]中提出的将安全策略分治的方法是一个可能的云安全趋势,云服务提供者从云平台底层对数据进行存储、操作和管理,可以从硬件底层到文件系统到高层的抽象操作等多方面方便地入手安全事务,而用户的互动参与可以视具体情况而给予对应抽象层的信用等级和权限。而一种可能的细粒度方法可以是从硬件底层的内存空间对数据进行标签染色,而后可以使用标签跟踪数据的操作过程或者安全验证标签,这一点可从云平台搭建时入手,也可以从软件上对数据进行类似思想的着色,同样用于数据的追踪和保护。

云平台的一个理想趋势是用户或者第三方可以自己使用云平台提供的接口进行扩展,这也涉及到可以给予非特权扩展者的权限和权限验证策略。

安全领域一直是“道高一尺魔高一丈“的状态,是一轮又一轮”攻击-防御-平衡”的动态平衡演变,攻击和防御技术相互领先着共同向前发展,恐怕是一场永远的赛跑吧。没有任何一方可以一劳永逸的占据绝对优势,这一道理在云安全上同样适用。

五, 人云亦云之云策略

Amazon等巨头拉起云计算的大旗,随后国内外多家企业陆续涉足这一领域,可谓人云亦云,一片“百家齐放”的景象,但是,可能会像以往的IT领域一样,竞争到最后呈少数几家“数足鼎立”甚至“一家独大”的市场情况。目睹先后参与搅云计算这趟浑水的企业,有搜索如Google,有Web存储和电子商务如Amazon,有全面选手如Microsoft,有存储大鳄如EMC,有数据库巨头如刚收购Sun的Oracle,有硬件厂商如Intel。分别是搭平台的搭平台搞产品的搞产品。而国内的企业如趋势科技早在08年就开始思考云安全,阿里巴巴也已宣布其云研究计划,其他亦有有潜力的选手如腾讯,百度和网易。国际市场是风云再起,国内市场是紧锣密鼓。将有一场如何的博弈,将是所有人期待的好戏吧。

Oracle并购Sun再一次说明有一流市场的企业可以有足够的能量收拾只有一流技术的企业,对业界巨头如Microsoft等,用资金等方式换取其他厂商的技术也是未尝不可。抛却这种因素而只是从云计算研究的方面来看,对一个想要在未来云计算市场分一杯羹的企业来说,最重要的莫过于有依靠自己技术搭建的云平台和衍生的服务。前面在第三部分已经述说了云平台之于研究开发和供用户体验的功能,在[5]中在硬件上从经济角度计算和比较了租用和自己搭建云平台的费用开销。撇开经济开销不谈,只是从平台的可获得性、可维护性、可拓展性来考虑,大到可能的政府信息安全小到企业自身的数据安全都说明拥有自己独立云平台的重要性。而从吸引用户角度来说,最早的无疑是最新鲜的,而提前多占有1%的市场在日后需要花多大代价来挽回,各个企业应该各自有体会。

就搭建云平台来说,不同企业也可以根据自身情况巧选角度入手。如Google在其已有的搜索和存储平台上可以方便地对已有用户推销新的云产品和技术;Microsoft更是在多方面拥有稳定的产品平台和市场结构;存储企业如EMC,其已有产品已经用狗成熟的云存储基础和数据管理系统,想在在其上搭建云平台应该只不过是时间问题,任何一个已经拥有稳定的存储架构和市场系统的企业,都可以在已有业务和平台上搭建自己的云平台,这只是技术突破的早晚问题。而对于目前没有成熟市场和产品架构的企业,想入足云计算市场,能依赖的只有技术了,如存储领域、文件系统领域、资源管理领域、安全领域。

而要在一个领域长远立足,要考虑的就不仅是技术了,前段时间网上传播的一篇博文《百度之死》,就尝试着从一个企业的长远发展战略角度说明企业拥有自己的产品定位和产品架构,拥有自己的扩张线路和抢占市场的产品研发策略。最重要的,莫过于再最初的时候能清楚定位,弄明白自己的技术特色和产品市场,然后静下心来勤恳作业。

国内企业可以做的,除了上面几个方面,也可以多家联手,充分利用硬件平台和技术开发手段,巩固和发展国内市场,也许在众多国际企业的虎视眈眈下,这样做可以来的更快更好。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2024-11-24 23:22 , Processed in 0.090183 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表