阿里云产品经理蔡华:从一张照片说起

蔡华:我现在是阿里云的产品经理,之前在阿里云的飞天团队做云产品研发,阿里云其实有一句话叫做云计算是用户教会了我们。实际上在第一天我们做飞天平台的时候,其实我们并不是太了解我们的用户到底要什么,但是在做的过程中,尤其是我们以产品的心态开放出去的时候,包括我们的产品是否完整,包括技术是否稳定等等,在这里特别想感谢在座的各位,是你们教会了我们怎么做云计算。

阿里云产品经理蔡华:从一张照片说起

我想跟大家分享的是,阿里云怎么为移动互联网提供一整套的云计算解决方案。从一张照片说起,咱们拿“手机拍一张照片分享出去”这样一个应用举例,我们暂且把整个开发周期缩短到五天,在五天里面会发生什么样的事情,不同阶段会提供什么样的支撑。我们把五天走完之后,大家也可以看到,实际上我们可以更有规划,前期就可以做好一些研发的准备工作。

第一天,存一张照片,把这个照片能够发给看照片的用户,首先需要有一个运行环境,今天我们有弹性计算,可以帮大家先把环境运行起来。第二个,随着用户访问量增加,一台机器支撑不住,需要把流量分配到不同的机器上去,所以第二件事情我们有负载均衡。第三件事情,我们需要有用户相关的信息,而这些信息需要有数据库。这样的第一天我们的应用就跑起来了。

第二天,假设我们的应用往前走得挺好,用户上来了,数据存储也上来了,这个时候烦恼就出来了。第一个是数据存储越来越多了怎么办呢?你可以存储在云服务器里面,但更好的架构是把前端运行环境和后端存储剥离开来,这时候可以用开放存储服务OSS,开放存储服务是一个对象的存储,它后面能够存储无限大的空间,无限多的对象,有足够多的并发能力,并且它使得用户访问这些数据的时候,不需要经过你前端的机器,所以你不需要买那么多机器只是为了把这些流量给支撑住。另外在数据的安全性上也会有很好的保障。第二个问题是CDN服务。我们去买一个东西,如果东西在新疆,延时很厉害,如果你要买的东西已经在会场的旁边,这时候响应就非常实时,这时候我们可以用到CDN服务。另外我们现在有手机拍摄,图片上传也可以做加速,实际上是利用了CDN反向的通路,通过这个通路就可以以专线的方式上传到我们的服务器上。然后拍了一个图片有各种需求出来,可能要适配不同屏幕的大小,或者我们需要先产生一个缩略图,然后再看原图,如果每个人都要这么去做的话其实也不好做,这时候会用到我们的一个图片服务。最后一个问题是这些图片存得久了,也没有看,但是很有价值或者有一天有人想看到,大家会不会想有没有更低成本的存储,把这些数据永久的存起来,我想要的时候能够拿得到。这属于是一个备份服务,在未来我们也会开发出来,所以这是非结构化存储上面一整个链条。

第三天,有一些用户需要给图片加评论了,另外还有位置信息,我们把这些类型的数据叫做结构化数据,这些数据也需要一个存储,但是它不同于非结构化数据,不同于存图片,存视频,这些数据本身量不大,但是条数非常多该怎么办。这些数据可以存储在大的表里面做高效的存储、查询和访问。这就是OTS能够做的,而且有很高的并发。
第四天,我们把非结构化数据和结构化数据全部管理起来了,是不是就结束了呢?假设这样一个图片服务的应用发展得很好,用户很多了,问题就出来了,我把它理解为幸福的烦恼,因为咱们的开发和运维可能会承担很大的压力,所以程序是人写的,是人写的程序第一天都很难通盘的考虑它的发展过程中各种各样的问题,可能是某个点上有瓶颈,可能处理得不够高效,这时候怎么办呢?其实今天最最有效的办法,这个办法也一直没有变过,就是写日志,写非常多的日志,但是日志怎么管理呢?日志可能分布在一百台机器上面,可能有十种类型的进程,怎么办呢?所以第一个问题日志该怎么管理,有些日志可能要存一周的,有些日志更重要需要存一个月的,有些要存一年的,甚至有些日志是永远不能删除的,这时候怎么办?第二个问题真的出错的话,我们开发运维的人员上去只能看到这些日志存储在不同机器上面,这个时候怎么查,可能里面有一个唯一的IP写进去了但是但是查出来?第三个问题日志太多了怎么搜索,搜索不只通过一个条件,可能通过多个条件。最后一个问题是假设我们做得很先进,这么多日志更多是想处理日志,通过挖掘日志找问题。这些问题在飞天的开发过程中第一天就碰到,但是最后碰到的是五千台的量级上面,去年对外宣布是阿里巴巴达到了五千台规模集群的处理能力,但是这个过程其实很痛苦,在五千台上查很痛苦。怎么办呢?我们自己有一个简单日志服务,它能够进行日志的管理,第二个更好的管理这些数据,第三更有效的搜索,这样的数据阿里云做了五年的时间,我们会在未来几个月里面把这些服务开发出来。

第五天我们要想一些应用方面的问题。哪些图片是热门?用户对什么样的东西感兴趣?用户来自于哪些地区?咱们的手段是什么?需要数据处理,只有通过数据处理才是一种系统化的办法,能够让这个应用长期的跑下去。做这些数据处理,数据在哪里呢?其实很大程度上是运用日志服务搜集起来的,就像我们阿里巴巴内部做大数据处理的能力。

我们简单回顾一下,第一天让大家考虑的是应用托管,怎么样用简单、快速、有效的办法能够把服务搭建起来,这是阿里云提供的服务。弹性计算,ECS,SLB,RDS。但是第二天的时候一定会碰到存储的问题,就是非结构化数据管理,怎么办?就是OSS,CDN。这时候大家考虑的是既能够把数据存下来,成本越低越好并且数据永远不要丢失这是最好的。第三个是结构化数据管理。第四天是日志管理,其实最好在第一天的时候能够考虑到,这样的话我们可以快速往前走。最后一个是数据分析,数据分析在第一天可能用不到,但是这是一个最大的问题。

该日志由 91aliyun 于2014年02月25日发表在 经验分享 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。

转载请注明:阿里云产品经理蔡华:从一张照片说起

关键词:蔡华
分享到:

阿里云产品经理蔡华:从一张照片说起:等您发表观点呢!

发表评论


快捷键:Ctrl+Enter