- 分布式结构化数据表Bigtable
Bigtable是Google开发的基于GFS和Chubby的分布式存储系统。Google的很多数据,包括Web索引、卫星图像数据等在内的海量结构化和半结构化数据,都是存储在Bigtable中的。从实现上来看,Bigtable并没有什么全新的技术,但是如何选择合适的技术并将这些技术高效、巧妙的结合在一起恰恰是最大的难点。Google的工程师通过研究以及大量实践,完美实现了相关技术的选择及融合。Bigtable在很多方面和数据库类似,但它并不是真正意义上的数据库。通过本章的学习,读者将会对Bigtable的数据模型、系统构架、实现以及它使用的一些数据库技术有一个全面的认识。
- 设计动机与目标
Google设计Bigtable的动机主要有如下三个方面。
- 需要存储的数据种类繁多。Google目前向公众开放的服务很多,需要处理的数据类型也非常多。包括URL、网页内容、用户的个性化设置在内的数据库都是Google需要经常处理的。
- 海量的服务请求。Google运行着目前世界上最繁忙的系统,它每时每刻处理的客户服务请求数量是普通系统根本无法承受的。
- 商用数据库无法满足Google的需求。一方面现有商用数据库的设计着眼点在于其通用性,面对Google的苛刻服务要求根本无法满足,而且在数量庞大的服务器上根本无法成功部署普通的商用数据库。另一方面对于底层系统的完全掌控会给后期的系统维护、升级带来极大的便利。
点击加载更多评论>>