分布式存储管理

为什么直接采用关系模型的分布式数据库并不能适应大数据时代的？

规模效应所带来的压力
- 传统数据库倾向于纵向扩展(Scale-Up)，即增加单台计算机的性能
- 适应大数据的数据库系统的应该具有良好的横向扩展(Scale-Out)，即为集群增加一台计算机
数据类型的多样化
传统数据类型：
- 结构化数据
  大数据时代的数据类型：
- 结构化数据
- 半结构化数据
- 非结构化数据
设计理念所带来的冲突
- 关系型数据库 One size fits all ,即面对不同问题不需要重新考虑数据管理问题
  简单来说就是，单一模式可以适应所有变化
- 新理念 “One size fits one” 和 “One size fits domain”
数据库的事务特性
- 传统数据库ACID特性 A(Atom，原子性)，C(Consistency，一致性)，I(Isolation,隔离性)，D(Durability,持久性)
- 大数据时代的数据库BASE。 Basically Available(基本可用)，Soft State(柔性状态)，Eventually Consistency(最终一致性)
  根据分布式领域著名的CAP理论来看，ACID追求一致性C,而BASE更加关注A
  一致性（Consistency）、可用性（Availability）、分区容错性（Partition tolerance）
  新型数据库Spanner

# NoSSQL特点, 分布式存储管理