为什么直接采用关系模型的分布式数据库并不能适应大数据时代的?
规模效应所带来的压力
数据类型的多样化
传统数据类型:- 结构化数据
大数据时代的数据类型: - 结构化数据
- 半结构化数据
- 非结构化数据
- 结构化数据
设计理念所带来的冲突
- 关系型数据库 One size fits all ,即面对不同问题不需要重新考虑数据管理问题
简单来说就是,单一模式可以适应所有变化 - 新理念 “One size fits one” 和 “One size fits domain”
- 关系型数据库 One size fits all ,即面对不同问题不需要重新考虑数据管理问题
数据库的事务特性
- 传统数据库ACID特性 A(Atom,原子性),C(Consistency,一致性),I(Isolation,隔离性),D(Durability,持久性)
- 大数据时代的数据库BASE。 Basically Available(基本可用),Soft State(柔性状态),Eventually Consistency(最终一致性)
根据分布式领域著名的CAP理论来看,ACID追求一致性C,而BASE更加关注A
一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)
新型数据库Spanner
NoSQL 特点
- 模式自由(Schema-free)
- 支持简易备份(Easy Replication Support)
- 简单应用程序接口(Simple API)
- 最终一致性(或说支持BASE特性,不支持ACID特性)
- 支持海量数据(Huge Amount of Data)