分布式存储管理

为什么直接采用关系模型的分布式数据库并不能适应大数据时代的?

  1. 规模效应所带来的压力

    • 传统数据库倾向于纵向扩展(Scale-Up),即增加单台计算机的性能
    • 适应大数据的数据库系统的应该具有良好的横向扩展(Scale-Out),即为集群增加一台计算机
  2. 数据类型的多样化
    传统数据类型:

    • 结构化数据
      大数据时代的数据类型:
    • 结构化数据
    • 半结构化数据
    • 非结构化数据
  3. 设计理念所带来的冲突

    • 关系型数据库 One size fits all ,即面对不同问题不需要重新考虑数据管理问题
      简单来说就是,单一模式可以适应所有变化
    • 新理念 “One size fits one” 和 “One size fits domain”
  4. 数据库的事务特性

    • 传统数据库ACID特性 A(Atom,原子性),C(Consistency,一致性),I(Isolation,隔离性),D(Durability,持久性)
    • 大数据时代的数据库BASE。 Basically Available(基本可用),Soft State(柔性状态),Eventually Consistency(最终一致性)
      根据分布式领域著名的CAP理论来看,ACID追求一致性C,而BASE更加关注A
      一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)
      新型数据库Spanner

NoSQL 特点

  • 模式自由(Schema-free)
  • 支持简易备份(Easy Replication Support)
  • 简单应用程序接口(Simple API)
  • 最终一致性(或说支持BASE特性,不支持ACID特性)
  • 支持海量数据(Huge Amount of Data)

Comments

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×