数据库范式
标签:MySQL

数据库范式

范式:是“符合某一种级别的关系模式的集合,表示一个关系内部各属性之间的联系的合理化程度" 简单来说可以把它粗略的理解为一张数据表的表结构所符合的某种设计标准的级别。满足这些规范的数据库是简洁的,结构明晰的,同时不会发生插入,删除和更新操作异常。

数据库范式分为1NF,2NF,3NF,BCNF,4NF,5NF,一般我们在设计数据库结构的时候最多只要满足到BCNF就可以了,符合高一级别的范式必定满足符合低一级别的范式。

1. 1NF

数据库第一范式:

  • 数据库表中的所有字段都只具有单一属性
  • 单一属性的列是由基本的数据类型所构成的
  • 设计出来的表都是简单的二维表

在使用数据库建表的时候都符合1NF,如果不满足1NF,是不能创建成功数据库表的。

2. 2NF

2NF要满足1NF,此外还包括两部分内容:一是表必须有一个主键,二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。

如果存在的话,应当将这个属性和主关键字分离出来形成一个新的实体,新的实体和原实体是一对多的关系。不符合2NF的容易产生冗余数据。

OrderDetail:(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)

因为我们知道在一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID),Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合 2NF。不符合 2NF 的设计容易产生冗余数据。

可以把 OrderDetail 表拆分为:

OrderDetail:(OrderID,ProductID,Discount,Quantity)

Product:(ProductID,UnitPrice,ProductName)

来消除原订单表中UnitPrice,ProductName多次重复的情况。

3. 3NF

要满足2NF,且非主键列必须直接依赖于主键,不能存在传递依赖,即不能存在A依赖主键,B依赖A这种情况。

一个订单表:

Order:(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)

其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。

通过拆分**Order**为:

Order:(OrderID,OrderDate,CustomerID)

Customer:(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 3NF。

第二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是直接依赖于非主键列。即2NF消除部分依赖,3NF消除传递依赖

参考文章:数据库(第一范式,第二范式,第三范式)

4. 反范式化

有的时候我们为了提高性能和读取效率,适当对数据库设计方式的要求进行违反,而允许存在少量的冗余数据,即我们用空间来换时间。

对比范式化与反范式化

由于范式化可以尽量的减少数据冗余,故更新操作比反范式化更快,而且范式化的表通常比反范式化的更小。缺点是对于查询需要关联多个表,由于在不同的表中,也难对索引进行相关的优化

反范式化可以减少表的关联,也可以更好的进行索引优化,但存在数据冗余即数据维护异常,也需要更多对数据的修改成本。

  • 4 min read

CONTRIBUTORS


  • 4 min read