Database: 数据库函数依赖 平凡函数依赖 非平凡函数依赖 完全函数依赖 部分函数依赖 传递依赖 多值依赖
在我们学习数据库的范式之前,我们需要理解一下有关函数依赖的一些知识。
我们数据库中常说的函数依赖其实是数据依赖的一种,数据依赖除了函数依赖还有多值依赖和连接依赖。其中最重要的是函数依赖。
函数依赖的概念
函数依赖是关系模式中各个属性之间的一种依赖关系,是规范化理论中最为重要和基础的概念。
为了便于理解,直接通过以下一个例子进行讲解。
学号 | 姓名 | 专业名 | 性别 | 出生日期 | 本学期学分 |
42014601 | 小明 | 信管 | 男 | 2000-2-11 | 24 |
42014602 | 小红 | 电商 | 女 | 2001-8-7 | 24 |
42014603 | 二丫 | 财会 | 女 | 2001-9-4 | 24 |
42014604 | 狗蛋 | 物流 | 男 | 2002-10-18 | 24 |
我们观察以上的表,其中学号、姓名、性别、出生日期、本学期学分,这些我们可以看作是不同的属性,假设我们已知一个同学的学号为42014603,我们就可以得到这个人的姓名为二丫,专业为财会,性别为女等信息。
也就是说在此表中如果说已知了一个学号值,我们可以通过这个学号值查找到这个学号对应的唯一的姓名,也可以通过这个学号值得到唯一的专业名。
上面这种属性(属性组)和属性(属性组)之间一对一的推导关系便为函数依赖
我们用一个“→”来表示这种函数依赖关系。即X→Y,其所表达的含义为Y依赖于X(注意是后依赖前)
例如:学号→姓名,学号→专业名,学号→性别,学号→出生日期,学号→本学期学分
几种特定的函数依赖
为了便于理解下面内容,我们用以下这个表作为例子。
学号 | 姓名 | 课程号 | 个人成绩 |
011 | 小马 | 020114 | 99 |
平凡函数依赖
定义: 设一个关系为R(U),X和Y为属性集U上的子集,当X → Y时,如果Y ⊂ X(也就是Y是X的子集) 那么称X→Y是平凡的函数依赖。(这时候的X一般为属性组,Y为单个属性或者属性组)
举例:(学号,姓名)→姓名
注意:如果有Y ⊂ X ,那么X → Y 一定成立。
解释:因为Y ⊂ X ,那么Y必然是X中的一部分,因为X确定了,那么自然其子集也确定了,因为整体可以决定部分。
特殊情况:Y有可能和X是一样的,因为子集可以包含自己本身,也就是自己推导自己。
非平凡函数依赖
定义:设一个关系为R(U),X和Y为属性集U上的子集,若X→Y且X不包含Y,则称X→Y为非平凡函数依赖。
举例:
(学号、课程号)→个人成绩
相对于平凡函数依赖来说,非平凡函数依赖更为重要与常见
完全函数依赖
定义:一个关系模式R(U)中,X和Y为属性集U上的子集,如果X→Y,且对与X的任意一个真子集Z来说,Z→Y都不成立。
这个完全函数依赖我们分俩个情况理解,1.X为单个属性值,这时候X→Y,那么这个关系必定为完全依赖关系。2.X为属性组,也就是你用他的子集无法推导出Y,必须用整个X才行。
举例:
- 单个属性:学号→姓名,这个依赖关系必是完全函数依赖,因为X没真子集。
- 属性组:(学号,课程号)→个人成绩,其真子集有俩:学号和课程编号,如果只知道其中一个,是推导不出来个人成绩的,必须合在一起整体使用,所以是完全函数依赖。
部分函数依赖
定义:一个关系模式R(U)中,X和Y为属性集U上的子集,如果X→Y,对与X的真子集Z来说,存在一个Z→Y,那么X→Y为部分函数依赖。
举例:(学号,课程号)→姓名,此时X为属性组(学号,课程号)其真子集有俩个:学号、课程号,我们通过学号可以直接得到学生的姓名,也就是学号→姓名,所以(学号,课程号)→姓名为部分函数依赖
传递函数依赖
定义:一个关系模式R(U)中,X、Y、Z为属性集U上的子集,如果X→Y,Y不能反推出X,且Y→Z,这时候通过X可以推出Z,即X→Z,我们把X→Z称为传递函数依赖。
举例:
学号 | 所在系 | 系主任 |
0112 | 管理系 | 王老师 |
学号→所在系,所在系→系主任,所以学号→系主任为传递函数依赖。
多值依赖
定义
设R(U)是属性集U上的一个关系模式。X,Y,Z是U的子集,并且Z=U-X-Y。关系模式R(U)中多值依赖X→→Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值有一组Y的值,这组值仅仅决定于x值而与z值无关。
平凡的多值依赖与非平凡的多值依赖:
若X→→Y,而Z为空集,则称X→→Y为平凡的多值依赖;若Z不为空,则称其为非平凡的多值依赖。
性质
(1)对称性:使用上述定义的符号,若X→→Y,则X→→Z .
(2)实例r的X或Z每增删一个值,r就须同步增删多条记录。
(3)若X→Y,则X→→Y。故可把函数依赖看成多值依赖的特殊情况。
举例
有这样一个关系 <仓库管理员,仓库号,库存产品号> ,假设一个产品只能放到一个仓库中,但是一个仓库可以有若干管理员,那么对应于一个 <仓库管理员,库存产品号>有一个仓库号,而实际上,这个仓库号只与库存产品号有关,与管理员无关,就说这是多值依赖。
特点介绍
(1)允许X的一个值决定Y的一组值,这种决定关系与Z取值无关。
(2)多值依赖是全模式的依赖关系。
多值依赖的缺点是:数据冗余太大