数据库的候选码到底要如何一步步正确地寻找和最终判定呢？

在关系数据库理论中，码是用于唯一标识关系中元组（即表中的行）的关键概念，理解并正确判定候选码，是进行数据库设计、范式分析和保证数据完整性的基础，候选码并非一个单一的字段，而是一个或一组属性的组合，它必须满足两个核心条件：唯一性和最小性。

候选码的两个核心属性

要准确判定一个属性集是否为候选码,必须严格依据以下两个基本准则进行检验：

唯一性

唯一性是指候选码的值必须能够唯一地确定关系中的每一个元组，换句话说，在任何一个时刻，表中不允许存在两个不同的元组，它们在该候选码上的属性值完全相同，这个属性集是区分所有记录的“指纹”，确保了数据的可识别性，在一个学生表中，每个学生的“学号”都是独一无二的，学号”属性满足唯一性。

最小性

最小性，也称为不可缩减性，是区分候选码与超码的关键，它指的是在候选码的属性集中，任何一个属性都不能被移除，否则该属性集将不再满足唯一性，这意味着候选码是能够保证唯一性的“最小”属性组合，如果一个属性集满足唯一性，但其某个真子集也满足唯一性，那么这个属性集就不是候选码,而是一个超码。

如果（学号，姓名）这个组合能唯一标识一个学生，但单独的“学号”已经可以唯一标识了，学号，姓名）就不满足最小性，它只是一个超码，而“学号”才是候选码。

在实际操作中,我们可以通过一个系统性的流程来寻找和判定一个关系模式中的所有候选码。

第一步：列出所有可能的属性集

从单个属性开始，逐一考察它们是否满足唯一性，如果单个属性不满足，则考虑包含两个属性的组合，然后是三个属性的组合，以此类推,直到找到所有满足唯一性的属性集。

第二步：验证唯一性

对于每一个在第一步中选定的属性集，扫描整个关系表（或在设计阶段分析数据语义和业务规则），确认是否存在重复的值，如果该属性集的值组合在表中是唯一的,那么它就是一个超码。

第三步：验证最小性

这是筛选候选码最关键的一步，对于每一个已经验证为唯一的超码，尝试从中逐一移除属性,并检查剩下的属性子集是否仍然满足唯一性。

假设我们有一个“学生选课”关系表：SC（Sno, Cno, Grade, Sname），其中Sno是学号，Cno是课程号，Grade是成绩，Sname是学生姓名，并假设一个学生可以选修多门课程，一门课程可以被多个学生选修,学生姓名可能重复。

通过这个表格分析，我们可以清晰地看出，只有（Sno, Cno）这个属性组合同时满足了唯一性和最小性,因此它是该关系模式唯一的候选码。

在数据库设计中，有几个与候选码密切相关的概念,明确它们的区别至关重要。

候选码 vs. 主码：一个关系模式中可以存在多个候选码，但数据库设计者必须从所有候选码中选择一个作为主码，用于实现主要的唯一性约束，主码是物理层面的实现，而候选码是逻辑层面的概念，未被选中的候选码有时被称为“备用码”。
候选码 vs. 超码：如前所述，超码是所有能唯一标识元组的属性集的统称，候选码是超码的一个子集，特指那些满足最小性的超码，所有候选码都是超码,但并非所有超码都是候选码。
候选码 vs. 主属性：任何一个作为候选码一部分的属性，都被称为主属性，如果（A, B）和（C, D）都是候选码，那么属性A, B, C, D都是主属性,不包含在任何候选码中的属性则被称为非主属性。

判定数据库中的候选码是一个严谨的逻辑过程，核心在于紧扣“唯一性”和“最小性”两大原则，通过系统地分析属性组合，并依次进行唯一性和最小性的双重检验，我们就能准确地找出所有候选码，这不仅为后续选择主码提供了依据，也为进行数据库范式优化、消除数据冗余和保证数据一致性奠定了坚实的基础。