Klíč kandidáta je kombinace atributů, které jednoznačně identifikují záznam databáze, aniž by odkazovaly na jakákoli jiná data. Každá tabulka může mít jednoho nebo více kandidátů. Jeden z těchto kandidátských klíčů je vybrán jako primární klíč tabulky. Tabulka obsahuje pouze jeden primární klíč, ale může obsahovat několik kandidátských klíčů. Pokud se kandidátský klíč skládá ze dvou nebo více sloupců, nazývá se složený klíč.
Vlastnosti kandidátského klíče
Všechny kandidátské klíče mají některé společné vlastnosti. Jednou z vlastností je, že po dobu životnosti kandidátského klíče musí atribut použitý k identifikaci zůstat stejný. Další je, že hodnota nemůže být nulová. A konečně, klíč kandidáta musí být jedinečný.
Například ke konkrétní a jedinečné identifikaci každého zaměstnance může společnost použít číslo sociálního pojištění zaměstnance. Někteří lidé sdílejí stejná křestní jména, příjmení a pozici, ale žádní dva lidé nepoužívají stejné číslo sociálního pojištění.
Číslo sociálního zabezpečení | Křestní jméno | Příjmení | Pozice |
---|---|---|---|
123-45-6780 | Craig | Jones | Manager |
234-56-7890 | Craig | Beal | Společník |
345-67-8900 | Sandra | Beal | Manager |
456-78-9010 | Trina | Jones | Společník |
567-89-0120 | Sandra | Smith | Společník |
Příklady kandidátských klíčů
Některé typy dat se snadno hodí jako kandidáti:
- Mezinárodní standardní čísla knih: Kódy ISBN jednoznačně identifikují knihy a související média. Vydávání čísel ISBN je přísně regulováno správci bran a vydavatelé nikdy znovu nepoužívají čísla ISBN.
- Čísla bankovních účtů: Většina bank čísla účtů nerecykluje.
- Sériová čísla: Přestože se sériová čísla neřídí napříč odvětvími, v kontextu jednoho dodavatele by sériové číslo mělo být vždy jedinečné.
- Čísla řidičských průkazů: Obvykle se tato čísla neduplikují. Osoba, která se stěhuje ze státu do státu, však může mít více než jedno číslo DL.
- ID národního poskytovatele: Každý z lékařů a dalších licencovaných poskytovatelů zdravotní péče má alespoň jeden NPI, který je pro ně jedinečný a který vydalo Ministerstvo zdravotnictví a sociálních služeb USA.
Některé typy informací, které by se mohly zdát jako dobří kandidáti, se však ve skutečnosti ukáží jako problematické:
- Telefonní čísla: Většina operátorů recykluje telefonní čísla a jednotliví předplatitelé mohou používat několik telefonních čísel současně.
- Univerzální cenové kódy: UPC jsou jedinečné, ale vlastník bloku UPC může produkty libovolně recyklovat.
- Čísla lékařských záznamů: MRN se obecně vydávají na úrovni nemocnice, bez jakýchkoli národních pokynů ohledně struktury a formátu těchto identifikátorů.
- Čísla sociálního zabezpečení: Ačkoli jsou teoreticky jedinečná, SSN se recyklují a podvody s SSN jsou natolik běžné, že činí tento identifikátor problematickým u velkých souborů dat. (V kontextu zaměstnavatele, který ověřuje SSN, tato výzva nepředstavuje problém.)