Een
gegevensverzameling of
dataset is een
verzameling van
gegevens (data), meestal gepresenteerd in
tabelvorm. Elke
kolom vertegenwoordigt een bepaalde
variabele. Elke
rij komt overeen met een bepaald lid van de gegevensverzameling in kwestie. Deze rij bevat de waarden voor elk van de variabelen, of attributen, voor dit lid, bijvoorbeeld lengte en gewicht of ook willekeurige getallen. Elke waarde staat bekend als een
datum. De gegevensverzameling kan gegevens voor een of meer leden bevatten, overeenkomend met het aantal rijen.