Deduplikation, auch
Datendeduplikation (engl.
Deduplication), in unsauberem Deutsch auch
Deduplizierung, ist in der
Informationstechnik ein Prozess, der
redundante Daten identifiziert (
Duplikaterkennung) und eliminiert, bevor diese auf einen nichtflüchtigen Datenträger geschrieben werden. Der Prozess
komprimiert wie andere Verfahren auch die Datenmenge, die von einem Sender an einen Empfänger geschickt wird. Es ist nahezu unmöglich, die Effizienz bei der Verwendung von Deduplikations-Algorithmen vorherzusagen, da sie immer von der Datenstruktur und der Änderungsrate abhängig ist. Deduplikation ist jedoch die derzeit effizienteste Art, Daten zu reduzieren, bei denen eine
Mustererkennung möglich ist (unverschlüsselte Daten).