داده کاوي، پايگاهها و مجموعههاي حجيم دادهها را در پي کشف واستخراج دانش، مورد تحليل و کند و کاوهاي ماشيني (و نيمهماشيني) قرار ميدهد. اين گونه مطالعات و کاوشها را به واقع ميتوان همان امتداد و استمرار دانش کهن و همه جا گير آمار دانست. تفاوت عمده در مقياس، وسعت و گوناگوني زمينهها و کاربردها، و نيز ابعاد و اندازههاي دادههاي امروزين است که شيوههاي ماشيني مربوط به يادگيري، مدلسازي، و آموزش را طلب مينمايد.