TF-IDF (от ) — статистическая мера, используемая для оценки важности слова в контексте
документа, являющегося частью коллекции документов или
корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.