Niveau: Einfach Standard Studienbrücke

Bag of Words

Bag of Words (BoW) ist ein einfaches Modell zur Repräsentation von Texten in der natürlichen Sprachverarbeitung (NLP), bei dem ein Text als ungeordnete Menge seiner Wörter dargestellt wird, ohne Grammatik oder Wortfolge zu berücksichtigen. Jedes Wort wird gezählt, sodass ein Text als Häufigkeitsvektor dargestellt werden kann. BoW ist die Grundlage für viele Textklassifikations- und Informationsextraktionsverfahren.