Vai al contenuto

Text categorization

Da Wikipedia, l'enciclopedia libera.
Versione del 15 nov 2007 alle 16:30 di Bramfab (discussione | contributi) (+senza fonti)

La Text Categorization(TC), in ambito informatico, è l'attività, nota anche come text classification, che si occupa di classificare testi in linguaggio naturale assegnando automaticamente collezioni di documenti ad una o più classi appartenenti ad un insieme detto "set di classi" predefinito. Per reazlizzare ciò è necessario addestrare il sistema di TC tramite autoapprendimento ad esempi (istanze) da cui generare un modello generale per la classificazione noto come classificatore.