Classificatore lineare
Nel campo dell'apprendimento automatico, l'obiettivo della classificazione statistica è utilizzare le caratteristiche di un oggetto per identificare a quale classe (o gruppo) appartiene. Un classificatore lineare realizza ciò prendendo una decisione di classificazione basata sul valore di una combinazione lineare delle caratteristiche. Le caratteristiche di un oggetto sono anche conosciute come valori di caratteristiche e sono tipicamente presentate alla macchina in un vettore chiamato vettore di caratteristiche. Questi classificatori funzionano bene per problemi pratici come la classificazione dei documenti e, più in generale, per problemi con molte variabili (caratteristiche), raggiungendo livelli di accuratezza paragonabili ai classificatori non lineari mentre richiedono meno tempo per allenarsi ed essere usati.
Definizione
[modifica | modifica wikitesto]Se il vettore delle caratteristiche d'ingresso è un vettore di numeri reali allora il punteggio d'uscita è
dove è un vettore reale di pesi e f è una funzione che converte il prodotto scalare dei due vettori nell'uscita desiderata. In altre parole, è una funzione lineare che mappa in R. Il vettore peso è appreso da un insieme di campioni d'allenamento etichettati. Spesso f è una semplice funzione che mappa tutti i valori sopra una certa soglia alla prima classe e tutti gli altri valori alla seconda classe. Una f più complessa da la probabilità che un elemento appartenga a una certa classe.
Per un problema di classificazione a due classi, una può visualizzare l'operazione di un classificatore lineare come la divisione di un ingresso di uno spazio multidimensionale con un iperpiano: tutti i punti su un lato dell'iperpiano sono classificati come "si" e gli altri come "no".