Vai al contenuto

Predictive Model Markup Language

Da Wikipedia, l'enciclopedia libera.

Il Predictive Model Markup Language (PMML) è un linguaggio di markup basato su XML sviluppato dal Data Mining Group (DMG) per dare modo alle applicazioni di definire modelli collegati all'analisi predittiva, al Data Mining e per condividere modelli tra applicazioni che utilizzano tale linguaggio.

PMML fornisce un metodo indipendente dal distributore di definizione di modelli, in modo tale che questioni proprietarie e incompatibilità non sono più luogo di barriere per lo scambio di modelli tra applicazioni.

Esso consente agli utenti di sviluppare modelli all'interno di una applicazione e usare altre applicazioni per visualizzarlo, analizzarlo e valutarlo. Prima, questa era molto difficile da gestire, ma con PMML, lo scambio di modelli tra applicazioni è diventato semplice.

Da quando PMML è uno standard basato su XML, le specifiche sono XML Schema.

Componenti PMML

PMML segue una struttura intuitiva per descrivere un modello di data mining, sia se è un modello di rete naurale o un modello di regressione logistica.

Sequenzialmente, esso può essere descritto da i seguenti componenti:[1][2]

  • Header: contiene informazioni generali circa il documento PMML, come informazioni sul copyright del modello, sua descrizione e informazioni riguardo l'applicazione (nome e versione) usata per generarlo. Contiene anche un attributo di tipo timestamp il quale può essere usato per specificare la data della creazione del modello.
  1. ^ A. Guazzelli, M. Zeller, W. Chen, and G. Williams. PMML: An Open Standard for Sharing Models. The R Journal, Volume 1/1, May 2009.
  2. ^ A. Guazzelli, W. Lin, T. Jena (2010). PMML in Action: Unleashing the Power of Open Standards for Data Mining and Predictive Analytics. CreateSpace.