Discretization of continuous features

In statistics and machine learning, discretization refers to the process of converting continuous features or variables to discretized or nominal features. This can be useful when creating probability mass functions.

Typically data is discretized into partitions of K equal lengths (equal intervals) or K% of the total data (equal frequencies). ^[1]

Some mechanisms for discretizing continuous data include: