ITLGSTMar 27, 2024

Representatividad Muestral en la Incertidumbre Simétrica Multivariada para la Selección de Atributos

arXiv:2403.18685v1
Originality Synthesis-oriented
AI Analysis

It addresses the problem of reliable feature selection in machine learning, though it appears incremental as it builds on existing MSU measures.

The paper analyzes how multivariate symmetric uncertainty (MSU) behaves under varying numbers of attributes, their cardinalities, and sample sizes, proposing a heuristic condition to preserve MSU quality for dimension reduction.

In this work, we analyze the behavior of the multivariate symmetric uncertainty (MSU) measure through the use of statistical simulation techniques under various mixes of informative and non-informative randomly generated features. Experiments show how the number of attributes, their cardinalities, and the sample size affect the MSU. In this thesis, through observation of results, it is proposed an heuristic condition that preserves good quality in the MSU under different combinations of these three factors, providing a new useful criterion to help drive the process of dimension reduction. -- En el presente trabajo hemos analizado el comportamiento de una versión multivariada de la incertidumbre simétrica a través de técnicas de simulación estadísticas sobre varias combinaciones de atributos informativos y no-informativos generados de forma aleatoria. Los experimentos muestran como el número de atributos, sus cardinalidades y el tamaño muestral afectan al MSU como medida. En esta tesis, mediante la observación de resultados hemos propuesto una condición que preserva una buena calidad en el MSU bajo diferentes combinaciones de los tres factores mencionados, lo cual provee un nuevo y valioso criterio para llevar a cabo el proceso de reducción de dimensionalidad.

Foundations

The foundational work for this paper's niche, ranked by how specifically the neighbourhood builds on it — not by global fame.

Your Notes