¿Estamos utilizando todos los datos que extraemos para respaldar los sesgos propios ya concluidos?

Más probable.

[Advertencia: si la tuya era una pregunta casual, no sigas leyendo. Pero si le preocupan los límites de la ciencia tal como la conocemos, siga leyendo]

Es de conocimiento común que las estadísticas se pueden manipular para probar el sesgo de uno.

Muchas organizaciones basadas en datos esperan que se puedan tomar decisiones “objetivas” basadas en análisis de datos (de los cuales la minería de datos es solo un componente importante).

Sin embargo, lo cierto es que, desde la forma en que se registran o capturan los datos hasta cómo se almacenan, procesan y analizan (extraen), es probable que se obtengan resultados, conclusiones o predicciones sesgados, principalmente porque la minería de datos y TODOS los análisis predictivos actuales Los métodos se basan en métodos estadísticos en el peor de los casos y ecuaciones algebraicas en el mejor.

Ahora, no me malinterpretes. No hay nada intrínsecamente malo con las estadísticas y las ecuaciones algebraicas. Ambos nos han servido MUY bien para comprender el mundo determinista, como predecir el movimiento de los cuerpos celestes y la energía que se desencadena por las reacciones nucleares.

Pero ambos se quedan cortos cuando se usan para predecir el mundo indeterminista de fenómenos caóticos y aleatorios y el problema REAL radica en decidir sobre la “muestra representativa” para analizar o extraer sobre la cual podamos basar de manera confiable nuestras conclusiones.

Es por eso que, debido a estas deficiencias en el modelado estadístico y algebraico, paso mucho de mi tiempo libre investigando “Un nuevo tipo de paradigma predictivo” que:

a) tiene en cuenta TODOS los eventos pasados y no solo una muestra

b) tiene en cuenta TODOS los eventos futuros conocidos que aún no han ocurrido

c) aplica geometría computacional (y no estadística o ecuación algebraica) para llegar a una conclusión razonable.

Sígueme y mira este espacio mientras navego por lo imposible.

[Nota al margen: Por supuesto, se diseñó un muestreo estadístico debido a la falta de recursos para reducir los números. Sin embargo, incluso cuando se presentan con toda la población, los métodos estadísticos nos dan, en el mejor de los casos, estimaciones del futuro. Es por eso que necesitamos un nuevo paradigma que descaradamente dependa totalmente del poder computacional “bruto”.