Quiero aprender a usar Excel para la minería de datos y el análisis de datos porque estoy trabajando para una empresa de comercio electrónico. ¿Dónde puedo encontrar recursos para aprender?

Antes de decidir qué herramienta utilizar, debe comprender bien el problema o los problemas que se le presentan o le presentarán.
Una vez que sepa que tiene una buena comprensión del análisis que necesita hacer, la herramienta correcta será una opción más fácil, y con frecuencia la respuesta es todo menos Excel.

Si por alguna razón ya comprende bien lo que está tratando de lograr a partir de su análisis y tiene una restricción sobre qué herramienta puede usar, es decir, está limitado a Excel, entonces antes de comenzar a aprender, verifique que su clase de análisis se puede hacer en Excel. Aquí hay un enlace a
Especificaciones y límites de Excel.

Su punto de partida para el análisis de datos en Excel es probablemente
Funciones estadísticas de Excel.

Excel ofrece algo de minería de datos a través de complementos de minería de datos. Como leerá en la referencia anterior, Excel se vincula bastante bien con las bases de datos MS SQL y ODBC. Una cosa a tener en cuenta especialmente si va a analizar datos de una base de datos o si tiene acceso a una, es utilizar las funcionalidades estadísticas y analíticas que ofrecen muchos motores SQL, en particular para las funciones estadísticas MS SQL (DAX).

También hay otros complementos que no son MS que se dirigen a MS Excel, un ejemplo es StatTools: software de pronóstico y análisis estadístico para Excel, estoy seguro de que una búsqueda rápida en Google mostrará muchos más.

En resumen:

  1. Comprenda su problema: tipos de datos, escala, formatos de datos, etc.
  2. Define lo que vas a analizar.
  3. Decide qué herramienta usar.

Realmente espero que pueda obtener acceso a un software estadístico adecuado, pero si está obligado a usar Excel, no se desespere, aún puede hacer cosas interesantes, especialmente si tiene una buena comprensión del análisis de datos estadísticos.

Una vez realicé un análisis completo de datos de rendimiento con mi serie TI-89 TI-89, papel cuadriculado y algunos bolígrafos, ¡fue muy divertido!

No use un martillo para abrir una botella de vino.
No use Excel para hacer análisis de datos.

Si va a realizar un trabajo serio en el análisis de datos, entonces hay mucho que aprender y una de las cosas que debe aprender son las herramientas adecuadas para el trabajo. Una excelente herramienta gratuita es R. Pero hay muchas herramientas disponibles: SAS, Matlab, Python, etc. Cada una tiene sus fortalezas y debilidades, sus defensores y detractores. Pero cada uno es un abridor de botellas y Excel no.

Estoy de acuerdo con Tanya Zyabkina.

Para una empresa de comercio electrónico, probablemente intente identificar patrones en el comportamiento del consumidor (fuente de tráfico, navegación del sitio, uso de funciones) y cómo conducen a las ventas. Es probable que esté tratando de determinar la importancia de los resultados de la prueba A / B. Y probablemente esté tratando de visualizar procesos e identificar áreas de mejora. Su objetivo general es comprender qué iniciativas están funcionando y cuáles no, y luego tomar medidas.

Si esas suposiciones son correctas, en mi experiencia, Excel es altamente efectivo como herramienta creativa de exploración y visualización de datos. A menudo puede obtener MUCHO de Excel con solo algunas de sus funciones más básicas. Entonces, si bien Python o R ciertamente podrían arrojar hallazgos más avanzados en conjuntos de datos más complejos, podrían ser excesivos.

Para mejorar sus habilidades de Excel en lo que respecta específicamente a su situación actual, le recomiendo leer Web Analytics 2.0 y Head First Excel. Cuando todo lo demás falla, búscalo en Google. En serio, hay una tremenda comunidad de Excel en línea con respuestas a casi todos los problemas. “Cómo contar instancias únicas de un valor específico de una lista desordenada de Excel” es un ejemplo del tipo de cosas que buscaríamos mientras fortalecemos nuestras habilidades aquí. ¡Intentalo!

También debe leer el ‘Diseño del tablero de información’ de Stephen Few. Nada peor que encontrar grandes ideas y no poder presentarlas adecuadamente a las partes interesadas clave. He descubierto que la última pieza a menudo se pasa por alto. Echa un vistazo a una publicación que escribimos sobre esto: Nuestro compromiso con el diseño de datos útiles.

En resumen, definitivamente no estoy desanimando el aprendizaje de Ciencia de Datos (y el curso de la Asamblea General requiere conocimiento de Python / R). Para usar la analogía de la botella de vino, Python o R se abrirán y servirán una copa de vino perfecta, pero Excel aún lo hará beber vino al final del día. 🙂

Voy a ir contra la corriente aquí. Sí, utilice Excel para el análisis de datos. Excel es una herramienta maravillosa y le permite “sentir” los datos como ninguna otra herramienta. Todo es bueno y elegante cuando tomas una herramienta sofisticada y la usas para matemáticas sofisticadas, pero he visto más errores cometidos en matemáticas sofisticadas que en Excel. Si no es un estadístico capacitado, pero tiene una inclinación analítica, puede aprender lo suficiente como para ser peligroso en Excel, y hay mucha más confianza en que no está usando mal los métodos avanzados o usándolos de una manera inconsistente con sus suposiciones.

En mi opinión, la forma más óptima de usar Excel es extraer datos resumidos de su base de datos utilizando alguna herramienta SQL, como MySQL, Cognos o incluso SAS, y luego jugar con Excel en tablas dinámicas, búsquedas y fórmulas dinámicas. . Puede cortar los datos de muchas maneras y visualizarlos instantáneamente a través de Pivot Chart. Una vez que encuentre algo interesante, puede copiar los datos y crear un gráfico adecuado que no le avergüence poner en la presentación (y créanme, un buen gráfico tiene más impacto en los destinatarios que 10 resultados estadísticos). En cuanto a las estadísticas, puede usar fórmulas integradas para comprender la media, la desviación estándar y la correlación entre las variables. El paquete de análisis tiene herramientas para la regresión múltiple. Si necesita comprender el significado estadístico, le recomiendo que revise una clase Stat 101, que tiene la mayoría de los conceptos básicos, y puede recrearlo todo en Excel.

¡Buena suerte!

Lamento que esto no sea una respuesta, pero cada vez que realiza un análisis estadístico en Excel, un científico de datos llora: Uso de Excel para el análisis de datos

Existen herramientas gratuitas que son infinitamente mejores, como R.

El análisis de datos con Excel es una de las poderosas herramientas para analizar datos. No es discutible decir que son las herramientas más populares para el análisis de datos con sus tablas dinámicas integradas. Otra razón por la que es popular es que no necesita un largo período de entrenamiento en Excel para ofrecer un análisis simple de datos de Excel. También se le permite usar cualquier versión compatible de Excel que haya instalado en su computadora.

¿Potentes consejos de Excel para analista de datos?

Funciones de uso común

  • Vlookup ()
  • CONCATINAR ()
  • LEN ()
  • INFERIOR (), SUPERIOR () y ADECUADO ()
  • PODAR()
  • Si()

Generando inferencia a partir de datos

  • Tabla dinámica
  • Limpieza de datos

Para aprender trucos avanzados de Excel que todo analista de datos debe saber: le sugiero que vaya a un curso de análisis de datos en línea utilizando Excel realizado por Digital Vidya, donde aprenderá todos los trucos avanzados de Excel de los principales científicos de datos de la industria.

Hay varios tipos de datos. Varía de datos científicos a datos estadísticos sociales. La elección de qué herramientas utilizar depende del campo de estudio. Nuestra preocupación es evaluar brevemente el análisis de datos utilizando Excel, su campo relevante o campo de uso asociado.

Leer más: ¿Qué es mejor para el análisis de datos: R o Python?

¿Cómo aprendo ciencia de datos al “hacerlo”?

Espero que esto ayude. Para cualquier otra consulta, no dude en mencionarla en los comentarios.

Voy a recomendar la segunda recomendación de R (especialmente con los paquetes adicionales Deducer o Rcmdr para acortar la curva de aprendizaje). Las alternativas no gratuitas incluyen Minitab o JMP, que aunque no son tan capaces como R, generalmente son más fáciles de aprender que R y más confiables que Excel.

Dicho esto, hay algunos recursos que he encontrado útiles con Excel:

Consejos generales:

  • Familiarícese con el uso de tablas dinámicas.
  • Si puede permitírselo, obtenga el complemento @Risk para Excel.
  • Aprenda a muestrear datos con y sin reemplazo en Excel.
  • Aprenda a crear histogramas y diagramas de puntos manualmente.
  • Conozca las limitaciones de Excel (por ejemplo, Solver es útil pero se sabe que se adapta a soluciones locales).

Si insiste en utilizar Excel, consulte “Datos inteligentes de John W. Foreman : uso de la ciencia de datos para transformar la información en información” . Repasa ejemplos en hojas de cálculo sobre los siguientes temas:

  1. Todo lo que siempre necesitó saber sobre las hojas de cálculo, pero tenía demasiado miedo de preguntar
  2. Análisis de clúster Parte I: uso de K-Means para segmentar su base de clientes
  3. Naïve Bayes y la increíble ligereza de ser un idiota
  4. Modelado de optimización: porque ese jugo de naranja “recién exprimido” no se va a mezclar
  5. Análisis de clúster Parte II: Gráficos de red y detección comunitaria
  6. El abuelo de la inteligencia artificial supervisada: la regresión
  7. Modelos de conjunto: un montón de pizza mala
  8. Predicción: Respire tranquilo; No puedes ganar
  9. Detección de valores atípicos: el hecho de que sean extraños no significa que no sean importantes
  10. Pasar de hojas de cálculo a R

Tomaré una posición ligeramente contraria sobre esta cuestión. Excel tiene un lugar en la minería de datos y el análisis de datos. Es una, de muchas, herramientas útiles en la caja. Yo uso Excel en casi todos los proyectos de minería / análisis. Lo uso para:

  • ETL: la mayoría de los datos que encuentro están en libros de Excel
  • Trazados rápidos como verificación cruzada de la calidad de los datos.
  • Solver (aunque no se usa en todos los proyectos) es una buena herramienta para problemas de optimización rápida

Dicho esto, es solo una herramienta en la caja. No intente utilizar Excel para aprender un modelo de bosque aleatorio de sus datos. No intente usar Excel para construir un modelo de red neuronal. Te dan la imagen.

Antes de responder la pregunta, creo que es mejor saber cuáles son los casos de uso, es decir, cuáles son los tipos de proyectos que su empresa le pedirá que haga. La minería de datos y el análisis de datos son términos amplios con un significado diferente para muchas personas. ¿Estamos hablando de números directos, números de usuarios por día, ingresos? ¿Estamos hablando de análisis y resultados de pruebas A / B? Dependiendo de su caso, cambiaría la forma en que respondo la pregunta.

Si solo está buscando un libro genérico sobre análisis de datos en Excel, le recomendaría este libro a uno de mis antiguos profesores, Wayne Winston.

Microsoft® Excel® 2010: Análisis de datos y modelado comercial: Wayne L. Winston: 9780735643369: Amazon.com: Libros

Wayne hace un gran trabajo al diseñar cómo comprender mejor y utilizar Excel como un usuario avanzado. Sin embargo, si las necesidades de su nueva posición se inclinan más hacia el análisis de trabajo pesado (estadísticas pesadas, Big Data, transmisiones en tiempo real, etc.), me tomaría el tiempo para aprender R y SPSS o SAS (dependiendo de la arquitectura técnica actual de su empresa )

Puede cubrir prácticamente todos los casos de uso en el mundo de análisis y minería de datos con la combinación de Excel + R + SPSS + SAS.

¡Buena suerte!

Un colega mío en realidad estaba tratando de hacer eso, escribiendo un guión en VBA, pero se quedó atascado. Creé un breve tutorial de MATLAB http://www.slideshare.net/toshia … para que él le muestre lo fácil que es integrarlo con Excel en su flujo de trabajo. También puede resultarle útil.

Si bien hay muchos otros paquetes buenos que podría usar, ese es el que le recomendé porque me parece que MATLAB sería uno de los más fáciles de aprender si vienes de Excel, y una vez que aprendes a hacer minería de datos con él , esa habilidad se puede aplicar con otros paquetes también. Yo uso R y Python junto con él, por ejemplo.

Aunque Excel también es excelente para la visualización de algunos datos, pero no resolvería el propósito de lo que está buscando. SAS, SPSS, STATA, WPS son algunas herramientas excelentes para la minería de datos y el análisis de datos.
Pero me gustaría enfatizar R; que es de código abierto y tiene excelentes paquetes para resolver sus problemas. Un poco de conocimiento de codificación sería muy útil para eso y puede obtener muchos tutoriales gratuitos en Google. El enlace mencionado a continuación es muy informativo para el aprendizaje.
Recursos para ayudarlo a aprender y usar R

Creo que Excel es un excelente lugar para comenzar: sí, hay algunos recursos sofisticados y gratuitos como R para manipular datos, pero para análisis simples, Excel puede ayudarlo a obtener algunas respuestas. Además de usar el “cómo …” de Google, descubrí que el Blog de Annie Cushing – Consultor de SEO, análisis y visualización de datos tiene excelentes publicaciones sobre cómo usar Excel para organizar y leer sus datos, incluyendo cómo crear y manipular pivot mesas. También puede hacer referencia a Occam’s Razor de Avinash Kaushik – Blog de marketing digital y análisis para comprender y leer sus análisis.

Lea el capítulo 2 del libro Minería de datos con Microsoft SQL Server 2008 (Amazon.co.uk: Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat: 9780470277744: Libros). Es para Excel versión 2007 pero aplicable a versiones posteriores.

Actualmente estoy aprendiendo este curso sobre Udemy – Data Science AZ ™: Ejercicios de ciencia de datos de la vida real
Tiene 4 secciones

  1. Visualización
  2. Modelado
  3. Preparación de datos
  4. Comunicaciones

Puede aprenderlos de forma independiente y según sus necesidades.

¡Feliz análisis!

Hay muchos recursos disponibles en línea. Sugeriría buscar en Udemy o Coursera.

Pruebe este también – Excel for Analytics | Udemy

Esto ha sido realizado por Analytics Leap (www.a-leap. Com), que en general son bastante buenos.

Envíame un mensaje si tienes más consultas.

Mejor,

UNA

Puede hacer algunos cálculos básicos en Excel sin necesidad de ser un genio de las matemáticas o la programación. Sin embargo, para la información realmente valiosa, como quiénes son mis clientes caducados, qué producto es más probable que compre un cliente a continuación, realmente necesita un programa que lo haga por usted.

Existen algunas opciones excelentes y no es necesario que pague una fortuna.