¿Qué compañías prefieren R en vez de SAS / SPSS en su trabajo diario?

Puedo agregar algunas líneas basadas en mi experiencia trabajando estrechamente con empresas en el espacio tecnológico de big data. Si bien se ha señalado correctamente que el “volumen de datos” es uno de los criterios para la selección de R, hay un poco más de opciones.

No he visto ninguna entidad tecnológica que solo trabaje con una herramienta. De hecho, la mayoría de las compañías tecnológicas afirman que son “agnósticas tecnológicas” y tienen recursos especializados en todas las herramientas de análisis. Por lo tanto, en la mayoría de los lugares no es sorprendente ver que SAS, R, SPSS y Excel se utilicen para el análisis.

Entonces, para esas empresas de tecnología de big data, ¿cuál es el criterio para seleccionar R sobre otras herramientas? En primer lugar, las empresas tecnológicas están impulsadas por la preferencia expresada por su Cliente. Si el cliente articula claramente su preferencia por una herramienta “X”, eso es todo. Sencillo.

Luego viene la viabilidad técnica del tamaño de los datos. Sí, cuanto más grandes son los datos, menor es la probabilidad de usar R.

No podemos ignorar el hecho de que el requisito comercial de algoritmos complejos y modelos estadísticos específicos de casos también impulsa la elección de la herramienta.

Cuando le pregunté a estas entidades de análisis de datos sobre el alcance del uso de R sobre productos que no son de código abierto, la mayoría de los casos me informaron que el alcance del uso de R se limita a un máximo del 7-10% de sus proyectos de análisis total. Si bien, este rango declarado puede ser cuestionado y debatido, el hecho es que la mayoría de las entidades empresariales todavía prefieren herramientas de código abierto para proyectos clave.

si lo admito
R considerado como el lenguaje de programación más duro en la industria analítica
pero sigue siendo popular debido al enorme mundo de paquetes que casi ofrecen funciones listas para usar y una gran libertad para automatizar todo el proceso

Depende totalmente del volumen de los datos. Si el volumen es menor que puede usar “R” pero si el volumen de datos es alto, se prefiere SAS.

  • La mayoría de las empresas de tecnología de big data usan R para el análisis estadístico en lugar del software de código abierto que mencionó