Cómo cambiar de carrera de Java a Big Data

Al ser un desarrollador de Java, tendrá una ventaja adicional mientras aprende Hadoop. Aunque Java no es obligatorio para aprender Hadoop, el conocimiento de Java le brinda una ventaja en ciertos escenarios, como la configuración de opciones avanzadas en MapReduce. MapReduce es un paradigma de programación para escribir su lógica en forma de funciones de mapeador y reductor.

Aquellos que tienen una gran capacidad de autoaprendizaje pueden elegir Hadoop por su cuenta utilizando excelentes recursos en línea que se enumeran a continuación. Para otros que prefieren cursos dirigidos por instructores, también hay buenos cursos en línea.

Enlace del curso: The Ultimate Hands-On Hadoop – ¡Domestique su Big Data!

Hadoop, MapReduce, HDFS, Spark, Pig, Hive, HBase, MongoDB, Cassandra, Flume: ¡la lista continúa! Más de 25 tecnologías.

El mundo de Hadoop y “Big Data” puede ser intimidante: cientos de tecnologías diferentes con nombres crípticos forman el ecosistema de Hadoop. Con este curso, no solo comprenderá cuáles son esos sistemas y cómo encajan entre sí, sino que aprenderá cómo usarlos para resolver problemas comerciales reales.

Aprenda y domine las tecnologías de big data más populares en este curso integral, impartido por un ex ingeniero y gerente senior de Amazon y IMDb . Vaya más allá de Hadoop y sumérjase en todo tipo de sistemas distribuidos con los que necesite integrarse.

  • Instale y trabaje con una instalación real de Hadoop directamente en su escritorio con Hortonworks y la interfaz de usuario de Ambari
  • Administre big data en un clúster con HDFS y MapReduce
  • Escribir programas para analizar datos en Hadoop con Pig y Spark
  • Almacene y consulte sus datos con Sqoop , Hive , MySQL , HBase , Cassandra , MongoDB , Drill , Phoenix y Presto
  • Diseñe sistemas del mundo real utilizando el ecosistema Hadoop
  • Aprenda cómo se gestiona su clúster con YARN , Mesos , Zookeeper , Oozie , Zeppelin y Hue
  • Maneje la transmisión de datos en tiempo real con Kafka , Flume , Spark Streaming , Flink y Storm

Comprender Hadoop es una habilidad muy valiosa para cualquiera que trabaje en empresas con grandes cantidades de datos.

Casi todas las grandes empresas en las que desee trabajar utilizan Hadoop de alguna manera, incluidas Amazon, Ebay, Facebook, Google, LinkedIn, IBM, Spotify, Twitter y Yahoo! Y no son solo las empresas de tecnología las que necesitan Hadoop; Incluso el New York Times usa Hadoop para procesar imágenes.

Este curso es integral, abarca más de 25 tecnologías diferentes en más de 14 horas de video conferencias . Está lleno de actividades y ejercicios prácticos, por lo que obtienes experiencia real en el uso de Hadoop, no es solo teoría.

Encontrarás una variedad de actividades en este curso para personas de todos los niveles. Si usted es un gerente de proyecto que solo quiere aprender las palabras de moda, existen interfaces de usuario web para muchas de las actividades en el curso que no requieren conocimientos de programación. Si se siente cómodo con las líneas de comando, también le mostraremos cómo trabajar con ellas. Y si eres un programador, te desafiaré a escribir scripts reales en un sistema Hadoop usando Scala, Pig Latin y Python .

Te alejarás de este curso con una comprensión real y profunda de Hadoop y sus sistemas distribuidos asociados, y puedes aplicar Hadoop a problemas del mundo real. Además, ¡un valioso certificado de finalización te espera al final!

Tenga en cuenta que este curso se centra en el desarrollo de aplicaciones, no en la administración de Hadoop. Aunque aprenderá algunas habilidades administrativas en el camino.

¿Quién es el público objetivo?

  • Ingenieros de software y programadores que desean comprender el ecosistema más grande de Hadoop y usarlo para almacenar, analizar y vender “big data” a escala.
  • Gerentes de proyectos, programas o productos que desean comprender la jerga y la arquitectura de alto nivel de Hadoop.
  • Analistas de datos y administradores de bases de datos que sienten curiosidad por Hadoop y cómo se relaciona con su trabajo.
  • Arquitectos de sistemas que necesitan comprender los componentes disponibles en el ecosistema de Hadoop y cómo encajan entre sí.

Haga clic en el enlace del curso de arriba para ver el contenido del curso.

Ya he dado una respuesta a este tipo de preguntas anteriormente y me gustaría agregar algunos puntos aquí también.

Primero me gustaría insistir en que la gente siga la siguiente pregunta para comprender el futuro de la “Tecnología de Big Data”

La respuesta de Akash Dugam a ¿Aumentarán los salarios de los científicos de datos en la próxima década?

Si ha visitado el enlace de arriba, entonces habrá llegado a saber sobre “Big Data y su futuro”

Ahora hablemos de cómo lo lograrías. 🙂

Hoy en día, “Big Data” tuvo un gran auge en los sectores de TI de todo el mundo. Como todos sabemos, los trabajos analíticos pagan mucho. Enorme cantidad de datos que generamos día a día para ser administrados para este propósito BIG DATA entra en escena.

Como hay una descripción adjunta a esta pregunta, ¿no podría obtener más detalles sobre su conocimiento o de qué campo es? que trabajo haces Estas preguntas son muy importantes. Te consideraré más fresco e intentaré responder a tu pregunta.

Big data no es una asignatura o idioma, por lo que puede aprender estudiándolo. En realidad es una combinación de un montón de temas, tecnologías, etc.

Consideremos esta ecuación,

Big Data = Habilidades de programación + Estructura de datos y algoritmos + Habilidades analíticas + Habilidades de base de datos + Matemáticas + Aprendizaje automático + PNL + OS + Criptografía + Programación paralela.

¡Si! No estoy bromeando aquí, realmente necesitas tener conocimiento de estos temas.

Pero no te preocupes, puedes prepararlo desde cero. Hay enormes recursos disponibles en Internet que lo ayudarán a dominar todas las habilidades.

1] Antes de comenzar:

Me he encontrado con el hermoso curso introductorio de la universidad de Stanford. Si eres un novato en el campo de la informática, completa el curso CS101.

Aquí está el enlace para registrarse en CS101:

Informática 101

2] Habilidades de programación:

Como mencioné anteriormente, las habilidades de programación son obligatorias para comenzar con Big Data. Necesita aprender los siguientes lenguajes de programación.

  • Aprende Python:

Python se considera el lenguaje de programación más fácil del mundo debido a su sintaxis simple. Puedes aprender Python rápidamente.

Aprenda Python aquí: Tutoriales de Python: Temporada 1 (No necesita ser Python Ninja, solo se necesita información básica).

  • Aprende Java:

Si está buscando “Trabajo de desarrollador de Big Data”, le sugiero que aprenda Java. Hadoop está escrito en Java, por lo que el conocimiento de los conceptos básicos de Java es esencial para aprender Hadoop.

Aquí están los mejores recursos disponibles en Internet para preparar JAVA: Tutoriales para desarrolladores de Java y capacitación en línea

El MIT también ofrece un curso de código abierto sobre Java. Aquí está el enlace: Introducción a la programación en Java

[Nota: cualquier lenguaje OOP es obligatorio para aprender Big Data]

3] Estructura de datos y algoritmos:

¡Si! Debes tener las habilidades de DS y Algoritmo. Puede tomar el curso MIT para dominarlos: Introducción a los algoritmos

Aprenda acerca de los tipos de datos fundamentales (pila, colas y bolsas), algoritmos de clasificación (ordenación rápida, combinación, ordenación) y estructuras de datos (árboles de búsqueda binarios, árboles rojo-negros, tablas hash), Big O.

4] Habilidades analíticas:

El pensamiento analítico te hará PRO en Big Data. Te sugiero que trates de resolver acertijos de internet o comiences a jugar al ajedrez. Hacer estas cosas ampliará su pensamiento analítico.

5] Habilidades de base de datos:

Como vas a jugar con muchos datos, mi recomendación es aprender SQL. Puede aprender SQL aquí: SQLZOO o del canal de youtube de “Manish Sharma”: tutoriales de SQL para principiantes / tutoriales de Oracle Database.

6] Matemáticas:

Si su experiencia matemática depende del cálculo multivariable y el álgebra lineal, tendrá suficiente experiencia para comprender casi todas las probabilidades / estadísticas / aprendizaje automático para el trabajo.

  • Cálculo multivariable: aquí puedes aprender cálculo multivariable. Por favor visite este enlace: Cálculo multivariable
  • Álgebra lineal numérica / Álgebra lineal computacional / Álgebra matricial: Álgebra lineal
  • Aprendamos Estadística y Probabilidad: La probabilidad también se llama la ciencia de la incertidumbre y ese concepto es más importante en el campo de la DS. Puedes aprenderlo de los cursos del MIT. Aquí está el enlace de youtube: youtube.comProbability and Statistics MIT
  • Aquí hay otra serie importante del MIT: Matemáticas para la informática

7] Aprendizaje automático:

Otro tema importante que todos deberían aprender es el “Aprendizaje automático”. Necesitas tener conocimientos de matemáticas para aprender ML. Aquí está el mejor tutorial del mundo sobre ML: Lecture Collection | Aprendizaje automático

8] PNL:

Aquí hay algunos recursos que lo ayudarán en PNL:

Libro:

Procesamiento del habla y el lenguaje (2a edición): Daniel Jurafsky, James H. Martin: 9780131873216: Amazon.com: Libros

Tutoriales web:

Inteligencia artificial Procesamiento del lenguaje natural

Aquí está la mejor referencia, Procesamiento de lenguaje natural con Python

9] Sistema operativo:

Desarrolle un sólido conocimiento del sistema operativo a partir de los siguientes recursos.

Recursos en línea: UC Berkeley Computer Science 162

10] Criptografía:

Aquí está el enlace a los maestros en criptografía: Tutorial de criptografía

11] Programación paralela:

Programación paralela y concurrente en Haskell: Técnicas para programación multinúcleo y multiproceso por Simon Marlow es un libro fantástico.

El último paso:

El procedimiento de más de 11 pasos es realmente importante si desea hacer una gran carrera en tecnologías de Big Data. Después de completar el paso anterior, me gustaría insistir en que visite el siguiente enlace y comience a aprender sobre Big Data:

Universidad de Big Data | Cursos de ciencia de datos

**** Proyecto de trabajo ****

Aquí hay otra forma de capturar lo que un proyecto de Big Data podría significar para su empresa o proyecto: estudie cómo otros han aplicado la idea.

Estos son algunos ejemplos del mundo real de Big Data en acción:

  • Las compañías de productos de consumo y las organizaciones minoristas están monitoreando las redes sociales como Facebook y Twitter para obtener una visión sin precedentes del comportamiento del cliente, las preferencias y la percepción del producto.
  • Los fabricantes están monitoreando los datos de vibraciones diminutas de sus equipos, que cambian ligeramente a medida que se desgastan, para predecir el momento óptimo para reemplazar o mantener. Reemplazarlo demasiado pronto desperdicia dinero; reemplazarlo demasiado tarde desencadena un costoso paro laboral
  • Los fabricantes también están monitoreando las redes sociales, pero con un objetivo diferente al de los vendedores: lo están utilizando para detectar problemas de soporte del mercado de accesorios antes de que una falla de la garantía se vuelva públicamente perjudicial.
  • El gobierno está haciendo públicos los datos a nivel nacional, estatal y de la ciudad para que los usuarios desarrollen nuevas aplicaciones que puedan generar bienes públicos. Conozca cómo las agencias gubernamentales reducen significativamente la barrera para implementar datos abiertos con NuCivic Data
  • Las organizaciones de servicios financieros están utilizando datos extraídos de las interacciones con los clientes para dividir y dividir a sus usuarios en segmentos finamente ajustados. Esto permite a estas instituciones financieras crear ofertas cada vez más relevantes y sofisticadas.
  • Las agencias de publicidad y marketing están rastreando las redes sociales para comprender la capacidad de respuesta a campañas, promociones y otros medios publicitarios.
  • Las compañías de seguros están utilizando el análisis de Big Data para ver qué solicitudes de seguro de hogar pueden procesarse de inmediato y cuáles necesitan una visita en persona validada por un agente.
  • Al adoptar las redes sociales, las organizaciones minoristas involucran a defensores de la marca, cambian la percepción de los antagonistas de la marca e incluso permiten que los clientes entusiastas vendan sus productos.
  • Los hospitales están analizando datos médicos y registros de pacientes para predecir aquellos pacientes que probablemente busquen readmisión dentro de unos meses después del alta. El hospital puede intervenir con la esperanza de evitar otra costosa estadía en el hospital.
  • Las empresas basadas en la web están desarrollando productos de información que combinan datos recopilados de los clientes para ofrecer recomendaciones más atractivas y programas de cupones más exitosos.
  • Los equipos deportivos están utilizando datos para rastrear la venta de boletos e incluso para rastrear estrategias de equipo.

Consejo: Seguir los 11 pasos e implementar uno de los proyectos mencionados y poner su currículum significa mucho para el reclutador.

Nota para el desarrollador de Java: el desarrollador de Java puede omitir los pasos relacionados con el aprendizaje de Java, ya que ya están trabajando en el mismo campo.

Gran gran suerte para su carrera de Big Data.

[Nota: si necesita ayuda, no dude en enviarme un mensaje.]

Referencias

La respuesta de Akash Dugam a ¿Dónde debería comenzar para aprender el desarrollo de big data?

La respuesta de Akash Dugam a ¿Cuál es la diferencia entre analista de datos y analista de negocios?

La respuesta de Akash Dugam a ¿Hay algún sitio web donde podamos aprender ciencia de datos de forma gratuita?

La respuesta de Akash Dugam a ¿Qué hace que Python sea tan rápido para el análisis de datos a gran escala en comparación con R o SAS?

La respuesta de Akash Dugam a ¿Cuáles son las habilidades necesarias para convertirse en probador de big data?

La respuesta de Akash Dugam a ¿Es útil para un científico de datos saber acerca de los sistemas operativos?

Muchos profesionales están cambiando sus carreras a Big Data y Hadoop debido al aumento repentino de datos y demanda en Big Data y sus tecnologías. Hadoop es la tecnología más popular en él.

Y

Es más beneficioso y fácil de entender para un ‘desarrollador de Java’ ya que el marco Hadoop está escrito en lenguaje Java . De hecho, aprender y entrar en Big data y Hadoop podría ser muy ventajoso para cualquier persona con experiencia en TI.

Como un camino para entrar en Big Data y Hadoop, te sugiero que aprendas primero Big Data Hadoop; es mejor ir a un curso certificado para una capacitación adecuada y obtener el trabajo. Los institutos de capacitación lo ayudan a conseguir el trabajo.

Te sugeriría DataFlair para la capacitación de Big Data Hadoop, ya que están 100% orientados al trabajo y se enfocan en preparar a la industria de los estudiantes para comenzar a trabajar directamente en las principales empresas. También capacitan a profesionales experimentados junto con apoyo laboral . Puede obtener la capacitación junto con su trabajo o estudios.

También proporciona algunos enlaces para comenzar a aprender los conceptos básicos de Hadoop

  1. Tutorial de Hadoop: una guía completa de Hadoop para principiantes
  2. Características de Hadoop y principios de diseño
  3. Terminologías de Big Data y conceptos de Hadoop que debe conocer
  4. Componentes del ecosistema de Hadoop y su papel
  5. Cómo funciona Hadoop: aprenda el funcionamiento interno de Hadoop
  6. Limitaciones de Hadoop – Cómo superar
  7. Caché Distribuido en Hadoop – Introducción, Pros y Contras
  8. Las 100 preguntas y respuestas más importantes de la entrevista de Hadoop
  9. ¿Cómo instalar Hadoop 1.x en un clúster de múltiples nodos?

Si la respuesta fue suficientemente informativa, UPVOTE.

¡Todo lo mejor!

En gran medida, Big Data es Java. Hadoop y un gran porcentaje del ecosistema de Hadoop están escritos en Java. La interfaz nativa de MapReduce para Hadoop es Java. Por lo tanto, puede pasar fácilmente a Big Data simplemente creando soluciones Java que se ejecuten sobre Hadoop. También hay bibliotecas Java como Cascading que facilitan el trabajo. Java también es realmente útil para depurar cosas, incluso si usa algo como Hive.

Más allá de Hadoop, Storm está escrito en Java y Spark (es decir: podría decirse que el futuro de la computación hadoop) está en Scala (que se ejecuta en JVM y Spark tiene una interfaz Java). Entonces, Java cubre un porcentaje masivo del espacio de Big Data.

Todas estas herramientas son de código abierto, lo que significa que las empresas pueden tener ingenieros internos para ampliarlas. Para agregar funcionalidad o para lidiar con problemas ellos mismos. Por lo tanto, hay muchos trabajos Java a su alrededor en comparación con una solución de código cerrado.

La demanda de analistas de sistemas informáticos con experiencia en big data aumentó en un 89,9% en los últimos doce meses y en un 85,40% para los científicos de investigación en informática e información.

La demanda de experiencia en programación de Python aumentó en un 96.9% en puestos relacionados con big data en los últimos doce meses.

Estas y otras ideas clave provienen de un análisis reciente completado de las tendencias de contratación de big data utilizando WANTED Analytics, el proveedor líder de análisis de datos en el lugar de trabajo. Para los propósitos de este análisis, el término “big data” se compone de los cuatro conjuntos de habilidades de análisis de datos, adquisición de datos, minería de datos y estructuras de datos.

¿Cuáles son los requisitos previos para aprender Big Data – Hadoop?

No hay un requisito previo estricto para comenzar a aprender Hadoop.

Sin embargo, si desea convertirse en un experto en Hadoop y hacer una excelente carrera, debe tener al menos conocimientos básicos de Java y Linux.

¿No tienes idea de Java o Linux? – No te preocupes, aún puedes comenzar a aprender Hadoop. La mejor manera sería pasar paralelamente algunas horas aprendiendo Java y Linux también.

El aspecto Java / Linux se explicará con más detalle en los siguientes párrafos.

Por qué Java no es estrictamente un requisito previo:

Las herramientas como Hive y Pig que se construyen sobre Hadoop ofrecen sus propios lenguajes de alto nivel para trabajar con datos en su clúster. Si desea escribir su propio código MapReduce, puede hacerlo en cualquier lenguaje (por ejemplo, Perl, Python, Ruby, C, etc.) que admita la lectura desde la entrada estándar y la escritura en la salida estándar con Hadoop Streaming.

Además, hay abstracciones de alto nivel proporcionadas por los marcos de Apache como Pig y Hive para las cuales no se requiere familiaridad con Java. Pig se puede programar en Pig Latin y Hive se puede programar usando HiveQL. Ambos programas se convertirán automáticamente a programas MapReduce en Java.

No hay requisitos previos predefinidos o estrictos para aprender Hadoop, pero la Capacitación integral de certificación de Hadoop puede ayudarlo a obtener un trabajo de Big data Hadoop si está listo para desarrollar una carrera en Big Data Domain.

Un conocimiento básico de cualquier lenguaje de programación como Java, C ++ o Python, y Linux siempre es una ventaja adicional. Las siguientes personas pueden convertirse en un profesional de BigData Hadoop, desarrolladores de software, arquitectos, analistas, DBA, analistas de datos, analistas de negocios, profesionales de Big Data o cualquier persona que esté considerando construir una carrera en Big Data y Hadoop es un candidato ideal para el Entrenamiento de Big Data Hadoop.

Más oportunidades de trabajo con Hadoop:

Un informe de investigación de Avendus Capital estima que el mercado de TI para big data en India ronda los $ 1.15 mil millones a medida que finaliza 2015. Esto contribuyó a una quinta parte del mercado de KPO de la India por valor de $ 5.6 mil millones. Además, The Hindu predice que para fines de 2018, solo India enfrentará una escasez de cerca de dos lakh Data Scientists. Esto presenta una gran carrera y oportunidad de crecimiento.

Escala de pago:

Alice Hill, directora gerente de Dice, le dice a Data Informed que las publicaciones para trabajos de Hadoop han aumentado en un 64% , en comparación con el año pasado. Y que Hadoop es el líder en la categoría Big Data Hadoop de ofertas de trabajo. Según Dice, los profesionales de Hadoop obtuvieron un promedio de $ 108,669 en 2013, que está ligeramente por encima del promedio de $ 106,542 para trabajos de Big Data.

Déjame decirte cómo cambié de Java a Big Data. Como estuve trabajando en Java durante los últimos 4 años, pero no estaba satisfecho allí. No pude aprender mucho allí. Siempre quise trabajar en un campo donde puedo mejorar mi conocimiento.

Entonces, uno de mis amigos me sugirió que aprendiera Big Data Hadoop. Como Big Data es algo que crecerá día a día.

Me tomé el tiempo y pensé. Finalmente, decidí aprenderlo.

Entonces decidí unirme a la capacitación en línea para aprender Big Data.

Me uní a Dataflair como uno de mis amigos había entrenado.

Comenzaron la capacitación desde el principio sobre qué es Big Data, qué es Hadoop, los componentes clave del ecosistema Hadoop y Hadoop, etc. Me ayudaron a preparar mi currículum. Incluso, me ayudaron a prepararme para las entrevistas.

Solo por ellos, obtuve confianza y, en última instancia, obtuve selección en TCS como desarrollador de Hadoop.

Déjame decirte cómo cambié del proyecto de soporte al desarrollo de Hadoop:

Primero aprendí conceptos básicos de Java y luego comencé mi capacitación en línea de Hadoop en DataFlair. Como ya eres de Java, no necesitas ningún entrenamiento adicional en Java y eres lo suficientemente bueno como para comenzar a aprender Hadoop directamente. Allí realicé muchas prácticas y proyectos en tiempo real en Hadoop que me proporcionaron conocimientos completos para descifrar entrevistas y comenzar mi carrera en esta tecnología.

Puedes seguir el mismo camino para aprenderlo. Puede enviarme un correo electrónico a [email protected] si necesita ayuda con respecto al mismo.

JAN-FEB Edición 2014 de la revista JAVA de ORACLE tiene un buen material sobre BIG DATA para la comunidad JAVA DEV.
Contácteme si no puede encontrar el mismo en línea o impreso, podré enviarle algo

Puedes comenzar con lo básico. Recibí una capacitación en el aula por Ravi Gurbaxani . Puedes ver tutoriales en línea Inicio – Ravi Gurbaxani

Una vez que esté claro con los conceptos, intente abordar problemas básicos de big data y resolverlos. Busque oportunidades de trabajo relacionadas con Big Data en los portales de trabajo.

¡Buena suerte!

Existe este artículo perspicaz sobre cómo cambiar su carrera de Java a Big Data. Echa un vistazo, Cambiar de carrera: de Java a Big Data / Hadoop | Blog Edureka. ¿Demasiado perezoso para leer?

Mira este video Cambiando de carrera de Java a Hadoop

Por otro lado, Jigsaw Academy tiene un buscador de rutas, que le presentará un conjunto de preguntas simples para responder y le hará saber dónde le falta en términos de habilidades necesarias para cambiar a Big Data.

Cursos en línea y capacitación en análisis, ciencia de big data, SAS & R

Una buena experiencia interna cuando se pasa de Java a Big Data es la historia de Nakul, esto es lo que hizo.

Después de su B.Tech., Nakul trabajó durante dos años con una gran empresa de consultoría. Durante su MBA, Nakul se introdujo en la analítica donde, junto con sus estudios, realizó el curso de Ciencia de datos con SAS de Jigsaw. Nakul consiguió el trabajo de sus sueños en IMRB a través de ubicaciones en el campus, y ahora está trabajando como Director de Proyecto Asociado con AMRB (Millward Brown – Medio Oriente). ¿Cómo fue posible el cambio?

Mira su historia

http://www.jigsawacademy.com/suc

No tiene que abandonar Java para hacer Big Data. Hay muchos problemas que se pueden resolver con sus habilidades de Java.

Por ejemplo, hacemos muchas cosas de Hive y todas las funciones personalizadas están escritas en Java (UDF). También tenemos algunas personas que prefieren la conexión en cascada y Java.

Instala Hadoop. Descargue algunos conjuntos de datos grandes y comience a jugar con las funciones de reducción de mapas. Ir a reuniones y conferencias.

aprende hadoop y spark usando java