¿Cómo actualiza JustDial / AliBaba su listado en caso de que un Proveedor / minorista haya agregado o eliminado un artículo de su inventario?

JustDial tiene un ejército de rastreadores web (tuve la suerte de trabajar en ese equipo hace unos años)

Utilizan scripts de perl y shell para rastrear un sitio web específico. Así es como funciona.

  1. Primero, si no hay datos para un sitio web en particular en la base de datos JD, se asigna un sitio web a un desarrollador.
  2. Escribe un script en perl para rastrear todo el sitio y enviar el resultado final al equipo de DB.
  3. El equipo de base de datos agrega el resultado a las bases de datos según la categoría
  4. El mismo sitio web se rastrea periódicamente (una vez cada 2/3/4/5/6 meses según la necesidad)
  5. El equipo de DB verifica si hay algún registro nuevo presente que esté disponible en la hoja final y que no esté disponible en DB y viceversa.
  6. El equipo de base de datos agrega / elimina el registro en / de la base de datos

y bingo,
Así es como la base de datos siempre se actualiza con nueva información.
Sin embargo, hay una instalación donde los propietarios de las empresas pueden solicitar a JD que agregue su información

Confían en el propietario del negocio para actualizar la información.