Amazon es un gran ejemplo de la complejidad que puede venir con un amplio catálogo de productos que necesita organización. Su oferta abarca desde comestibles hasta muebles y productos digitales. Ofrecen cientos de millones de SKU. Echa un vistazo a su directorio.
Amazon, como la mayoría de los sitios, utiliza un conjunto jerárquico de categorías limitantes desde la categoría principal hasta los nodos. Cada producto está vinculado a una categoría (generalmente un nodo). A veces, los productos se pueden vincular a múltiples categorías.
Piense en un televisor LED de 60 “disponible en Amazon. Aquí está su categorización principal:
- ¿A quién le gusta comprar en línea?
- ¿En qué mercados en línea están disponibles en el sudeste asiático para vender mis productos?
- ¿Qué es Magento Enterprise Cloud Edition?
- ¿Puede una persona de la India comenzar un sitio web de suscripción paga dirigido a los Estados Unidos o el Reino Unido?
- ¿Cómo puede estar seguro el consumidor de que está obteniendo la mejor calidad de los portales de comercio electrónico como Flipkart, Snapdeal y Amazon?
Su categoría más estrecha (nodo) son los televisores LED y LCD, que es una categoría secundaria de televisores , que es secundaria de Television & Video , que es secundaria de electrónica . Cada una de estas categorías también tiene elementos de metadatos que incluyen una descripción y atributos del producto. Los atributos del producto (por ejemplo, Tamaño de pantalla de TV) le permiten filtrar cuando navega por categoría. Se espera que los productos dentro de una determinada categoría tengan datos para los atributos predeterminados de la categoría.
Los metadatos de cada categoría y su relación con sus categorías padre e hijo se almacenan en la base de datos de Amazon. Hay un sistema de software (casi seguro de cosecha propia) que administra la base de datos y brinda a los empleados una interfaz para administrar las categorías y su estructura. Ya está bastante bien definido, habiendo crecido a lo largo de los años que han estado en el negocio. No conozco los detalles, pero imagino que tienen algunos procesos internos que aseguran que los cambios sean examinados. La arquitectura / infraestructura de almacenamiento de esa cantidad de datos puede ser un desafío, pero creo que el mayor desafío en taxonomía para un catálogo tan grande es la gestión de la calidad de los datos.
Amazon tiene un control centralizado efectivo sobre la estructura de categorías, ya que limitan quién puede editar o agregar categorías. Sin embargo, los datos de sus productos provienen de una amplia variedad de lugares. Algunos datos de productos provienen de sus comerciantes, otros datos provienen directamente de los fabricantes, y aún más provienen de terceros a través de su plataforma de mercado. ¡Es un trabajo difícil examinar todos esos datos entrantes!