Cuando la gente discute sobre la escalabilidad del comercio electrónico, siempre se centra en desafíos tecnológicos aparentemente grandiosos como la búsqueda distribuida, el inventario y los motores de recomendación. Pero lo que realmente preocupa a cada plataforma de comercio electrónico suelen ser los problemas más básicos: la inconsistencia en los valores de los atributos del producto.
Los valores de los atributos impulsan todo el sistema de descubrimiento de productos. Soportan la filtración, comparación, clasificación en búsquedas y lógica de recomendaciones. Sin embargo, en catálogos de productos reales, los valores de los atributos rara vez son limpios. La repetición, los formatos confusos y la ambigüedad semántica son la norma.
Miremos un atributo aparentemente simple como "tamaño": ["XL", "Small", "12cm", "Large", "M", "S"]
Y ahora "color": ["RAL 3020", "Crimson", "Red", "Dark Red"]
Solo con estos datos desordenados puede parecer que no hay problema, pero cuando tienes más de 300万+