Khi mọi người thảo luận về quy mô thương mại điện tử, họ thường tập trung vào các thách thức công nghệ tưởng chừng lớn lao như tìm kiếm phân tán, tồn kho, hệ thống đề xuất. Nhưng điều thực sự khiến mỗi nền tảng thương mại điện tử đau đầu thường là những vấn đề cơ bản nhất: sự không nhất quán của thuộc tính sản phẩm.
Giá trị thuộc tính thúc đẩy toàn bộ hệ thống khám phá sản phẩm. Chúng hỗ trợ lọc, so sánh, xếp hạng tìm kiếm và logic đề xuất. Tuy nhiên, trong danh mục hàng hóa thực tế, giá trị thuộc tính hiếm khi sạch sẽ. Trùng lặp, định dạng rối rắm, ý nghĩa mơ hồ mới là trạng thái phổ biến.
Hãy xem thuộc tính "kích thước" tưởng chừng đơn giản: ["XL", "Small", "12cm", "Large", "M", "S"]
Rồi đến "màu sắc": ["RAL 3020", "Crimson", "Red", "Dark Red"]
Chỉ nhìn những thứ hỗn loạn này có vẻ không vấn đề, nhưng khi bạn có hơn 300万+