Đâu là bí ẩn đằng sau ma thuật của Amazon, Facebook để giới thiệu tới bạn chính xác những bộ phim bạn muốn xem, những con người bạn muốn gặp, những fan page bạn muốn like?
Đối với khách hàng bình thường, tất cả những lời đề nghị ta nhận được khi lang thang trên mạng có vẻ như giống nhau. Họ không thấy có sự khác biệt lớn giữa những thứ mà “bạn có thể thích”, “bạn của bạn đã thích”, và “người mua thứ này cũng từng mua sản phẩm kia ”. Thực ra, đó là cả một sự khác biệt lớn, và cách tiếp cận nó có thể là chìa khóa giúp phát triển hoặc hạ gục một doanh nghiệp trực tuyến.
Theo Giám đốc xử lý dữ liệu Vipul Sharma của Eventbrite, để tạo ra đề xuất hợp lý liên quan chặt chẽ tới cấu trúc dữ liệu và cả cách bạn kinh doanh. Công ty cần biết người dùng của họ là ai, loại dữ liệu có thể thu thập là gì và cách dùng chúng để tìm ra thứ mà người tiêu dùng thật sự muốn. Công ty cần phải hiểu về khoa học của dữ liệu.
Mô hình thu nhỏ của Amazon.
Amazon là một ví dụ tốt về cách tiếp cận vấn đề. Theo Sharma, người khổng lồ về thương mại điện tử sử dụng một mô hình phân cấp để đề xuất thêm những mặt hàng khác cho người mua. Sản phẩm được phân loại để luôn nhớ việc giới thiệu “kèm” pin cho người đang mua máy ảnh. Tuy nhiên khi danh mục sản phẩm nhiều lên, Amazon đã nâng khả năng phân tích và sử dụng biện pháp mới dựa trên những sản phẩm mà những người từng mua sản phẩm này đã mua.
Hiện tại, Amazon còn có thể đưa ra những đề xuất chính xác hơn nhờ dự liệu theo thời gian thực mua sắm thực để phỏng đoán rằng bạn nên mua gì. Nhờ cho thấy “Khách hàng mua thứ này cũng mua những sản phẩm sau” Amazon không chỉ bán được nhiều hơn, mà còn giúp người tiêu dùng thấy an tâm, vì họ tin vào quyết định của số đông khi lựa chọn những sản phẩm phù hợp với nhau.
Tất nhiên Amazon cũng sử dụng một quá trình gọi là “bộ lọc hợp tác” để đưa ra những lời đề xuất cho khách hàng thậm chí trước khi họ tìm kiếm bất cứ thứ gì. Những đề xuất này không chỉ dựa vào sản phẩm được mua cùng nhau như trên, mà còn dựa vào thói quen tiêu dùng của những khách hàng có cùng lịch sử mua sắm và sở thích như bạn. Amazon đã giải thích quá trình này khá rõ trong phần FAQ về mục đề xuất.
“Chúng tôi xác định sở thích của bạn bằng việc xem xét những mặt hàng bạn đã mua, những mặt hàng nào bạn đã có, những sản phẩm bạn đã đánh giá, đã thích. Tiếp đó chúng tôi so sánh hoạt động của bạn trên trang của chúng tôi với những hoạt động của khách hàng khác, từ đó đưa ra đề xuất về mặt hàng có thể bạn sẽ thích.”
Amazon có một thủ thuật mà nhiều công ty khác không có: Những người mua hàng dành nhiều thời gian trên trang và phần lớn không ngại bỏ một chút công sức để có được những đề xuất chính xác hơn. Vì vậy Amazon có thể thu thập dữ liệu chính xác hơn nữa bằng cách hỏi khách hàng về những sản phẩm được đề xuất – để xem họ có đang sở hữu nó không, họ có thích nó không, và họ có thích cách giới thiệu như vậy không. Dữ liệu càng chính xác, các đề xuất hoặc quảng cáo càng hiệu quả.
Tất cả đều khác nhau
Tuy nhiên Sharma giải thích rằng mỗi công ty web đều có một cách đặc biệt để đưa ra đề xuất cho người dùng. Facebook dựa vào đồ hình xã hội của riêng mình để đưa ra đề xuất dựa vào những gì bạn bè người dùng đã “like” (và các quảng cáo chủ yếu dựa vào “like” của người dùng). Là một nền tảng liên kết giữa bạn bè, nên Facebook cho rằng người dùng sẽ quan tâm tới những hành động và sở thích của bạn bè họ.
Netflix sử dụng một phương pháp khác, tập trung vào nỗ lực đề xuất dựa vào tính chất của nội dung. Thuật toán của công ty đo lường mối quan hệ giữa những nội dung riêng biệt dựa trên những biến như thể loại phim, diễn viên, đánh giá và cả thứ tự mà người dùng hay chọn xem. Cá nhân hóa trong trường hợp này nghiêng nhiều về đồ hình sở thích (interest graph) hơn đồ hình xã hội – Netflix biết bạn thích điều gì (hoặc ít nhất là bạn đã xem gì) và đưa ra nội dung mới có liên quan. Như tôi đã giải thích ở đây, một đồ hình là yếu tố bắt buộc trong lưu trữ thông tin dữa trên mối quan hệ giữa chúng.
(Tuy nhiên có một số lập luận rằng Netflix nên phân nhóm người dùng dựa trên sở thích vì những nội dung mà người có cùng sở thích đang xem có thể sẽ tạo ra đề xuất thích hợp hơn việc cố gắng đọc xem nội dung đó nói về cái gì ).
Vào tháng 6, đồng nghiệp của tôi Stacey Higginbotham viết về bí ẩn đằng sau khả năng đề xuất tốt của Apple trên iTunes. Phương pháp có vẻ không có gì đặc biệt, nhưng rất tiếc khi một post trên Quora giải thích về nó đã bị dỡ.
Đồ hình xã hội ẩn của Eventbrite:
Để có thể đề xuất sự kiện phù hợp với người dùng, EventBrite đã sử dụng kết hợp những chiến thuật trên. Mô hình chủ yếu dựa trên tính chất các sự kiện mà người dùng tham dự để giới thiệu và đồ hình hóa các sở thích của họ, tuy nhiên theo Sharma, họ cũng xây dựng một đồ hình xã hội ẩn giữa những người hay cùng đến một sự kiện.
“Chúng tôi ngầm định họ là bạn bè của bạn và tin rằng họ là một phần trong mạng lưới quan hệ của bạn vì họ chia sẻ cùng sở thích với bạn một cách bền bỉ”. Với một người luôn đi những chương trình âm nhạc lớn hoặc các sự kiện về big data, anh ta hẳn sẽ hứng thú với nhug74 người cũng đến sự kiện đó
Eventbrite có sử dụng Facebook Connect (một cách để khai thác đồ hình xã hội có sẵn của Facebook), nhưng theo Sharma, Facebook Connect “có hữu ích, nhưng không thật sự quá tuyệt”. “Mọi người không thường xuyên cập nhật về sở thích của họ và mối quan tâm trong nghề nghiệp của một người có thể không liên quan tới sở thích ngoài cuộc sống. Mặc dù Sharma không nhắc đến nhưng theo các doanh nghiệp khác cũng đang xây dựng đồ hình, những gì mọi người thể hiện ra nơi công cộng (và trên Facebook) không nhất thiết trùng với sở thích mà họ bộc lộ thông qua hành đồng thực.
Một khó khăn với những công ty nghiêng về dịch vụ như Eventbrite là người dùng thường không nhiệt tình trả lời những câu hỏi để giúp công ty tạo ra mô hình tốt hơn. Họ không nghiện sự kiện (hoặc họ không thấy sự kiện quan trọng như bộ phim họ xem). Người dùng Amazon và Netflix có thể trả lời những câu hỏi giúp cải thiện các đề xuất, và Facebook cũng có những cách để nhận biết (ví dụ như khi người dùng block hoặc unlike ai đó), nhưng nếu Eventbrite muốn có dữ liệu đó, họ phải có một cách tiếp cận nhẹ nhàng với người dùng.
Và trong khi buổi nói chuyện hôm nay liên quan đến đồ hình xã hội và sở thích, Sharma nghĩ rằng tương lại của đề xuất trực tuyến sẽ là đồ hình đối tượng (object graph). Một công ty âm nhạc không chỉ cần biết khách hàng thích âm nhạc, mà họ còn phải biết cô ấy chơi nhạc cụ nào. Điều này sẽ rất khó với những công ty không thể hỏi trực tiếp khách hàng về những sở thích cụ thể, nhưng Sharma nói việc thu thập thông tin từ trên chính trang của mình và từ các bên khác sẽ ngày càng dễ dàng, dẫn tới những phân tích sâu hơn, cụ thể hơn, kể cả đối với những công ty nhỏ.
Sự cá nhân hóa là một phương pháp thông dụng mà các dịch vụ web dùng để khẳng định giá trị của mình. Netflix khẳng định rằng 75% những gì mọi người xem không hề tồn tại với người khác và là kết quả từ một đề xuất. Đối với Eventbrite, Sharma đã nói: chúng tôi không yêu cầu người dùng trả tiền dịch vụ hàng tháng, nhưng khi người dung yêu sản phẩm, họ sẽ trung thành với nó.”
Theo Derrick Harris