Spotify là một dịch vụ phát nhạc trực tuyến được ra mắt vào năm 2008. Hiện nay, nó có 180 triệu người dùng hoạt động và 83 triệu người đăng ký.1
Tương tự các dịch vụ trực tuyến khác đã trở nên nổi tiếng trong thập kỷ qua, như là Amazon và Netflix, ứng dụng cung cấp cho người dùng một danh mục nội dung lớn với mức giá rẻ hơn các phương thức phân phối truyền thống. Đó chính là một phần trong công thức thành công của Spotify.
Công nghệ dự đoán tiên tiến của Spotify có tên là “icing on the cake”, được hỗ trợ bởi học máy (machine learning). Công nghệ này giúp trình bày nội dung đó theo cách thức mà mọi người có thể thấu hiểu và yêu thích.
Spotify đã quản lý thành công dựa vào danh sách Discover Weekly. Danh sách này được trí tuệ nhân tạo (AI) chọn lọc và cung cấp cho người dùng nội dung mà được cho là sẽ được yêu thích.
Trí tuệ nhân tạo đã giúp giải quyết những vấn đề gì?
Với hàng triệu bài hát trong tầm tay, người dùng không bao giờ thiếu nhạc để nghe. Tuy nhiên, họ có thể gặp khó khăn khi khám phá các nhóm nhạc và nghệ sĩ mới theo cách mà những người nghe radio đã từng gặp phải trong quá khứ.
Mặc dù có thể đủ đơn giản để họ tìm kiếm tên nhóm nhạc hay ca sĩ yêu thích của họ và nghe bản phát hành mới nhất của họ, nhưng việc khai thác tài năng mới từ hàng ngàn bản nhạc mới được thêm vào dịch vụ mỗi ngày là một đề xuất khó khăn hơn.
Trí tuệ nhân tạo được sử dụng như thế nào trong thực tế?
Spotify giới thiệu cho người dùng 30 bản nhạc mới mỗi tuần mà họ nghĩ rằng họ sẽ yêu thích thông qua danh sách phát Discover Weekly cá nhân của mỗi người.
Đối với những người trong chúng ta lớn lên tạo ra các bản phối cho bạn bè bằng cách sao chép các bài hát vào băng cassette, giống như có một người bạn thân mới, người tình cờ trở thành AI.
Một cách nhìn khác sẽ là nghĩ về AI khi lấp đầy vai trò truyền thống của DJ radio – đọc sở thích của khán giả và phát bài hát mà họ nghĩ rằng sẽ được yêu thích.
Một bước đột phá giúp podcast Discover Weekly hiểu ra rằng đó không chỉ là những gì Spotify gợi ý mang lại ích lợi cho người dùng, mà còn là cách đưa ra đề xuất.2
Khi người dùng đã quen với khái niệm “danh sách phát” như một hình thức quản lý âm nhạc từ những ngày đầu của nhạc số, khi đó dễ hiểu rằng Spotify sử dụng định dạng này để trình bày các đề xuất tự động của nó.
Công nghệ, công cụ và dữ liệu nào được sử dụng?
Cũng như với hệ thống gợi ý của Netflix, dữ liệu cho danh sách nhạc Discover Weekly Spotify được thu thập bằng cách giám sát thói quen nghe nhạc của người dùng.
Từ đó bắt đầu xây dựng các đề xuất thông qua một quá trình gọi là lọc cộng tác (collaborative filtering).3
Ví dụ đơn giản, hãy xem Người A thường xuyên nghe nhạc của Nghệ sĩ X và Nghệ sĩ Y. Một người dùng khác, Người B, thường xuyên nghe Nghệ sĩ Y và Nghệ sĩ Z.
Với dữ liệu này, một thuật toán lọc cộng tác có thể suy ra, một cách chắc chắn, Người A có thể thích được giới thiệu với Nghệ sĩ Z và Người B có thể yêu thích tác phẩm của Nghệ sĩ X.
Tất nhiên, với hàng triệu người dùng và hàng triệu bài hát, ma trận được xây dựng để cho phép các đề xuất này xuất hiện phức tạp hơn đáng kể so với trong ví dụ này, đó là lý do tại sao thuật toán AI cần thiết để cung cấp hiểu biết sâu sắc như vậy ở quy mô rất lớn.
Nó cũng tìm kiếm các tín hiệu tiêu cực – bỏ qua một bài hát trong vòng 30 giây đầu tiên khi phát và thuật toán AI của Spotify sẽ ghi nhận điều đó làm dấu hiệu cho thấy bạn không thích nó, và sẽ hạn chế những bài hát khác tương tự trong các đề xuất của mình.4
Mặc dù vậy, công cụ đề xuất Spotify, đi xa hơn thế, cũng sử dụng phân tích âm thanh và xử lý ngôn ngữ tự nhiên để tạo ra các đề xuất.
Phân tích âm thanh bằng cách chia từng bản nhạc riêng lẻ thành các phần cấu thành của nó – ví dụ: tiết tấu, nhịp, cao độ của các nốt, loại nhạc cụ và âm thanh được sử dụng, sự nổi bật và mẫu lời bài hát.
Điều này cho phép nó tinh chỉnh tính toán xác suất mà một người dùng nhất định sẽ thích một bản nhạc cụ thể bằng cách so sánh các yếu tố này với các bài hát yêu thích của họ, cũng như các bài hát được người dùng khác yêu thích, những người có sở thích nghe tương tự như của họ.
Trình xử lý ngôn ngữ tự nhiên lấy dữ liệu bên ngoài – văn bản tìm thấy trên mạng có liên quan đến bài hát cụ thể. Spotify thu thập dữ liệu trên web để tìm các bài báo và bài đăng trên blog nói về các bài hát. Nó phân tích cảm xúc của văn bản mô tả từng bài hát – thường được mô tả là “lạc quan”, hay “vui nhộn”, hay “u sầu”, hay “nặng nề” – và sử dụng dữ liệu này để xác định mức độ dễ tiếp nhận của một người dùng.5
Spotify sử dụng học sâu và mạng nơ-ron nhân tạo để kết hợp tất cả các thông tin này lại với nhau và đưa ra các khuyến nghị mà nó biết – với mức độ xác suất cao – người dùng sẽ thích nghe.6
Sẽ như thế nào nếu bạn cho một người bạn mượn thông tin đăng nhập của bạn? Chà, hóa ra Spotify nhận thức rõ rằng một tỷ lệ thành viên làm điều này. Vì vậy, thuật toán AI của nó đủ thông minh để bỏ qua những thay đổi mạnh mẽ nhưng ngắn gọn trong thói quen nghe nhạc.
Spotify không có trung tâm dữ liệu riêng. Vào năm 2018, nó đã hoàn thành việc di chuyển toàn bộ nền tảng của mình sang Google Cloud. Điều này cho phép mở rộng quy mô nhanh hơn mà không cần phải liên tục nâng cấp cơ sở hạ tầng để đón nhận những người dùng mới tham gia.7
Kết quả đạt được là gì?
Danh sách phát Discover Weekly của Spotify có nghĩa là có thể đề xuất nhạc mới mà người dùng sẽ yêu thích và đổi lại, họ có khả năng vẫn tiếp tục duy trì việc đăng ký dịch vụ của Spotify.
Thành công của nó trong việc dự đoán âm nhạc mới mà người dùng sẽ yêu thích đã được trích dẫn là yếu tố thúc đẩy thành công của nó, với số lượng người đăng ký ở mức 8 triệu người và giá cổ phiếu tăng 25% trong vòng ba tháng sau khi niêm yết tại Sở giao dịch chứng khoán New York vào tháng 4 năm 2018.8
Những thách thức và bài học chính được rút ra
- Các dịch vụ phát trực tuyến lớn như Spotify có quyền truy cập vào rất nhiều dữ liệu để họ có thể đưa ra dự đoán chính xác cao, thậm chí về các vấn đề rất cá nhân và con người như sở thích âm nhạc của chúng ta.
- Các yếu tố riêng lẻ trong một bản nhạc, như nhịp độ, nhịp và nội dung lời bài hát, là những chỉ số tốt có thể được sử dụng để khớp với người nghe, những người sẽ yêu thích nó.
- Kết hợp các kết quả phân tích của một số bộ dữ liệu khác nhau – hành vi người dùng, dữ liệu bài hát và dữ liệu văn bản bên ngoài – cho phép các hệ thống học sâu của Spotify dựa vào đó để đưa ra dự đoán ngày càng chính xác hơn.
- Trình bày dự đoán cho người dùng theo cách họ sẽ hiểu và cảm thấy thoải mái thường là yếu tố quan trọng như chính sự dự đoán – Spotify chọn định dạng Discover Weekly vì người dùng ngày càng nghe nhạc nhiều hơn thông qua các danh sách phát nhạc.
Tham khảo
1. Spotify, Spotify Technology S.A. Announces Financial Results for SecondQuarter 2018: https://investors.spotify.com/financials/press-release-details/2018/Spotify-Technology-SA-Announces-Financial-Results-for-Second-Quarter-2018/default.aspx
2. YouTube, Vidhya Murali and Ching-wei Chen on predicting music: https://www.youtube.com/watch?time_continue=166&v=n5gCQWLXJcw
3. HPAC, Music Recommendation System Spotify: http://hpac.rwth-aachen.de/teaching/sem-mus-17/Reports/Madathil.pdf
4. Music:Ally, Spotify talks playlists, skip rates and NF’s Nordic-fuelled suc-cess (#SlushMusic): https://musically.com/2017/11/29/spotify-playlists-skip-rates-nf/
5. Music Business Journal, Spotify’s Secret Weapon: http://www.thembj.org/2014/10/spotifys-secret-weapon/
6. Quartz, The Magic That Makes Spotify’s Discover Weekly PlaylistsSo Damn Good: https://qz.com/571007/the-magic-that-makes-spotifys-discover-weekly-playlists-so-damn-good/
7. Computer World, How Spotify migrated everything from on-premiseto Google Cloud Platform: https://www.computerworlduk.com/cloud-computing/how-spotify-migrated-everything-from-on-premise-google-cloud-platform-3681529/
8. FinancialTimes, Spotify gains 8m paid subscribers aided by Latin America growth: https://www.ft.com/content/16c0c91c-90cd-11e8-bb8f-a6a2f7bca546