Deezer phát triển AI để phát hiện lời bài hát rõ ràng

Dịch vụ phát trực tuyến Deezer đang phát triển công nghệ để tự động phát hiện nội dung rõ ràng trong các bài hát.

Công ty đã xem xét vấn đề này vì các hãng thu âm thường không xác định được lời bài hát gây khó chịu khi họ gửi bài hát, nó giải thích.

Trên thực tế, nó cho biết, một “phần lớn đáng kể” của thư viện của nó không có thẻ cho biết liệu một bài hát có chứa ngôn ngữ hay chủ đề mạnh hay không.

Để đáp lại, nó đang nghiên cứu một cách tự động gắn cờ nội dung đó.

Mặc dù công nghệ này chưa “phù hợp để gắn thẻ các bài hát như một cách rõ ràng theo cách hoàn toàn tự động”, nhưng nó có thể được sử dụng để giúp con người xác định tài liệu có khả năng rõ ràng.

Vấn đề đã trở nên lớn hơn theo cấp số nhân trong vài năm qua, với những lời tục tĩu thường xuyên xuất hiện trong các bài hát pop chính thống như Ariana Grande và Beyonce.

Thêm vào đó, một dịch vụ phát trực tuyến như Deezer có thể nhận tới 40.000 bản nhạc mới mỗi ngày, khiến con người không thể xem lại tất cả nội dung trữ tình.

Phụ huynh đặc biệt muốn sàng lọc nội dung rõ ràng – nhưng trong khi các dịch vụ chính như Deezer, Apple và Amazon Music cung cấp khả năng “tắt” các bài hát rõ ràng, thì kết quả rất tốt.

Đó là điều khiến Deezer điều tra vấn đề này, và người đứng đầu nghiên cứu và phát triển của công ty, ông Manuel Moussallam, đã trình bày chi tiết về quá trình phát triển hệ thống này trong một blog dài vào đầu tuần này.

Nhiệm vụ “đòi hỏi sự hiểu biết cao về các kỳ vọng văn hóa và liên quan đến nhiều sự chủ quan”, ông nói, với “rất nhiều cân nhắc về đối tượng dự định và bối cảnh nghe”.

Ông nói thêm rằng, trong khi một danh sách các từ xúc phạm có thể được tổng hợp thành một “từ điển rõ ràng”, thì máy thường khó hiểu được ca sĩ hay rapper đang nói gì, hoàn toàn bằng cách phân tích một bản nhạc ở dạng hiện có.

Để giúp đỡ, công ty đã sử dụng công cụ “Spleeter” hiện có, có thể trích xuất giọng hát từ các bài hát, nhưng Moussallam lưu ý rằng kết quả vẫn không hoàn hảo.

“Không ai trong số các hệ thống [chúng tôi] coi mức độ chính xác đạt được có thể so sánh với con người”, ông nói, gợi ý rằng máy móc đơn giản có thể được sử dụng để gắn cờ nội dung có khả năng gây khó chịu cho con người.

Tài liệu nghiên cứu đầy đủ của Deezer sẽ được xuất bản tại Hội nghị quốc tế sắp tới về Âm học, Phát âm và Xử lý tín hiệu, sẽ được tổ chức vào tuần tới.

5/5 (3 Reviews)