Google cải thiện dịch vụ nhận dạng bài hát bằng trí tuệ nhân tạo từ Pixel 2

Linh Le

Nhận dạng bài hát ngoại tuyến (còn được biết đến với cái tên Now Playing) là một trong những tính năng được yêu thích nhất của Google Pixel 2. Một số công nghệ AI mạnh mẽ đằng sau nó hiện là một phần của tính năng Tìm kiếm âm thanh tương tự hiện diện trong Google Tìm kiếm và Trợ lý Google, cho phép cung cấp kết quả nhanh hơn và chính xác hơn trên bất kỳ thiết bị nào hỗ trợ các dịch vụ này.

Khi Now Playing hoạt động ngoại tuyến, tiện ích Tìm kiếm âm thanh (Sound Search) sẽ yêu cầu kết nối internet. Để sử dụng, bạn chỉ cần bắt đầu truy vấn giọng nói trên điện thoại, lúc này trên điện thoại sẽ xuất hiện lời nhắc “Đây là bài hát gì? nếu có nhạc đang phát xung quanh; chọn vào đó để Google tìm ra bản nhạc.
Để nhận ra bài hát trên Pixel 2, trước tiên, AI đã tạo “dấu vân tay” nhận dạng clip âm thanh có độ dài tám giây – được ghi lại qua micrô của thiết bị – bằng cách tạo bảy lần nhúng, mỗi lần hai giây (các đoạn âm thanh mẫu nhỏ) trong khoảng thời gian một giây. Sau đó, nó tìm kiếm trên cơ sở dữ liệu trên thiết bị hai lần cho mỗi lượt: Lần tra cứu đầu tiên nhanh nhưng không chính xác, trong khi lần thứ hai là tìm kiếm chi tiết. Google cập nhật cơ sở dữ liệu này thường xuyên để đưa vào các bài hát mới.

Google đưa ra lời giải thích rằng Tìm kiếm âm thanh hoạt động trên quy mô lớn hơn Now Playing, khiến việc tìm kiếm bài hát trở nên khó khăn hơn. Nhưng vì đó là một hoạt động phía máy chủ nên không bị giới hạn từ việc tính toán có sẵn trên thiết bị di động theo cách riêng của Now Playing.

Vì vậy, đội ngũ làm việc của Google đã giới thiệu ba thay đổi chính để cải thiện tiện ích Tìm kiếm âm thanh:

– Tăng gấp bốn lần kích thước của mạng lưới nơ-ron để chuyển đổi âm thanh ghi được từ không gian được nhúng vào.

– Tăng mật độ nhúng bằng cách lấy dấu vân tay mỗi 0,5 giây thay vì 1 giây để khớp nhanh hơn và chính xác hơn.

– Thay đổi trọng lượng của chỉ số trong cơ sở dữ liệu để xác định các bài hát phổ biến một cách nhanh chóng.

Từ các kiểm tra ngắn trong một quán cà phê ngày hôm nay, Sound Search đã được xác nhận là hoạt động chính xác hơn, vì đã xác định chính xác các bài hát như The Middle của Cimorelli và một bản cover Starboy của Rajiv Dhall.

Điều đó sẽ giúp khả năng nhận diện bài hát tốt hơn so với trước đây – và hy vọng loại bỏ các ứng dụng thứ ba có chức năng tương tự, như Shazam và SoundHound. Đội ngũ về Trí tuệ nhân tạo của Google cho biết rằng bước tiếp theo của Tìm kiếm âm thanh là nhận ra các bài hát tốt hơn trong môi trường ồn ào. Chúng tôi đang rất mong chờ bước cải tiến này hoàn thành.

Chia sẻ bài viết ngay

Nguồn bài viết : https://thenextweb.com