Facebook công bố mã nguồn mở các phần mềm trí tuệ nhân tạo giúp phân loại đối tượng trong hình ảnh

Ngoc Huynh

Facebook vừa mới chính thức công bố mã nguồn mở một vài phần mềm trí tuệ nhân tạo (AI – Artificial Intelligence) giúp phân loại đối tượng trong hình ảnh (Segmenting objects within images). Các phần mềm này hiện đã có mặt trên GitHub theo giấy phép BSD bao gồm: DeepMask, SharpMaskMultiPathNet.

Đây không phải là lần đầu tiên Facebook mở mã nguồn các chương trình này cho cộng đồng. Hiện nay, toàn bộ công trình nghiên cứu về trí thông minh nhân tạo (Artificial Intelligence Research – FAIR) đang mở ra cho cộng đồng làm phần mềm có thể trải nghiệm và xây dựng trực tiếp trên nó.

Image segmentation đã phát triển lên một bậc nữa khi mà nó có thể nhận diện con người, nơi chốn, hay vật thế trong một hình ảnh, và thậm chí nó còn thể xác nhận địa điểm thông qua dữ liệu trên hình ảnh. Để làm được việc đó, Facebook đang dùng một công nghệ A.I gọi là deep learning, một công nghệ cho phép huấn luyện trí thông minh thông qua rất nhiều mạng dữ liệu rồi từ đó giúp chúng có thể tư duy từ những nguồn dữ liệu mới.

Trên blog cá nhân của nhà khoa học Piotr Dollar, các chương trình này đã được mô tả vắn tắt như sau: “DeepMask sẽ tạo ra các initial object masks, SharpMask làm rõ lại các mask này, và cuối cùng MultiPathNet tiến hành nhận diện các chủ thể được thiết lập từ các mask.”

Đây không phải những hệ thống trí tuệ nhân tạo đầu tiên của Facebook, trước đó hãng cũng đã tung ra Torchnet vào hồi tháng Sáu.

Apple, Baidu, Google, Microsoft và các công ty khác cũng đã đầu tư rất nhiều vào việc nghiên cứu và phát triển công nghệ deep learning.

Facebook cũng đã có nhiều ý tưởng trong việc sử dụng những công cụ trí tuệ nhân tạo này để tạo ra các ứng dụng tốt hơn. Ông Dollar đã viết như sau:

Việc để máy có thể tự nhận dạng vật thể trên các bức ảnh, nó sẽ giúp người dùng có thể tìm kiếm những bức hình cụ thể một cách dễ dàng hơn. Công cụ này cũng sẽ giúp những người bị khiếm thị có thể hiểu được nội dung những bức ảnh mà bạn bè mình đang chia sẻ, hệ thống sẽ có thể giúp họ làm được điều ấy một cách dễ dàng.

Hơn nữa, đây cũng là một định hướng giúp cải thiện trải nghiệm người dùng hơn nữa. Thách thức tiếp theo của chúng tôi là ứng dụng công nghệ này vào video, nơi mà các vật thể di chuyển liên tục, tương tác, và thay đổi theo thời gian. Hiện chúng tôi cũng đã đang có một số hướng đi nhất định với computer vision techniques giúp tương tác trên video theo thời gian thực, hiểu và phân loại được vật thể ví dụ như con mèo hay đồ ăn. Và đặc biệt, công nghệ classification này sẽ giúp tăng độ tương tác trên các Live videos.

Chia sẻ bài viết ngay

Nguồn bài viết : http://venturebeat.com/