Linkedln chính thức phát hành FeatureFu – một bộ công cụ dùng để xây dựng Machine Learning thành mã nguồn mở

Ngoc Huynh

Linkedln vừa mới chính thức phát hành một công cụ nội bộ có tên là FeatureFu thành mã nguồn mở. Bộ công cụ FeatureFu giúp cho các lập trình viên xây dựng machine learning (có nghĩa là Học máy, có tài liệu gọi là Máy học) bao gồm các máy thống kê và cây quyết định dễ dàng hơn.

LinkedIn muốn đem sự hiểu biết của mình về “sự sắp đặt các tính năng” và tạo điều kiện cho các lập trình viên bên ngoài công ty có thể truy cập vào công cụ này dễ dàng. Trong machine learning, về cơ bản sự sắp đặt các tính năng đang sử dụng sự hiểu biết của bạn về hiện tượng mà bạn đang nghiên cứu và sau đó sử dụng nền tảng kiến thức đó để xây dựng các mô hình machine learning.

LinkedIn cho rằng hầu hết các hệ thống gợi ý (recommendation system) ở quy mô lớn thường được quản lý bởi ít nhất hai nhóm: một nhóm xử lý mô hình hóa offline và một nhóm xử lý mô hình hóa online. Điều này dẫn tới nhiều vấn đề mà FeatureFu đang cố giải quyết.

“Nhiều recommendation system ở quy mô lớn thì dễ bị tấn công. FeatureFu cho phép phương thức phát triển linh hoạt (agile development) và sáng tạo trên những hệ thống này để mà việc tạo ra các tính năng mới không tốn nhiều thời gian,” ông Bing Zhao – kỹ sư phần mềm cao cấp của LinkedIn cho biết.

Một sự thay đổi nhỏ trong cách mà các tính năng được sinh ra có thể tạo ra nhiều công việc cho các nhóm khác và cũng gây ra sự khó khăn khi tiến hành thực nghiệm với các kỹ thuật hiện đại/tính năng khác biệt.

FeatureFu sử dụng thư viện nhỏ của Java có tên là Expr, các lập trình có thể sử dụng để chuyển đổi và xây dựng dựa trên các tính năng hiện có. Ông Zhao mô tả những lợi thế của hệ thống này như sau: “Một khi các tính năng online được triển khai, thì nó sẽ loại trừ các nhu cầu thêm nữa cho các thay đổi về lập trình để tạo ra các mô hình cho các tính năng được dẫn xuất đa dạng.”

Vậy tại sao LinkedIn đã quyết định phát hành công cụ này thành mã nguồn mở? “Khi chúng tôi có nhu cầu kinh doanh phần mềm, thì đầu tiên chúng tôi muốn biết liệu có dự án nào trước đó là mã nguồn mở không. Nếu không có thì chúng tôi sẽ tạo ra nó,” ông Zhao cho biết. “Chỉ cần phần mềm không phải là bộ vi phân doanh nghiệp, thì chúng tôi sẽ thường phát hành nhiều công cụ thành mã nguồn mở để mà mọi người đều có thể sử dụng.”

Ông Zhao cũng hy vọng FeatureFu sẽ được mọi người chấp nhận rộng rãi. “FeatureFu có thể trở thành một kỹ thuật phổ biến cho nhiều hệ thống machine learning,” ông nói. “Công cụ này giúp cho việc sắp đặt các kỹ năng linh hoạt hơn, đây là một trong những chìa khóa thành công cho các ứng dụng machine learning. Do đó chúng tôi muốn chia sẻ nó với mọi người.”

Chia sẻ bài viết ngay

Nguồn bài viết : http://techcrunch.com/