Google công khai mã nguồn mở của các công cụ TensorFlow

Ngoc Huynh

Tensor2Tensor đơn giản hóa mô hình deep-learning (học sâu) để các lập trình viên có thể tạo ra workflows của máy học (machine learning) dễ dàng hơn.

Trong những năm qua, TensorFlow của Google đã tự khẳng định mình như là một bộ công cụ mã nguồn mở phổ biến dành cho deep learning. Nhưng việc training một mô hình TensorFlow có thể trở nên cồng kềnh và chậm chạp – đặc biệt khi đó là nhiệm vụ lấy một dataset được sử dụng bởi người khác và cố gắng tinh chỉnh quá trình đào tạo mà nó sử dụng.

Trong tuần này, Google đã công khai mã nguồn mở một dự án nhằm giảm bớt số lượng công việc trong việc lập cấu hình mô hình deep learning về training. Tensor2Tensor, hoặc gọi tắt là T2T, là một thư viện được viết dựa trên Python. Nó cho phép các nhà phát triển xác định các yếu tố chính được sử dụng trong mô hình TensorFlow và xác định mối quan hệ giữa chúng.

Các yếu tố chính:
• Datasets (Tập dữ liệu): T2T có sự hỗ trợ gắn liền dành cho một vài dataset phổ biến được sử dụng để training. Bạn có thể thêm các dataset mới vào các workflow của riêng bạn hoặc thêm chúng vào T2T project chính thông qua một pull request.
• Problems và modalities (Vấn đề và cách thức): Những mô tả về những loại nhiệm vụ training, chẳng hạn như nhận dạng giọng nói so với machine translation, và những loại dữ liệu dành cho chúng cũng như được sinh ra từ chúng. Ví dụ, một hệ thống nhận dạng hình ảnh sẽ lấy hình ảnh và chuyển đổi thành các text label.
• Models (Mô hình): Nhiều model được sử dụng phổ biến đã được đăng ký với T2T, nhưng bạn cũng có thể thêm vào nữa.
• Hyperparameters: Bạn có thể tạo ra các tập hợp cài đặt khác nhau dùng để điều khiển quá trình training, do đó bạn có thể chuyển đổi giữa chúng hoặc kết hợp chúng với nhau khi cần thiết
• Trainers: Bạn có thể chỉ định riêng các thông số được truyền đến training binary thực tế.

Bên cạnh đó, T2T sẽ còn có những mặc định dành cho mỗi yếu tố. Một số mô hình và datasets phổ biến được đưa vào T2T, vì vậy bạn có thể nhanh chóng bắt đầu bằng cách sử dụng lại hoặc mở rộng trên một model hiện có và triển khai một trong những mặc định và chỉnh sửa với nó nếu cần.

Những gì T2T không làm được đó là cung cấp một context lớn hơn TensorFlow đối với việc tổ chức một dự án deep learning. Về mặt lý thuyết, nó có thể trở thành một phần của hệ thống data-to-prediction, end-to-end, cho việc xây dựng các giải pháp máy học, nhưng ngay bây giờ nó chỉ đơn giản là giúp sử dụng TensorFlow dễ dàng hơn và điều đó hoàn toàn có giá trị.

Chia sẻ bài viết ngay

Nguồn bài viết : http://www.infoworld.com