Ngôn ngữ lập trình R chính thức được sử dụng trên nền tảng Google Cloud

Linh Le

Trong nỗ lực mang lại sự hỗ trợ lớn hơn cho ngôn ngữ lập trình R trên Google Cloud Platform, Google đã công bố bản phát hành beta của các công việc Spark trên Cloud Dataproc. Ngôn ngữ R được sử dụng phổ biến nhất cho các công cụ phân tích dữ liệu và ứng dụng thống kê. Theo Google, sự trỗi dậy của điện toán đám mây đã mở ra những cơ hội mới cho R.

Sử dụng GCP cho R cho phép bạn tránh các rào cản cơ sở hạ tầng được sử dụng để áp đặt các giới hạn trong việc hiểu dữ liệu của bạn, chẳng hạn như chọn bộ dữ liệu nào để lấy mẫu vì giới hạn kích thước dữ liệu hoặc tính toán. Với GCP, bạn có thể xây dựng các mô hình quy mô lớn để phân tích các bộ dữ liệu có kích thước mà trước đây cần phải đầu tư rất lớn vào cơ sở hạ tầng điện toán hiệu năng cao, ông Christopher Christopher Crosbie, giám đốc sản phẩm của Dataproc và Hadoop, và Mikhail Chrestkha, chuyên gia máy học, đã viết trong một bài đăng trên blog.

Cloud Dataproc là một dịch vụ đám mây được quản lý hoàn toàn cho các cụm Apache Spark và Apache Hadoop trên GCP, trong khi SparkR là gói nhẹ cho phép Apache Spark từ R trên frontend, công ty giải thích.

Tích hợp này cho phép các nhà phát triển R sử dụng các hoạt động giống như dplyr trên các bộ dữ liệu với kích thước gần như bất kỳ kích thước nào được lưu trữ trong Cloud Storage. SparkR cũng hỗ trợ học máy phân tán bằng MLlib. Bạn có thể sử dụng tích hợp này để xử lý các bộ dữ liệu lưu trữ đám mây lớn hoặc thực hiện công việc chuyên sâu về mặt tính toán, có tên là Crosbie và Chrestkha.

Nhiều cách khác về cách các nhà phát triển có thể sử dụng R trên GCP có sẵn tại đây.

Ngoài ra, Google đã công bố những cải tiến mới cho Cloud Spanner và Python 3.7 cho App Engine.

App Engine hiện giới thiệu thời gian chạy Python thế hệ thứ hai trên GCP. Theo công ty, các nhà phát triển hiện có thể sử dụng các phụ thuộc từ Chỉ mục gói Python hoặc kho riêng. Trình lập lịch biểu đám mây và Nhiệm vụ đám mây cũng đã được tách rời khỏi Máy ứng dụng để các nhà phát triển có thể sử dụng các tính năng này trên tất cả các dịch vụ GCP.

Các bản cập nhật cho Cloud Spanner bao gồm các cải tiến nội quan truy vấn, tính khả dụng của vùng mới và cấu hình đa vùng mới. Khả năng hướng nội mới được thiết kế để cung cấp khả năng hiển thị nhiều hơn cho các truy vấn. Khu vực mới có sẵn bao gồm Nam Carolina, Singapore, Hà Lan, Montreal, Mumbai, Bắc Virginia và Los Angeles. Cơ sở dữ liệu Cấu hình mới đầu tiên của cơ sở dữ liệu có nghĩa là cho vùng phủ sóng đa vùng ở Hoa Kỳ và được thiết kế để giảm độ trễ trong khi cấu hình thứ hai dành cho vùng phủ sóng trong EU. Thêm thông tin có sẵn ở đây.

Chia sẻ bài viết ngay

Nguồn bài viết : https://sdtimes.com