10 thuật toán thống trị thế giới (Phần 1)

Ngoc Huynh

Mặc dù không có định nghĩa chính thức, nhưng các nhà khoa học máy tính mô tả thuật toán là một tập hợp các quy tắc xác định một chuỗi các hoạt động. Tầm quan trọng của thuật toán trong cuộc sống của chúng ta hiện nay không thể bị phóng đại. Chúng được sử dụng hầu như ở khắp mọi nơi, từ các tổ chức tài chính đến trang web hẹn hò. Có một số thuật toán định hình và kiểm soát thế giới của chúng ta nhiều hơn những loại khác – và mười thuật toán mà chúng tôi giới thiệu qua bài viết hôm nay là quan trọng nhất.

1. Google Search

Thuật toán sáng tạo nổi tiếng của Google được mang tên PageRank.

Công cụ tìm kiếm của Google đang chiếm 66.7% thị phần tại Mỹ. Tiếp theo đó là Microsoft với 18.1%, Yahoo – 11.2%; Ask – 2.6%; AOL – 1.4%.

PageRank thường phối hợp với các phần mềm spider hoặc crawler để xử lý một lượng keyword khổng lồ và các yếu tố đi kèm với nó như: tần suất, vị trí địa lý; kèm theo đó là thời gian tồn tại của trang web được điều hướng tới. Thuật toán này định mức “chất lượng” của từng trang web để đi đến kết quả cuối cùng, liên quan tới “mức độ quan trọng” của trang web đó. Trang web có mức độ quan trọng cao nhất sẽ hiển thị ở vị trí đầu tiên trong danh sách kết quả tìm kiếm.

2. News feed của Facebook

Một sự thật không thể chối cãi, newfeeds của Facebook là nơi mà chúng ta “thích” lãnh phí thời gian của mình nhiều nhất. Nếu bạn không đặt tùy chọn “Show all the activities” trong preference thì status hiển thị trên newsfeed của bạn luôn được lọc bởi thuật toán của Facebook.

Để phân tích và dự đoán được chính xác những nội dung mà người dùng ưa thích, thuật toán này xem xét một số yếu tố như: lượng comment trên status, ảnh, event… của bạn, số lượng người ghé thăm và post bài trên Wall của bạn… Thuật toán này cũng đưa ra được một bảng xếp hạng về những người bạn tương tác với bạn nhiều nhất cũng như phân loại được các post có liên quan tới bạn.

3. OKCupid Date Matching

Theo thống kê, doanh thu hiện tại của hẹn hò online đạt $2 tỷ đô la. Nhờ sự lớn mạnh không ngừng của các trang hẹn hò như match.com, eHarmony, OkCupid, quy mô của ngành công nghiệp này đã mở rộng 3.5% kể từ khi nó xuất hiện lần đầu tiên vào năm 2008. Có rất nhiều dự báo về sự tăng trưởng tích cực của nó.

Dịch vụ hẹn hò trực tuyến ngày càng trở nên phổ biến bởi đó là cách đơn giản nhất để các cặp tình nhân có thể biết đến nhau. Và để các đối tượng có thể kết nối với bên kia, các dịch vụ hẹn hò online này sử dụng một hệ thống thuật toán nhằm phân tích hoạt động, sở thích, tâm trạng của người dùng để đưa ra các match – gợi ý trong việc tìm kiếm đối tác.

Ví dụ, OKCupid là một trang web hẹn hò online được đồng sáng lập bởi Christian Rudder – cựu sinh viên toán đến từ đại học Harvard lừng danh. Chính anh là người đặt nền tảng cho thuật toán tìm kiếm của OKCupid (dựa theo phương pháp phân tích quyết định của người dùng). Mỗi câu hỏi và quyết định tương ứng của người dùng đều dùng để làm đầu vào (input) cho các hàm đánh giá. Nhờ các thuật toán phân tích quyết định và các hàm đánh giá tối ưu, OKCupid tỏ ra vượt trội hơn khá nhiều đối thủ.

4. Hệ thống thu thập, phân loại và mã hóa dữ liệu của NSA

Chúng ta đang bị theo dõi, nhưng không phải bởi người mà là bởi thuật toán. Nhờ các vụ rò rỉ tài liệu mật (Wikileaks, Edward Snowden…), dân tình mới biết đến sự tồn tại của liên minh tình báo Five Eyes – gồm 5 quốc gia: Mỹ, Anh, Úc, Canada, New Zealan. 5 cơ quan tình báo của 5 quốc gia này bắt tay với nhau, từ đó họ kiểm soát được tất cả các cuộc điện thoại, email, ảnh chụp webcam và vị trí địa lý của mọi người. Với yêu cầu thu thập, xử lý, phân tích, tổng hợp một lượng dữ liệu khổng lồ với độ chính xác cao, đương nhiên, Five Eyes phải sử dụng các thuật toán.

Thú vị là, NSA phủ nhận việc “thu thập” dữ liệu của chúng ta. Theo thủ tục luật tố tụng năm 1982, thông tin coi như được thu thập khi và chỉ khi quá trình thu thập trực tiếp bởi nhân viên của ủy ban phòng thủ trực thuộc cơ quan tình báo quốc gia. Nếu thông tin được dò quét và trích xuất tự động từ bất kỳ nguồn nào bởi máy móc hoặc các hệ thống tự động thì các thông tin đó chỉ coi như “đươc thu thập” khi và chỉ khi chúng được xử lý thành dạng văn bản mà con người có thể đọc được.

Vấn đề nằm ở chỗ, các thuật toán lại có mối liên hệ mật thiết với con người (nói đúng ra là con người sản xuất ra thuật toán để phục vụ mục đích của mình). Và một khi chúng ta nghĩ đến việc các thuật toán thu thập dữ liệu cá nhân, chúng ta cũng phải nghĩ đến tác giả đứng đằng sau thuật toán đó và động cơ của họ. Không một cá nhân hay tổ chức nào có thể đảm bảo về tính riêng tư của các dữ liệu mà họ thu được.

Một vấn đề nữa liên quan tới thuật toán, đó là hệ mật Suite B của NSA. Hệ mật này là tập hợp các thuật toán mã hóa được phát triển bới chính NSA và phục vụ cho công việc của NSA. Hệ mật này được ứng dụng vào quá trình mã hóa dữ liệu, trao đổi khóa, chữ ký số, băm dữ liệu với mục đích duy nhất là bảo vệ tất cả thông tin của NSA.

5. Các trang thương mại điện tử

Các trang web và dịch vụ như Amazon và Netflix quan sát những quyển sách mà chúng ta mua và những bộ phim mà chúng ta stream, và từ đó đưa ra đề xuất những item liên quan dựa theo thói quen của chúng ta.

Trong vài thập niên đầu của thế kỷ 21, tính năng này cực kỳ phổ biến. Giống với thuật toán trên Newsfeed của Facebook, các thuật toán của Amazon tạo ra một trạng thái tạm gọi là filter-bubble. Filter-bubble dùng để mô tả trạng thái của người dùng khi mà họ bị “cô lập thông tin” ( khi người dùng sử dụng các trang thương mại điện tử này, những thông tin phù hợp với thói quen của người dùng được hiển thị với tần suất cao hơn rất nhiều so với các thông tin “trái” với thói quen của họ).

Chia sẻ bài viết ngay

Nguồn bài viết : http://io9.gizmodo.com/