JavaScript framework mới giúp Firefox trở nên thông minh hơn

Ngoc Huynh

Fathom framework của Mozilla giúp các trình duyệt có thể hiểu rõ các web page như con người.

Với Fathom framework – một framework được viết dựa theo JavaScript, Mozilla muốn trích xuất ý nghĩa của các web pages và tạo ra một trình duyệt thông minh hơn.

Được xem như là một “ngôn ngữ nhỏ” dùng để viết các semantic extractors (trình trích xuất ngữ nghĩa), Fathom hiện đang trong quá trình phát triển với công cụ theo dõi lưu lượng truy cập web Activity Stream của Firefox, lựa chọn các mô tả trang, hình ảnh, và các mục khác. Tuy vẫn còn đang trong giai đoạn đầu phát triển, nhưng Fathom đã giúp FireFox hiểu rõ cấu trúc và nội dung của web page. Framework này có thể được triển khai trong các trình duyệt, tiện ích mở rộng của trình duyệt và phần mềm phía server.

Nhờ framework này mà Firefox có thể hiểu rõ về các web page như con người. Chẳng hạn như: trình duyệt có thể nhận diện và theo dõi một log-in link, cung cấp các hotkey để gạt bỏ các popover, ẩn navigation không cần thiết hoặc các header trên các màn hình nhỏ, và xác định những gì cần in mà không cần in stylesheets.

Ngoài ra, Fathom là một ngôn ngữ dòng dữ liệu như Prolog. Nó trích xuất ý nghĩa của các web pages, xác định các phần như address form, nút Previous/Next, và nôi dung nguyên văn chính. DOM nodes được score và trích xuất dựa theo các điều kiện đặc trưng người dùng, và một hệ thống các types (kiểu) và annotations biểu thị dependency giữa scoring steps và controls state. Các tập hợp scoring rules hiện tại có thể được mở rộng mà không cần phải trực tiếp chỉnh sửa chúng, do đó các tinh chỉnh bên thứ ba có thể được trộn lẫn vào nhau.

Chia sẻ bài viết ngay

Nguồn bài viết : http://www.infoworld.com