Deep learning (học sâu) là gì?

Linh Le

Hãy cùng chúng tôi tìm hểu về hiện tượng AI tiên tiến nhất hiện nay

Học sâu (Deep learning) đề cập đến một kỹ thuật để tạo ra trí tuệ nhân tạo bằng cách sử dụng một mạng lưới nơ ron thần kinh dạng lớp, tương tự như trong thiết kế trong bố trí của bộ não con người.
Nó phù hợp với một nhóm lớn hơn các kỹ thuật học máy nhằm mục đích dạy cho một máy tính để phân tích, thay vì sử dụng các thuật toán được xác định trước được xây dựng cho một nhiệm vụ cụ thể.
Học sâu dựa trên tân vỏ não (neocortex) của não, sắp xếp các nút phân tích trong một loạt các đường dẫn cho dữ liệu lưu thông ở giữa, về cơ bản kết nối chúng trong một mạng lưới giống như các nút lớp phân tầng.

Sức mạnh phân tích mà phương pháp này cung cấp là hỗ trợ công nghệ tương lai như những chiếc xe không người lái, giúp họ nhận biết dấu hiệu đường bộ hoặc phân biệt giữa các vật thể chặn đường đi của nó, như những chiếc xe khác và người đi bộ. .

Các mô hình học sâu có thể đạt được mức độ chính xác cao, đôi khi vượt quá hiệu suất ở cấp độ con người và thường được đào tạo bằng cách sử dụng một tập hợp lớn dữ liệu có nhãn và kiến trúc mạng nơron chứa nhiều lớp.

AI và các phân loại của nó

Khái niệm AI đã ra đời sơm hơn tính toán, là một thiết bị plot device phổ biến vào đầu thế kỷ 18. Công nghệ này đã được miêu tả rộng rãi trong các bộ phim như một nỗi lo sợ cho nhân loại như bộ phim: A Space Odessy hoặc The Terminator năm 2001. Tuy nhiên, chúng tôi đang bắt đầu nhìn thấy những ví dụ thực tế về công nghệ, và may mắn đó không phải là robot giết người, đang phát triển nhanh chóng và ngày nay chúng tôi có các công ty phát triển chatbot và ứng dụng hỗ trợ AI.

Vào năm 2015, một công ty tên Luka đã tạo ra một chatbot để tưởng niệm một người tên là Roman Mazurenko, người đã qua đời cùng năm đó. Các “Roman” bot được tiêu thụ trên hàng ngàn tin nhắn văn bản và các bài viết truyền thông xã hội được gửi bởi Mazurenko trong một khoảng thời gian bốn năm và sử dụng một thuật toán để bắt chước phản ứng của mình. Đây bước đầu được gọi là ‘General AI’, đó là công việc tạo ra những sinh vật nhân tạo suy nghĩ và hành động giống như chúng ta.

Chúng ta có thể tách AI thành hai loại chính, một là General AI, và một là “Narrow AI” áp dụng các nguyên tắc General AI để thực hiện các nhiệm vụ cụ thể như an ninh mạng, đã được chứng minh là có kết quả thành công hơn nhiều.

Narrow AI có thể không tiên tiến như những con robot giống như những giấc mơ khoa học viễn tưởng của chúng ta, nhưng vẫn cho phép tạo ra các hệ thống sao chép một số mức độ thông minh của con người, chủ yếu là do những tiến bộ trong học máy.

Thay vì máy chỉ sao chép hành động của con người với các thói quen được mã hóa trước, các thuật toán được sử dụng như một cách để đào tạo các hệ thống học hỏi từ dữ liệu mà chúng xử lý.

Ví dụ, trong trường hợp hệ thống cố gắng xác định hình ảnh của quả bóng sinh nhật, máy có thể được dạy để sử dụng các quy trình định sẵn, chẳng hạn như một để phát hiện hình dạng, một để xác định số, và thứ khác để phân tích màu sắc. Trong các mô hình học máy sớm, hệ thống sẽ thực hiện các thói quen mã hóa con người này và phát triển các thuật toán để giúp nó học cách xác định các đối tượng một cách chính xác.

Vậy deep learning phù hợp để sử dụng như thế nào?

Nếu như đây chắc chắn là đột phá cho sự phát triển của AI, thì đồng nghĩa với việc nhanh chóng xuất hiện những sai sót trong mô hình. Vấn đề lớn nhất là việc sử dụng các thói quen phân tích được xác định trước, đòi hỏi quá nhiều dữ liệu đầu vào của con người. Cũng có những vấn đề khi nói đến những hình ảnh khó xử lý, chẳng hạn như vật thể hoặc khuôn mặt bị mờ.

Từ đó, các mô hình đã giúp chúng ta hiểu về bộ não con người, như thuật ngữ gọi là deep learning.

Thuật ngữ ‘deep’ ám chỉ đến việc xây dựng mạng nơron phân tầng, giống như lưới của các nơron liên kết với nhau nằm trong não. Không giống như bộ não, hoạt động giống như mạng 3D, nơi một nơron có thể giao tiếp với bất kỳ nơron nào khác trong vùng lân cận của nó, các mạng nhân tạo này vận hành cấu trúc tầng, với lớp trên lớp đường dẫn được kết nối để cho phép dữ liệu lưu thông. Một kỹ thuật được gọi là truyền ngược (backpropagation) điều chỉnh trọng số giữa các nút trong các mạng này để đảm bảo một điểm dữ liệu dẫn đến đúng đầu ra.

Các nhà nghiên cứu muốn tái tạo lại quá trình phân tích phức tạp của bộ não. Mỗi lớp được thiết kế không chỉ để phân tích dữ liệu, mà còn cung cấp ngữ cảnh bổ sung qua mỗi lần. Khi đối tượng đi qua mỗi lớp, sẽ có một bức tranh chính xác hơn và sự nhận biết về nó.

Trong ví dụ bong bóng, hình ảnh sẽ được chia thành các phần cấu thành của nó, cho dù đó là màu, đánh số hoặc chữ trên bề mặt, hình dạng nào, và cho dù nó đang đứng yên hay đang bay trong không khí. Mỗi phần sau đó được phân tích bởi lớp tế bào thần kinh đầu tiên, một sự phán xét được thực hiện và được truyền đến lớp tiếp theo.

Điều này có thể hoạt động đặc biệt tốt trong cuộc chiến chống gian lận. Ví dụ: một hệ thống có thể được thiết kế để xác định hoạt động tài khoản gian lận, liên quan đến mạng nơron đầu tiên lấy dữ liệu thô, sau đó thêm thông tin theo ngữ cảnh khi nó đi qua, chẳng hạn như giá trị giao dịch và dữ liệu vị trí.

Trong khi một số mạng có thể chỉ có một vài lớp, một số chương trình, bao gồm cả AlphaGo của Google – được quản lý để đánh bại một nhà vô địch của trò chơi Chinese board game Go của Trung Quốc Vào năm 2016, có hàng trăm lớp như vậy. Đương nhiên, điều này đòi hỏi sức mạnh tính toán rộng lớn, và mặc dù mạng nơron luôn là tham vọng cho những người tiên phong AI sớm, cho đến nay điều này vẫn chưa có tính thực tế.

Hiện trạng về Deep learning hiện nay

Nhiều hệ thống học máy tiên tiến nhất hiện nay sử dụng mạng nơ-ron để xử lý dữ liệu. Những thành công gần đây trong ngành công nghiệp xe hơi không người lái đã được thực hiện có thể nhờ deep learning, trong khi các nguyên tắc cũng đang được triển khai trong các lĩnh vực quốc phòng và hàng không vũ trụ để xác định các đối tượng từ không gian.

Trong khi tiềm năng của deep learning là rất lớn, vẫn còn những hạn chế khi nói đến thực hiện đa nhiệm vụ giống như con người. Deep learning vượt trội khi nhận dạng mẫu, giống như các quy tắc phức tạp nhưng cố định của Go. Nhưng các nhà nghiên cứu chỉ ra rằngsố lượng lớn dữ liệu đào tạo cần thiết để dạy cho một cỗ máy chỉ là một bộ quy tắc cụ thể.

Ở giai đoạn phát triển hiện tại, chưa thể phát triển học sâu để thực hiện các quy trình suy nghĩ phức tạp, thích nghi của con người, tuy nhiên công nghệ này vẫn đang tiếp tục phát triển với tốc độ khá cao.

Chia sẻ bài viết ngay

Nguồn bài viết : http://www.itpro.co.uk