Phân tích cảm xúc bằng hộp công cụ mã nguồn mở MixedEmotions

Linh Le

MixedEmotions: open-source toolbox for emotion analysisA

Nhóm nghiên cứu ở châu Âu, cùng với Đại học Kỹ thuật Madrid, đã phát triển một hộp công cụ mã nguồn mở để đánh giá cảm xúc trong văn bản, âm thanh và video.

MixedEmotions Toolkit là một bộ công cụ mã nguồn mở phân tích cảm xúc. Hộp công cụ này là kết quả của dự án nghiên cứu MixedEmotions. Mục đích của dự án này là tự động nhận biết cảm xúc thông qua xử lý văn bản, âm thanh và video.

Hành động của chúng ta bị ảnh hưởng bởi cả tâm trạng lẫn cách chúng ta cảm nhận về người khác. Nhu cầu phân tích cảm xúc tự động trong các lĩnh vực khác nhau ngày càng tăng. Ứng dụng của nghiên cứu này có thể bao gồm các trung tâm cuộc gọi, môi trường thông minh, phân tích danh tiếng thương hiệu và công nghệ hỗ trợ.

Đầu tiên, các công cụ phân tích có thể rất phức tạp. Để nhận dạng cảm xúc, có thể yêu cầu tuổi tác, giới tính hoặc nhận dạng khuôn mặt. Thứ hai, phân tích cũng đòi hỏi cả kiến thức và tài nguyên ngôn ngữ tiên nghiệm, những dữ liệu không phải lúc nào cũng được công khai, và thứ ba, những công cụ này thường được thiết kế bằng một ngôn ngữ, thường là bằng tiếng Anh.

Để đưa các công cụ này vào các ngôn ngữ khác là một nhiệm vụ khó khăn đòi hỏi tài nguyên cụ thể trên từng ngôn ngữ. Tất cả các vấn đề này kết hợp lại đã làm giảm phạm vi hoạt động của các công cụ có sẵn miễn phí.

Mục đích của MixedEmotions là tăng số lượng các công cụ này. Các công cụ phát triển được điều chỉnh theo nhiều ngôn ngữ Châu Âu khác nhau để nhận diện tiềm năng đa văn hóa và đa ngôn ngữ của công nghệ hiện tại.

Để hiển thị tiện ích của các công cụ này, các nhà nghiên cứu đã thử nghiệm chúng trong bối cảnh ba trường hợp sử dụng cụ thể: một ứng dụng TV thông minh cung cấp các khuyến nghị dựa trên cảm xúc, hệ thống giám sát trung tâm cuộc gọi để đánh giá tâm trạng và phản ứng của khách hàng trong từng cuộc gọi và hệ thống danh tiếng thương hiệu trực tuyến cho các công ty nghiên cứu ý kiến và phản hồi của khách hàng.

Để hiển thị tiện ích của các công cụ này, các nhà nghiên cứu đã thử nghiệm chúng trong bối cảnh ba trường hợp sử dụng cụ thể: một là ứng dụng TV thông minh đưa các khuyến nghị dựa trên cảm xúc, hai là hệ thống giám sát trung tâm cuộc gọi để đánh giá tâm trạng và phản ứng của khách hàng trong mỗi cuộc gọi và ba là hệ thống danh tiếng thương hiệu trực tuyến cho các công ty nghiên cứu ý kiến và phản hồi của khách hàng.

Nhóm hệ thống thông minh (Intelligent System Group, GSI) từ UPM đã có những đóng góp cho dự án này. Đầu tiên, họ đã chỉ đạo mô hình hóa dữ liệu liên kết cho các dịch vụ và từ vựng ngữ nghĩa. Kết quả là, tất cả các công cụ dự án đều sử dụng loại từ vựng này dựa trên các nguyên tắc dữ liệu được liên kết.

Điều này làm giảm khả năng tương tác, vì các phân tích trong các phương thức khác nhau được thực hiện bằng cách sử dụng các kỹ thuật nhiệt hạch. Fernando Sánchez, một nhà nghiên cứu của GSI cho biết: “Liên quan đến vấn đề này, chúng tôi đã phát triển một nhóm cộng đồng trên World Wide Web Consortium (W3C), một cộng đồng quốc tế tập trung vào việc phát triển các tiêu chuẩn để đảm bảo sự phát triển Web dài hạn, để thảo luận mô hình hóa ngữ nghĩa này và chuyển giao kết quả thu được.”

Thứ hai, nhóm GSI đã phát triển ra Senpy, một gói phần mềm để phát triển và phát hành các dịch vụ và công cụ phân tích cảm xúc, chủ yếu tập trung vào xử lý văn bản. Cuối cùng, nhóm đã cải thiện phân tích cảm xúc thông qua bối cảnh xã hội, tức là, thông tin bổ sung về người dùng, nội dung và các mối quan hệ khác nhau trong các mạng xã hội.

Chia sẻ bài viết ngay

Nguồn bài viết : https://phys.org