Nhập csv với mã hóa đặc biệt qua Laravel Excel

Tram Ho

I. Đặt vấn đề

  • Như tiêu đề bài viết, bài lần này mình sẽ hướng dẫn cách làm import csv qua Laravel Excel
  • Vấn đề này mình gặp phải và đã mất mấy ngày, vì khi dùng package này theo tìm hiểu thì chỉ set dc đúng 1 encoding (cay), khi set cái này QA lại dùng cái khác import, rồi đến khách…chẳng nhẽ mình lại bảo họ chỉ được dùng 1 loại ? vậy đâu có được….
  • File config excel.php của Laravel Excel có attribute là input_encoding, ở đây Laravel Excel có để sẵn mặc định là encoding UTF-8.
  • Nhưng ở Nhật họ thường dùng Shift-JIS (hoặc cũng có thể loại khác như UJIS, ANSI…)
  • Như lẽ thường thì dĩ nhiên mình cũng đã set SJIS vào config trên, mọi thứ hoạt động ok được vài ngày thì khách lại dùng file với encoding khác. :v

II. Giải quyết vấn đề.

Sau vài lần thì mình cũng oải may quá nảy ra 1 ý là mình sẽ detect định dạng encoding thì họ có dùng encoding của Thổ Nhĩ Kỳ, Hy Lạp…cho đến teencode thì mình cũng làm được, may qua suy nghĩ đơn sơ thế mà cũng tìm ra cách ❤️
Và đây là cách giải quyết của mình

Ý nghĩa:

  • Dòng 1: function file_get_contents sẽ đọc nội dung trong file.
  • Dòng 2: function mb_detect_encoding sẽ dectect encoding dựa vào mb_list_encodings và trả ra encoding của file đã upload
  • Dòng 3: sẽ can thiệp vào config tại thời điểm đó – tức là n sẽ thay đổi r sau khi thực hiện xong chức năng sẽ quay trở lại như cũ (khác với việc ghi đè vào file nhé).

III. Thực hiện việc upload file

  • Mình muốn chia sẻ cái mình tìm hiểu nên trông nó hơi ngắn 😃) vậy nên mình sẽ hướng dẫn thực hiện cách upload file luôn.
  • Package này rất hay ở chỗ đã thực hiện chunk file ra cho mình, nên cũng đã hạn chế được phần nào việc đọc file nặng (Bạn nên dùng)
  • Controller

  • hàm setInputEncoding sẽ được chạy trước khi Laravel Excel thực hiện đọc file upload.
  • Ở đây nếu bạn k sử dụng queue mà muốn hiển thị lỗi validate trong lúc import thì hãy làm như mình như phần catche nhe.
  • File Import

  • Ở đây mình k dùng queue, còn nếu bạn dùng queue thì nếu lỗi validate thì có thể lấy từ database (queue database)….hoặc dùng các loại queue khác.
  • hàm chunkSize mình thấy rất lợi hại trong package này, nó thực sự cần thiết nếu dự án nào tiết kiệm k sử dụng queue (như dự án mình =))).

III. Kết thuc

  • Trên đây là cách mình làm việc khi import csv, với những loại encoding không thực sự nhiều người dùng và phổ biến. Hi vọng sẽ giúp được các bạn đang gặp phải vấn đề như mình
  • Còn một vấn đề nhỏ nữa có thể xảy ra trong khi upload đó là mình sử dụng ubuntu khi tạo file csv và gửi sang cho khách (dùng window) thì có thể sẽ rơi vào case là máy tính tự change extension của file (csv -> xls) nên bạn cũng có thể lưu ý thêm vấn đề này khi validate file nhe (lol)
Chia sẻ bài viết ngay

Nguồn bài viết : Viblo