trăn gấu trúc

Tram Ho

Panda là một thư viện để thao tác với dữ liệu bằng Python. Thông tin nhanh: | Sự thật | Mô tả | | ——– | ——– | | Trang chủ | https://pandas.pydata.org | | API doc | https://pandas.pydata.org/docs/reference/index.html | | Năm đầu tiên | Ngày 05 tháng 8 năm 2009 (13 năm trước). https://github.com/pandas-dev/pandas/commit/ec1a0a2a2 | | Mã nguồn | https://github.com/pandas-dev/pandas | | Thẻ Stack Overflow | https://stackoverflow.com/questions/tagged/pandas | | Phiên bản ổn định mới nhất | 1.4.2 '(02 tháng 4, 2022) | Môi trường phát triển! [Image.png] (https://images.viblo.asia/d55ee195-ae53-4879-8d59-4445ab5ea71a.png) Install pandas! [Install_panda] (https://user-images.githubusercontent.com/ 1328316 / 164500646-3330a0bb-7eea-433a-aa60-c03d90b75493.png) Phiên bản Python '(pythonProject1) C: Users donhu> python --version Python 3.10.0 Cài đặt! [Image.png] (https://images.viblo.asia/f65d8acc-6bd5-4231-9e1c-6e91fc01ec6a.png)! [image.png] (https://images.viblo.asia/71d14c2d-3c9e-453c-a60d-51c4bb6cfa2e. png) Thuộc tính và phương pháp với đối tượng gấu trúc python import pandas as pd df = pd.DataFrame ({"Name": ["Braund, Mr. Owen Harris", "Allen, Mr. William Henry", "Bonnell, Miss . Elizabeth ",]," Tuổi ": [22, 35, 58]," Giới tính ": [" nam "," nam "," nữ "],}) print (" n01 ------- ---------- ") print (df) print () print (" n02 ----------------- ") print (df [" Tuổi " ]) print (" n03 -----------------") age = pd.Series ([22, 35, 58], name = "Age") print (age) print (" n04 -----------------") print (df ["Tuổi"]. max ()) print (" n05 ------- ---------- ") print (age.max ()) print (" n06 ----------------- ") print (df.describe ( )) # https://raw.githubusercontent.com/pandas-dev/pandas/main/doc/data/titanic.csv print (" n07 ----------------- ") titanic = pd.read_csv (" vy / titanic.csv ") print (titanic) print (" n08 ----------------- ") print (titanic.head ( 2)) print (" n09 -----------------") print (titanic.dtypes) print (" n10 ------------ ----- ") # pip install openpyxl # conda install openpyxl print (titanic.to_excel (" minh_thu.xlsx ", sheet_name =" loves ", index = False)) print (" n11 ------- ---------- ") my_titanic = pd.read_excel (" minh_thu.xlsx ", sheet_name =" loves ") print (my_titanic.head (3)) print (" n12 ------ ----------- ") print (my_titanic.info ()) # https://raw.githubusercontent.com/pandas-dev/pandas/main/pandas/tests/io/data/csv/ tips.csv url = ("https://raw.github.com/pandas-dev" "/pandas/main/pandas/tests/io/data/csv/tips.csv") tips = pd.read_csv (url) print (" n12b -----------------") print (mẹo) print (" n14 ----------------- ") sorted_df = tips.sort_val ues (by = 'total_bill') print (sorted_df) print (" n15 -----------------") sorted_df = tips.sort_values ​​(by = 'total_bill', ascending = Sai) print (sorted_df) result '' C: ProgramData Anaconda3 envs pythonProject1 python.exe C: /Users/donhu/PycharmProjects/pythonProject1/vy_panda_01.py 01 -------- --------- Tên Tuổi Giới tính 0 Braund, Ông Owen Harris 22 nam 1 Allen, Ông William Henry 35 nam 2 Bonnell, Cô Elizabeth 58 nữ 02 ----------- ------ 0 22 1 35 2 58 Tên: Tuổi, kiểu: int64 03 ----------------- 0 22 1 35 2 58 Tên: Tuổi, kiểu: int64 04 ----------------- 58 05 ----------------- 58 06 ----------- ------ Đếm tuổi 3,000000 trung bình 38.333333 std 18.230012 min 22.000000 25% 28.500000 50% 35.000000 75% 46.500000 max 58.000000 07 ----------------- PassengerId Survived Pclass ... Giá vé Cabin đã bắt đầu 0 1 0 3 ... 7.2500 NaN S 1 2 1 1 ... 71.2833 C85 C 2 3 1 3 ... 7.9250 NaN S 3 4 1 1 ... 53.1000 C123 S 4 5 0 3 ... 8.0500 NaN S .. ... ... ... ... ... ... ... 886 887 0 2 ... 13.0000 NaN S 887 888 1 1 ... 3 0,0000 B42 S 888 889 0 3 ... 23,4500 NaN S 889 890 1 1 ... 30,0000 C148 C 890 891 0 3 ... 7,7500 NaN Q [891 hàng x 12 cột] 08 --------- -------- PassengerId Survived Pclass ... Fare Cabin Embarked 0 1 0 3 ... 7.2500 NaN S 1 2 1 1 ... 71.2833 C85 C [2 hàng x 12 cột] 09 ----- ------------ PassengerId int64 Tồn tại int64 Lớp int64 Tên đối tượng Đối tượng giới tính Tuổi float64 SibSp int64 Parch int64 Đối tượng vé Giá vé float64 Đối tượng cabin Đối tượng nhúng: đối tượng 10 ---------- ------- Không có 11 ----------------- Hạng hành khách còn sống ... Buồng vé đã bắt đầu 0 1 0 3 ... 7.2500 NaN S 1 2 1 1. .. 71.2833 C85 C 2 3 1 3 ... 7.9250 NaN S [3 hàng x 12 cột] 12 ----------------- RangeIndex: 891 mục nhập, 0 đến 890 cột Dữ liệu (tổng số 12 cột): # Column Non-Null Count Dtype --- ---------------- - 0 PassengerId 891 non-null int64 1 Survived 891 non-null int64 2 Pclass 891 non-null int64 3 Name 891 non-null object 4 Sex 891 non-null object 5 Tuổi 714 non-null float64 6 SibSp 891 non-null int64 7 Parch 891 non-null int64 8 Ticket 891 non-null object 9 Fare 891 non-null float64 10 Cabin 204 non-null object 11 Embarked 889 non-null object dtypes: float64 (2), int64 (5), object (5 ) sử dụng bộ nhớ: 83,7+ KB Không có 12b ----------------- tổng_bill tiền boa người hút thuốc trong ngày kích thước ban ngày 0 16,99 1,01 Nữ Bữa tối Không có Mặt trời 2 1 10,34 1,66 Nam Bữa tối Không có Mặt trời 3 2 21,01 3,50 Nam Bữa tối không có nắng 3 3 23,68 3,31 Nam Bữa tối không có nắng 2 4 24,59 3,61 Nữ Bữa tối không có nắng 4 .. ... ... ... ... ... ... ... 239 29,03 5,92 Nam Không Bữa tối thứ Bảy 3 240 27,18 2,00 Nữ Có Bữa tối thứ Bảy 2 241 22,67 2,00 Nam Có Bữa tối thứ Bảy 2 242 17,82 1,75 Nam Không Bữa tối thứ Bảy 2 243 18,78 3,00 Nữ Không Bữa tối 2 [244 ro ws x 7 cột] 14 ----------------- total_bill tip sex người hút thuốc kích thước trong ngày 67 3,07 1,00 Nữ Có Bữa tối thứ 7 1 92 5,75 1,00 Nữ Có Bữa tối thứ 6 2 111 7,25 1,00 Nữ Không Bữa tối thứ Bảy 1 172 7.25 5,15 Nam Có Bữa tối Chủ nhật 2 149 7,51 2,00 Nam Không Bữa trưa Thứ Bảy 2 .. ... ... ... ... ... ... ... 182 45,35 3,50 Nam Có Bữa tối Chủ nhật 3 156 48,17 5,00 Nam Không ăn tối 6 59 48,27 6,73 Nam Không ăn tối 4 212 48,33 9,00 Nam Không ăn tối 4 170 50,81 10,00 Nam Có ăn tối 3 [244 hàng x 7 cột] 15 --------- -------- Total_bill tip quan hệ tình dục người hút thuốc vào thời gian trong ngày cỡ 170 50,81 10,00 Nam Có Bữa tối thứ Bảy 3 212 48,33 9,00 Nam Không Bữa tối thứ Bảy 4 59 48,27 6,73 Nam Không Bữa tối thứ Bảy 4 156 48,17 5,00 Nam Không có Mặt trời Bữa tối 6182 45,35 3,50 Nam Có Bữa tối Chủ nhật 3 .. ... ... ... ... ... ... ... ... 149 7,51 2,00 Nam Không Bữa trưa 2 111 7,25 1,00 Nữ Không Bữa tối Thứ Bảy 1 172 7,25 5,15 Nam Có Chủ nhật Bữa tối 2 92 5,75 1,00 Nữ Có Bữa tối thứ Sáu 2 67 3,07 1,00 Nữ Có Bữa tối thứ Bảy 1 [244 hàng x 7 cột] Quá trình kết thúc với lối ra c ode 0 ! [image.png] (https://images.viblo.asia/47607cba-5549-43de-a340-f8243546c4cc.png) ** Pandas Excel API ** Cần cài đặt pandasopenpyxl bên trong Miniconda trước khi thực hành. Đây là ** đọc excel ** hàm. python import pandas as pd found_url = (" https://m.hvtc.edu.vn/Portals/0/01_2018/01.DS%20TN_9.2021%20.xlsx ") hehe = pd.read_excel (found_url ) hehe Kết quả! [image] (https://user-images.githubusercontent.com/1328316/164501346-f0299556-9298-4181-8a5f-e53f26b73560.png) Không có tiêu đề '' 'python hihi = pd.read_excel (found_url, index_col = None, header = None) hihi rb có nghĩa là r + b = read + binary. Xem https://docs.python.org/3/library/functions.html#open python hoho = pd.read_excel (open ('C: \ Users \ donhu \ Desktop \ 01.DS TN_9 .2021 .xlsx ',' rb '), sheet_name =' LC22 ') hoho' '

Chia sẻ bài viết ngay

Nguồn bài viết : Viblo