Tổng hợp việc làm cho sinh viên Học viện CN Bưu chính VT - CS TpHCM theo ngành nghề. Nơi sinh viên tìm việc phù hợp và định hướng nghề nghiệp.
1. Phát triển và duy trì script:
Xây dựng và duy trì các script Python để tự động thu thập dữ liệu từ nhiều nguồn web khác nhau, đảm bảo chất lượng và độ chính xác của dữ liệu thu thập.
Đảm bảo rằng các script được viết tối ưu và dễ bảo trì.
2. Làm sạch và tổ chức dữ liệu:
Thực hiện các bước làm sạch, lọc và tổ chức dữ liệu thu thập được để đảm bảo tính nhất quán và sẵn sàng cho phân tích.
Sử dụng các công cụ như Pandas để xử lý và chuyển đổi dữ liệu.
3. Quản lý và lưu trữ dữ liệu:
Sử dụng Python để quản lý và lưu trữ dữ liệu hiệu quả, làm việc với các hệ thống cơ sở dữ liệu SQL và NoSQL.
Phát triển các quy trình quản lý dữ liệu, đảm bảo dữ liệu được lưu trữ an toàn và có thể truy xuất dễ dàng.
4. Giám sát và tối ưu hóa hiệu suất:
Theo dõi và cải thiện hiệu suất của quy trình scraping, xử lý các thách thức như chặn IP, giới hạn tốc độ và CAPTCHA để đảm bảo hoạt động của hệ thống không bị gián đoạn.
Phân tích dữ liệu thu thập để tối ưu hóa quy trình scraping và cải thiện trải nghiệm người dùng.
5. Kiến thức về đường ống dữ liệu:
Hiểu rõ về các khái niệm và kỹ thuật trong xây dựng đường ống dữ liệu để chuyển giao và xử lý dữ liệu từ nhiều nguồn khác nhau.
Tham gia vào việc thiết kế và triển khai các đường ống dữ liệu nhằm đảm bảo dữ liệu được thu thập và xử lý một cách hiệu quả.