Mô Tả Công Việc
Thiết kế & xây dựng hạ tầng dữ liệu:- Thiết kế và xây dựng hạ tầng lưu trữ dữ liệu: Data Warehouse, Data Lake / Data Lakehouse, đảm bảo khả năng mở rộng và hiệu suất- Thiết kế mô hình dữ liệu (Star Schema, Snowflake Schema, Data Vault...) phù hợp với yêu cầu phân tích và báo cáo- Xây dựng hệ thống xử lý dữ liệu phân tán với các công cụ Big Data (Spark, Hadoop hoặc tương đương)Xây dựng & vận hành Data Pipeline:- Phát triển pipeline ETL/ELT để thu thập, biến đổi và tải dữ liệu từ nhiều nguồn (CSDL nội bộ, API, ứng dụng bên thứ ba...)- Xây dựng pipeline xử lý dữ liệu theo cả hai mô hình batch processing và stream processing- Triển khai pipeline lên môi trường production, giám sát hoạt động và khắc phục sự cố- Xây dựng quy trình tự động hóa (scheduling, alerting, retry) để đảm bảo pipeline hoạt động ổn địnhĐảm bảo chất lượng & bảo mật dữ liệu:- Thực hiện Data Cleaning: phát hiện và xử lý dữ liệu sai sót, thiếu sót, không nhất quán trước khi đưa vào sử dụng- Xây dựng quy trình kiểm tra và giám sát chất lượng dữ liệu (data validation, data profiling, anomaly detection)- Tối ưu hiệu năng truy vấn và xử lý dữ liệu: indexing, partitioning, caching- Thiết lập cơ chế bảo mật dữ liệu: mã hóa, phân quyền truy cập, đảm bảo tuân thủ các quy định về bảo vệ dữ liệuPhối hợp & hỗ trợ:- Phối hợp với Data Analyst, Data Scientist, BA và các đội phát triển để cung cấp dữ liệu sạch, sẵn sàng phục vụ phân tích, báo cáo và xây dựng mô hình ML- Hỗ trợ triển khai mô hình ML vào data pipeline khi có yêu cầu- Xây dựng tài liệu kỹ thuật: thiết kế pipeline, data dictionary, hướng dẫn vận hànhNghiên cứu & cải tiến:- Nghiên cứu công nghệ mới, đề xuất giải pháp cải tiến nhằm nâng cao hiệu suất, độ tin cậy và khả năng mở rộng của hệ thống dữ liệu.
Xem toàn bộ Mô Tả Công Việc
Yêu Cầu Công Việc
1. Yêu cầu tối thiểu1.1. Trình độ chuyên môn- Đào tạo: Tốt nghiệp Đại học chuyên ngành Công nghệ thông tin, Khoa học máy tính, Khoa học dữ liệu, Toán - Tin, Hệ thống thông tin hoặc các ngành liên quan.- Tiếng Anh: Đọc hiểu tài liệu kỹ thuật tiếng Anh. Có khả năng giao tiếp cơ bản bằng tiếng Anh trong công việc.1.2. Kiến thức và kỹ năng chuyên môn- Thành thạo Python hoặc Scala cho xử lý và biến đổi dữ liệu- Thành thạo SQL nâng cao (window functions, query optimization, stored procedures...)- Có kinh nghiệm với các framework xử lý dữ liệu lớn: Apache Spark, Hadoop hoặc tương đương- Hiểu biết về xây dựng pipeline dữ liệu: batch processing và stream processing (Kafka, Flink, Spark Streaming...)- Có kiến thức về các loại cơ sở dữ liệu: RDBMS (PostgreSQL, Oracle...), NoSQL (MongoDB, Cassandra...), Search Engine (Elasticsearch...)- Hiểu biết về thiết kế và tổ chức Data Warehouse (Star Schema, Snowflake Schema, Data Vault...)- Có kinh nghiệm với các công cụ ETL/ELT và orchestration (Apache Airflow, dbt, NiFi hoặc tương đương)- Có kiến thức về Data Testing và Data Validation (Great Expectations, dbt tests hoặc tương đương)- Sử dụng thành thạo Git (GitHub/GitLab), quen với quy trình code review- Có kiến thức cơ bản về Docker/Container và quy trình CI/CD1.3. Kinh nghiệm nghề nghiệp- Tối thiểu 02 năm kinh nghiệm làm việc chính với data pipeline ở vị trí Data Engineer hoặc vai trò tương đương (Backend Developer chuyên xử lý dữ liệu, BI Developer...)- Đã từng tham gia xây dựng hoặc vận hành ít nhất một hệ thống data pipeline ở quy mô production1.4. Tố chất cá nhân- Tư duy logic tốt, cẩn thận và có trách nhiệm với chất lượng dữ liệu- Chủ động học hỏi công nghệ mới và sẵn sàng thích ứng với yêu cầu dự án2. Ưu tiên- Có kinh nghiệm xây dựng Data Lake / Data Lakehouse cho doanh nghiệp tài chính, bảo hiểm hoặc ngân hàng- Có kinh nghiệm với cloud platform (AWS: Glue, Redshift, S3; GCP: BigQuery, Dataflow; Azure: Synapse, Data Factory)- Hiểu biết về Data Quality và Data Governance (data lineage, data catalog, metadata management)- Có kinh nghiệm với các công cụ Data Lineage (Apache Atlas, DataHub, OpenLineage hoặc tương đương)- Có kinh nghiệm với Graph Database (Neo4j...) hoặc real-time analytics (ClickHouse, Druid...)- Có kiến thức về Data Modeling nâng cao và tối ưu hiệu năng cho hệ thống dữ liệu lớn- Có chứng chỉ cloud liên quan (AWS Data Analytics, GCP Data Engineer...) là lợi thế
Xem toàn bộ Yêu Cầu Công Việc
Hình thức
Full-time
Quyền Lợi
Thu nhập người lao động nhận được tại Tập đoàn Bảo Việt bao gồm:Tiền lương, tiền thưởng:Lương cố định hàng tháng;Lương tháng thứ 13;Lương cho các ngày nghỉ hàng năm mà người lao động chưa nghỉ;Thưởng theo hiệu quả làm việc;Thưởng sáng kiến cải tiến;Thưởng danh hiệu thi đua hàng năm và thưởng đột xuất khác.Các chế độ đãi ngộ khác:Thưởng từ nguồn lợi nhuận sau thuế của Tập đoàn;Phúc lợi nhân dịp ngày thành lập Bảo Việt, thành lập Tập đoàn, nhân ngày Lễ, Tết;Các khoản trợ cấp điện thoại, công tác phí nội vùng, chế độ khoán phương tiện đi lại, đồng phục, ăn ca;Thực hiện đầy đủ các chế độ Bảo hiểm xã hội bắt buộc, bảo hiểm y tế, bảo hiểm thất nghiệp, khám sức khỏe định kỳ;Bảo hiểm tự nguyện mà Tập đoàn cung cấp cho người lao động gồm: Bảo hiểm sức khỏe toàn diện (Bao Viet Care), bảo hiểm hưu trí vững nghiệp, bảo hiểm nhân thọ An phát trọn đời, BH tai nạn kết hợp con người, bảo hiểm dành cho người thân.Các chương trình đào tạo, phát triển năng lực cá nhân trong và ngoài nước theo Bản đồ học tập chung và Bản đồ học tập chuyên môn nghiệp vụ.Các chương trình nghỉ mát, hội nghị, liên hoan tổng kết, Gala Dinner, dã ngoại hàng năm.
Mức lương
Thỏa thuận
Báo cáo tin tuyển dụng: Nếu bạn thấy rằng tin tuyển dụng này không đúng hoặc có dấu hiệu lừa đảo,
hãy phản ánh với chúng tôi.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.
Tham khảo: 10 Dấu hiệu nhận biết hành vi lừa đảo qua tin tuyển dụng.