Mục tiêu: Đảm bảo hệ thống/ứng dụng hoạt động ổn định, đáp ứng SLA, giám sát liên tục, xử lý sự cố kịp thời, và hỗ trợ các bộ phận vận hành nghiệp vụ. Trách nhiệm chính Đảm bảo hệ thống hoạt động ổn định Theo dõi trạng thái hoạt động của ứng dụng: hiệu năng, tài nguyên, kết nối, luồng giao dịch.Thực hiện các kiểm tra định kỳ: job/batch, interface, kết nối đối tác, certificate, cấu hình vận hành.Chủ động phát hiện bất thường và đề xuất phương án phòng ngừa rủi ro.Giám sát & xử lý sự cố Tiếp nhận và xử lý sự cố/ticket từ L1; phân tích log, trace giao dịch để khoanh vùng nguyên nhân.Khôi phục dịch vụ theo quy trình vận hành được phân quyền.Phối hợp với các đội liên quan (Infra, Dev, DBA, Security, đối tác) khi sự cố vượt quá phạm vi xử lý.Ghi nhận sự cố, cập nhật knowledge base và đề xuất cải tiến.Hỗ trợ bộ phận vận hành nghiệp vụ Hỗ trợ BO/CSKH/Nghiệp vụ trong việc tra soát giao dịch, kiểm tra trạng thái, xác minh dữ liệu.Giải thích nguyên nhân lỗi giao dịch hoặc hành vi hệ thống dựa trên log và trạng thái xử lý.Đảm bảo các báo cáo/luồng nghiệp vụ liên quan đến ứng dụng được thực thi đầy đủ và chính xác.Tham gia triển khai thay đổi Tham gia vào quy trình quản lý thay đổi trong các bước: đánh giá kế hoạch, giám sát và xác nhận trạng thái ứng dụng sau thay đổi.Xây dựng quy trình, tài liệu và đào tạo Tham gia xây dựng các quy trình của Khối Công nghệ.Viết và cập nhật tài liệu vận hành (runbook, checklist, SOP).Đào tạo L1 các thao tác vận hành, xử lý cảnh báo theo runbook/checklist/SOP.Báo cáo định kỳ (số liệu vận hành, SLA, ticket xử lý,...).