1. Giới thiệu công ty khách hàng
Ngân hàng TMCP Kỹ Thương Việt Nam
(Techcombank) được thành lập vào tháng 9 năm 1993 với trụ sở chính tại Hà Nội.
Hiện là một trong những ngân hàng thương mại cổ phần lớn nhất tại Việt Nam với
mạng lưới hơn 300 chi nhánh cùng hơn 13.000 cán bộ, phục vụ trên 5–10 triệu
khách hàng cá nhân và doanh nghiệp. Techcombank nổi bật với sứ mệnh “Change
banking, Change lives” – tiên phong chuyển đổi số trong ngành tài chính và cam
kết mang đến các giải pháp tài chính cá nhân hóa, minh bạch và hiệu quả, nhằm
nâng cao chất lượng cuộc sống cho người Việt. Ngân hàng liên tục đạt được nhiều
giải thưởng uy tín trong và ngoài nước nhờ hiệu suất vận hành xuất sắc, nền tảng
ngân hàng số tiên tiến và các giải pháp tài chính sáng tạo.
Địa chỉ: Số 6, Phố Quang Trung, Phường Trần Hưng Đạo, Quận Hoàn Kiếm, Thành
phố Hà Nội. |
3. Nội dung khóa học
PHẦN 1: TỔNG QUAN VỀ QUẢN LÝ SỰ CỐ
(Mục tiêu: Cung cấp nền tảng vững chắc về quản lý sự cố IT, vai trò của Incident
Manager và các phương pháp tiếp cận tiêu chuẩn.)
1.1. Khái niệm vai trò quản lý sự cố
• Mục tiêu của Quản lý Sự cố IT
• So sánh: Incident – Risk – Problem – Change – Release
• Ảnh hưởng của sự cố đến hoạt động doanh nghiệp & khách hàng
• 5 Cấp độ trưởng thành trong quản lý sự cố
1.2. Vòng đời quản lý sự cố
• Các bước: Phát hiện → Ghi nhận → Phân loại → Xử lý → Đóng sự cố
• Mối liên kết giữa Incident Management và các quy trình ITSM khác (Problem,
Change, CMDB, Service Desk)
• Các KPI chính: MTTR, số lượng sự cố, tỉ lệ xử lý đúng thời gian,…
PHẦN 2: NHẬN DIỆN & GHI NHẬN SỰ CỐ
(Mục tiêu: Phát hiện và ghi nhận sự cố nhanh chóng, đầy đủ, chuẩn hóa thông
tin.)
2.1. Nhận diện sự cố sớm
• Nguồn phát hiện: End-users, giám sát hệ thống, …
• Thiết lập cảnh báo (Alerting Rules)
2.2. Ghi nhận sự cố
• Các trường dữ liệu cần có trong bản ghi sự cố
• Các cấp độ mô tả: Technical vs Non-technical
PHẦN 3: PHÂN LOẠI VÀ ƯU TIÊN SỰ CỐ
(Mục tiêu: Hệ thống hóa sự cố và xác định đúng mức độ ưu tiên để phân bổ nguồn
lực.)
3.1. Phân loại sự cố
• Theo nguyên nhân: Hardware, Software, Network, Security, Human error,…
• Theo tác động & mức độ khẩn cấp
3.2. Ưu tiên xử lý sự cố
• Mô hình đánh giá Impact vs Urgency
• Sử dụng Ma trận Ưu tiên
PHẦN 4: PHÂN TÍCH NGUYÊN NHÂN GỐC RỄ (RCA) SỰ CỐ
(Mục tiêu: Sử dụng các công cụ RCA để xác định nguyên nhân thực sự và đề xuất
giải pháp phòng ngừa.)
4.1. Đánh giá sơ bộ sự cố
• Đo lường mức độ ảnh hưởng
• Thu thập log, sự kiện từ monitoring system
4.2. Phân tích nguyên nhân gốc rễ (RCA Tools)
a. Kỹ thuật phân tích 5 Whys
• Phương pháp đặt câu hỏi liên tiếp
• Ưu/nhược điểm
• Ứng dụng cho sự cố đơn giản
b. Kỹ thuật Fishbone Diagram (Ishikawa)
• Nhóm nguyên nhân: Con người – Quy trình – Công nghệ – Môi trường
• Dễ áp dụng trong workshop
c. Kỹ thuật Fault Tree Analysis (FTA)
• Phân tích logic theo cây nguyên nhân – kết quả
• Hiệu quả với sự cố hệ thống phức tạp
d. Kỹ thuật Pareto Analysis
• Quy tắc 80/20 – Ưu tiên xử lý nguyên nhân phổ biến nhất
• Ứng dụng trong phân tích dữ liệu nhiều sự cố
PHẦN 5: XỬ LÝ VÀ PHỤC HỒI HỆ THỐNG
(Mục tiêu: Đưa ra quyết định xử lý nhanh, đúng cách và hiệu quả nhằm phục hồi
hoạt động.)
5.1. Triển khai giải pháp
• Đánh giá & chọn lựa giải pháp khả thi
• Kiểm thử trước khi triển khai chính thức
5.2. Đánh giá sau xử lý
• Lessons Learned
• Post-Incident Review
PHẦN 6: GIAO TIẾP - ĐÓNG SỰ CỐ – BÁO CÁO – PHÒNG NGỪA
(Mục tiêu: Hoàn thiện quy trình quản lý sự cố, đóng sự cố chính xác và áp dụng
cải tiến bền vững.)
6.1. Giao tiếp nội bộ khi có sự cố
• Cách thiết lập War Room hiệu quả
• Các công cụ giao tiếp thời gian thực (Microsoft Teams, Zoom,...)
• Giao tiếp với khách hàng và cấp trên
• Kỹ năng viết Incident Report
6.2. Quy trình đóng sự cố
• Xác nhận khắc phục hoàn toàn
• Cập nhật hệ thống ITSM
6.3. Báo cáo & cải tiến sau sự cố
• Viết Incident Report chi tiết
• Sử dụng dữ liệu để điều chỉnh quy trình
6.4. Phòng ngừa sự cố & xây dựng hệ thống học hỏi
• Xây dựng Knowledge Base cho RCA
• Chia sẻ bài học trong nội bộ
• Mô phỏng sự cố và phòng ngừa
 |
|