แนวทางการขึ้นระบบ (Go-live) และการตอบสนองเหตุขัดข้อง (Incident Response)
แผนก
สารบัญ
วัตถุประสงค์
แนวทางนี้กำหนด playbook การดำเนินงานขั้นต่ำสำหรับ การดำเนินการ go-live และ การตอบสนองเหตุขัดข้อง (ใครทำอะไร เขียนอะไรใน Asana และ “เสร็จ” หมายถึงอะไร)
| ผลลัพธ์ |
|---|
| การเปลี่ยนแปลง Production ดำเนินการด้วยความรับผิดชอบที่ชัดเจน และเหตุขัดข้องได้รับการจัดการด้วยการควบคุมที่รวดเร็วและการสื่อสารที่ชัดเจน |
ขอบเขต
แนวทางนี้ครอบคลุม:
| # | รวมอยู่ด้วย |
|---|---|
| 1 | คำจำกัดความ environment และการไหลของการส่งเสริม |
| 2 | ความรับผิดชอบในการดำเนินการ go-live (รวมถึง rollback) |
| 3 | Workflow และ artifacts การตอบสนองเหตุขัดข้องขั้นต่ำ |
แนวทางนี้ ไม่ แทนที่ runbook การปรับใช้เฉพาะโครงการ หากโครงการต้องการ runbook ที่กำหนดเอง ควรลิงก์จากงาน go-live ใน Asana
คำจำกัดความ
| คำศัพท์ | คำจำกัดความ |
|---|---|
| Go-live | ปล่อยการเปลี่ยนแปลงเข้าสู่ Production (ผู้ใช้จริง / การดำเนินงานจริง) |
| Rollback | การย้อนกลับไปยังสถานะที่ปลอดภัยเมื่อ go-live นำมาซึ่งความเสี่ยงหรือความล้มเหลวที่ไม่ยอมรับได้ |
| Incident | ปัญหา Production ที่ส่งผลกระทบอย่างมีนัยสำคัญต่อประสบการณ์ผู้ใช้ ความถูกต้องของข้อมูล หรือการดำเนินงานทางธุรกิจ |
Operating Model (Sprint + Asana + Visibility)
| # | Operating Model |
|---|---|
| 1 | Asana คือระบบหลัก (system of record) สำหรับการติดตามงาน การอนุมัติ และการส่งต่องาน |
| 2 | ใช้จุดตรวจสอบและจุดตัดสินใจ: ไม่ไปขั้นถัดไปจนกว่าขั้นก่อนจะ “เสร็จ”, และกรณีแตกแขนงต้องระบุให้ชัดเจน |
| 3 | ลำดับการส่งต่องาน (handoff order): เอกสาร upstream กำหนดสิ่งที่ต้องส่งมอบ/เกณฑ์จบขั้น; เอกสาร downstream กำหนดวิธีทำงานหลังรับมอบ |
ภาพรวม Environment
| Environment | คำอธิบาย |
|---|---|
| Local | เครื่องมือของนักพัฒนาเพื่อการเขียนโค้ดและการทดสอบ |
| DEV | เซิร์ฟเวอร์ทดสอบภายในทีม |
| UAT / DEMO | Environment ทดลองที่ลูกค้าเข้าถึงได้เพื่อตรวจสอบว่าฟังก์ชันทำงานถูกต้องตามข้อตกลงและยอมรับได้ |
| Staging | Environment ก่อน Production ที่ใกล้เคียงกับ Production มากที่สุดเพื่อการทดสอบสุดท้าย |
| Production | ระบบที่ใช้งานจริงสำหรับผู้ใช้จริง |
สรุป Workflow
Development → Testing → Client validation → Production-like validation → Go live
Local → DEV → UAT/DEMO → Staging → Production
ขั้นตอนการทำงานแบบทีละขั้น
| # | ขั้นตอน |
|---|---|
| 1 | ยืนยันเจ้าของ go-live + หน้าต่างการดำเนินการ (ใครรันการเปลี่ยนแปลง เมื่อไหร่ ใครอยู่ standby) |
| 2 | ยืนยันว่า แผน rollback มีอยู่ (rollback หมายถึงอะไรที่นี่ + วิธีดำเนินการ) |
| 3 | ยืนยันว่า แผนการตรวจสอบ มีอยู่ (เช็กลิสต์ที่ประกาศความสำเร็จ) |
| 4 | ดำเนินการ go-live และบันทึก execution notes ใน Asana |
| 5 | ตรวจสอบ แล้วสื่อสารผลลัพธ์ (สำเร็จ / rollback / การดำเนินการติดตาม) |
จุดตัดสินใจ: ผลลัพธ์ go-live
| ผลลัพธ์ | การดำเนินการ |
|---|---|
| Verified (สำเร็จ) | ดำเนินการต่อตามแผน hypercare/monitoring (ถ้ากำหนดไว้) และปิดงานการดำเนินการ go-live |
| Not verified (ล้มเหลว / ความเสี่ยงที่ไม่ยอมรับได้) | ดำเนินการแผน rollback บันทึกสิ่งที่เกิดขึ้น และจัดแนวขั้นตอนถัดไป + ตารางเวลาใหม่ |
เทมเพลตการ์ด Asana: Go-live execution (Technology)
| เทมเพลตการ์ด Asana | |
|---|---|
| Title | Go-live execution (Technology) – [Client Name] – [Project Title] |
| Assignee | Technology owner |
| Description | กรุณาดำเนินการ go-live สำหรับโครงการนี้ References • Project card: [Link] • Delivery go-live task: [Link] Environment path Local → DEV → UAT/DEMO → Staging → Production Rollback plan • Rollback approach (high-level): [Notes/link] Verification plan • What to verify post-release: [Checklist/link] Execution • Go-live datetime: [Datetime] • Execution notes (minimum): what changed + start time + end time + any deviations + who executed Result • Outcome: Verified / Rolled back • Follow-ups (if any): [List/link] |
การตอบสนองเหตุขัดข้อง (ขั้นต่ำ)
| # | ขั้นตอน |
|---|---|
| 1 | Triage และยืนยันผลกระทบ (อะไรเสียหาย ใครได้รับผลกระทบ ความรุนแรง) |
| 2 | Contain (หยุดการรั่วไหล: rollback, disable feature, hotfix, mitigation) |
| 3 | สื่อสารสถานะ (AE/PM จัดแนว; การสื่อสารกับลูกค้าเมื่อจำเป็น) |
| 4 | แก้ไขและตรวจสอบ |
| 5 | บันทึกสรุปเหตุขัดข้องสั้น ๆ และงานติดตาม (ป้องกันการเกิดซ้ำ) |
เทมเพลตการ์ด Asana: Incident
| เทมเพลตการ์ด Asana | |
|---|---|
| Title | Incident – [System/Feature] – [Short description] |
| Assignee | Technology owner |
| Description | Impact: [Who is affected / what is broken] Severity: [Low/Medium/High] Start time: [Datetime] Containment: [Actions taken] Current status: [Short] Client comms owner (AE/PM): [Name] Resolution: [What fixed it] Verification: [What checks passed] Follow-ups: [Tasks/links] |
เช็กลิสต์ Go-live (แผนกเทคโนโลยีใช้)
Preconditions
| # | เช็กลิสต์ |
|---|---|
| 1 | ☐ Go-live owner ถูกมอบหมาย |
| 2 | ☐ แผน rollback มีอยู่ (high-level) |
| 3 | ☐ แผนการตรวจสอบมีอยู่ |
| 4 | ☐ Stakeholders ที่เกี่ยวข้องอยู่ standby (ตามที่ตกลง) |
Execution
| # | เช็กลิสต์ |
|---|---|
| 1 | ☐ Execution notes บันทึกใน Asana |
| 2 | ☐ การตรวจสอบเสร็จสิ้น |
| 3 | ☐ ผลลัพธ์สื่อสารแล้ว (สำเร็จ / rollback / ขั้นตอนถัดไป) |