แนวทางการขึ้นระบบ (Go-live) และการตอบสนองเหตุขัดข้อง (Incident Response)

แผนก

เทคโนโลยี

สารบัญ


วัตถุประสงค์

แนวทางนี้กำหนด playbook การดำเนินงานขั้นต่ำสำหรับ การดำเนินการ go-live และ การตอบสนองเหตุขัดข้อง (ใครทำอะไร เขียนอะไรใน Asana และ “เสร็จ” หมายถึงอะไร)

ผลลัพธ์
การเปลี่ยนแปลง Production ดำเนินการด้วยความรับผิดชอบที่ชัดเจน และเหตุขัดข้องได้รับการจัดการด้วยการควบคุมที่รวดเร็วและการสื่อสารที่ชัดเจน

ขอบเขต

แนวทางนี้ครอบคลุม:

#รวมอยู่ด้วย
1คำจำกัดความ environment และการไหลของการส่งเสริม
2ความรับผิดชอบในการดำเนินการ go-live (รวมถึง rollback)
3Workflow และ artifacts การตอบสนองเหตุขัดข้องขั้นต่ำ

แนวทางนี้ ไม่ แทนที่ runbook การปรับใช้เฉพาะโครงการ หากโครงการต้องการ runbook ที่กำหนดเอง ควรลิงก์จากงาน go-live ใน Asana


คำจำกัดความ

คำศัพท์คำจำกัดความ
Go-liveปล่อยการเปลี่ยนแปลงเข้าสู่ Production (ผู้ใช้จริง / การดำเนินงานจริง)
Rollbackการย้อนกลับไปยังสถานะที่ปลอดภัยเมื่อ go-live นำมาซึ่งความเสี่ยงหรือความล้มเหลวที่ไม่ยอมรับได้
Incidentปัญหา Production ที่ส่งผลกระทบอย่างมีนัยสำคัญต่อประสบการณ์ผู้ใช้ ความถูกต้องของข้อมูล หรือการดำเนินงานทางธุรกิจ

Operating Model (Sprint + Asana + Visibility)

#Operating Model
1Asana คือระบบหลัก (system of record) สำหรับการติดตามงาน การอนุมัติ และการส่งต่องาน
2ใช้จุดตรวจสอบและจุดตัดสินใจ: ไม่ไปขั้นถัดไปจนกว่าขั้นก่อนจะ “เสร็จ”, และกรณีแตกแขนงต้องระบุให้ชัดเจน
3ลำดับการส่งต่องาน (handoff order): เอกสาร upstream กำหนดสิ่งที่ต้องส่งมอบ/เกณฑ์จบขั้น; เอกสาร downstream กำหนดวิธีทำงานหลังรับมอบ

ภาพรวม Environment

Environmentคำอธิบาย
Localเครื่องมือของนักพัฒนาเพื่อการเขียนโค้ดและการทดสอบ
DEVเซิร์ฟเวอร์ทดสอบภายในทีม
UAT / DEMOEnvironment ทดลองที่ลูกค้าเข้าถึงได้เพื่อตรวจสอบว่าฟังก์ชันทำงานถูกต้องตามข้อตกลงและยอมรับได้
StagingEnvironment ก่อน Production ที่ใกล้เคียงกับ Production มากที่สุดเพื่อการทดสอบสุดท้าย
Productionระบบที่ใช้งานจริงสำหรับผู้ใช้จริง

สรุป Workflow

Development → Testing → Client validation → Production-like validation → Go live

Local → DEV → UAT/DEMO → Staging → Production


ขั้นตอนการทำงานแบบทีละขั้น

#ขั้นตอน
1ยืนยันเจ้าของ go-live + หน้าต่างการดำเนินการ (ใครรันการเปลี่ยนแปลง เมื่อไหร่ ใครอยู่ standby)
2ยืนยันว่า แผน rollback มีอยู่ (rollback หมายถึงอะไรที่นี่ + วิธีดำเนินการ)
3ยืนยันว่า แผนการตรวจสอบ มีอยู่ (เช็กลิสต์ที่ประกาศความสำเร็จ)
4ดำเนินการ go-live และบันทึก execution notes ใน Asana
5ตรวจสอบ แล้วสื่อสารผลลัพธ์ (สำเร็จ / rollback / การดำเนินการติดตาม)

จุดตัดสินใจ: ผลลัพธ์ go-live

ผลลัพธ์การดำเนินการ
Verified (สำเร็จ)ดำเนินการต่อตามแผน hypercare/monitoring (ถ้ากำหนดไว้) และปิดงานการดำเนินการ go-live
Not verified (ล้มเหลว / ความเสี่ยงที่ไม่ยอมรับได้)ดำเนินการแผน rollback บันทึกสิ่งที่เกิดขึ้น และจัดแนวขั้นตอนถัดไป + ตารางเวลาใหม่

เทมเพลตการ์ด Asana: Go-live execution (Technology)

เทมเพลตการ์ด Asana
TitleGo-live execution (Technology) – [Client Name] – [Project Title]
AssigneeTechnology owner
Descriptionกรุณาดำเนินการ go-live สำหรับโครงการนี้

References
• Project card: [Link]
• Delivery go-live task: [Link]

Environment path
Local → DEV → UAT/DEMO → Staging → Production

Rollback plan
• Rollback approach (high-level): [Notes/link]

Verification plan
• What to verify post-release: [Checklist/link]

Execution
• Go-live datetime: [Datetime]
• Execution notes (minimum): what changed + start time + end time + any deviations + who executed

Result
• Outcome: Verified / Rolled back
• Follow-ups (if any): [List/link]

การตอบสนองเหตุขัดข้อง (ขั้นต่ำ)

#ขั้นตอน
1Triage และยืนยันผลกระทบ (อะไรเสียหาย ใครได้รับผลกระทบ ความรุนแรง)
2Contain (หยุดการรั่วไหล: rollback, disable feature, hotfix, mitigation)
3สื่อสารสถานะ (AE/PM จัดแนว; การสื่อสารกับลูกค้าเมื่อจำเป็น)
4แก้ไขและตรวจสอบ
5บันทึกสรุปเหตุขัดข้องสั้น ๆ และงานติดตาม (ป้องกันการเกิดซ้ำ)

เทมเพลตการ์ด Asana: Incident

เทมเพลตการ์ด Asana
TitleIncident – [System/Feature] – [Short description]
AssigneeTechnology owner
DescriptionImpact: [Who is affected / what is broken]
Severity: [Low/Medium/High]
Start time: [Datetime]

Containment: [Actions taken]
Current status: [Short]

Client comms owner (AE/PM): [Name]

Resolution: [What fixed it]
Verification: [What checks passed]

Follow-ups: [Tasks/links]

เช็กลิสต์ Go-live (แผนกเทคโนโลยีใช้)

Preconditions

#เช็กลิสต์
1☐ Go-live owner ถูกมอบหมาย
2☐ แผน rollback มีอยู่ (high-level)
3☐ แผนการตรวจสอบมีอยู่
4☐ Stakeholders ที่เกี่ยวข้องอยู่ standby (ตามที่ตกลง)

Execution

#เช็กลิสต์
1☐ Execution notes บันทึกใน Asana
2☐ การตรวจสอบเสร็จสิ้น
3☐ ผลลัพธ์สื่อสารแล้ว (สำเร็จ / rollback / ขั้นตอนถัดไป)