chore: update project documentation, audit reports, and initialize IDE configuration files
Some checks failed
CI / Lint → Typecheck → Test → Build (22) (push) Failing after 29s
CI / E2E Tests (push) Has been skipped
CodeQL Analysis / CodeQL (javascript-typescript) (push) Failing after 2m42s
Deploy / Build Web Image (push) Failing after 27s
Deploy / Build AI Services Image (push) Failing after 29s
E2E Tests / Playwright E2E (push) Failing after 43s
Deploy / Build API Image (push) Failing after 1m31s
Security Scanning / Dependency Audit (pnpm) (push) Failing after 6s
Security Scanning / Trivy Scan — API Image (push) Failing after 5m35s
Security Scanning / Trivy Scan — AI Services Image (push) Failing after 3m45s
Deploy / Deploy to Staging (push) Has been skipped
Deploy / Smoke Test Staging (push) Has been skipped
Deploy / Deploy to Production (push) Has been skipped
Deploy / Smoke Test Production (push) Has been skipped
Deploy / Rollback Staging (push) Has been skipped
Deploy / Rollback Production (push) Has been skipped
Security Scanning / Trivy Scan — Web Image (push) Failing after 13m51s
Security Scanning / Trivy Filesystem Scan (push) Failing after 14m46s
Security Scanning / Security Gate (push) Has been cancelled
Some checks failed
CI / Lint → Typecheck → Test → Build (22) (push) Failing after 29s
CI / E2E Tests (push) Has been skipped
CodeQL Analysis / CodeQL (javascript-typescript) (push) Failing after 2m42s
Deploy / Build Web Image (push) Failing after 27s
Deploy / Build AI Services Image (push) Failing after 29s
E2E Tests / Playwright E2E (push) Failing after 43s
Deploy / Build API Image (push) Failing after 1m31s
Security Scanning / Dependency Audit (pnpm) (push) Failing after 6s
Security Scanning / Trivy Scan — API Image (push) Failing after 5m35s
Security Scanning / Trivy Scan — AI Services Image (push) Failing after 3m45s
Deploy / Deploy to Staging (push) Has been skipped
Deploy / Smoke Test Staging (push) Has been skipped
Deploy / Deploy to Production (push) Has been skipped
Deploy / Smoke Test Production (push) Has been skipped
Deploy / Rollback Staging (push) Has been skipped
Deploy / Rollback Production (push) Has been skipped
Security Scanning / Trivy Scan — Web Image (push) Failing after 13m51s
Security Scanning / Trivy Filesystem Scan (push) Failing after 14m46s
Security Scanning / Security Gate (push) Has been cancelled
This commit is contained in:
@@ -1,112 +1,112 @@
|
||||
# 📚 GoodGo Platform — Infrastructure Documentation
|
||||
# 📚 GoodGo Platform — Tài liệu Hạ tầng
|
||||
|
||||
This directory contains **three comprehensive operational documents** for the GoodGo Platform infrastructure.
|
||||
Thư mục này chứa **ba tài liệu vận hành toàn diện** dành cho hạ tầng GoodGo Platform.
|
||||
|
||||
## 📖 Documentation Files
|
||||
## 📖 Các Tệp Tài liệu
|
||||
|
||||
### 1. **INFRASTRUCTURE_RUNBOOK.md** (1,458 lines)
|
||||
**→ Read this for complete operational reference**
|
||||
### 1. **INFRASTRUCTURE_RUNBOOK.md** (1.458 dòng)
|
||||
**→ Đọc tài liệu này để có tài liệu tham chiếu vận hành đầy đủ**
|
||||
|
||||
Comprehensive guide covering:
|
||||
- ✅ Executive summary (12+ services overview)
|
||||
- ✅ Complete service inventory with ports, health checks, dependencies
|
||||
- ✅ Docker Compose specifications (dev, prod, CI environments)
|
||||
- ✅ Database layer (PostgreSQL 16 + PostGIS, 22 Prisma models)
|
||||
- ✅ Connection pooling (PgBouncer configuration, transaction mode)
|
||||
- ✅ Backup & recovery strategies (daily automated backups, verification)
|
||||
- ✅ Caching & search (Redis graceful degradation, Typesense full-text)
|
||||
- ✅ Monitoring & observability (Prometheus, Grafana dashboards, Loki logs)
|
||||
- ✅ Payment integration (VNPay, MoMo, ZaloPay, callback handling)
|
||||
- ✅ Health checks (liveness, readiness, dependency-specific probes)
|
||||
- ✅ Complete environment variables reference
|
||||
- ✅ Deployment pipeline (GitHub Actions CI/CD, Docker builds)
|
||||
- ✅ Detailed troubleshooting guide with 7+ common issues
|
||||
- ✅ Emergency procedures and Prometheus queries
|
||||
Hướng dẫn toàn diện bao gồm:
|
||||
- ✅ Tóm tắt điều hành (tổng quan 12+ dịch vụ)
|
||||
- ✅ Danh sách đầy đủ các dịch vụ kèm cổng, kiểm tra sức khoẻ, phụ thuộc
|
||||
- ✅ Đặc tả Docker Compose (môi trường dev, prod, CI)
|
||||
- ✅ Tầng cơ sở dữ liệu (PostgreSQL 16 + PostGIS, 22 mô hình Prisma)
|
||||
- ✅ Gộp kết nối (cấu hình PgBouncer, chế độ giao dịch)
|
||||
- ✅ Chiến lược sao lưu & khôi phục (sao lưu tự động hàng ngày, xác minh)
|
||||
- ✅ Bộ nhớ đệm & tìm kiếm (Redis giảm cấp nhẹ nhàng, Typesense toàn văn)
|
||||
- ✅ Giám sát & quan sát (Prometheus, bảng điều khiển Grafana, nhật ký Loki)
|
||||
- ✅ Tích hợp thanh toán (VNPay, MoMo, ZaloPay, xử lý callback)
|
||||
- ✅ Kiểm tra sức khoẻ (liveness, readiness, probe theo phụ thuộc)
|
||||
- ✅ Tài liệu tham chiếu đầy đủ biến môi trường
|
||||
- ✅ Quy trình triển khai (CI/CD GitHub Actions, bản dựng Docker)
|
||||
- ✅ Hướng dẫn xử lý sự cố chi tiết với 7+ vấn đề phổ biến
|
||||
- ✅ Quy trình khẩn cấp và truy vấn Prometheus
|
||||
|
||||
**Use when:** Creating runbooks, investigating outages, onboarding new ops team members
|
||||
**Dùng khi:** Tạo runbook, điều tra sự cố, giới thiệu thành viên mới vào đội vận hành
|
||||
|
||||
---
|
||||
|
||||
### 2. **INFRASTRUCTURE_QUICK_REFERENCE.md** (222 lines)
|
||||
**→ Read this for quick lookup**
|
||||
### 2. **INFRASTRUCTURE_QUICK_REFERENCE.md** (222 dòng)
|
||||
**→ Đọc tài liệu này để tra cứu nhanh**
|
||||
|
||||
Quick reference covering:
|
||||
- 🚀 Quick start commands (dev, prod, CI)
|
||||
- 📊 Service map with ports and health checks
|
||||
- 🗄️ Database overview (backup schedule, connection pooling)
|
||||
- 💾 Cache & search summary (Redis, Typesense features)
|
||||
- 📈 Monitoring dashboard links
|
||||
- 💳 Payment gateway summary
|
||||
- 🏥 Health endpoint reference
|
||||
- 🔐 Critical environment variables
|
||||
- 📦 Deployment container images
|
||||
- 🆘 Common troubleshooting steps (5 quick fixes)
|
||||
- 📝 Key file locations and links
|
||||
- 📞 Common Docker commands
|
||||
Tài liệu tham chiếu nhanh bao gồm:
|
||||
- 🚀 Lệnh khởi động nhanh (dev, prod, CI)
|
||||
- 📊 Bản đồ dịch vụ với cổng và kiểm tra sức khoẻ
|
||||
- 🗄️ Tổng quan cơ sở dữ liệu (lịch sao lưu, gộp kết nối)
|
||||
- 💾 Tóm tắt bộ nhớ đệm & tìm kiếm (tính năng Redis, Typesense)
|
||||
- 📈 Liên kết bảng điều khiển giám sát
|
||||
- 💳 Tóm tắt cổng thanh toán
|
||||
- 🏥 Tài liệu tham chiếu endpoint kiểm tra sức khoẻ
|
||||
- 🔐 Biến môi trường quan trọng
|
||||
- 📦 Ảnh container triển khai
|
||||
- 🆘 Các bước xử lý sự cố phổ biến (5 cách khắc phục nhanh)
|
||||
- 📝 Vị trí tệp quan trọng và liên kết
|
||||
- 📞 Lệnh Docker thường dùng
|
||||
|
||||
**Use when:** Debugging quickly, on-call shift lookup, quick health checks
|
||||
**Dùng khi:** Gỡ lỗi nhanh, tra cứu ca trực, kiểm tra sức khoẻ nhanh
|
||||
|
||||
---
|
||||
|
||||
### 3. **INFRASTRUCTURE_AUDIT.md** (1,246 lines)
|
||||
**→ Read this for complete audit trail of what was explored**
|
||||
### 3. **INFRASTRUCTURE_AUDIT.md** (1.246 dòng)
|
||||
**→ Đọc tài liệu này để xem toàn bộ lịch sử kiểm tra**
|
||||
|
||||
Detailed audit including:
|
||||
- Raw configuration file contents
|
||||
- Line-by-line analysis of each service
|
||||
- Environment variable specifications
|
||||
- Payment callback flow diagram (text)
|
||||
- Health check implementation details
|
||||
- Backup verification workflow
|
||||
- CI/CD pipeline stages
|
||||
Kiểm tra chi tiết bao gồm:
|
||||
- Nội dung tệp cấu hình thô
|
||||
- Phân tích từng dòng của từng dịch vụ
|
||||
- Đặc tả biến môi trường
|
||||
- Sơ đồ luồng callback thanh toán (dạng văn bản)
|
||||
- Chi tiết cài đặt kiểm tra sức khoẻ
|
||||
- Quy trình xác minh sao lưu
|
||||
- Các giai đoạn quy trình CI/CD
|
||||
|
||||
**Use when:** Verifying infrastructure documentation accuracy, compliance audits
|
||||
**Dùng khi:** Xác minh độ chính xác tài liệu hạ tầng, kiểm toán tuân thủ
|
||||
|
||||
---
|
||||
|
||||
## 🎯 Quick Navigation
|
||||
## 🎯 Điều hướng Nhanh
|
||||
|
||||
### By Role
|
||||
### Theo Vai trò
|
||||
|
||||
**🔧 DevOps/SRE Engineer**
|
||||
1. Start: INFRASTRUCTURE_QUICK_REFERENCE.md (5 min overview)
|
||||
2. Deep dive: INFRASTRUCTURE_RUNBOOK.md (sections 2-3, 7, 11)
|
||||
3. Reference: INFRASTRUCTURE_AUDIT.md (for raw configs)
|
||||
**🔧 Kỹ sư DevOps/SRE**
|
||||
1. Bắt đầu: INFRASTRUCTURE_QUICK_REFERENCE.md (tổng quan 5 phút)
|
||||
2. Tìm hiểu sâu: INFRASTRUCTURE_RUNBOOK.md (phần 2-3, 7, 11)
|
||||
3. Tham chiếu: INFRASTRUCTURE_AUDIT.md (để xem cấu hình thô)
|
||||
|
||||
**💼 Engineering Manager/Tech Lead**
|
||||
1. Start: INFRASTRUCTURE_RUNBOOK.md (section 1: Executive Summary)
|
||||
2. Details: INFRASTRUCTURE_RUNBOOK.md (sections 2-6, 10)
|
||||
**💼 Quản lý Kỹ thuật/Trưởng nhóm Kỹ thuật**
|
||||
1. Bắt đầu: INFRASTRUCTURE_RUNBOOK.md (phần 1: Tóm tắt Điều hành)
|
||||
2. Chi tiết: INFRASTRUCTURE_RUNBOOK.md (phần 2-6, 10)
|
||||
|
||||
**🚀 On-Call Engineer**
|
||||
1. Start: INFRASTRUCTURE_QUICK_REFERENCE.md (entire document)
|
||||
2. Troubleshoot: INFRASTRUCTURE_RUNBOOK.md (section 12)
|
||||
3. Debug: INFRASTRUCTURE_AUDIT.md (raw logs/configs if needed)
|
||||
**🚀 Kỹ sư Trực**
|
||||
1. Bắt đầu: INFRASTRUCTURE_QUICK_REFERENCE.md (toàn bộ tài liệu)
|
||||
2. Xử lý sự cố: INFRASTRUCTURE_RUNBOOK.md (phần 12)
|
||||
3. Gỡ lỗi: INFRASTRUCTURE_AUDIT.md (nhật ký/cấu hình thô nếu cần)
|
||||
|
||||
**👤 New Team Member**
|
||||
1. Start: INFRASTRUCTURE_QUICK_REFERENCE.md (overview)
|
||||
2. Learn: INFRASTRUCTURE_RUNBOOK.md (sections 1-6)
|
||||
3. Practice: Use common commands from Quick Reference
|
||||
**👤 Thành viên Mới**
|
||||
1. Bắt đầu: INFRASTRUCTURE_QUICK_REFERENCE.md (tổng quan)
|
||||
2. Tìm hiểu: INFRASTRUCTURE_RUNBOOK.md (phần 1-6)
|
||||
3. Thực hành: Dùng các lệnh phổ biến từ Quick Reference
|
||||
|
||||
---
|
||||
|
||||
## 🔍 Common Questions & Where to Find Answers
|
||||
## 🔍 Câu hỏi Thường gặp & Nơi Tìm Câu trả lời
|
||||
|
||||
| Question | Document | Section |
|
||||
|----------|----------|---------|
|
||||
| "How many services are running?" | Runbook | 1. Executive Summary |
|
||||
| "What ports do I need to know?" | Quick Reference | 📊 Service Map |
|
||||
| "How is the database backed up?" | Runbook | 8. Backup & Recovery |
|
||||
| "Payment callback failed, what now?" | Runbook | 12. Troubleshooting (Payment Callback) |
|
||||
| "Redis is down, will the app work?" | Runbook | 5. Caching & Search (Graceful Degradation) |
|
||||
| "How do I restart a service?" | Quick Reference | 📞 Common Commands |
|
||||
| "What's the monitoring setup?" | Runbook | 6. Monitoring & Observability |
|
||||
| "Where are environment variables?" | Runbook | 9. Environment Variables |
|
||||
| "How do I deploy to production?" | Runbook | 11. Deployment Pipeline |
|
||||
| "What does a health check do?" | Runbook | 7. Health Checks |
|
||||
| Câu hỏi | Tài liệu | Phần |
|
||||
|----------|----------|------|
|
||||
| "Có bao nhiêu dịch vụ đang chạy?" | Runbook | 1. Tóm tắt Điều hành |
|
||||
| "Tôi cần biết những cổng nào?" | Quick Reference | 📊 Bản đồ Dịch vụ |
|
||||
| "Cơ sở dữ liệu được sao lưu thế nào?" | Runbook | 8. Sao lưu & Khôi phục |
|
||||
| "Callback thanh toán thất bại, làm gì?" | Runbook | 12. Xử lý Sự cố (Callback Thanh toán) |
|
||||
| "Redis bị lỗi, ứng dụng có hoạt động không?" | Runbook | 5. Bộ nhớ đệm & Tìm kiếm (Giảm cấp Nhẹ nhàng) |
|
||||
| "Làm sao khởi động lại một dịch vụ?" | Quick Reference | 📞 Lệnh Thường dùng |
|
||||
| "Cấu hình giám sát như thế nào?" | Runbook | 6. Giám sát & Quan sát |
|
||||
| "Biến môi trường ở đâu?" | Runbook | 9. Biến Môi trường |
|
||||
| "Làm sao triển khai lên production?" | Runbook | 11. Quy trình Triển khai |
|
||||
| "Kiểm tra sức khoẻ làm gì?" | Runbook | 7. Kiểm tra Sức khoẻ |
|
||||
|
||||
---
|
||||
|
||||
## 📊 Infrastructure at a Glance
|
||||
## 📊 Tổng quan Hạ tầng
|
||||
|
||||
```
|
||||
Development Environment
|
||||
@@ -139,77 +139,77 @@ CI/E2E Environment
|
||||
|
||||
---
|
||||
|
||||
## 🔗 Related Files in Repository
|
||||
## 🔗 Tệp Liên quan trong Kho lưu trữ
|
||||
|
||||
```
|
||||
goodgo-platform-ai/
|
||||
├── README_INFRASTRUCTURE.md (THIS FILE)
|
||||
├── INFRASTRUCTURE_RUNBOOK.md (Complete reference)
|
||||
├── INFRASTRUCTURE_QUICK_REFERENCE.md (Quick lookup)
|
||||
├── INFRASTRUCTURE_AUDIT.md (Detailed audit)
|
||||
├── README_INFRASTRUCTURE.md (TỆP NÀY)
|
||||
├── INFRASTRUCTURE_RUNBOOK.md (Tài liệu tham chiếu đầy đủ)
|
||||
├── INFRASTRUCTURE_QUICK_REFERENCE.md (Tra cứu nhanh)
|
||||
├── INFRASTRUCTURE_AUDIT.md (Kiểm tra chi tiết)
|
||||
│
|
||||
├── docker-compose.yml (Dev environment)
|
||||
├── docker-compose.yml (Môi trường Dev)
|
||||
├── docker-compose.prod.yml (Production)
|
||||
├── docker-compose.ci.yml (Testing)
|
||||
│
|
||||
├── .env.example (Environment variables template)
|
||||
├── prisma/schema.prisma (Data model, 22 Prisma models)
|
||||
├── .env.example (Mẫu biến môi trường)
|
||||
├── prisma/schema.prisma (Mô hình dữ liệu, 22 mô hình Prisma)
|
||||
│
|
||||
├── infra/pgbouncer/ (Connection pooling)
|
||||
├── monitoring/ (Prometheus, Grafana, Loki configs)
|
||||
├── scripts/backup/ (Backup and verification scripts)
|
||||
├── infra/pgbouncer/ (Gộp kết nối)
|
||||
├── monitoring/ (Cấu hình Prometheus, Grafana, Loki)
|
||||
├── scripts/backup/ (Script sao lưu và xác minh)
|
||||
│
|
||||
└── .github/workflows/ (CI/CD pipelines)
|
||||
└── .github/workflows/ (Quy trình CI/CD)
|
||||
├── ci.yml (Lint → Test → Build)
|
||||
├── deploy.yml (Build images, deploy)
|
||||
├── e2e.yml (End-to-end tests)
|
||||
├── backup-verify.yml (Weekly backup verification)
|
||||
└── security.yml (Dependency scanning)
|
||||
├── deploy.yml (Dựng ảnh, triển khai)
|
||||
├── e2e.yml (Kiểm thử đầu-cuối)
|
||||
├── backup-verify.yml (Xác minh sao lưu hàng tuần)
|
||||
└── security.yml (Quét phụ thuộc)
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 🆘 Immediate Help
|
||||
## 🆘 Hỗ trợ Khẩn cấp
|
||||
|
||||
### "The API is down. What do I check?"
|
||||
1. Read: INFRASTRUCTURE_QUICK_REFERENCE.md → 🆘 Troubleshooting
|
||||
2. Quick commands:
|
||||
### "API bị lỗi. Tôi cần kiểm tra gì?"
|
||||
1. Đọc: INFRASTRUCTURE_QUICK_REFERENCE.md → 🆘 Xử lý Sự cố
|
||||
2. Lệnh nhanh:
|
||||
```bash
|
||||
docker compose ps api
|
||||
docker compose logs api --tail=50
|
||||
curl http://localhost:3001/health/ready
|
||||
```
|
||||
3. If still stuck: See INFRASTRUCTURE_RUNBOOK.md → 12. Troubleshooting
|
||||
3. Vẫn chưa giải quyết được: Xem INFRASTRUCTURE_RUNBOOK.md → 12. Xử lý Sự cố
|
||||
|
||||
### "I need to deploy to production"
|
||||
1. Read: INFRASTRUCTURE_QUICK_REFERENCE.md → 📦 Deployment
|
||||
2. Then: INFRASTRUCTURE_RUNBOOK.md → 11. Deployment Pipeline
|
||||
3. Review: `.github/workflows/deploy.yml` for actual steps
|
||||
### "Tôi cần triển khai lên production"
|
||||
1. Đọc: INFRASTRUCTURE_QUICK_REFERENCE.md → 📦 Triển khai
|
||||
2. Tiếp theo: INFRASTRUCTURE_RUNBOOK.md → 11. Quy trình Triển khai
|
||||
3. Xem lại: `.github/workflows/deploy.yml` để biết các bước thực tế
|
||||
|
||||
### "The database is slow"
|
||||
1. Read: INFRASTRUCTURE_RUNBOOK.md → 4. Database Layer (Connection Pooling)
|
||||
2. Check: INFRASTRUCTURE_QUICK_REFERENCE.md → 🆘 "Database connection pooling full?"
|
||||
3. Query: Use Prometheus queries from INFRASTRUCTURE_RUNBOOK.md
|
||||
### "Cơ sở dữ liệu chậm"
|
||||
1. Đọc: INFRASTRUCTURE_RUNBOOK.md → 4. Tầng Cơ sở Dữ liệu (Gộp Kết nối)
|
||||
2. Kiểm tra: INFRASTRUCTURE_QUICK_REFERENCE.md → 🆘 "Gộp kết nối cơ sở dữ liệu đầy?"
|
||||
3. Truy vấn: Dùng truy vấn Prometheus từ INFRASTRUCTURE_RUNBOOK.md
|
||||
|
||||
### "How do I restore from backup?"
|
||||
1. Read: INFRASTRUCTURE_RUNBOOK.md → 8. Backup & Recovery
|
||||
2. Steps: "Restore from Backup" section with exact commands
|
||||
### "Làm sao khôi phục từ bản sao lưu?"
|
||||
1. Đọc: INFRASTRUCTURE_RUNBOOK.md → 8. Sao lưu & Khôi phục
|
||||
2. Các bước: Phần "Restore from Backup" với lệnh chính xác
|
||||
|
||||
---
|
||||
|
||||
## 📈 Key Metrics & SLOs
|
||||
## 📈 Chỉ số Chính & SLO
|
||||
|
||||
From INFRASTRUCTURE_RUNBOOK.md monitoring section:
|
||||
Từ phần giám sát trong INFRASTRUCTURE_RUNBOOK.md:
|
||||
|
||||
| Metric | Warning | Critical | Source |
|
||||
| Chỉ số | Cảnh báo | Nghiêm trọng | Nguồn |
|
||||
|--------|---------|----------|--------|
|
||||
| API p99 latency | > 1s (5min) | > 3s (3min) | Prometheus histogram |
|
||||
| API p99/endpoint | > 2s (5min) | N/A | Prometheus |
|
||||
| 5xx error rate | > 1% (5min) | N/A | Prometheus |
|
||||
| Database response | Monitored | Monitored | Grafana dashboard |
|
||||
| Redis availability | Graceful fallback | Graceful fallback | App continues on DB |
|
||||
| Độ trễ p99 API | > 1s (5 phút) | > 3s (3 phút) | Histogram Prometheus |
|
||||
| p99/endpoint API | > 2s (5 phút) | N/A | Prometheus |
|
||||
| Tỷ lệ lỗi 5xx | > 1% (5 phút) | N/A | Prometheus |
|
||||
| Phản hồi cơ sở dữ liệu | Được giám sát | Được giám sát | Bảng điều khiển Grafana |
|
||||
| Khả dụng Redis | Giảm cấp nhẹ nhàng | Giảm cấp nhẹ nhàng | Ứng dụng tiếp tục trên DB |
|
||||
|
||||
Dashboards available at `http://localhost:3002` (Grafana):
|
||||
Bảng điều khiển có sẵn tại `http://localhost:3002` (Grafana):
|
||||
- API Latency
|
||||
- API Overview
|
||||
- Database Metrics
|
||||
@@ -220,59 +220,59 @@ Dashboards available at `http://localhost:3002` (Grafana):
|
||||
|
||||
---
|
||||
|
||||
## 🔐 Security Notes
|
||||
## 🔐 Lưu ý Bảo mật
|
||||
|
||||
From INFRASTRUCTURE_RUNBOOK.md environment variables section:
|
||||
Từ phần biến môi trường trong INFRASTRUCTURE_RUNBOOK.md:
|
||||
|
||||
**CRITICAL (Production):**
|
||||
- JWT_SECRET must be ≥32 characters (generate: `openssl rand -base64 48`)
|
||||
- KYC_ENCRYPTION_KEY must be 64 hex chars (generate: `openssl rand -hex 32`)
|
||||
- All payment gateway credentials must be rotated regularly
|
||||
- Redis requires password authentication in production
|
||||
- Docker containers run as non-root (node user)
|
||||
- Read-only filesystems for application containers
|
||||
- No new privileges flag set
|
||||
**QUAN TRỌNG (Production):**
|
||||
- JWT_SECRET phải có ít nhất 32 ký tự (tạo: `openssl rand -base64 48`)
|
||||
- KYC_ENCRYPTION_KEY phải là 64 ký tự hex (tạo: `openssl rand -hex 32`)
|
||||
- Tất cả thông tin xác thực cổng thanh toán phải được luân chuyển định kỳ
|
||||
- Redis yêu cầu xác thực bằng mật khẩu trong môi trường production
|
||||
- Container Docker chạy với người dùng không phải root (người dùng node)
|
||||
- Hệ thống tệp chỉ đọc cho container ứng dụng
|
||||
- Đặt cờ no new privileges
|
||||
|
||||
---
|
||||
|
||||
## 📞 Escalation Path
|
||||
## 📞 Quy trình Leo thang
|
||||
|
||||
1. **Immediate Issue?** → INFRASTRUCTURE_QUICK_REFERENCE.md
|
||||
2. **Complex Problem?** → INFRASTRUCTURE_RUNBOOK.md section 12
|
||||
3. **Need Audit Trail?** → INFRASTRUCTURE_AUDIT.md
|
||||
4. **Still Stuck?** → Check .github/workflows/ or git history
|
||||
1. **Vấn đề Khẩn cấp?** → INFRASTRUCTURE_QUICK_REFERENCE.md
|
||||
2. **Vấn đề Phức tạp?** → INFRASTRUCTURE_RUNBOOK.md phần 12
|
||||
3. **Cần Lịch sử Kiểm tra?** → INFRASTRUCTURE_AUDIT.md
|
||||
4. **Vẫn Chưa Giải quyết?** → Kiểm tra .github/workflows/ hoặc lịch sử git
|
||||
|
||||
---
|
||||
|
||||
## 📝 Document Updates
|
||||
## 📝 Cập nhật Tài liệu
|
||||
|
||||
These documents were generated on **April 11, 2026** from a complete infrastructure audit of the GoodGo Platform monorepo.
|
||||
Các tài liệu này được tạo vào **ngày 11 tháng 4 năm 2026** từ một cuộc kiểm tra hạ tầng toàn diện của monorepo GoodGo Platform.
|
||||
|
||||
**To keep up-to-date:**
|
||||
- Update these docs when adding new services
|
||||
- Review monitoring configs after infrastructure changes
|
||||
- Test backup procedures monthly (already automated)
|
||||
- Update runbooks based on incident postmortems
|
||||
**Để giữ tài liệu luôn cập nhật:**
|
||||
- Cập nhật tài liệu này khi thêm dịch vụ mới
|
||||
- Xem lại cấu hình giám sát sau khi thay đổi hạ tầng
|
||||
- Kiểm thử quy trình sao lưu hàng tháng (đã được tự động hoá)
|
||||
- Cập nhật runbook dựa trên postmortem sự cố
|
||||
|
||||
---
|
||||
|
||||
## 🎓 Learning Path
|
||||
## 🎓 Lộ trình Học tập
|
||||
|
||||
**For new team members:**
|
||||
1. **Day 1:** Read INFRASTRUCTURE_QUICK_REFERENCE.md (30 min)
|
||||
2. **Day 2:** Read INFRASTRUCTURE_RUNBOOK.md sections 1-3 (1 hour)
|
||||
3. **Day 3:** Practice commands from Quick Reference with mentor
|
||||
4. **Day 4:** Read INFRASTRUCTURE_RUNBOOK.md sections 4-7 (1.5 hours)
|
||||
5. **Day 5:** Read INFRASTRUCTURE_RUNBOOK.md sections 8-12 (1.5 hours)
|
||||
6. **Week 2:** Shadow on-call engineer, practice troubleshooting
|
||||
7. **Week 3:** Take on-call shift
|
||||
**Dành cho thành viên mới:**
|
||||
1. **Ngày 1:** Đọc INFRASTRUCTURE_QUICK_REFERENCE.md (30 phút)
|
||||
2. **Ngày 2:** Đọc INFRASTRUCTURE_RUNBOOK.md phần 1-3 (1 giờ)
|
||||
3. **Ngày 3:** Thực hành lệnh từ Quick Reference cùng người hướng dẫn
|
||||
4. **Ngày 4:** Đọc INFRASTRUCTURE_RUNBOOK.md phần 4-7 (1,5 giờ)
|
||||
5. **Ngày 5:** Đọc INFRASTRUCTURE_RUNBOOK.md phần 8-12 (1,5 giờ)
|
||||
6. **Tuần 2:** Theo sát kỹ sư trực, thực hành xử lý sự cố
|
||||
7. **Tuần 3:** Nhận ca trực
|
||||
|
||||
---
|
||||
|
||||
**Last Updated:** April 11, 2026
|
||||
**Version:** 1.0
|
||||
**Maintainers:** GoodGo Platform SRE Team
|
||||
**Cập nhật lần cuối:** Ngày 11 tháng 4 năm 2026
|
||||
**Phiên bản:** 1.0
|
||||
**Người bảo trì:** GoodGo Platform SRE Team
|
||||
|
||||
---
|
||||
|
||||
*For questions or updates to this documentation, contact: devops@goodgo.vn*
|
||||
*Để đặt câu hỏi hoặc cập nhật tài liệu này, liên hệ: devops@goodgo.vn*
|
||||
|
||||
Reference in New Issue
Block a user