Crawl Errors và HTTP Status Codes là nhóm tín hiệu kỹ thuật cốt lõi trong Technical SEO, phản ánh cách công cụ tìm kiếm thu thập, hiểu và đánh giá chất lượng hạ tầng website.
Việc xử lý sai hoặc bỏ qua các lỗi 404, 5xx và Soft 404 không chỉ làm giảm hiệu quả crawl budget mà còn ảnh hưởng trực tiếp tới khả năng lập chỉ mục và thứ hạng tìm kiếm.

1. Tổng quan về Crawl Errors & HTTP Status Codes #
Crawl Errors là các lỗi xảy ra khi bot tìm kiếm (điển hình là Googlebot) không thể truy cập hoặc xử lý URL đúng như kỳ vọng.
HTTP Status Codes là mã phản hồi chuẩn của máy chủ, cho biết trạng thái xử lý yêu cầu từ client (trình duyệt hoặc bot).
Bảng phân loại HTTP Status Codes trong SEO #
| Nhóm mã | Ý nghĩa | Ảnh hưởng SEO | Ví dụ |
|---|---|---|---|
| 2xx | Thành công | Tốt cho index | 200 OK |
| 3xx | Chuyển hướng | Trung lập / tích cực nếu đúng | 301, 302 |
| 4xx | Lỗi phía client | Tiêu cực nếu nhiều | 404, 410 |
| 5xx | Lỗi phía server | Rất tiêu cực | 500, 503 |
2. Lỗi 404 (Not Found) #
Lỗi 404 xảy ra khi server không tìm thấy tài nguyên tương ứng với URL được yêu cầu.
Đây là lỗi phổ biến nhất trong quá trình crawl và không phải lúc nào cũng xấu nếu được quản lý đúng.
2.1. Định nghĩa và nguyên lý hoạt động #
Lỗi 404 là phản hồi chuẩn HTTP cho biết URL không tồn tại. Google chấp nhận 404 như một trạng thái “bình thường của web”.
2.2. Khi nào 404 là tốt – khi nào là xấu? #
| Trường hợp | Đánh giá SEO |
|---|---|
| Trang sản phẩm đã ngừng bán vĩnh viễn | 404/410 là hợp lý |
| Trang có backlink, traffic | Nên 301 |
| 404 hàng loạt do lỗi kỹ thuật | Rất xấu |
2.3. Tác động tới thứ hạng #
- Không phạt trực tiếp website
- Lãng phí crawl budget nếu số lượng lớn
- Mất giá trị backlink nếu không redirect
2.4. Cách xử lý lỗi 404 #
| Tình huống | Giải pháp |
|---|---|
| Nội dung thay thế | 301 redirect |
| Không còn giá trị | Giữ 404 hoặc 410 |
| Lỗi internal link | Sửa link |
Checklist triển khai 404 #
- Audit 404 trong Google Search Console
- Phân loại URL có/không backlink
- Thiết lập redirect hợp lý
- Thiết kế trang 404 thân thiện người dùng
3. Soft 404 #
Soft 404 là trường hợp URL trả về mã 200 OK nhưng nội dung lại thể hiện “không tồn tại”.
3.1. Định nghĩa chuẩn SEO #
Soft 404 không phải mã HTTP mà là cách Google diễn giải nội dung.
Trang trống, trang “không tìm thấy sản phẩm” nhưng vẫn trả 200 sẽ bị coi là Soft 404.
3.2. Nguyên nhân phổ biến #
| Nguyên nhân | Ví dụ |
|---|---|
| Trang tìm kiếm rỗng | “Không có kết quả” |
| Trang sản phẩm hết hàng | Không có nội dung thay thế |
| Template lỗi | Nội dung mỏng |
3.3. Tác động tới SEO #
- Google không index
- Mất tín hiệu chất lượng
- Gây nhiễu hệ thống đánh giá nội dung
3.4. Cách xử lý Soft 404 #
| Tình huống | Cách làm |
|---|---|
| Trang không còn giá trị | Trả 404/410 thật |
| Có nội dung liên quan | Bổ sung nội dung |
| Trang tìm kiếm | Chặn index |
Checklist kiểm tra Soft 404 #
- Kiểm tra URL trả 200 nhưng không có nội dung
- So sánh HTML content vs intent
- Điều chỉnh status code phù hợp

4. Lỗi 5xx (Server Errors) #
Lỗi 5xx cho biết máy chủ không thể xử lý yêu cầu hợp lệ từ bot.
4.1. Phân loại lỗi 5xx thường gặp #
| Mã | Ý nghĩa | Nguy cơ |
|---|---|---|
| 500 | Internal Server Error | Cao |
| 502 | Bad Gateway | Cao |
| 503 | Service Unavailable | Trung bình (nếu tạm thời) |
4.2. Nguyên lý Google xử lý 5xx #
- Google giảm crawl rate
- Lặp lại crawl sau nhiều lần
- Có thể loại URL khỏi index nếu kéo dài
4.3. Tác động tới thứ hạng #
| Thời gian lỗi | Ảnh hưởng |
|---|---|
| < vài giờ | Gần như không |
| Vài ngày | Giảm crawl, giảm index |
| Hàng tuần | Mất thứ hạng rõ rệt |
4.4. Cách xử lý lỗi 5xx #
- Kiểm tra server log
- Giám sát uptime
- Dùng 503 + Retry-After khi bảo trì
Checklist xử lý 5xx #
- Thiết lập monitoring server
- Kiểm tra response time
- Audit hosting & CDN
- Thông báo bảo trì đúng chuẩn

5. So sánh 404 – Soft 404 – 5xx #
| Tiêu chí | 404 | Soft 404 | 5xx |
|---|---|---|---|
| Nguyên nhân | URL không tồn tại | Nội dung rỗng | Lỗi server |
| Mức độ nguy hiểm | Thấp–Trung | Trung | Cao |
| Ảnh hưởng crawl | Trung bình | Trung | Rất cao |
| Khuyến nghị | Quản lý | Sửa triệt để | Xử lý khẩn cấp |
6. Hiểu lầm thường gặp #
- “404 là lỗi xấu cần xoá hết” → Sai
- “Soft 404 không phải lỗi thật” → Sai
- “503 luôn tốt hơn 500” → Chỉ đúng khi bảo trì có chủ đích
7. Ví dụ thực tế #
Một website thương mại điện tử có:
- 12.000 URL sản phẩm cũ trả 200 nhưng nội dung trống
- Google báo Soft 404 hàng loạt
- Sau khi chuyển sang 410 + redirect thông minh
→ Tăng 18% số URL được index sau 6 tuần
8. Kết quả & kinh nghiệm thực tế #
- Quản lý đúng status code giúp Google hiểu rõ cấu trúc website
- Giảm lãng phí crawl budget
- Cải thiện độ tin cậy kỹ thuật (technical trust)
9. Lời kết #
Crawl Errors & Status Codes không phải là lỗi “cần xoá”, mà là tín hiệu cần được kiểm soát có chiến lược.
Một website mạnh về SEO là website nói đúng ngôn ngữ HTTP với công cụ tìm kiếm, minh bạch, nhất quán và có chủ đích.
Tài liệu thuộc SEO Wiki Việt Nam – dự án chuẩn hoá tri thức SEO cộng đồng.


