Đối với người mới bắt đầu làm SEO, kiểm toán kỹ thuật có vẻ giống như một nhiệm vụ đòi hỏi các công cụ chuyên nghiệp và kiến thức chuyên sâu. Tuy nhiên, trên thực tế, rất nhiều vấn đề kỹ thuật nghiêm trọng trên các trang web có thể được phát hiện chỉ bằng cách sử dụng Google Search.
Tôi đã từng thực hiện kiểm toán cơ bản cho hai trang web: một trang web giáo dục cung cấp dịch vụ dạy kèm, với khoảng 500 lượt truy cập tìm kiếm tự nhiên mỗi tháng; và một nền tảng thương mại điện tử giảm giá, với khoảng 11.000 lượt truy cập mỗi tháng. Điều đáng ngạc nhiên là cả hai trang web này đều có những vấn đề kỹ thuật rõ ràng, và một trong số đó thậm chí còn bị hack.
Những vấn đề này không phải là cá biệt. Ngay cả những trang web nổi tiếng trong lĩnh vực tiếp thị cũng thường xuyên tồn tại các lỗ hổng kỹ thuật khác nhau. Điểm mấu chốt là bạn không cần các công cụ SEO đắt tiền để phát hiện ra chúng.
Nhiều người vội vàng tạo nội dung và xây dựng liên kết ngoài, bỏ qua một thực tế: nếu nền tảng kỹ thuật của trang web có vấn đề, nội dung tốt nhất cũng sẽ không phát huy được tác dụng.
Hãy tưởng tượng bạn đã tạo ra một bài viết blog chất lượng cao, nhưng vì cấu hình HTTPS bị lỗi, Google lại thu thập phiên bản HTTP, và phiên bản này lại bị hack để cấy các liên kết rác. Hoặc, trang sản phẩm của bạn bị lập chỉ mục hàng trăm lần do các vấn đề về tham số URL, làm loãng sức mạnh của trang.
Những vấn đề này sẽ không trực tiếp làm sập trang web của bạn, nhưng chúng sẽ âm thầm làm tổn hại đến hiệu suất SEO của bạn như một căn bệnh mãn tính. Điều tệ hơn là nhiều người không hề hay biết về sự tồn tại của những vấn đề này.
Đối với người dùng sử dụng WordPress để xây dựng trang web, các vấn đề kỹ thuật đặc biệt phổ biến. Ví dụ như không xóa các trang mặc định sau khi cài đặt, hàng loạt trang thẻ (tag pages) bị lập chỉ mục, các trang tác giả tiết lộ thông tin nội bộ, v.v.
Bước đầu tiên là đảm bảo trang web của bạn chỉ có một phiên bản tiêu chuẩn. Nhập lần lượt bốn địa chỉ sau vào trình duyệt:
• http://yourdomain.com • http://www.yourdomain.com • https://yourdomain.com • https://www.yourdomain.com
Lý tưởng nhất là ngoài phiên bản tiêu chuẩn bạn đã chọn (khuyến nghị sử dụng https://yourdomain.com), ba phiên bản còn lại nên tự động chuyển hướng đến phiên bản tiêu chuẩn.
Trang web đầu tiên tôi kiểm toán đã gặp vấn đề ở bước này. Phiên bản HTTP của nó không chuyển hướng, và nghiêm trọng hơn, 164 trang HTTP này đã bị Google lập chỉ mục. Khi nhấp vào, tôi phát hiện ra các trang này chứa đầy các liên kết ngẫu nhiên đến các trang web tài chính Thụy Sĩ và các trường dạy lái xe Canada, rõ ràng là đã bị hack.
Nhập vào thanh tìm kiếm của Google:
site:yourdomain.com -inurl:https
Lệnh này sẽ hiển thị tất cả các trang đã được lập chỉ mục nhưng không sử dụng HTTPS. Nếu bạn đã kích hoạt chứng chỉ SSL, sẽ không có kết quả nào xuất hiện ở đây. Nếu có nhiều kết quả, điều đó có nghĩa là các trang HTTP cũ vẫn còn trong chỉ mục của Google và cần thiết lập chuyển hướng 301.
Nhập lệnh tìm kiếm sau:
site:yourdomain.co.uk intitle:yourdomain.com
Trang web thương mại điện tử tôi kiểm toán đã gặp vấn đề này. Trang web thực tế sử dụng tên miền .co.uk, nhưng tiêu đề của hàng trăm trang lại ghi là .com. Sự không nhất quán này không chỉ ảnh hưởng đến hình ảnh thương hiệu mà còn có thể làm giảm tỷ lệ nhấp, vì người dùng sẽ cảm thấy bối rối khi thấy tên miền trong kết quả tìm kiếm không khớp với tiêu đề.
Đối với các trang web WordPress, bạn có thể sử dụng các lệnh sau:
site:yourdomain.com inurl:tag
site:yourdomain.com inurl:author
site:yourdomain.com inurl:page
site:yourdomain.com inurl:welcome-to-wordpress OR inurl:hello-world
Các lệnh này lần lượt kiểm tra xem các trang thẻ, trang tác giả, các trang phân trang và các trang mặc định sau khi cài đặt WordPress có bị lập chỉ mục hay không.
Các trang web thương mại điện tử cũng cần đặc biệt chú ý đến các vấn đề về tham số URL. Ví dụ:
site:yourdomain.com inurl:page
site:yourdomain.com inurl:sort
Trang web thương mại điện tử tôi kiểm toán đã bị lập chỉ mục hàng trăm trang trùng lặp do tham số phân trang và sắp xếp, làm phân tán nghiêm trọng sức mạnh của trang.
Nhập các lệnh sau để kiểm tra xem có tệp nhạy cảm nào bị công khai lập chỉ mục hay không:
site:yourdomain.com filetype:pdf
site:yourdomain.com "lorem ipsum"
Lệnh đầu tiên tìm tất cả các tệp PDF đã được lập chỉ mục. Trong quá trình nghiên cứu, tôi đã phát hiện ra một số công ty vô tình công khai thông tin nhạy cảm như bảng lương nhân viên, địa chỉ khách hàng, v.v. Lệnh thứ hai tìm kiếm xem có trang nào vẫn đang sử dụng văn bản giữ chỗ (placeholder text) hay không, điều này cho thấy nội dung đã được xuất bản trước khi hoàn thành.
Google Search Operators có thể phát hiện nhiều vấn đề rõ ràng, nhưng chúng có ba hạn chế:
Đầu tiên, Google không thường xuyên thu thập lại các trang "không quan trọng", vì vậy kết quả tìm kiếm có thể lỗi thời. Bạn có thể đã khắc phục một vấn đề, nhưng Google vẫn hiển thị phiên bản cũ trong chỉ mục của mình.
Thứ hai, Google không thể cho bạn biết trực tiếp số lượng chuyển hướng 301 hoặc lỗi 404, bạn cần nhấp vào từng trang để xác minh.
Thứ ba, Google không chủ động giám sát trang web của bạn. Bạn cần thực hiện các tìm kiếm thủ công này một cách thường xuyên, và rất dễ bỏ sót vấn đề.
Đây là lý do tại sao các nhóm SEO chuyên nghiệp sử dụng các công cụ như Ahrefs để thực hiện kiểm toán hệ thống. Những công cụ này có thể tự động phát hiện hơn 100 loại vấn đề kỹ thuật phổ biến, tạo báo cáo chi tiết và giám sát tình trạng sức khỏe của trang web một cách thường xuyên.
Tuy nhiên, nếu bạn là chủ sở hữu trang web cá nhân hoặc một nhóm nhỏ mới bắt đầu, việc sử dụng Google để kiểm toán cơ bản đã đủ để phát hiện hầu hết các vấn đề nghiêm trọng. Điều quan trọng là tạo thói quen kiểm tra định kỳ.
Phát hiện vấn đề chỉ là bước đầu, quan trọng hơn là xây dựng một hệ thống nội dung và vận hành SEO dài hạn.
Nhiều người sau khi khắc phục các vấn đề kỹ thuật lại đối mặt với thách thức tiếp theo: làm thế nào để liên tục tạo ra nội dung SEO chất lượng cao? Cách truyền thống là tuyển dụng người viết, lập lịch nội dung, xuất bản từng bài, quy trình này vừa tốn thời gian vừa khó mở rộng quy mô.
Nếu bạn muốn nhanh chóng xây dựng lợi thế nội dung sau khi nền tảng kỹ thuật đã vững chắc, SEOInfra cung cấp một cách tiếp cận khác. Nó không chỉ giúp bạn viết blog, mà còn giúp bạn chuyển đổi hiệu quả các nguồn nội dung chất lượng cao hiện có (như video YouTube, podcast, thảo luận ngành) thành các bài blog gốc có thể được công cụ tìm kiếm lập chỉ mục, đồng thời tự động tối ưu hóa cấu trúc SEO và quy trình xuất bản.
Đối với các trang web thương mại điện tử xuyên biên giới hoặc SaaS, điều này có nghĩa là bạn có thể liên tục mở rộng phạm vi phủ sóng nội dung trong khi vẫn đảm bảo tình trạng kỹ thuật lành mạnh, mà không cần tăng quy mô đội ngũ đáng kể.
Ngoài các vấn đề chính đã đề cập ở trên, còn có một số chi tiết đáng chú ý.
Meta description trống hoặc trùng lặp. Trong kết quả tìm kiếm của Google, nếu bạn thấy mô tả của nhiều trang là "..." hoặc văn bản mẫu hoàn toàn giống nhau, điều đó có nghĩa là meta description chưa được thiết lập đúng cách. Mặc dù meta description không ảnh hưởng trực tiếp đến thứ hạng, nhưng nó ảnh hưởng đến tỷ lệ nhấp.
Tiêu đề trang bị cắt ngắn. Nếu tiêu đề bị cắt bằng dấu ba chấm trong kết quả tìm kiếm, điều đó có nghĩa là tiêu đề quá dài. Google thường hiển thị 50-60 ký tự, phần vượt quá sẽ bị ẩn.
Vấn đề lập chỉ mục phân trang (faceted navigation). Các chức năng lọc thường dùng trên các trang web thương mại điện tử (như sắp xếp theo màu sắc, kích thước, giá cả, v.v.) tạo ra nhiều biến thể URL. Nếu các trang này đều bị lập chỉ mục, chúng sẽ làm loãng nghiêm trọng sức mạnh của trang chính. Nên sử dụng thẻ noindex hoặc robots.txt để ngăn chặn các trang này bị thu thập.
Nếu trang web cập nhật nội dung thường xuyên, nên thực hiện kiểm toán cơ bản hàng tháng. Nếu trang web tương đối ổn định, kiểm toán hàng quý là đủ. Điều quan trọng là phải thực hiện kiểm toán trước và sau khi thực hiện các thay đổi lớn hoặc di chuyển trang web.
Ngay lập tức xóa mã độc, thay đổi tất cả mật khẩu quản trị viên, cập nhật tất cả plugin và chủ đề lên phiên bản mới nhất, sau đó gửi yêu cầu xem xét lại trong Google Search Console. Đồng thời, kiểm tra nhật ký máy chủ để xác định nguyên nhân xâm nhập và vá lỗ hổng.
Nếu các trang thẻ này có nội dung mỏng, chỉ liệt kê một vài bài viết, nên thêm thẻ noindex. Tuy nhiên, nếu trang thẻ của bạn có mô tả phong phú, nội dung độc đáo và được tối ưu hóa cho các từ khóa cụ thể, việc giữ chúng được lập chỉ mục là có giá trị.
Một số ít trang lỗi 404 là bình thường, Google cũng hiểu rằng một số nội dung có thể bị xóa. Tuy nhiên, nếu nhiều trang quan trọng trả về lỗi 404, hoặc có nhiều liên kết nội bộ trỏ đến các trang 404 này, bạn cần thiết lập chuyển hướng 301 hoặc sửa các liên kết đó.
Google Search Operators miễn phí, nhanh chóng, phù hợp để phát hiện các vấn đề rõ ràng. Công cụ chuyên nghiệp cung cấp dữ liệu toàn diện hơn, giám sát tự động và báo cáo chi tiết, phù hợp cho các nhóm cần quản lý SEO một cách hệ thống. Cả hai có thể được sử dụng kết hợp, trước tiên sử dụng Google để chẩn đoán sơ bộ, sau đó sử dụng công cụ để phân tích sâu.
大纲