19/12/13

Chương 9 - Những lầm tưởng và quan niệm sai lầm về SEO (Phần 2)

Spam Máy tìm kiếm

Nhắc đến tìm kiếm, nhiều người sẽ nghĩ ngay đến "spam". Thật vậy, ngay từ giữa những năm 1990, thời kỳ đầu của tối ưu hóa SE, các webmaster đã bắt đầu nhận thức được giá trị của việc trang web của họ được xếp hạng cao trong kết quả công cụ tìm kiếm, việc thao tác spam trên các cỗ máy tìm kiếm tạo ra các trang web và các chương trình được thiết kế để tăng tối đa thứ hạng hay việc lạm dụng các thuật toán xếp hạng sử dụng để phân loại nội dung phát triển ngày một tăng.
spam máy tìm kiếm
Với số tiền thanh toán khá lớn (có một thời điểm, một đồng nghiệp đã nói với chúng tôi rằng một vị trí trên bảng xếp hạng kết quả tìm kiếm của Google cho chỉ một ngày duy nhất đối với truy vấn "buy Viagra" có thể mang lại hơn 20,000$ trong doanh thu doanh hồng). Thao tác trên máy tìm kiếm là một hoạt động khá phổ biến tuy vậy, nó đang ngày một trở nên khó khăn hơn, và không còn giá trị nào đối với xếp hạng.
Bởi 2 lý do:

Kết quả đạt được không giá trị

Người sử dụng không ưa gì spam và SE đã tiêu tốn rất nhiều tiền bạc cho cuộc chiến chống spam. Nhiều người tin rằng lợi thế lớn nhất của Google trong hơn 10 năm qua so với các đối thủ cạnh tranh chính là khả năng kiểm soát và loại bỏ hàng loạt các web spam. Có được thành công "tức thời" nhờ vào spam, các webmaster phải vất vả hơn rất nhiều so với việc thành công "lâu dài" dựa vào xuất bản những nội dung chất lượng, mặt khác số tiền chi trả cho quá trình đó trong dài hạn gần như không có.
Tại sao chúng ta không đầu tư cho một chiến lược thành công lâu dài thay vì nỗ lực hết sức phát triển những chiến thuật black hat seo bị cấm?

Máy tìm kiếm thông minh hơn

Sự xuất hiện hệ phương pháp thông minh, mở rộng đối với công cuộc chống lại các thao tác spam, cùng với ảnh hưởng bất lợi của các thuật toán xếp hạng khiến cho quá trình spam trở nên khó khăn hơn rất nhiều. Các khái niệm phức tạp như TrustRank, HITS, các phân tích thống kê, dữ liệu mang tính lịch sử…tất cả đều hạ thấp giá trị của spam SE và các kỹ thuật minh bạch hơn hay chiến thuật mang tên "white hat (mũ trắng)"(những người không vi phạm các quy định của SE) có xu hướng tạo ra kết quả trong thời gian dài, mang lại hiệu quả tiếp thị cao nhất.
Bản cập nhập thuật toán Panda của Google gần đây nhất đã giới thiệu thuật toán máy học tinh vi nhằm chống lại spam và những trang có giá trị thấp một cách mạnh mẽ chưa từng thấy trong lịch sử tìm kiếm trực tuyến. SE ngày càng khắt khe và thông minh hơn bởi nó mang nhiệm vụ lớn đó là cung cấp tới người dùng những kết quả tìm kiếm tốt nhất, chất lượng nhất.
Hướng dẫn này không nhằm mục đích giới các chiến thuật spam cụ thể, nhưng, do số lượng các trang web bị penalty, ban hay bị đánh dấu khá lớn, đề nghị giúp đỡ, chúng tôi sẽ chỉ ra các yếu tố khác nhau mà các công cụ sử dụng để xác định spam nhằm giúp học viên SEO tránh được nhiều vấn đề rủi ro. Để biết thêm chi tiết về spam từ máy tìm kiếm, xem thêm bài viết Google's Webmaster Guidelines and Bing's Webmaster FAQs (pdf).
Điều quan trọng cần phải nhớ đó là: Trong hầu hết mọi trường hợp, các kỹ thuật thao tác Spam không những không mang lại hiệu quả cho bạn, mà nó còn là nguyên nhân khiến cho trang web của bạn rơi vào hố sâu Penalty của ông lớn Google.

Phân tích mức độ spam trang web:

phân tích mức độ spam trang webCác SE thực hiện các phân tích spam thông qua các trang cá nhân và toàn bộ trang web (kể cả tên miền). Trước tiên, chúng tôi sẽ chỉ ra cách chúng đánh giá các thực hành thao tác trên mức độ URL như thế nào.

Nhồi nhét từ khóa:

Một trong những kỹ thuật spam rủi ro và rõ ràng nhất đó chính là nhồi nhét từ khóa, liên quan đến việc xả rác lặp đi lặp lại các cụm từ hay thuật ngữ từ khóa từ một trang để tăng tần số xuất hiện trên trang kết quả tìm kiếm. Do vậy, xuất hiện suy nghĩ sai lầm trong nhiều người rằng cứ nhồi nhét nhiều thuật ngữ tìm kiếm sẽ đẩy nhanh quá trình xếp hạng cho trang web đằng sau đó là tăng số lần chỉ ra một thuật ngữ được coi như là bước đẩy cho thứ hạng một trang web. Nhiều tài liệu chỉ ra rằng sự lặp đi lặp lại từ khóa trong một trang đóng vai trò cực kỳ hạn chế trong việc thúc đẩy thứ hạng và ít liên quan với các vị trí tìm kiếm hàng đầu khi xem xét hàng ngàn kết quả tìm kiếm top đầu cho các truy vấn khác nhau.
Ban đầu, các công cụ tìm kiếm được lập trình xếp hạng cho trang web dựa trên tính thường xuyên một từ khóa xuất hiện. Hầu hết các công cụ tìm kiếm hiện đại có khả năng phân tích một trang với các từ khóa bị nhồi nhét, và các thuật toán được cập nhập thực hiện quá trình đó. Bạn có thể tham khảo thêm tại Blog của chuyên gia đứng đầu nhóm Spam Web – Google qua bài viết SEO tip: Avoid Keyword Stuffing.

Manapulative Link

Một trong những hình thức spam web phổ biến nhất đó chính là mua lại liên kết hấp dẫn - dựa vào mức độ SE sử dụng, đánh giá tính phổ biến liên kết trong các thuật toán xếp hạng của chúng nhằm cố gắng thổi phồng các số liệu giả tạo và cải thiện khả năng hiển thị. Đây là một trong những hình thức khó khăn nhất của việc spam đối với các SE để vượt qua được bởi nó có thể xuất hiện trong rất nhiều hình thức. Một vài trong số nhiều cách các liên kết hấp dẫn xuất hiện có thể bao gồm:
  • Trao đổi liên kết đối ứng (Reciprocal link exchange) - một chương trình khá phổ biến ngày nay, nói một cách dễ hiểu đó là bạn tạo liên kết tới tôi và tôi sẽ trỏ lại liên kết của bạn. Mục đích của chương trình này đó là tăng tính phổ biến cho liên kết để được các SE đánh giá cao. Vậy nên cứ trao đổi tràn lan, quá mức- SE sẽ chẳng phát hiện ra đâu. Ồ, không, đừng nghĩ rằng có thể qua mắt được SE bởi chúng quá tinh khôn trong việc phát hiện và làm giảm giá trị của hàng loạt thể loại liên kết này.
  • Link schemes, thuật ngữ bao gồm "link farm (trang trại liên kết)" và "link juice (mạng lưới liên kết)" ở các trang web có giá trị giả tạo hoặc thấp hơn được xây dựng hay duy trì một cách hoàn toàn như những nguồn liên kết nhân tạo để thổi phồng tính phổ biến. Máy tìm kiếm chống lại những liên kết này thông qua vô số phương thức phát hiện các kết nối giữa các trình đăng ký trang web, chồng chéo liên kết hay các yếu tố phổ biến khác.
  • Paid links: Để được xếp hạng cao trong các kết quả tìm kiếm, rất nhiều người mua các link có xếp hạng PR ở vị trí cao. Hình thức này ngày một phổ biến trong cộng đồng SEO. Mặc dù, Google cực kỳ lên án việc mua bán liên kết nhằm thao túng PR, và máy tìm kiếm làm việc chăm chỉ nhằm ngăn chặn chúng, nhưng hình thức này vẫn tồn tại cung cấp giá trị tức thời cho nhiều người bán và người mua.
  • Các liên kết thư mục chất lượng thấp: Xuất hiện thường xuyên trong thị trường SEO. Một con số không nhỏ các thư mục trang web trả tiền cho vị trí tồn tại để phục vụ thị trường SEO và mặc nhiên công nhận tính hợp pháp và các mức độ thành công khác nhau. Google thuờng xuyên đưa ra những hình phạt cho các trang web này như loại bỏ điểm PR từ thanh công cụ (hay làm giảm điểm PR một cách đột ngột), nhưng đâu phải trong trường hợp nào Google cũng có thể áp dụng cách này.
SE khá sành sỏi với các loại chiến thuật xây dựng liên kết hấp dẫn của các SEOer. Theo đó, thuật toán được cập nhập mỗi ngày nhằm ngăn chặn các chiến thuật bất hợp pháp, hay ít nhiều làm giảm tác động xấu của chúng đến bộ máy. Các hình thức Spam mỗi ngày một nhiều hơn, nhưng máy tìm kiếm luôn chiến đấu với chúng dựa vào các thuật toán nhắm mục tiêu, qua những đánh giả của con người và trình thu thập báo cáo spam từ các Webmaster và SEOer.

Cloaking (Thủ thuật che giấu nội dung)

Cloaking là một kỹ thuật SEO được thao tác bởi các Webmaster nhằm giúp cho nội dung văn bản trong mã HTML dưới mắt của "nhện" khác với nội dung mà khác truy cập thông thường nhìn thấy. Hiểu một cách đơn giản, đó là hành vi che giấu bot của SE các nội dung mà người dùng nhìn thấy và đề xuất những nội dung nhìn thấy được tối ưu tốt.
Một khi bị phát hiện, các SE sẽ coi đó là hành vì "che đậy" và đương nhiên, trang web của bạn sẽ bị phạt Penalty rất nặng. Cloaking có thể được thực hiện trong nhiều cách với vô số lý do cả tiêu cực lẫn tích cực. Nhiều Webmaster coi Cloaking là hành vi vi phạm đạo đức, không nên dùng. Nhưng số khác vẫn áp dụng nó cho các mục đích khác tích cực hơn không nhằm lừa bot và SERP. Trong một số trường hợp, máy tìm kiếm có thể cho phép sử dụng kỹ thuật này nếu chúng hoạt động vì lý do trải nghiệm tích cực của người dùng. Đối với chủ đề Cloaking và mức độ rủi ro liên quan cùng với nhiều chiến thuật và mục đích đa dạng, tham khảo bài viết White hat cloaking của tác giả Rand Fishkind.

Low Value Pages (Các trang giá trị thấp):

Mặc dù về mặt kỹ thuật, chúng ta không thể coi các trang web này giống như "web spam", máy tìm kiếm rất thông minh trong việc phân biệt các trang web có nội dung chất lượng, biên tập tốt, không trùng lặp cho người tìm kiếm trước khi lưu trữ trong lập chỉ mục của chúng cũng như trong SERPs. Thể loại nội dung được lọc phổ biến nhất trong một trang web đó là nội dung liên kết "nghèo nàn", nội dung trùng lặp hay nội dung được tạo ra chung chung, ít có giá trị. Máy tìm kiếm phản đối việc lưu trữ những trang web này, bằng cách sử dụng đa dạng các thuật toán phân tích liên kết, nội dung để lọc ra những trang có giá trị thấp xuất hiện trong SERP.
Phiên bản Panda update năm 2011 của Google đem đến những bước đáng kinh ngạc chưa từng thấy trong việc làm giảm nội dung chất lượng thấp trên trang web, và Google vẫn đang từng bước cập nhập mỗi ngày.

0 nhận xét:

Đăng nhận xét