duplicate content là gì

Duplicate content là thuật ngữ dùng để nhắc đến vấn đề trùng lặp nội dung trên website. Và dạo gần đây Google đang dò quét thuật toán khá mạnh, phạt mạnh tay đối với các web bị lỗi duplicate conten. Vì vậy, nếu website của bạn đang bị lỗi này, thì hãy tìm cách khắc phục ngay nhé

1. Duplicate content là gì ?

Duplicate content trong seo là thuật ngữ dùng để chỉ đến lỗi nội dung trùm lặp trên website. Và lỗi này được xác định theo 2 trường hợp:

1.1 Trường hợp 1: Trùng lặp nội dung với website khác

Nghĩa là các bạn tạo ra nội dung, và nội dung này trùng với mội nội dung khác trên website khác. Hay nói rõ hơn là người làm content web đang copy nội dung web khác đưa vào website

Khi copy nội dung, nếu như nội dung đó đã được Google index. Thì tất nhiên bản quyền thuộc về website đó, bạn sẽ là người sao chép. Mà khi đã sao chép thì nội dung bị trùng, hệ quả là url chứa nội dung này sẽ thường không có thứ hạng cao, hoặc thậm chí là url không được index

Ví dụ: Thay vì tự viết bài theo ý, câu từ của mình, bạn copy nguyên đoạn nội dung từ website khác bỏ vào web mình

1.2 Trường hợp 2: Trùng lặp chủ đề nội dung các bài viết

Trường hợp này xảy ra khi các bạn viết bài liên tục trên website mà không phân tích từ khóa, phân chia nhóm key

Dẫn đến hệ quả là cùng một nhóm key có nghĩa tương đồng, các bạn tạo ra vô số bài viết. Hệ quả của trường hợp duplicate content seo này đó chính là các nội dung “ĐẤU ĐÁ LẪN NHAU”

Và khi mà những nội dung bạn tạo ra nhiều, không hoàn thuận, chất lượng nội dung không đảm bảo thì những bài viết này thường sẽ không có thứ hạng cao. Nhóm key bị phân chia và hiển thị trên Google với nhiều bài viết khác nhau

Tất nhiên, Google không đánh giá cao lỗi content cùng chủ đề trên web như thế này. Điển hình là trong đợt update thuật toán cần đây, những website chứa nội dung trùng lặp dạng này đang ở trạng thái rớt tóp, tụt traffic thê thảm

Ví dụ: Bạn viết 2 bài:

– 1 bài tối ưu cho key “duplicate content là gì”

– 1 bài tối ưu cho key “duplicate là gì”

Và thực ra 2 keywords này trong seo cùng 1 nghĩa, người dùng hướng đến 1 kết quả. Có thể bạn biết điều này, nhưng khi bạn viết bài thứ 2, bạn không để ý rằng mình đã viết 1 bài về chủ đề này. Trường hợp này sẽ dẫn đến duplicate conten ngay bên trong website

Chốt lại:

– Duplicate là lỗi trùng lặp nội dung trên website

– Duplicate content seo chia làm 2 loại: Trùng lặp bên ngoài và trùng lặp bên trong

2. Google phạt lỗi trùng lặp nội dung như thế nào ?

Như mình đã nhắc đến ở phần trên, duplicate content chia làm 2 trường hợp, và tất nhiên, án phạt cho mỗi trường hợp sẽ khác nhau

2.1 Phạt lỗi duplicate bên ngoài

Nghĩa là website bạn copy nội dung website khác:

– Url chứa nội dung trùng lặp này sẽ không có thứ hạng cao, hoặc không được index

– Website bạn sao chép quá nhiều nội dung website khác, Google sẽ đánh giá tổng thể website bạn là không mang lại giá trị. Khi đó cơ hội làm seo, seo từ khóa mục tiêu sẽ trở nên cực kỳ khó khăn

2.2 Phạt lỗi duplicate bên trong

Trước đợt update thuật toán 08/2018, Google không có phạt lội nội dung trùng lặp bên trong website. Tuy nhiên, vào đợt update 08/2018, Google đánh cực kỳ mạnh vào lỗi duplicate này

Điển hình là cùng một chủ đề nội dung, bạn tạo ra nhiều url với nhiều phiên bản nội dung nói về vấn đề này, cùng tối ưu cho những key giống nhau

Thì chung tất cả những bài viết này sẽ đấu đá nội dung lẫn nhau để xem bài nào tốt hơn để hiển thị trên Google. Mà khi đã đấu đá content thì Google sẽ không đánh giá cao web bạn, thay vào đó Google sẽ ưu tiên kêt quả từ những website sạch sẽ, không bị trùng lặp content

Án phạt cụ thể:

– Từ khóa seo vẫn hiển thị trên Google, nhưng cơ hội có thứ hạng cao là thấp

– Nhiều bài viết về 1 key thì nếu có, chỉ có 1 bài hiển thị trên Google, những bài khác thì không, trừ khi trust website bạn quá cao

– Khó phát triển website, khó seo

– Website sẽ bị đì sự phát triển nếu lỗi này xuất hiện quá nhiều

3. Hướng dẫn check duplicate content

3.1 Check bên ngoài

+ Bước 1: Truy cập https://smallseotools.com/plagiarism-checker/

+ Bước 2: Copy đoạn nội dung bạn muốn check, dán vào ô

Ghi chú: Mỗi lần chỉ check được 1000 từ

+ Bước 3: Chọn Check Plagiarism và Đợi

duplicate content checker

+ Bước 4: Kiểm tra

Dòng nào báo xanh là nội dung không bị trùng, dòng nào báo đỏ thì là nội dung bị trùng với website khác

duplicate là gì

Ghi chú:

– Thực ra đôi khi bạn viết, mà không có copy bên nào, nhưng câu từ bị trùng với website khác, hay nội dung khác trên website thì vẫn bị tính là trùng

– Tỷ lệ trùng lặp yêu cầu không được quá 20% (báo đỏ)

duplicate content seo

Khi đó, nếu bạn duplicate content checker online mà thấy rằng lỗi trùng lặp trên 20% thì hãy vào ngay những đoạn nội dung bị báo lỗi đỏ để điều chỉnh lại một chút về câu từ sử dụng ở đó nhé

3.2 Check bên trong

Phần này yêu cầu bạn cần phải biết về cách phân tích từ khóa, nhóm các từ khóa thuộc vào cùng một nhu cầu tìm kiếm của người dùng lại với nhau

+ Bước 1: Phân tích & nhóm các bộ key

+ Bước 2: Chọn ra key chính mỗi bộ

+ Bước 3: Truy cập trang tìm kiếm Google

+ Bước 4: Search cú pháp: site:domain.com + từ khóa

+ Bước 5: Kiểm tra xem cùng 1 chủ đề như vậy thì có bao nhiêu kết quả giống nhau về nội dung

seo duplicate content

+ Bước 6: Gộp các nội dung hữu ích từ các bài về 1 bài mạnh nhất

+ Bước 7: Đưa ra phương án xử lý các nội dung bị trùng

Có thể là: Gắn thẻ canonical, redicrect 301 hoặc xóa hẳn những nội dung bị trùng, giữ lại 1 bài nội dung mạnh nhất của nhóm key này

Như vậy là xong nhé . . .

Kết luận

Thực ra phần check và xử lý lỗi duplicate content bên trong mình hướng dẫn như vậy, nhưng nhiều bạn chưa rành có thể chưa hiểu những gì mình nói. Vậy nên nếu quan tâm các bạn có thể đăng ký khóa học seo tphcm bên mình nếu quan tâm nhé

Cảm ơn các bạn