ปัญหา Duplicate Content (เนื้อหาซ้ำ) เป็นอีกหนึ่งเรื่องใหญ่ที่คนทำ SEO หรือเจ้าของเว็บไซต์จะละเลยไปไม่ได้ครับ
หลายคนอาจจะยังไม่รู้ตัวว่า บทความที่เราเขียนเองกับมือแท้ ๆ กำลังกลายเป็น "เนื้อหาซ้ำ" ในสายตา Google อยู่ ซึ่งผลเสียคือหน้าเว็บของเราจะแย่งกันทำอันดับเอง (Keyword Cannibalization) จนสุดท้ายไม่มีหน้าไหนติดอันดับสักหน้า
แต่ไม่ต้องห่วงครับ พระเอกของเราวันนี้... Canonical Tag สามารถช่วยแก้ปัญหานี้ได้ครับ
1. Canonical Tag คืออะไร?
ก่อนอื่นต้องนิยามให้ชัดเจนก่อนครับ ระหว่าง "URL" กับ "Tag"
- Canonical URL: คือ URL หลัก หรือ URL ต้นฉบับ ที่เราต้องการให้ Google จดจำและแสดงผลในหน้าแรก
- Canonical Tag: คือ HTML Tag ที่ใช้บอก Google ว่า "URL ไหนคือตัวจริง"
โครงสร้างของ Code
เพื่อให้เห็นภาพชัดเจน เรามาแยกชิ้นส่วนของโค้ดกันครับ:
<link rel="canonical" href="https://webmastery.dev/seo-guide" />
| ส่วนประกอบ | คำอธิบาย |
|---|---|
<link ... /> |
เป็น HTML Element มาตรฐานสำหรับเชื่อมโยงเอกสาร |
rel="canonical" |
หัวใจสำคัญ: บอก Search Engine ว่าลิงก์นี้คือ "ต้นฉบับ" (Master Copy) |
href="..." |
เป้าหมาย: ระบุ URL ที่เป็น Absolute URL (ควรมี https:// เต็มรูปแบบ) |

ตัวอย่างการใช้งาน Canonical Tag บนหน้า homepage ของเว็บไซต์ Web Mastery เพื่อระบุ URL หลักให้ Search Engine เข้าใจ และป้องกันปัญหาเนื้อหาซ้ำ (Duplicate Content)
2. ทำไมถึงเกิด Duplicate Content? (1 เนื้อหา = หลาย URLs)
เพื่อน ๆ อาจสงสัยว่า "ฉันเขียนบทความแค่ครั้งเดียว มันจะซ้ำได้ไง?"
ความจริงคือ... ในมุมมองของ Server และ Google การเปลี่ยนแปลงตัวอักษรนิดเดียวใน URL ก็ถือว่าเป็นคนละหน้าแล้วครับ
ตัวอย่าง: สมมติเพื่อน ๆ เขียนบทความ "10 คาเฟ่ที่ดีที่สุดในกรุงเทพฯ"
ในสายตาเรา มันคือหน้าเดียว แต่ในระบบหลังบ้าน มันอาจเข้าถึงได้ผ่าน URL เหล่านี้ทั้งหมด:
1. https://www.example.com/blog/top-10-cafes (มี www)
2. https://example.com/blog/top-10-cafes (ไม่มี www)
3. http://www.example.com/blog/top-10-cafes (ไม่มี s - ไม่ปลอดภัย)
4. https://example.com/blog/top-10-cafes/ (มี Trailing Slash / ปิดท้าย)
5. https://example.com/blog/top-10-cafes/index.html
6. https://example.com/blog/top-10-cafes?utm_source=facebook (มี Parameter)
ผลลัพธ์: Google เห็นเป็น 6 หน้าที่เนื้อหาเหมือนกันเป๊ะ! ทำให้เกิดความสับสนในการทำ Indexing และคะแนน SEO ก็ถูกหารเฉลี่ยจนพลังไม่พอที่จะดันหน้าไหนให้ติดอันดับเลย
3. วิธีแก้ปัญหา: เลือกเครื่องมือให้ถูกงาน
เรามีอาวุธ 3 อย่างในการจัดการเนื้อหาซ้ำครับ คือ Canonical Tag, 301 Redirect, และ Noindex แต่ละตัวใช้งานต่างกัน ดังตารางนี้ครับ
ตารางเปรียบเทียบ: Canonical vs 301 vs Noindex
| วิธีการ (Method) | การทำงาน (Action) | ผลลัพธ์ต่อ User | ผลลัพธ์ต่อ Google (SEO) | ใช้เมื่อไหร่? (Use Case) |
|---|---|---|---|---|
| Canonical Tag | "หน้านี้มีอยู่จริง แต่ให้คะแนนหน้าต้นฉบับนะ" | เข้าได้ปกติ เห็นเนื้อหาปกติ | Index หน้าต้นฉบับ + รวมพลังลิงก์ไปหน้าต้นฉบับ | หน้าสินค้าที่มีหลายสี, หน้าที่มี URL Parameters, บทความที่ลงหลายเว็บ |
| 301 Redirect | "ย้ายบ้านถาวร ไปที่ใหม่เลย" | เด้งไปหน้าใหม่ทันที (ไม่เห็นหน้าเก่า) | Index หน้าใหม่ + ส่งพลังลิงก์ทั้งหมดไปหน้าใหม่ | เปลี่ยน http > https, แก้ www vs non-www, ย้ายโดเมน |
| Noindex | "ห้ามเก็บหน้านี้เข้าสารบัญ" | เข้าได้ปกติ เห็นเนื้อหาปกติ | ไม่ Index (ไม่โชว์ใน Google) | หน้า Admin, หน้าตะกร้าสินค้า, หน้าขอบคุณ (Thank you page) |
4. วิธีติดตั้ง Canonical Tag (Implementation)
การติดตั้งทำได้โดยเพิ่มโค้ดเข้าไปในส่วน <head> ของเว็บไซต์ครับ
A. Self-Referencing Canonical (ชี้หาตัวเอง)
เทคนิคที่แนะนำคือ "ทุกหน้าควรมี Canonical ชี้เข้าหาตัวเอง" (ถ้ามันคือต้นฉบับ) เพื่อป้องกันอุบัติเหตุจากการโดนก๊อปปี้ หรือ URL Parameters ที่เราไม่รู้ตัว
<head>
<title>Top 10 Cafes in Bangkok | Content Mastery</title>
<link rel="canonical" href="https://www.example.com/blog/top-10-cafes">
</head>
B. การเลือกใช้ www หรือ non-www?
ไม่มีกฎตายตัวครับ ขอแค่ "เลือกอย่างใดอย่างหนึ่ง" แล้วใช้ให้เหมือนกันทั้งเว็บ (Consistency) อย่างเครื่องมือทำ SEO ระดับโลก 2 เจ้านี้ก็ใช้ต่างกันครับ (ซึ่งก็ไม่มีถูกมีผิดเนอะ)
- Ahrefs: ใช้แบบ
non-www(https://ahrefs.com) - Semrush: ใช้แบบ
www(https://www.semrush.com)
ข้อควรระวัง: อย่าใช้สลับไปมา เดี๋ยว Google งงครับ เลือกแล้วยึดตามนั้นตลอดชีพเว็บเลย
5. วิธีตรวจสอบปัญหาใน Google Search Console 🔍
เพื่อน ๆ สามารถเช็กได้ง่าย ๆ ว่าเว็บเรามีปัญหานี้ไหม โดยเข้าไปที่ GSC เมนู Pages แล้วมองหา Status เหล่านี้ครับ
| Status Message | ความหมาย | วิธีแก้ไข |
|---|---|---|
| Duplicate without user-selected canonical | Google เจอหน้าซ้ำ แต่เราไม่ได้ระบุ Canonical ไว้ (Google เลยสุ่มเลือกให้เอง ซึ่งอาจผิด) | รีบใส่ Canonical Tag ระบุหน้าต้นฉบับทันที |
| Duplicate, Google chose different canonical than user | Google เจอหน้าซ้ำ เราเลือกแล้ว แต่ Google ไม่เชื่อ! (มักเกิดจากหน้าต้นฉบับคุณภาพแย่กว่า) | ปรับปรุงหน้าต้นฉบับให้เนื้อหาดีกว่าหน้าซ้ำ หรือเช็กว่าเราชี้ Canonical ผิดไหม |
6. ข้อดีของการทำ Canonicalization
- รักษาค่าพลังลิงก์ (Link Equity): คะแนน Backlink ทั้งหมดจะไม่กระจัดกระจาย แต่จะถูกส่งตรงไปที่หน้าหลักหน้าเดียว (Consolidate Signals)
- Crawl Budget มีประสิทธิภาพ: Google ไม่ต้องเสียเวลา Crawl หน้าซ้ำ ๆ ทำให้มาเก็บหน้าใหม่ของเราได้ไวขึ้น
- รายงาน GSC สะอาดตา: Google Search Console จะไม่แจ้งเตือนแดงเถือกให้รกหูรกตาอีกต่อไปครับ (อันนี้สบายใจสุด ๆ lol)
สรุป Checklist สำหรับ Ep 7
- [ ] Standardize URL: ตัดสินใจว่าจะใช้
httpsและwww(หรือnon-www) เป็นมาตรฐาน - [ ] Check Source Code: สุ่มเปิดหน้าเว็บ กด
Ctrl+Uแล้วค้นหาrel="canonical"ดูว่ามีไหม? และลิงก์ถูกต้องไหม? - [ ] CMS Settings: ถ้าใช้ WordPress ตรวจสอบการตั้งค่าใน Yoast SEO / Rank Math ว่าเปิดใช้งานแล้ว
- [ ] Cross-Domain: ถ้าเอาบทความไปลงเว็บอื่น (เช่น Medium, LinkedIn) อย่าลืมตั้ง Canonical กลับมาที่เว็บเรา
การแก้ปัญหา Duplicate Content อาจดูเป็นเรื่องเทคนิคจ๋า ๆ แต่ถ้าทำได้ เว็บไซต์ของเพื่อน ๆ จะมีรากฐานที่แข็งแรง และพร้อมทะยานขึ้นหน้าแรกได้ง่ายขึ้นเยอะครับ
ในบทต่อไป เราจะขยับไปเรื่องที่ Google ให้ความสำคัญสุด ๆ ในปี 2026 (และเป็นปัจจัยการจัดอันดับโดยตรง) นั่นคือเรื่องของ "ความเร็วและประสบการณ์ใช้งาน" ใน Ep 8: Core Web Vitals & Page Experience ครับ
อ้างอิงเพิ่มเติม:
- Google Search Central: Consolidate duplicate URLs
- Content Mastery: Canonical Tag Guide