Search Engine ทำงานอย่างไรในเบื้องลึกเบื้องหลัง เพื่อจัดอันดับหน้าเว็บ โดยในที่นี้เราจะอ้างถึง Google ซึ่งเป็นเสิร์ชเอ็นจินที่ได้รับความนิยมสูงสุดในโลกครับ
Step 1 - Crawling
Google ทำการรวบรวมเว็บไซต์ทั้งหมดที่ Google ไป crawl มา ผ่านตัว Googlebot
ในขั้นตอนนี้ Google จะใช้ Googlebot เพื่อค้นหาและรวบรวมหน้าเว็บในอินเทอร์เน็ต โดยบอตเหล่านี้จะทำการติดตามลิงก์จากหน้าหนึ่งไปยังอีกหน้าหนึ่งของเว็บไซต์ต่าง ๆ
นั่นเป็นเหตุผลว่าทำไมเราต้องทำพวก Internal Linking ด้วย เพื่อให้บอตหาลิงก์หรือหน้าเว็บต่าง ๆ ของเราได้สะดวกมากยิ่งขึ้น
ซึ่งขั้นตอน crawling นี้เอง ในมุมมองการทำ SEO เราต้องอำนวยความสะดวกให้ Search Engine มาเก็บข้อมูลในเว็บเราได้ง่ายและดีที่สุดเท่าที่จะเป็นไปได้ เพื่อเพิ่มโอกาสในการทำอันดับ SEO ซึ่งส่วนนี้จะอธิบายเพิ่มเติมในบทเรียน Technical SEO ในบทถัด ๆ ไปครับ

การทำงานของ Search Engine (Image Credit: Semrush)
แต่ก็มีบางหน้าเว็บที่ Google ไม่สามารถ crawl ได้
ตัวอย่างเช่น
- หน้าที่ต้องมีการ Login เข้าใช้งาน หรือมีการทำ Authentication
- หน้าที่มีการกำหนดการเข้าถึงใน robots.txt
Step 2 - Indexing
Google ทำการจัดอันดับและทำหมวดหมู่ของคอนเทนต์ลงในฐานข้อมูลขนาดใหญ่ หรือ Large Database ของ Google
เมื่อ Googlebot ได้รวบรวมหน้าเว็บมาแล้ว ขั้นตอนต่อมาก็คือการสร้างดัชนี หรือ Indexing ของ Google
การทำ index คือการจัดระเบียบและจัดเก็บข้อมูลที่รวบรวมไว้ในฐานข้อมูล โดยการทำ Indexing จะพิจารณาข้อมูลหลายส่วนของหน้าเว็บ เช่น
- เนื้อหา
- คุณลักษณะต่าง ๆ เช่น คำหลัก หรือ Main Keyword
- ส่วนหัว หรือ Headings
- โครงสร้าง URL หรือ URL Structure
- ภาษา
- โลเคชัน
- ฯลฯ
โดยในส่วน Indexing นี้เอง จะช่วยให้ Google ดึงผลลัพธ์ที่เกี่ยวข้องได้อย่างรวดเร็วเมื่อผู้ใช้ทำการค้นหา ก่อนที่จะเข้าสู่ขั้นตอนสุดท้ายคือ Ranking ครับ
วิธีเช็คว่า Google ได้ index หน้าเว็บแล้วหรือยัง
เช็คได้ด้วยวิธีเบื้องต้น โดยสามารถพิมพ์ใน Google Search ด้วยคำว่า site: ตามด้วยชื่อเว็บไซต์ เช่น
site:example.com
หรือถ้าเป็นเว็บ Content Mastery ก็จะได้ลักษณะประมาณนี้

วิธีการเช็คว่า Google ได้ index หน้าเว็บของเราไปหรือยัง
จากนั้น Google จะแสดงผลลัพธ์ที่อยู่ใน index ออกมาให้ดูแบบคร่าว ๆ

ตัวอย่างผลลัพธ์จากการใช้ site operator เพื่อดูจำนวน URL ที่ Google index
จากภาพ
- หมายเลข 1: แสดงจำนวน URLs ที่ Google ได้ index หน้าเว็บเราไปแล้ว
- หมายเลข 2: หน้าเว็บที่ Google ได้ index
วิธีการนี้เป็นวิธีการในเบื้องต้นเท่านั้น ซึ่งจะมีข้อจำกัดในกรณีที่เรามีเว็บไซต์หลายหน้ามาก ๆ
ถ้าต้องการรู้แบบเฉพาะเจาะจงจริง ๆ ในแต่ละหน้า การใช้งานฟีเจอร์ URL Inspection ใน Google Search Console จะสามารถเช็คตรงนี้ได้ดีกว่า
ถ้าหน้าเว็บของเรายังไม่ได้ถูก index ล่ะ?
ถ้าลองพิมพ์ใน Google ตามวิธีการด้านบนแล้ว แต่ไม่ปรากฏหน้าเว็บของเราว่าถูก index ก็อาจเป็นไปได้หลายสาเหตุ เช่น
- เว็บของเรายังใหม่อยู่
- Site Navigation ของเว็บเรายังออกแบบได้ไม่ดีพอ ทำให้ Googlebot เข้ามาเก็บข้อมูลในเว็บเราได้ยาก
- หน้าเว็บใช้
noindextag ทำให้ Google ไม่ทำการ index หน้าเว็บ - หน้าเว็บของเราถูก Google แบน เพราะมีการทำ spam
ดังนั้น ถ้าอยากเช็คให้แม่นยำกว่าเดิม แนะนำให้ใช้ Google Search Console โดยเฉพาะฟีเจอร์ URL Inspection เพื่อตรวจสอบว่า URL นั้นถูก crawl แล้วหรือยัง ถูก index แล้วหรือไม่ และมีปัญหาอะไรที่ทำให้ Google ยังไม่สามารถ index หน้าเว็บนั้นได้
Step 3 - Ranking
หลังจาก Google ได้ทำ Indexing และเก็บคอนเทนต์เข้าเป็นหมวดหมู่ที่เป็นระเบียบเรียบร้อยแล้ว ต่อมาก็จะเป็นการจัดอันดับ หรือ Ranking
Ranking คือการเลือกหน้าเว็บที่ดีที่สุดไปแสดงผลตามคำค้นหา หรือ Search Query / Search Intent ของผู้ใช้
เมื่อผู้ใช้ค้นหาข้อมูลที่ต้องการใน Google Search อัลกอริทึมการจัดอันดับของ Google จะวิเคราะห์เพื่อกำหนดหน้าเว็บที่เกี่ยวข้องและมีประโยชน์มากที่สุดแก่ผู้ใช้ เพื่อไปแสดงผลในหน้า SERPs หรือ Search Engine Results Pages
อัลกอริทึมของ Google จะพิจารณาปัจจัยต่าง ๆ ในการจัดอันดับ หรือ Ranking Factors ซึ่งว่ากันว่ามีอยู่มากกว่า 200 ปัจจัย แต่หลัก ๆ แล้วจะเกี่ยวข้องกับ
- ความเกี่ยวข้อง หรือ Relevance
- คุณภาพของเนื้อหา หรือ Quality
- ชื่อเสียงของเว็บไซต์ หรือ Domain Authority
- ประสบการณ์ของผู้ใช้ หรือ User Experience
- แบ็คลิงก์ หรือ Backlink
- ความเป็นมิตรต่อผู้ใช้งานบนมือถือ หรือ Mobile Friendliness
และยังมีสัญญาณอื่น ๆ อีกหลายตัวประกอบกัน เพื่อให้ Google สามารถแสดงผลลัพธ์ที่ดีที่สุดแก่ผู้ใช้
สรุป
เป็นอย่างไรบ้างครับสำหรับบทเรียน “การทำงานของ Search Engine หรือ Google”
โดยภาพรวมแล้ว Search Engine มี 3 ขั้นตอนหลัก ๆ คือ
- Crawling: Googlebot เข้าไปเก็บเกี่ยวหน้าเว็บ เพื่อนำข้อมูลมาประมวลผลต่อ
- Indexing: Google จัดเก็บหน้าเว็บเป็นหมวดหมู่ในฐานข้อมูล เพื่อให้นำมาแสดงผลได้สะดวกและรวดเร็ว
- Ranking: Google จัดอันดับและนำหน้าเว็บที่ดีที่สุดมาแสดงผลแก่ผู้ใช้ โดยปัจจัยหลัก ๆ คือความเกี่ยวข้องและคุณภาพของเนื้อหา หรือ Relevance and Quality Content
หวังว่าจะทำให้ผู้อ่านมองภาพรวมการทำงานของ Search Engine ออกนะครับ เพราะถ้าเราเข้าใจส่วนนี้ ก็เสมือนเราได้รู้เบื้องลึกเบื้องหลังการทำงานของ Google Search จนนำไปสู่การทำ SEO ที่ได้ผลและมีประสิทธิภาพมากยิ่งขึ้นกว่าเดิม โดยบทเรียนถัดไปเราจะมาเรียนรู้เรื่อง Keyword Research กันต่อครับ