GORAGOD.com

ผลการทดสอบความสามารถของ Google ในการ Index เว็บไซต์ที่เป็น Ajax หรือ Javascript

มีคำพูดในหมู่ Dev มากมายทั้งฝั่งที่เห็นว่า Google สามารถอ่านส่วนที่เป็น Javascript หรือ Ajax ของเว็บไซต์ได้  โดยคนที่เชื่อก็เชื่อตามคำบอกเล่าของ Google ซึ่งก็บอกไว้อย่างนั้นจริงๆ และก็มีบางส่วน ที่เชื่อว่า Google ไม่สามารถอ่าน Javascript ได้ ผมเลยได้ทำการออกแบบการทดสอบ โดยแบ่งการทดสอบออกเป็น 3 ไซต์ที่เงื่อนไขต่างกัน

เว็บไซต์แรก https://goragod.github.io/shopapi/ เว็บนี้เป็นเว็บแรกสุดที่ผมทำการทดสอบ โดยการสร้างไซต์บน github ที่เป็นต้นทางของโปรเจ็คนี้ (ซอร์สโค้ดของโปรเจ็คอยู่ที่นั่น) เงื่อนไขในการทดสอบที่ผมทำเหมือนๆกันในทุกไซต์คือ
  1. ใช้ข้อมูลสินค้าต้นทางเหมือนๆกัน (ข้อมูลสินค้ามาจาก API ของ http://oas.kotchasan.com/)
  2. มีการเพิ่มไซต์ไปยัง Google โดยตรง และมีการแอดหน้าแรกของเว็บไซต์ที่ทำการทดสอบไปยัง Google โดยตรง (เพียงหน้าเดียว)
ผลการทดสอบแรก Google สามารถอ่านไซต์ที่เป็น Javascript ได้ และ สามารถ Render หน้าเว็บไซต์ส่วนที่เป็น Javascript ได้ ด้วยเครื่องมือของ Google เอง (ที่หน้า "ดึงข้อมูลเหมือนเป็น Google") ผลการทดสอบนี้เป้นเครื่องยืนยันว่า Google มีเครื่องมือที่สามารถอ่าน Javascript ได้ (ข้อสังเกตุ มีการใช้ความสามารถนี้ในหลายๆส่วนของ Google นะครับ)
หลังจากการเพิ่มไซต์ไปยัง Google ภายในไม่กี่ชั่วโมง Google ก็มาทำการ Index หน้าแรกไปเรียบร้อย ซึ่งจะเห็นว่าเร็วมาก (ผลการทดสอบตามรูปเป็นผลการค้นหาปัจจุบัน ณ.วันที่เขียนบทความนะครับ) แต่ในแคชของ Google ไม่มีการระบุว่ามีการเก็บข้อมูลเนื้อหาแต่อย่างใด จากผลการทดสอบตามรูป สามารถสรุปได้ว่า
  1. การที่ Google สามารถ Render ส่วนของ Javascript ได้ ไม่ได้หมายความว่า Google ใช้ความสามารถในการ Render หน้าเว็บส่วนของ Javasctipt กับการ Index เว็บเพจ
  2. ผลการค้นหาที่เก็บในแคช มีเพียงข้อมูลส่วนที่เป็น HTML ปกติเท่านั้น ไม่มีส่วนของ Javascript ซึ่งข้อมูลนี้จะสอดคล้งกับการทดสอบในส่วนที่สองและสามต่อไป

เพื่อให้ผลการทดสอบครบถ้วน ผมได้เพิ่มเว็บสำหรับทดสอบอีกสองเว็บ

เว็บไซต์ที่สอง http://shopapi.goragod.com ข้อแตกต่างของไซต์นี้กับไซต์แรก (ที่ github) คือโดเมนที่อยู่ในไทยเท่านั้นครับ ไซต์นี้ให้ผลลัพท์การทดสอบที่แตกต่างจากไซต์แรกเพียงอย่างเดียวคือ มี Index ที่มากกว่าไซต์แรกเล็กน้อย (ปัจจุบัน เว็บไซต์นี้ไม่มีแล้วนะครับ) จากผลการทดสอบตามกราฟ จะเห็นว่า มีการใช้เวลาถึงสองเดือนกว่าที่ Google จะ Index หน้าเว็บ ซึ่งผลลัพท์ที่ได้ก็ยังดีกว่าไซต์จากต่างประเทศ

เว็บไซต์ที่สาม http://shopdemo.goragod.com เป็นไซต์สุดท้ายที่ผมใช้ทดสอบ ซึ่งมีข้อแตกต่างเพิ่มเติมอีกเล็กน้อย คือเว็บไซต์นี้จะมี sitemap ด้วย โดยที่ผมได้ทำการ submit sitemap เข้าไปยัง Google ด้วยตั้งแต่ตอนเริ่มต้น ซึ่งผลการ Index ของไซต์นี้น่าสนใจมากครับ จากกราฟจะเห็นว่า Google ทำการ Index แทบจะในทันทีถึงเกือบหกร้อยหน้า (จากข้อมูลทั้งหมดตาม sitemap พันกว่าหน้า) ซึ่งผลลัพท์ก็ทำท่าจะดีในตอนแรก แต่หลังจากนั้นประมาณสองเดือน ผลการ Index ตกลงเหลือ 9 รายการตามที่เห็นในปัจจุบัน
เหตุผลที่ Google ให้ในการลดการจัดทำดัชนี คือ Google แจ้งว่าผลการ Index ให้ข้อมูลในทุกๆหน้าเหมือนๆกัน (คือมีเฉพาะโค้ด HTML หลักเท่านั้น เหมือนที่ได้แคชไว้) Google เลยไม่ทำการ Index หน้าย่อยๆอื่นๆ

ผ่านไปปีกว่าๆ ผมกลับมาตรวจสอบ Index ของไซต์นี้อีกครั้ง พบว่ามี Index เหลืออยู่เพียงไซต์เดียว คือ http://shopdemo.goragod.com อาจเป็นเพราะไซต์นี้มีความน่าเชื่อถือสูงกว่าก็ได้ เนื่องจากอีกไซต์เป็นซับโฟลเดอร์ของ github และ ไซต์นี้ยังมี sitemap ด้วย โดยที่ Index มีเก็บไปหลายร้อยรายการ และที่สำคัญ บางคีย์ ยังสามารถขึ้นอันดับ 1 ได้ด้วย (25 มิย. 2562)  
สรุป ผลการทดสอบนี้ให้ข้อมูลเรา 2 อย่าง
  1. ปัจจุบัน (25 มิย. 2562) Google สามารถทำการ Index ไซต์ที่เป็น Javascript ได้แล้ว แต่อาจใช้เวลามากกว่าไซต์ที่เป็น static ซักหน่อย
  2. sitemap เป็นอะไรที่เยี่ยมยอดมากในการทำ seo เพราะมันช่วยให้ google มา Index เว็บเราอย่างรวดเร็ว
หมายเหตุ ผลการทดสอบนี้ไม่เกี่ยวข้องกับ GCMS นะครับ เนื่องจาก GCMS ใช้เทคนิคอื่นในการส่งข้อมูลให้ Google เพื่อให้ Google สามารถ Index หน้าเว็บได้