ผลการทดสอบความสามารถของ Google ในการ Index เว็บไซต์ที่เป็น Ajax หรือ Javascript
มีคำพูดในหมู่ Dev มากมายทั้งฝั่งที่เห็นว่า Google สามารถอ่านส่วนที่เป็น Javascript หรือ Ajax ของเว็บไซต์ได้ โดยคนที่เชื่อก็เชื่อตามคำบอกเล่าของ Google ซึ่งก็บอกไว้อย่างนั้นจริงๆ และก็มีบางส่วน ที่เชื่อว่า Google ไม่สามารถอ่าน Javascript ได้ ผมเลยได้ทำการออกแบบการทดสอบ โดยแบ่งการทดสอบออกเป็น 3 ไซต์ที่เงื่อนไขต่างกัน
เว็บไซต์แรก https://goragod.github.io/shopapi/ เว็บนี้เป็นเว็บแรกสุดที่ผมทำการทดสอบ โดยการสร้างไซต์บน github ที่เป็นต้นทางของโปรเจ็คนี้ (ซอร์สโค้ดของโปรเจ็คอยู่ที่นั่น) เงื่อนไขในการทดสอบที่ผมทำเหมือนๆกันในทุกไซต์คือ
หลังจากการเพิ่มไซต์ไปยัง Google ภายในไม่กี่ชั่วโมง Google ก็มาทำการ Index หน้าแรกไปเรียบร้อย ซึ่งจะเห็นว่าเร็วมาก (ผลการทดสอบตามรูปเป็นผลการค้นหาปัจจุบัน ณ.วันที่เขียนบทความนะครับ) แต่ในแคชของ Google ไม่มีการระบุว่ามีการเก็บข้อมูลเนื้อหาแต่อย่างใด จากผลการทดสอบตามรูป สามารถสรุปได้ว่า
เพื่อให้ผลการทดสอบครบถ้วน ผมได้เพิ่มเว็บสำหรับทดสอบอีกสองเว็บ
เว็บไซต์ที่สอง http://shopapi.goragod.com ข้อแตกต่างของไซต์นี้กับไซต์แรก (ที่ github) คือโดเมนที่อยู่ในไทยเท่านั้นครับ ไซต์นี้ให้ผลลัพท์การทดสอบที่แตกต่างจากไซต์แรกเพียงอย่างเดียวคือ มี Index ที่มากกว่าไซต์แรกเล็กน้อย (ปัจจุบัน เว็บไซต์นี้ไม่มีแล้วนะครับ) จากผลการทดสอบตามกราฟ จะเห็นว่า มีการใช้เวลาถึงสองเดือนกว่าที่ Google จะ Index หน้าเว็บ ซึ่งผลลัพท์ที่ได้ก็ยังดีกว่าไซต์จากต่างประเทศ
เว็บไซต์ที่สาม http://shopdemo.goragod.com เป็นไซต์สุดท้ายที่ผมใช้ทดสอบ ซึ่งมีข้อแตกต่างเพิ่มเติมอีกเล็กน้อย คือเว็บไซต์นี้จะมี sitemap ด้วย โดยที่ผมได้ทำการ submit sitemap เข้าไปยัง Google ด้วยตั้งแต่ตอนเริ่มต้น ซึ่งผลการ Index ของไซต์นี้น่าสนใจมากครับ จากกราฟจะเห็นว่า Google ทำการ Index แทบจะในทันทีถึงเกือบหกร้อยหน้า (จากข้อมูลทั้งหมดตาม sitemap พันกว่าหน้า) ซึ่งผลลัพท์ก็ทำท่าจะดีในตอนแรก แต่หลังจากนั้นประมาณสองเดือน ผลการ Index ตกลงเหลือ 9 รายการตามที่เห็นในปัจจุบัน
เหตุผลที่ Google ให้ในการลดการจัดทำดัชนี คือ Google แจ้งว่าผลการ Index ให้ข้อมูลในทุกๆหน้าเหมือนๆกัน (คือมีเฉพาะโค้ด HTML หลักเท่านั้น เหมือนที่ได้แคชไว้) Google เลยไม่ทำการ Index หน้าย่อยๆอื่นๆ
ผ่านไปปีกว่าๆ ผมกลับมาตรวจสอบ Index ของไซต์นี้อีกครั้ง พบว่ามี Index เหลืออยู่เพียงไซต์เดียว คือ http://shopdemo.goragod.com อาจเป็นเพราะไซต์นี้มีความน่าเชื่อถือสูงกว่าก็ได้ เนื่องจากอีกไซต์เป็นซับโฟลเดอร์ของ github และ ไซต์นี้ยังมี sitemap ด้วย โดยที่ Index มีเก็บไปหลายร้อยรายการ และที่สำคัญ บางคีย์ ยังสามารถขึ้นอันดับ 1 ได้ด้วย (25 มิย. 2562)
สรุป ผลการทดสอบนี้ให้ข้อมูลเรา 2 อย่าง
เว็บไซต์แรก https://goragod.github.io/shopapi/ เว็บนี้เป็นเว็บแรกสุดที่ผมทำการทดสอบ โดยการสร้างไซต์บน github ที่เป็นต้นทางของโปรเจ็คนี้ (ซอร์สโค้ดของโปรเจ็คอยู่ที่นั่น) เงื่อนไขในการทดสอบที่ผมทำเหมือนๆกันในทุกไซต์คือ
- ใช้ข้อมูลสินค้าต้นทางเหมือนๆกัน (ข้อมูลสินค้ามาจาก API ของ http://oas.kotchasan.com/)
- มีการเพิ่มไซต์ไปยัง Google โดยตรง และมีการแอดหน้าแรกของเว็บไซต์ที่ทำการทดสอบไปยัง Google โดยตรง (เพียงหน้าเดียว)
หลังจากการเพิ่มไซต์ไปยัง Google ภายในไม่กี่ชั่วโมง Google ก็มาทำการ Index หน้าแรกไปเรียบร้อย ซึ่งจะเห็นว่าเร็วมาก (ผลการทดสอบตามรูปเป็นผลการค้นหาปัจจุบัน ณ.วันที่เขียนบทความนะครับ) แต่ในแคชของ Google ไม่มีการระบุว่ามีการเก็บข้อมูลเนื้อหาแต่อย่างใด จากผลการทดสอบตามรูป สามารถสรุปได้ว่า
- การที่ Google สามารถ Render ส่วนของ Javascript ได้ ไม่ได้หมายความว่า Google ใช้ความสามารถในการ Render หน้าเว็บส่วนของ Javasctipt กับการ Index เว็บเพจ
- ผลการค้นหาที่เก็บในแคช มีเพียงข้อมูลส่วนที่เป็น HTML ปกติเท่านั้น ไม่มีส่วนของ Javascript ซึ่งข้อมูลนี้จะสอดคล้งกับการทดสอบในส่วนที่สองและสามต่อไป
เพื่อให้ผลการทดสอบครบถ้วน ผมได้เพิ่มเว็บสำหรับทดสอบอีกสองเว็บ
เว็บไซต์ที่สอง http://shopapi.goragod.com ข้อแตกต่างของไซต์นี้กับไซต์แรก (ที่ github) คือโดเมนที่อยู่ในไทยเท่านั้นครับ ไซต์นี้ให้ผลลัพท์การทดสอบที่แตกต่างจากไซต์แรกเพียงอย่างเดียวคือ มี Index ที่มากกว่าไซต์แรกเล็กน้อย (ปัจจุบัน เว็บไซต์นี้ไม่มีแล้วนะครับ) จากผลการทดสอบตามกราฟ จะเห็นว่า มีการใช้เวลาถึงสองเดือนกว่าที่ Google จะ Index หน้าเว็บ ซึ่งผลลัพท์ที่ได้ก็ยังดีกว่าไซต์จากต่างประเทศ
เว็บไซต์ที่สาม http://shopdemo.goragod.com เป็นไซต์สุดท้ายที่ผมใช้ทดสอบ ซึ่งมีข้อแตกต่างเพิ่มเติมอีกเล็กน้อย คือเว็บไซต์นี้จะมี sitemap ด้วย โดยที่ผมได้ทำการ submit sitemap เข้าไปยัง Google ด้วยตั้งแต่ตอนเริ่มต้น ซึ่งผลการ Index ของไซต์นี้น่าสนใจมากครับ จากกราฟจะเห็นว่า Google ทำการ Index แทบจะในทันทีถึงเกือบหกร้อยหน้า (จากข้อมูลทั้งหมดตาม sitemap พันกว่าหน้า) ซึ่งผลลัพท์ก็ทำท่าจะดีในตอนแรก แต่หลังจากนั้นประมาณสองเดือน ผลการ Index ตกลงเหลือ 9 รายการตามที่เห็นในปัจจุบัน
เหตุผลที่ Google ให้ในการลดการจัดทำดัชนี คือ Google แจ้งว่าผลการ Index ให้ข้อมูลในทุกๆหน้าเหมือนๆกัน (คือมีเฉพาะโค้ด HTML หลักเท่านั้น เหมือนที่ได้แคชไว้) Google เลยไม่ทำการ Index หน้าย่อยๆอื่นๆ
ผ่านไปปีกว่าๆ ผมกลับมาตรวจสอบ Index ของไซต์นี้อีกครั้ง พบว่ามี Index เหลืออยู่เพียงไซต์เดียว คือ http://shopdemo.goragod.com อาจเป็นเพราะไซต์นี้มีความน่าเชื่อถือสูงกว่าก็ได้ เนื่องจากอีกไซต์เป็นซับโฟลเดอร์ของ github และ ไซต์นี้ยังมี sitemap ด้วย โดยที่ Index มีเก็บไปหลายร้อยรายการ และที่สำคัญ บางคีย์ ยังสามารถขึ้นอันดับ 1 ได้ด้วย (25 มิย. 2562)
สรุป ผลการทดสอบนี้ให้ข้อมูลเรา 2 อย่าง
- ปัจจุบัน (25 มิย. 2562) Google สามารถทำการ Index ไซต์ที่เป็น Javascript ได้แล้ว แต่อาจใช้เวลามากกว่าไซต์ที่เป็น static ซักหน่อย
- sitemap เป็นอะไรที่เยี่ยมยอดมากในการทำ seo เพราะมันช่วยให้ google มา Index เว็บเราอย่างรวดเร็ว