ควบคุมวิธีที่ Google จัดทำดัชนีเนื้อหาของคุณด้วยเมตาแท็ก
มีเสิร์ชเอ็นจิ้นมากมาย แต่ส่วนใหญ่เจ้าของเว็บไซต์ให้ความสำคัญกับการจัดทำดัชนีเว็บไซต์ของตนบน Google ผู้ทรงอำนาจ วิธีหนึ่งที่จะทำงานได้ดีขึ้นในเครื่องมือค้นหาคือการ ใช้เมตาแท็กของหุ่นยนต์.
เมตา
แท็กโรบ็อตเป็นเมตาแท็กฉันทามติในบรรดาเครื่องมือค้นหาเช่น Google, Yahoo และ Bing การใช้เมตาแท็กคือเพื่อให้นักพัฒนาเว็บสามารถควบคุมการเข้าถึงได้ง่ายสำหรับหน้าเว็บต่อต้านเครื่องมือรวบรวมข้อมูลของเครื่องมือค้นหา ตัวอย่างเช่นบางสิ่งบางอย่าง noindex
จะป้องกันไม่ให้โรบอตทั้งหมดจากเครื่องมือค้นหาวางหน้าเว็บของคุณในดัชนีของพวกเขา.
หุ่นยนต์ของ Google นั้นเรียกว่า Googlebot ในโพสต์นี้เราจะดูว่าเราจัดการกับ Googlebot อย่างไรโดยเฉพาะ เมตาแท็ก.
ที่อยู่ Googlebot
หากต้องการระบุ Googlebot ให้ระบุเมตา ชื่อ
เช่น Googlebot
แทนที่จะเป็นเพียงแค่ หุ่นยนต์
. ตัวอย่างนี้จะป้องกันไม่ให้ Googlebot วางหน้าเว็บของคุณในดัชนี แต่ยังอนุญาตให้บอทจาก Bing และ Yahoo รวบรวมข้อมูลหน้าเว็บ ดังนั้นหน้าเว็บของคุณอาจยังปรากฏใน Bing และ Yahoo ผลการค้นหา.
Google มีหุ่นยนต์พิเศษจำนวนมากที่รวบรวมข้อมูลผ่านเนื้อหาประเภทต่างๆเช่นรูปภาพข่าววิดีโอโฆษณาและมือถือ Google อนุญาตให้คุณบล็อกโรบอตเหล่านี้แยกกัน หากคุณไม่ต้องการให้เว็บไซต์ของคุณปรากฏในผลการค้นหาของ Google Mobile คุณสามารถระบุ meta robot tag ด้วยวิธีนี้:
รายการประเภทบ็อต Google ทั้งหมดสามารถพบได้ในหน้าซอฟต์แวร์รวบรวมข้อมูลเว็บไซต์ของ Google.
ป้องกันการสร้างดัชนีภาพ
มันน่ารำคาญจริง ๆ เมื่อคุณพบว่าภาพที่มีลิขสิทธิ์ของคุณถูกใช้โดยบุคคลอื่นโดยไม่ได้รับอนุญาตจากคุณก่อน หากคุณต้องการลดสิ่งนี้ให้น้อยที่สุดคุณสามารถป้องกันไม่ให้ Google วางภาพลงในดัชนีของพวกเขา.
ระบุเมตาหุ่นยนต์แท็กด้วยค่า noimageindex
. วิธีนี้จะป้องกันไม่ให้โรบอตจัดทำดัชนีรูปภาพทั้งหมดในหน้าและรูปภาพของคุณจะไม่ปรากฏในผลการค้นหารูปภาพของ Google ซึ่งเป็นที่ที่คนมักค้นหา.
หรือคุณสามารถตั้งชื่อเมตาเป็น Googlebot ภาพ
เพื่อป้องกันไม่ให้หุ่นยนต์ของ Google รวบรวมข้อมูลเว็บไซต์ของคุณเป็นรูปภาพ.
ป้องกันการแปล
Google Chrome นำเสนอการแปลของเว็บไซต์ในภาษาต่างประเทศเป็นภาษาที่ชื่นชอบหรือท้องถิ่นของผู้เข้าชมด้วยความช่วยเหลือของ Google Translate ในขณะที่การแปลของ Google แปลภาษากำลังดีขึ้น แต่ก็ยังไม่สมบูรณ์แบบสำหรับบางภาษา บางครั้งผลลัพธ์การแปลอาจแปลกไปหน่อย.
หากคุณไม่ต้องการให้ Google แปลหน้าเว็บของคุณให้ตั้งค่า meta ของ Googlebot ด้วยค่า notranslate
, ชอบมาก.
หากคุณต้องการป้องกันไม่ให้มีการแปลบางส่วนของหน้าคุณสามารถเพิ่ม notranslate
ระดับภายในองค์ประกอบห่อเนื้อหา:
Google จะไม่สนใจสิ่งนี้ นอกจากนี้คุณยังสามารถป้องกันไม่ให้ Google จัดทำดัชนีหน้าเว็บของคุณหลังจากช่วงระยะเวลาหนึ่ง สิ่งนี้จะเป็นประโยชน์อย่างยิ่งสำหรับหน้าเว็บที่มีความเกี่ยวข้องเฉพาะภายในกรอบเวลาเช่นหน้าลงทะเบียนกิจกรรมเป็นต้น. ในกรณีนี้คุณอาจต้องการแจ้งให้โรบอตไม่รวบรวมข้อมูลและจัดทำดัชนีหน้านี้หลังจากเหตุการณ์สิ้นสุดลงจึงป้องกันไม่ให้ปรากฏในผลการค้นหาของ Google. หากต้องการทำสิ่งนี้ให้ระบุเมตาแท็กด้วยค่า จากตัวอย่างด้านบนหุ่นยนต์ Google จะไม่รวบรวมข้อมูลหน้าเว็บหลังจาก 29-Sep-14 ในที่สุดหน้าจะหายไปจากดัชนี แต่คุณยังคงสามารถเก็บหน้านี้ไว้เพื่อเก็บไว้ในเว็บไซต์ของคุณได้.ป้องกันการสร้างดัชนีหลังจากเวลาที่กำหนด
unavailable_after
ตามด้วยข้อมูลเวลา รูปแบบเวลาควรเป็นไปตามรูปแบบ RFC-850 ตัวอย่างเช่น: วันพฤหัสบดี, 26 ก.ย. -14 10:00:00 UTC