תוכן משוכפל, מה זה ואיך פותרים??
תוכן משוכפל, מה זה ואיך פותרים??
החלטנו להוציא מספר כתבות על בעיות טכנולוגיות הנוגעות לתחום ה SEO. החלטנו להתחיל עם התוכן בעית התוכן המשוכפל.
מרבית מומחי ה-SEO שנשאלו בעניין, ציינו את תופעת התוכן המשוכפל כסוגיה טכנית מרכזית שיש לתת עליה את הדעת. תוכן משוכפל הוא למעשה כל תוכן, שכלי מנהל האתרים של גוגל מוצא דומה במידה ניכרת או זהה לחלוטין לתוכן שנמצא באתר שלכם.
אז מהו תוכן משופכל?
הסורקים של גוגל חייבים לכסות שטח רב, גוגל לא יכול לצרוך את כל הנתונים, במיוחד כאשר לוקחים בחשבון שגוגל חייב לבקר מחדש בכל דף שוב ושוב על מנת למצוא שינויים או חומרים חדשים. כל מה שעלול להאט את הסריקות או הגילויים של גוגל על הרשת הוא גורם בלתי רצוי. במקרים רבים אתרים דינמיים שיוצרים דפי רשת ממאגרי מידע במהירות רבה, מתפקדים לא נכון מנקודת מבט של קידום אתרים. אתרים אלו עלולים ליצור המון כתובות אתרים או דפים המכילים בעצם את אותו תוכן, שוב ושוב.
מקורות אחרים של תוכן משוכפל כוללים את השימוש הן בכתובות "רגילות" והן בכתובות מאובטחות פרוטוקול (HTTP ו-HTTPS), ללא העדפה של דומיין עם קידומת www על פני דומיין ללא www, תגי בלוג וסינדיקציית הזנות RSS.
כדי לפתור את הבעיה, עליכם לסרוק את האתר שלכם בחיפוש אחר כפילויות, להחיל את הנחיות הסריקה וליידע את גוגל על הערך היחסי של ריבוי הכתובות. תוכלו להשתמש ב-robots.txt, קובץ שמאפשר לכם לשלוט באופן בו גוגל מאתחלת סריקה וממיינת את דפי הרשת הציבוריים שלכם. כך תספרו לגוגל אילו תיקיות ספציפיות ומדריכים מיותר לסרוק.
אפשרות נוספת היא לספר לגוגל אילו מכתובות האתרים יש להעדיף בזכות האינדקס שלהם, על ידי הפעלת רכיב הקישור rel=canonical שיצביע על כתובת האתר המועדפת. תגי קנוניקל יכולים לעזור עם בעיות של תוכן משוכפל משום שהם מדווחים למנועי חיפוש כי עמוד אחד הוא שכפול של האחר, וכן אילו מן הדפים המשוכפלים ייחשב הדף העיקרי עבור האינדקס שעורכים הרובוטים של גוגל.
שלא תטעו, גם אתרים בינלאומיים הפונים למספר מדינות עם תוכן במגוון רחב של שפות, עלולים בסופו של דבר לאחסן כמויות של תוכן משוכפל." בתרחיש זה, נייג'ר ממליץ להשתמש בקוד hreflang rel="alternate" בתוך כל דף כדי לזהות את המיקום הגיאוגרפי של התוכן בשפה דומה, אך מכוונת יותר למטרה. פתרון אחר, לדבריו, הוא איתור כתובת ה-IP שתייצר את השפה ומטבע הלשון המתאימים ביותר כברירת המחדל לדף.
בעיה נפוצה של תוכן משוכפל צצה כאשר לאתר אחד יש כתובת המתחילה ב-www או כתובת שאינה מכילה www כלל. למרבה המזל, ניתן לתקן את זה בקלות.
נסו להקליד את כתובת האתר שלכם ללא www ולראות אם הוא פונה לגרסת www, ואז נסו את ההפך. אם בשני המקרים האתר עולה ללא הפניה מחדש, לא הגדרתם את האתר כמו שצריך. אם כך, תפנו לכלי מנהל האתר שלכם. עברו להגדרות ומשם להגדרות אתר. ראו אם מצוינת שם גרסה שאתם מעדיפים. אם אינכם בטוחים, תשיגו מקצוען שיסייע לכם לקבוע איזו גרסה כדאי לכם להתקין כדי להמשיך לרוץ איתה קדימה.
השימוש בגרסאות מרובות של דף הבית יכול לגרום לבעיות רבות של תוכן משוכפל, כאשר כל קישור איכותי שהאתר מקבל, מתפשט בכל הכתובות השונות.
תוכלו לפתור בעיה זו על ידי בחירה בכתובת אתר אחת שתהיה כתובת האתר הראשית שלכם, מה שכן ברגע שאתם בוחרים כתובת אתר אחת, תדאגו להישאר איתה. כל הכתובות האחרות יבצעו הפניה אוטומטית לכתובת הראשית באמצעות קוד 301 להפניה מחדש.