محتوای تکراری چیست؟

محتوای تکراری محتوایی است که در بیش از یک مکان در اینترنت نشان داده می شود. این "یک مکان" به عنوان یک مکان با یک آدرس وب سایت منحصر به فرد (URL) تعریف می شود - بنابراین اگر محتوای مشابه در بیش از یک آدرس وب نمایش داده شود، عنوان محتوای تکراری را دریافت می کند.

در حالی که از لحاظ فنی از مجازات برخوردار نیست، محتوای تکراری گاهی اوقات می تواند بر رتبه بندی سایت در موتورهای جستجو تاثیر منفی بگذارد.

محتوای تکراری می تواند سه مساله اصلی را برای موتورهای جستجو ارائه دهد:

موتورهای جستجو نمی دانند کدام نسخه (ها) شامل حذف می شوند ، همچنین موتورهای جستجو نمی دانند که آیا می توان معیارهای پیوند (trust, authority, anchor text, link equity) را به یک صفحه هدایت کرد یا آن را بین چندین نسخه تقسیم کرد ، آنها نمی دانند کدام نسخه (ها) را برای رتبه بندی در نتایج جستجو حساب کنند.

وقتی محتوای تکراری وجود دارد، صاحبان سایت ها قطعا کاهش رتبه بندی و سئو را تجربه کنند. این زیان ها اغلب از دو مسئله عمده تشکیل می شود:

برای ارائه بهترین تجربه جستجو، موتورهای جستجو به ندرت چندین نسخه از همان محتوا را نمایش می دهند و بنابراین مجبورند انتخاب کنند که کدام نسخه احتمالا بهترین نتیجه باشد.

چگونه مسائل محتوای تکراری اتفاق می افتد؟

در اکثر موارد، صاحبان وب سایت ، عمدا مطالب تکراری ایجاد نمی کنند. اما، این بدان معنی نیست که این کار را انجام نمی دهند. در حقیقت با برخی برآوردها، تا 29 درصد از وب در واقع محتوای تکراری است!

بیایید نگاهی به برخی از رایج ترین روش های ایجاد محتوای تکراری کنیم:

1. تغییرات URL

پارامترهای URL، مانند ردیابی کلیک و برخی از کد تجزیه و تحلیل، می تواند مسائل محتوای تکراری را ایجاد کند. این مسئله می تواند یک مشکل نه تنها توسط پارامترهای خود باشد، بلکه همچنین باعث می شود که این پارامتر ها در URL خود ظاهر شوند.

به طور مثال، شناسه و آدرس پیوند یک خالق محتوای تکراری مشترک است.

2. HTTP در مقابل HTTPS یا WWW در مقابل صفحات غیر WWW

اگر سایت شما دارای نسخه های جداگانه "www.site.com" و "site.com" (با و بدون پیشوند "www") و محتوای مشابه در هر دو نسخه وجود دارد ، شما به طور نا خواسته محتوای تکراری از هر یک از آنها را ایجاد کرده اید ، این جریان شامل صفحات سایت هایی که نسخه های http: // و https: // را دارند نیز صدق می کند. اگر هر دو نسخه از یک صفحه برای موتورهای جستجو قابل مشاهده هستند، شما ممکن است موضوع محتوای تکراری را تجربه کنید.

3. محتوای محرمانه یا کپی شده

محتوای تکراری نه تنها شامل پست های وبلاگ و محتوای مقاله، بلکه صفحات اطلاعات محصول نیز می شود. اما یک مشکل رایج برای سایت های تجارت الکترونیک ( فروشگاهی ) نیز وجود دارد: اطلاعات محصول در بسیاری از وب سایت های مختلف که یک عنصر مشابه را به فروش می رسانند مشابه است و همه آنها از توصیف سازندگان این محصولات استفاده می کنند.

چگونه مشکلات محتوای تکراری را رفع کنیم

رفع مسئله محتوای تکراری همه را به یک ایده مرکزی می اندازد: مشخص کردن کدام یک از موارد تکراری

استفاده از 301 تغییر مسیر به URL درست، ویژگی rel = canonical یا استفاده از ابزار دست زدن به پارامتر در کنسول جستجوی گوگل

301 تغییر مسیر

در بسیاری از موارد، بهترین راه برای مقابله با محتوای تکراری، تنظیم 301 تغییر مسیر از صفحه "تکراری" به صفحه محتوای اصلی است.

هنگامی که چندین صفحه با توانایی رتبه بندی خوب به یک صفحه متصل می شوند، نه تنها رقابت با یکدیگر را متوقف می کنند؛ آنها یک سیگنال قوی تر و محبوبتر را به طور کلی ایجاد می کنند. این تاثیر مثبتی بر توانایی صفحه "صحیح" برای رتبه بندی خوب خواهد بود.

ویژگی کانونی rel = canonical

گزینه دیگر برای برخورد با محتوای تکراری استفاده از ویژگی rel = canonical است. این به موتورهای جستجو می گوید که صفحه داده شده باید مانند یک کپی از URL مشخص شده و تمام پیوندها، معیارهای محتوا و "رتبه بندی قدرت" که موتورهای جستجو برای این صفحه اعمال شود.

خصیصه rel = "canonical" بخشی از صفحه HTML صفحه وب است

ویژگی rel = canonical باید به سربرگ HTML هر نسخه تکراری یک صفحه اضافه شود، با بخش "URL اصلی صفحه" در بالا با یک پیوند به صفحه اصلی (کانونی) جایگزین شود.

بسته به ساختار URL شما و علت مسائل مربوط به محتوای تکراری شما، راه اندازی دامنه یا پارامتر مورد نظر (یا هر دو!) ممکن است راه حلی ارائه دهد.

اشکال اصلی استفاده از مدیریت پارامتر به عنوان روش اصلی برای رسیدگی به محتوای تکراری این است که تغییراتی که شما انجام می دهید فقط برای Google کار می کنند. هر قواعدی که با استفاده از Google Search Console جایگزین می شود بر نحوه باینری یا هر خزنده موتور جستجوی دیگر، تفسیر سایت شما تاثیر نمی گذارد. شما باید از ابزارهای وب مستر برای موتورهای جستجوی دیگر علاوه بر تنظیم کردن تنظیمات در کنسول جستجو استفاده کنید.

روش های دیگر برای مقابله با محتوای تکراری

حفظ یکپارچگی هنگام اتصال به داخل وب سایت. به عنوان مثال، اگر یک وب مستر تعیین کند که نسخه قاعده یک دامنه www.example.com/ باشد، تمام پیوندهای داخلی باید به جای http://www.example.com/ نمونه به مثال http://example.com/ بروید. صفحه (توجه به عدم وجود WWW).

هنگام بارگیری محتوا، اطمینان حاصل کنید که وب سایت syndicating یک پیوند را به محتوای اصلی اضافه می کند و نه یک تغییر در URL

برای اضافه کردن یک ضمانت اضافی در برابر اسکرپورهای محتوا، سرقت اعتبار سئو برای محتوای شما، عاقلانه است که پیوند rel = canonical را به صفحات موجود اضافه کنید. این یک ویژگی کانونی است که به نشانی اینترنتی که در حال حاضر است را نشان می دهد، نقطه ای که تلاش برخی از اسکرپورها را خنثی می کند.

محتوای تکراری بدان معنی است که محتوای مشابه در چندین (URL) در وب ظاهر می شود و در نتیجه موتورهای جستجو نمی دانند دقیقا کدام URL را برای نمایش در نتایج جستجو نشان دهند.

این می تواند به رتبه بندی یک صفحه سایت صدمه بزند و مشکل وقتی بدتر می شود که افراد شروع به پیوند دادن به نسخه های مختلف همان محتوا کنند. این مقاله به شما کمک می کند تا دلایل مختلف محتوای تکراری را بفهمید و راه حل هر یک از آنها را بیابید.

محتوای تکراری داخلی چیست؟

محتوای تکراری داخلی ، محتوایست که در چندین URL در همان وبسایت موجود است. از آنجا که بیش از یک URL همان محتوای را نشان می دهند ، موتورهای جستجو نمی توانند تشخیص دهند کدام URL را در لیست نتایج جستجو بالاتر ببرند، بنابراین آنها ممکن است هر دو URL را در رتبه پایین تر و به سایر صفحات وب ترجیح دهند.

در این مقاله بیشتر به دلایل فنی محتوای تکراری و راه حلهای آنها خواهیم پرداخت. اگر دوست دارید دید بازتری در مورد محتوای تکراری بدست آورید و نحوه ارتباط آن با محتوای کپی شده cannibalization با کلمه کلیدی را بیاموزید ، ما به شما توصیه می کنیم این پست را بخوانید.

بیایید این را با یک مثال نشان دهیم : محتوای تکراری را می توان تقاطعی توصیف کرد که علائم راه در دو جهت مختلف برای یک مقصد مشخص شده است: کدام جاده را باید طی کنید؟ اوضاع وقتی بدتر می شود که مقصد نهایی نیز متفاوت است ، به عنوان یک خواننده ، شما مهم نیستید زیرا شما محتوای مورد نظر خود را یافتید، اما یک موتور جستجو باید بین آنها صفحه ای را انتخاب کند تا در نتایج جستجو نشان دهد ، زیرا مطمئناً نمی خواهد همان مطلب را دو بار نشان دهد.

بیایید بگوییم مقاله شما در مورد "کلمه کلیدی x" در آدرس :

ظاهر می شود و همان محتوا نیز در آدرس :

ظاهر می شود، و همچنین آدرس : .

اما این یک حقیقت است که در بسیاری از سیستم های مدرن مدیریت محتوا اتفاق می افتد.

محتوای تکراری مشکل شماست زیرا این لینک ها، URL های مختلف را تبلیغ می کنند. اگر همه آنها به همان URL پیوند داشتند ، شانس شما برای رتبه بندی "کلمه کلیدی x" بیشتر خواهد بود.

علل محتوای تکراری

ده ها دلیل برای محتوای تکراری وجود دارد. بیشتر آنها فنی هستند: خیلی وقتها که یک انسان تصمیم می گیرد همان مطالب را در دو مکان مختلف قرار دهد بدون اینکه مشخص کند کدام اصلی است؛ دلایل فنی زیادی وجود دارد زیرا توسعه دهندگان مانند مرورگر یا حتی یک کاربر فکر نمی کنند ، چه رسد به یک عنکبوت موتور جستجو ، فقط آنها مانند یک برنامه نویس فکر می کنند.

فهمیدن مفهوم URL

نه ، آن برنامه نویس دیوانه نشده است ، آنها فقط با زبانی متفاوت صحبت می کنند. CMS وب سایت را نیرو می بخشد و در آن پایگاه داده فقط یک مقاله وجود دارد ، اما نرم افزار وب سایت فقط اجازه می دهد تا آن مقاله مشابه در پایگاه داده از طریق چندین URL قابل بازیابی باشد.

به این دلیل که از نظر توسعه دهنده ، شناسه منحصر به فرد برای آن مقاله ، شناسه ای است که مقاله در پایگاه داده دارد ، نه URL. اما برای موتور جستجو ، URL شناسه منحصر به فرد برای یک قطعه از محتوا است. اگر این مسئله را برای یک توسعه دهنده توضیح دهید ، آنها شروع به دریافت مشکل می کنند و بعد از خواندن این مقاله ، شما حتی می توانید بلافاصله راه حل برای آنها ارائه دهید.

شناسه جلسه

شما اغلب می خواهید بازدیدکنندگان خود را ردیابی کنید و به آنها اجازه دهید ، به عنوان مثال ، وسایلی را که می خواهید برای خرید آنها در سبد خرید خریداری کنید.

برای انجام این کار ، شما باید "جلسه" به آنها بدهید. جلسه ، تاریخچه مختصری از کارهایی است که بازدید کننده در سایت شما انجام داده است و می تواند مواردی مانند مواردی را در سبد خرید خود داشته باشد. برای حفظ آن جلسه به عنوان کلیک بازدید کننده از یک صفحه به صفحه دیگر ، باید شناسه منحصر به فرد آن جلسه - با نام Session ID - در جایی ذخیره شود. متداول ترین راه حل ، انجام این کار با کوکی ها است. اما موتورهای جستجو معمولاً کوکی ها را ذخیره نمی کنند.

در آن مرحله ، برخی از سیستم ها به استفاده از شناسه های جلسه در URL بر می گردند. این بدان معنی است که هر پیوند داخلی در وب سایت باعث می شود که Session ID به URL خود اضافه شود ، و به دلیل اینکه Session ID منحصر به فرد برای آن جلسه است ، یک URL جدید ایجاد می کند ، و بنابراین محتوای آن را کپی می کند.

پارامترهای URL مورد استفاده برای ردیابی و مرتب سازی

علت دیگر ایجاد محتوای تکراری استفاده از پارامترهای URL است که محتوای یک صفحه را تغییر نمی دهد ، به عنوان مثال در پیگیری لینک ها. می بینید ، در موتور جستجو ،

همان URL نیستند.

دومی ممکن است به شما امکان پیگیری این را بدهد که منبع از کجا آمده ، اما همچنین ممکن است رتبه بندی را برای شما دشوارتر کند - یک اشکال ناخواسته!

البته این فقط به دنبال ردیابی پارامترها نمی رود، بلکه برای هر پارامتر شما می توانید به URL اضافه کنید که محتوای حیاتی را تغییر ندهد ، خواه این پارامتر برای "تغییر مرتب سازی بر روی مجموعه ای از محصولات" باشد یا "نشان دادن نوار کناری ": همه آنها باعث تکرار شدن می شوند.

Scraper و سندیکای محتوا

بیشتر دلایل محتوای تکراری یا "تقصیر" شما یا وب سایت شماست. با این وجود ، بعضی اوقات وب سایتهای دیگر با رضایت شما از مطالب شما استفاده می کنند. آنها همیشه به مقاله اصلی شما پیوند نمی دهند ، بنابراین موتور جستجوگر آن را دریافت نمی کند و باید با نسخه دیگری از همان مقاله مقابله کند. هرچه سایت شما محبوب تر شود ، اسکرابر بیشتر خواهید شد و این مشکل بزرگتر و بزرگتر می شود.

ترتیب پارامترها

یکی دیگر از دلایل شایع این است که CMS از URL های تمیز استفاده نمی کند ، بلکه URL هایی مانند /?id=1&cat=2 ، جایی که شناسه به مقاله و مجموعه به این دسته اشاره می کند. URL /?cat=2&id=1 در اکثر سیستم های وب سایت نتایج مشابهی ارائه می دهد ، اما برای موتور جستجو کاملاً متفاوت هستند.

صفحه بندی نظر

در وردپرس و حتی در برخی از سیستمهای دیگر ، گزینه ای برای پیوند زدن به نظرات شما وجود دارد. این منجر به تکثیر مطالب در URL مقاله و URL مقاله + / نظر-صفحه-1 / ، / نظر-صفحه-2 / و غیره می شود.

صفحات سازگار با چاپگر

اگر سیستم مدیریت محتوا شما صفحات سازگار با چاپگر ایجاد کند و شما به صفحات مقاله خود پیوند دهید ، Google معمولاً آنها را پیدا می کند ، مگر اینکه به طور خاص آنها را مسدود کنید. حال ، از خود بپرسید: شما کدام نسخه را می خواهید Google نشان دهد؟ یکی با تبلیغات و محتوای جانبی ، یا موردی که فقط مقاله شما را نشان می دهد؟

WWW در مقابل غیر WWW

این یکی از قدیمی ترین مشکلات در سئو سایت است ، اما بعضی اوقات موتورهای جستجوگر اشتباه می کنند: WWW در مقابل محتوای کپی غیر WWW ، در صورت دسترسی هر دو نسخه از سایت شما. یکی دیگر از وضعیتهای کمتر رایج اما موردی که من نیز دیده ام HTTP در مقابل محتوای تکراری HTTPS است که در آن محتوای مشابه بیش از هر دو ارائه می شود.

راه حل مفهومی: یک URL "متعارف"

همانطور که قبلاً دیدیم ، این واقعیت که چندین URL منجر به همان محتوا می شوند ، یک مشکل است ، اما می توان آن را حل کرد. شخصی که در یک نشریه کار می کند به طور معمول قادر خواهد بود به راحتی به شما بگوید نشانی اینترنتی "صحیح" برای یک مقاله خاص چیست ، اما گاهی اوقات وقتی از سه نفر در همان شرکت سؤال می کنید ، سه جواب متفاوت دریافت خواهید کرد …

این مشکلی است که نیاز به آدرس دهی دارد زیرا در پایان ، فقط یک (URL) وجود دارد. آن URL صحیح برای بخشی از مطالب توسط موتورهای جستجو به URL Canonical گفته می شود.

Canonical چیست؟

Canonical اصطلاحی است که ناشی از سنت کاتولیک رومی است ، جایی که لیستی از کتب مقدس ایجاد شده و به عنوان اصلی پذیرفته شده است. آنها به عنوان انجیل های متعارف عهد جدید شناخته می شدند.

طعنه آمیز این است که کلیسای کاتولیک رومی حدود 300 سال طول کشید و دعواهای بیشماری برای تهیه این فهرست متعارف به دست آورد و آنها سرانجام چهار نسخه از همین داستان را انتخاب کردند …

شناسایی مسائل مربوط به مطالب تکراری

شاید ندانید که آیا مسئله محتوای تکراری را در سایت خود دارید، استفاده از Google یکی از ساده ترین راه ها برای مشاهده مطالب تکثیر است.

چندین ترفند جستجو وجود دارد که در مواردی مانند اینها بسیار مفید هستند. اگر می خواهید تمام آدرس های اینترنتی موجود در سایت خود را که حاوی مقاله کلمه X شما است ، پیدا کنید ، عبارت جستجو زیر را در Google تایپ کنید:

site:example.com intitle:"keyword"

Google سپس تمام صفحات را به شما نشان می دهد که حاوی آن کلمه کلیدی هستند. هرچه بخشی خاص تر از درخواست را پیدا کنید ، می توانید محتوای تکراری را از بین ببرید. می توانید از همان روش برای شناسایی محتوای تکراری در سراسر وب استفاده کنید. بیایید بگوییم که عنوان کامل مقاله شما "کلید واژه X - چرا عالی است" است ، می توانید جستجو کنید:

intitle:"Keyword X - why it is awesome"

و Google به تمام سایت هایی که با آن عنوان مطابقت دارند می دهد. بعضی اوقات حتی ارزش جستجو برای یک یا دو جمله کامل از مقاله شما نیز وجود دارد ، زیرا ممکن است برخی از اسکرابرها عنوان را تغییر دهند. در برخی موارد ، هنگامی که شما چنین جستجویی را انجام می دهید ، ممکن است Google در آخرین صفحه نتایج اعلانی مانند این نشان دهد:

راه حل های عملی برای محتوای تکراری

هنگامی که تصمیم گرفتید که یک URL متعارف برای محتوای شما باشد ، باید فرایند کانونیالیزاسیون را شروع کنید.

این بدان معنی است که ما باید به نسخه های عادی یک صفحه تاکید و به موتورهای جستجو اجازه دهیدم آن را پیدا کنند. با اولویت چهار روش برای حل مسئله وجود دارد:

اعلام اینکه این محتوای تکراری نیست
هدایت محتوای تکراری به URL متعارف
اضافه کردن یک عنصر پیوند کانونی به صفحه تکراری
افزودن کد 301 از صفحه تکراری به صفحه کانونی

جلوگیری از محتوای تکراری

اگر مشکل شما به راحتی برطرف نشده است ، بازهم ارزش دارد تلاش کنید. هدف باید این باشد که از انتشار محتوای تکراری به طور کلی جلوگیری کنیم ، زیرا این راه حل بهترین راه حل است.

301 تغییر مسیر محتوای تکراری

در بعضی موارد ، جلوگیری از ایجاد سیستم URL های اشتباه برای محتوا ، کاملاً غیرممکن است ، اما گاهی اوقات امکان تغییر مسیر مجدد وجود دارد.

اگر این مسئله برای شما منطقی نیست (که می توانم آن را درک کنم) ، هنگام صحبت با توسعه دهندگان خود ، آن را در خاطر داشته باشید. اگر از برخی از محتوای محتوای تکراری خلاص شده اید ، مطمئن شوید که تمام URL های قدیمی محتوای تکراری را به URL های متعارف مناسب هدایت کنید.

با استفاده از پیوندها

گاهی اوقات شما نمی خواهید یا نمی توانید از نسخه تکراری یک مقاله خلاص شوید ، حتی اگر می دانید که این URL اشتباه است. برای حل این مسئله خاص ، موتورهای جستجو عنصر پیوند کانونی را معرفی کرده اند. در بخش سایت شما قرار می گیرد:

در قسمت href از پیوند کانونی ، URL صحیح کانونی برای مقاله خود قرار می دهید.

هنگامی که یک موتور جستجوگر این عنصر پیوند را پیدا کند ، یک تغییر مسیر 301 را انجام می دهد و پیوند جمع آوری شده توسط آن صفحه را به صفحه متعارف شما منتقل می کند.

این روند کمی آهسته تر از تغییر مسیر 301 است ، بنابراین اگر شما فقط می توانید یک تغییر مسیر 301 را انجام دهید که ترجیحاً همانطور که توسط جان مولر گوگل ذکر شده است انجام دهید .