محتوای تکراری

محتوای تکراری بدان معنی است که محتوای مشابه در چندین (URL) در وب ظاهر می شود و در نتیجه موتورهای جستجو نمی دانند دقیقا کدام URL را برای نمایش در نتایج جستجو نشان دهند.

این می تواند به رتبه بندی یک صفحه سایت صدمه بزند و مشکل وقتی بدتر می شود که افراد شروع به پیوند دادن به نسخه های مختلف همان محتوا کنند. این مقاله به شما کمک می کند تا دلایل مختلف محتوای تکراری را بفهمید و راه حل هر یک از آنها را بیابید.

محتوای تکراری

محتوای تکراری محتوایست که در چندین URL در وب موجود است. از آنجا که بیش از یک URL همان محتوای را نشان می دهند ، موتورهای جستجو نمی توانند تشخیص دهند کدام URL را در لیست نتایج جستجو بالاتر ببرند، بنابراین آنها ممکن است هر دو URL را در رتبه پایین تر و به سایر صفحات وب ترجیح دهند.

در این مقاله بیشتر به دلایل فنی محتوای تکراری و راه حلهای آنها خواهیم پرداخت. اگر دوست دارید دید گسترده تری در مورد محتوای تکراری بدست آورید و نحوه ارتباط آن با محتوای کپی شده cannibalization با کلمه کلیدی را بیاموزید ، ما به شما توصیه می کنیم این پست را بخوانید.

بیایید این را با یک مثال نشان دهیم : محتوای تکراری را می توان تقاطعی توصیف کرد که علائم راه در دو جهت مختلف برای یک مقصد مشخص شده است: کدام جاده را باید طی کنید؟ اوضاع وقتی بد تر می شود که مقصد نهایی نیز متفاوت است ، به عنوان یک خواننده ، شما مهم نیستید زیرا شما محتوای مورد نظر خود را یافتید، اما یک موتور جستجو باید بین آنها صفحه ای را انتخاب کند تا در نتایج جستجو نشان دهد ، زیرا مطمئناً نمی خواهد همان مطلب را دو بار نشان دهد.

بیایید بگوییم مقاله شما در مورد “کلمه کلیدی x” در آدرس :

http://www.example.com/keyword-x/ ظاهر می شود و همان محتوا نیز در آدرس :

http://www.example.com/article-category/keyword-x/ ظاهر می شود، و همچنین آدرس : http://www.example.com/article-category/keyword-x/ .

اما این یک حقیقت است که در بسیاری از سیستم های مدرن مدیریت محتوا اتفاق می افتد.

محتوای تکراری مشکل شماست زیرا این لینک ها، URL های مختلف را تبلیغ می کنند. اگر همه آنها به همان URL پیوند داشتند ، شانس شما برای رتبه بندی “کلمه کلیدی x” بیشتر خواهد بود.

علل محتوای تکراری

ده ها دلیل برای محتوای تکراری وجود دارد. بیشتر آنها فنی هستند: خیلی وقت هاست که یک انسان تصمیم می گیرد همان مطالب را در دو مکان مختلف قرار دهد بدون اینکه مشخص کند کدام اصلی است؛ دلایل فنی زیادی وجود دارد زیرا توسعه دهندگان مانند مرورگر یا حتی یک کاربر فکر نمی کنند ، چه رسد به یک عنکبوت موتور جستجو ، فقط آنها مانند یک برنامه نویس فکر می کنند.

فهمیدن مفهوم URL

نه ، آن برنامه نویس دیوانه نشده است ، آنها فقط با زبانی متفاوت صحبت می کنند. CMS وب سایت را نیرو می بخشد و در آن پایگاه داده فقط یک مقاله وجود دارد ، اما نرم افزار وب سایت فقط اجازه می دهد تا آن مقاله مشابه در پایگاه داده از طریق چندین URL قابل بازیابی باشد. به این دلیل که از نظر توسعه دهنده ، شناسه منحصر به فرد برای آن مقاله ، شناسه ای است که مقاله در پایگاه داده دارد ، نه URL. اما برای موتور جستجو ، URL شناسه منحصر به فرد برای یک قطعه از محتوا است. اگر این مسئله را برای یک توسعه دهنده توضیح دهید ، آنها شروع به دریافت مشکل می کنند و بعد از خواندن این مقاله ، شما حتی می توانید بلافاصله راه حل برای آنها ارائه دهید.

شناسه جلسه

شما اغلب می خواهید بازدیدکنندگان خود را ردیابی کنید و به آنها اجازه دهید ، به عنوان مثال ، وسایلی را که می خواهید برای خرید آنها در سبد خرید خریداری کنید. برای انجام این کار ، شما باید “جلسه” به آنها بدهید. جلسه ، تاریخچه مختصری از کارهایی است که بازدید کننده در سایت شما انجام داده است و می تواند مواردی مانند مواردی را در سبد خرید خود داشته باشد. برای حفظ آن جلسه به عنوان کلیک بازدید کننده از یک صفحه به صفحه دیگر ، باید شناسه منحصر به فرد آن جلسه – با نام Session ID – در جایی ذخیره شود. متداول ترین راه حل ، انجام این کار با کوکی ها است. اما موتورهای جستجو معمولاً کوکی ها را ذخیره نمی کنند.

در آن مرحله ، برخی از سیستم ها به استفاده از شناسه های جلسه در URL بر می گردند. این بدان معنی است که هر پیوند داخلی در وب سایت باعث می شود که Session ID به URL خود اضافه شود ، و به دلیل اینکه Session ID منحصر به فرد برای آن جلسه است ، یک URL جدید ایجاد می کند ، و بنابراین محتوای آن را کپی می کند.

پارامترهای URL مورد استفاده برای ردیابی و مرتب سازی

علت دیگر ایجاد محتوای تکراری استفاده از پارامترهای URL است که محتوای یک صفحه را تغییر نمی دهد ، به عنوان مثال در پیگیری لینک ها. می بینید ، در موتور جستجو ،

http://www.example.com/keyword-x/ و

http://www.example.com/keyword-x/?source=rss همان URL نیستند.

دومی ممکن است به شما امکان پیگیری این را بدهد که منبع از کجا آمده ، اما همچنین ممکن است رتبه بندی را برای شما دشوارتر کند – یک اشکال ناخواسته!

البته این فقط به دنبال ردیابی پارامترها نمی رود، بلکه برای هر پارامتر شما می توانید به URL اضافه کنید که محتوای حیاتی را تغییر ندهد ، خواه این پارامتر برای “تغییر مرتب سازی بر روی مجموعه ای از محصولات” باشد یا “نشان دادن نوار کناری “: همه آنها باعث تکرار شدن می شوند.

Scraper و سندیکای محتوا

بیشتر دلایل محتوای تکراری یا “تقصیر” شما یا وب سایت شماست. با این وجود ، بعضی اوقات وب سایتهای دیگر با رضایت شما از مطالب شما استفاده می کنند. آنها همیشه به مقاله اصلی شما پیوند نمی دهند ، بنابراین موتور جستجوگر آن را دریافت نمی کند و باید با نسخه دیگری از همان مقاله مقابله کند. هرچه سایت شما محبوب تر شود ، اسکرابر بیشتر خواهید شد و این مشکل بزرگتر و بزرگتر می شود.

ترتیب پارامترها

یکی دیگر از دلایل شایع این است که CMS از URL های تمیز استفاده نمی کند ، بلکه URL هایی مانند /?id=1&cat=2 ، جایی که شناسه به مقاله و مجموعه به این دسته اشاره می کند. URL /?cat=2&id=1 در اکثر سیستم های وب سایت نتایج مشابهی ارائه می دهد ، اما برای موتور جستجو کاملاً متفاوت هستند.

صفحه بندی نظر

در وردپرس و حتی در برخی از سیستمهای دیگر ، گزینه ای برای پیوند زدن به نظرات شما وجود دارد. این منجر به تکثیر مطالب در URL مقاله و URL مقاله + / نظر-صفحه-1 / ، / نظر-صفحه-2 / و غیره می شود.

صفحات سازگار با چاپگر

اگر سیستم مدیریت محتوا شما صفحات سازگار با چاپگر ایجاد کند و شما به صفحات مقاله خود پیوند دهید ، Google معمولاً آنها را پیدا می کند ، مگر اینکه به طور خاص آنها را مسدود کنید. حال ، از خود بپرسید: شما کدام نسخه را می خواهید Google نشان دهد؟ یکی با تبلیغات و محتوای جانبی ، یا موردی که فقط مقاله شما را نشان می دهد؟

WWW در مقابل غیر WWW

این یکی از قدیمی ترین مشکلات در سئو سایت است ، اما بعضی اوقات موتورهای جستجوگر اشتباه می کنند: WWW در مقابل محتوای کپی غیر WWW ، در صورت دسترسی هر دو نسخه از سایت شما. یکی دیگر از وضعیتهای کمتر رایج اما موردی که من نیز دیده ام HTTP در مقابل محتوای تکراری HTTPS است که در آن محتوای مشابه بیش از هر دو ارائه می شود.

راه حل مفهومی: یک URL “متعارف”

همانطور که قبلاً دیدیم ، این واقعیت که چندین URL منجر به همان محتوا می شوند ، یک مشکل است ، اما می توان آن را حل کرد. شخصی که در یک نشریه کار می کند به طور معمول قادر خواهد بود به راحتی به شما بگوید نشانی اینترنتی “صحیح” برای یک مقاله خاص چیست ، اما گاهی اوقات وقتی از سه نفر در همان شرکت سؤال می کنید ، سه جواب متفاوت دریافت خواهید کرد …

این مشکلی است که نیاز به آدرس دهی دارد زیرا در پایان ، فقط یک (URL) وجود دارد. آن URL صحیح برای بخشی از مطالب توسط موتورهای جستجو به URL Canonical گفته می شود.

Canonical چیست؟

Canonical اصطلاحی است که ناشی از سنت کاتولیک رومی است ، جایی که لیستی از کتب مقدس ایجاد شده و به عنوان اصلی پذیرفته شده است. آنها به عنوان انجیل های متعارف عهد جدید شناخته می شدند. طعنه آمیز این است که کلیسای کاتولیک رومی حدود 300 سال طول کشید و دعواهای بیشماری برای تهیه این فهرست متعارف به دست آورد و آنها سرانجام چهار نسخه از همین داستان را انتخاب کردند …

شناسایی مسائل مربوط به مطالب تکراری

شاید ندانید که آیا مسئله محتوای تکراری را در سایت خود دارید، استفاده از Google یکی از ساده ترین راه ها برای مشاهده مطالب تکثیر است.

چندین ترفند جستجو وجود دارد که در مواردی مانند اینها بسیار مفید هستند. اگر می خواهید تمام آدرس های اینترنتی موجود در سایت خود را که حاوی مقاله کلمه X شما است ، پیدا کنید ، عبارت جستجو زیر را در Google تایپ کنید:

site:example.com intitle:”keyword”

Google سپس تمام صفحات را به شما نشان می دهد که حاوی آن کلمه کلیدی هستند. هرچه بخشی خاص تر از درخواست را پیدا کنید ، می توانید محتوای تکراری را از بین ببرید. می توانید از همان روش برای شناسایی محتوای تکراری در سراسر وب استفاده کنید. بیایید بگوییم که عنوان کامل مقاله شما “کلید واژه X – چرا عالی است” است ، می توانید جستجو کنید:

intitle:”Keyword X – why it is awesome”

و Google به تمام سایت هایی که با آن عنوان مطابقت دارند می دهد. بعضی اوقات حتی ارزش جستجو برای یک یا دو جمله کامل از مقاله شما نیز وجود دارد ، زیرا ممکن است برخی از اسکرابرها عنوان را تغییر دهند. در برخی موارد ، هنگامی که شما چنین جستجویی را انجام می دهید ، ممکن است Google در آخرین صفحه نتایج اعلانی مانند این نشان دهد:

راه حل های عملی برای محتوای تکراری

هنگامی که تصمیم گرفتید که یک URL متعارف برای محتوای شما باشد ، باید فرایند کانونیالیزاسیون را شروع کنید.

این بدان معنی است که ما باید به نسخه های عادی یک صفحه تاکید و به موتورهای جستجو اجازه دهیدم آن را پیدا کنند. با اولویت چهار روش برای حل مسئله وجود دارد:

اعلام اینکه این محتوای تکراری نیست
هدایت محتوای تکراری به URL متعارف
اضافه کردن یک عنصر پیوند کانونی به صفحه تکراری
افزودن کد 301 از صفحه تکراری به صفحه کانونی

جلوگیری از محتوای تکراری

اگر مشکل شما به راحتی برطرف نشده است ، بازهم ارزش دارد تلاش کنید. هدف باید این باشد که از انتشار محتوای تکراری به طور کلی جلوگیری کنیم ، زیرا این راه حل بهترین راه حل است.

301 تغییر مسیر محتوای تکراری

ریدایرکت 301
ریدایرکت 301

در بعضی موارد ، جلوگیری از ایجاد سیستم URL های اشتباه برای محتوا ، کاملاً غیرممکن است ، اما گاهی اوقات امکان تغییر مسیر مجدد وجود دارد. اگر این مسئله برای شما منطقی نیست (که می توانم آن را درک کنم) ، هنگام صحبت با توسعه دهندگان خود ، آن را در خاطر داشته باشید. اگر از برخی از محتوای محتوای تکراری خلاص شده اید ، مطمئن شوید که تمام URL های قدیمی محتوای تکراری را به URL های متعارف مناسب هدایت کنید.

با استفاده از پیوندها

گاهی اوقات شما نمی خواهید یا نمی توانید از نسخه تکراری یک مقاله خلاص شوید ، حتی اگر می دانید که این URL اشتباه است. برای حل این مسئله خاص ، موتورهای جستجو عنصر پیوند کانونی را معرفی کرده اند. در بخش سایت شما قرار می گیرد:

در قسمت href از پیوند کانونی ، URL صحیح کانونی برای مقاله خود قرار می دهید.

هنگامی که یک موتور جستجوگر این عنصر پیوند را پیدا کند ، یک تغییر مسیر 301 را انجام می دهد و پیوند جمع آوری شده توسط آن صفحه را به صفحه متعارف شما منتقل می کند.

این روند کمی آهسته تر از تغییر مسیر 301 است ، بنابراین اگر شما فقط می توانید یک تغییر مسیر 301 را انجام دهید که ترجیحاً همانطور که توسط جان مولر گوگل ذکر شده است انجام دهید .

1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5٫00 out of 5)
Loading...

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *