محتوای تکراری: دلیل و راه حل ها

files-folders-pc-transfer-move
۱۱ آذر ۱۳۹۶
|
0 نظرات
|
این مقاله را با دوستان‌تان به اشتراک بگذارید

موتور های جستجویی مثل گوگل یک مشکل دارند به نام ” محتوای مضاعف شده “. محتوای مضاعف شده به این معناست که یک محتوی در چند موقعیت (آدرس) در وب نمایش داده می شود. به عنوان یک نتیجه ی جستجو، موتور های جستجو نمی دانند کدام آدرس را در نتایج جستجو نشان دهند. این می تواند به رتبه ی یک وب سایت آسیب بزند. مخصوصا زمانی که مردم همه ی چند نسخه ی محتوی را پیوند (link) می دهند، مشکل بزرگ تر می شود. در این قسمت می خواهیم به شما دلایل مختلف  محتوای مضاعف شده، و راه حلی برای آن را به شما نشان دهیم.

شما می توانید محتوای مضاعف شده را به بودن در یک تقاطع تشبیه کنید. تابلو ها دو مسیر مختلف را برای رسیدن به یک مقصد نشان می دهند: کدام مسیر را باید انتخاب کنید؟ و حالت بدتر این است که مقصد ها نیز به صورت نامحسوسی مختلف باشند. به عنوان یک خواننده، شما اهمیتی نمی دهید: شما به مطلبی که می خواهید می رسید. یک موتور جستجو باید یکی را برای نمایش در نتایج جستجو انتخاب کند و قطعا نمی خواهد یک مطلب را دوبار نشان دهد.

فرض کنیم مقاله ی شما در مورد “کلمه ی کلیدی x” در http://www.example.com/keyword-x/ نمایان می شود و دقیقا همان محتوی در

http://www.example.com/article-category/keywordx/ موجود است. این موقعیت زیاد داستانی نیست. این اتفاق در بسیاری از سیستم های مدیریت محتوی رخ می دهد. مقاله ی شما توسط چند وبلاگ نویس برداشته شده است. بعضی از آنها به اولین آدرس و بعضی دیگر به دومین پیوند می دهند. اینجاست که موتور جستجو طبیعت خودش را نشان می دهد: این مشکل شماست. این محتوای مضاعف شده مشکل شماست زیرا آن پیوند ها آدرس های مختلفی را ارائه می دهند. اگر همه ی آنها به آدرس یکسانی پیوند می دادند شانس شما برای رتبه ی بهتر برای “کلمه ی کلیدی x” بالاتر می رفت.

جدول محتوی ها

  1. دلایل محتوای مضاعف شده
    • سوء تفاهم مفهوم آدرس
    • شناسه نشست (Session ID) (در یک عبارت کوتاه مشخصه‌ای است جهت شناسایی یک نشست مجاز، تعقیب عملیات مورد درخواست و فعل و انفعال منظم با او! بدین ترتیب سرویس دهنده گذشته‌اش را به یاد می‌آورد و از حال Stateless (بدون حالت) به Stateful (حافظ حالت) تبدیل می‌شود.)
    • پارامتر های آدرس، استفاده شده برای ردیابی و مرتب سازی

(یک پارامتر آدرس یک متغییری در آدرس وب است که بعد از علامت سوال (؟) ظاهر می شود.آنها همچنین رشته های پرس جو یا مسیر های جستجو نامیده می شوند ، و گاهی اوقات آنها اضافه می شوند به منظور پیگیری یک آدرس خاص که در این صورت آنها پارامتر های ردیابی نامیده می شوند.)

  • سایت های اسکریپر(Scraper) (سایت هایی می باشند که صفحات خود را با کپی برداري از دیگر صفحات موجود در وب پر می کنند. انواع گوناگونی دارند: از سایت های اسپم ساز و فروشگاه های اینترنتی تا موتور های جستجویی مثل Yahoo و نقشه های آنلاین مثل Google Maps) و سندیکای محتوی
  • ترتیب پارامترها
  • صفحه بندی نظر
  • صفحه های مناسب با پرینت
  • WWW /بدون-WWW

  1. راه حل مفهومی: یک آدرس “کانونی” (canonical URLs)

  1. شناسایی مسائل محتوای مضاعف شده
    • ابزار های وب مستر گوگل (وب مستر به طراحان و توسعه دهندگان وب‌سایت، مدیران وب‌سایت و وبلاگ و تمامی افرادی که در مدیریت یک وبگاه نقش دارند گفته می‌شود.)
    • جستجو برای عنوان ها یا اسنیپت ها

  1. راه حل های عملی برای محتوای مضاعف شده
    • جلوگیری از محتوای مضاعف شده
    • تعییر مسیر ۳۰۱ محتوای مضاعف شده
    • استفاده از پیوند های rel=”canonical”
    • پیوند به محتوای اصلی

  1. نتیجه: محتوای مضاعف شده درست شدنی است، و باید رفع شود

  1. دلایل محتوای مضاعف شده

ده ها دلیل برای ایجاد محتوای مضاعف شده وجود دارد. بیشتر آنها فنی هستند: خیلی اتفاق نمی افتد که یک انسان تصمیم بگیرد محتوای یکسانی را در دو محل خاص قرار دهد آن هم بدون تشخیص منبع اصلی… این برای بیشتر ما غیرطبیعی است. دلایل فنی نیز خیلی هستند. این غالبا به این خاطر اتفاق می افتد که توسعه دهندگان همانند یک مرورگر یا یک کاربر فکر نمی کنند،چه برسد به یک عنکبوت موتور جستجو(آنها نرم افزار یا اسکریپت اتوماتیکی هستند که لینک های اینترنتی را به یک الگوریتم مشخص و هدفمند دنبال می کنند و به وب سایت های مختلف سر می زنند و محتوای موجود در صفحات وب سایت را برای پایگاه داده های موتورهای جستجو ایندکس می کنند تا این پایگاه داده همیشه به روز باشد)… آنها همانند یک توسعه دهنده فکر می کنند. همان مقاله ی ذکر شده که در http://www.example.com/keyword-x/ و

http://www.example.com/article-category/keyword-x/

وجود دارد… اگر از توسعه دهنده بپرسید، او می گوید فقط یک جا وجود دارد.

  • سوء تفاهم مفهوم یک آدرس

آیا یک توسعه دهنده دیوانه شده است؟ خیر، فقط دارد با زبانی دیگر صحبت می کند. می بینید که کل وب سایت احتمالا توسط یک سیستم پایگاه داده راه اندازی شده است. در آن پایگاه داده، فقط یک مقاله وجود دارد، نرم افزار وبسایت فقط به همان مقاله اجازه می دهد تا از طریق چندین آدرس بازیابی شود. زیرا در چشم های توسعه دهنده، شناسه منحصر به فرد برای آن مقاله، شناسه ای است که آن مقاله در پایگاه داده دارد، نه آدرس. در حالی که برای موتور جستجو، آدرس، شناسه منحصر به فرد برای یک محتواست. اگر این را برای یک توسعه دهنده توضیح دهید، او شروع به درک قضیه می کند. و بعد از خواندن این مقاله، شما می توانید به او سریعا راه حلی ارائه دهید.

  • شناسه ی نشست

شما غالبا می خواهید مسائل بازدید کنندگانتان را پیگیری کنید و برای مثال این امکان را فراهم آورید که اقلامی که می خواهند بخرند را در سبد خرید آنها ذخیره کنید. برای این کار، نیاز است به آنها شناسه ای دهید. یک شناسه اساسا تاریخچه ای کوتاه از آنچه یک بازدید کننده در سایت شما انجام داده است می باشد، و می تواند شامل چیزهایی از قبیل اقلام داخل سبد آنها باشد. برای حفظ این شناسه همان طور که یک بازدیدکننده از یک صفحه به صفحه ای دیگر می رود شناسه منحصر به فرد برای آن نشست، همان شناسه ی نشست، باید در محلی دیگر ذخیره شود. رایج ترین راه حل این است که آن را با استفاده از کوکی ها انجام دهید.

در آن مرحله، بعضی از سیستم ها برمی گردند تا ازهمان شناسه ی نشست در آدرس استفاده کنند. این یعنی هر پیوند درونی در وب سایت آن شناسه ی اضافه شده به آدرس را می گیرد، و چون آن شناسه ی نشست برای آن نشست منحصر به فرد است، آدرس جدیدی را می سازد و این گونه محتوی را مضاعف می کند.

  • پارامتر های آدرس، استفاده شده برای ردیابی و مرتب سازی

علتی دیگر برای محتوای تکراری استفاده از “پارامتر های آدرس”ی است که که محتوای یک صفحه را تغییر نمی دهند، برای مثال در ردیابی پیوندها. می بینید که http://www.example.com/keyword-x/ و

http://www.example.com/article-category/keyword-x/

در واقع دو آدرس یکسان برای یک موتور جستجو نیستند. شاید دومی به شما اجازه دهد که ردیابی کنید مردم از چه منبعی وارد شدند، اما کسب یک رتبه ی خوب را نیز برای شما سخت تر می کنند، عوارض جانبی ناخواسته!

البته این فقط برای ردیابی پارامتر ها نیست و برای هر پارامتری که شما بتوانید به آدرسی که محتوای ضروری را تغییر نمی دهد اضافه کنید، درست است. آن پارامتر چه برای “تغییر طبقه بندی برای دسته ای از محصولات باشد” چه برای “نمایش سایدباری (sidebar) دیگر”: همه سبب محتوای تکراری می شوند.

  • اسکریپرها و سندیکای محتوی

مسبب بیشتر علل محتوای تکراری خودتان هستید، یا حداقل اشکال سایت شما، گاهی اوقات وبسایت های دیگر از محتوای شما ،با آگاهی شما یا بدون آن، استفاده می کنند. آن ها همیشه به مقاله ی اصلی شما پیوند نمی دهند، و در این حالت موتور جستجو این را “نمی فهمد” و باید با نسخه ای دیگر از مقاله ی شما کنار بیاید. هرچه سایت شما مشهور تر شود، اسکریپر های بیشتری خواهید داشت، که این مسئله را بزرگ و بزرگ تر می کنند.

  • ترتیب پارامترها

علت رایج دیگر این است که یک سی ام اس یا سامانه ی مدیریت محتوی (به انگلیسی : Content Management System یک برنامه رایانه‌ای است که امکان انتشار، ویرایش و مدیریت محتوا، سازماندهی، حذف و همچنین نگهداری از طریق یک رابط مرکزی فراهم می‌کند) از آدرس های پاک و مناسب استفاده نمی کند، بلکه از آدرس هایی همچون /?id=1&cat=2 ، که  id به مقاله و cat به دسته (category) رجوع داده می شود. آدرس /?cat=2&id=1 همان آدرس را به بیشتر سیستم های وبسایت تحویل می دهد (render)، درحالی که آن دو برای یک موتور جستجو کاملا متفاوت اند.

  • صفحه بندی نظرات

در وردپرس محبوب من، و همچنین در بعضی سیستم های دیگر، گزینه ی دیگری برای صفحه بندی نظراتتان وجود دارد. این منجر به تکرار مطلب در سراسر آدرس مقاله می شود.

  • صفحه های مناسب پرینت

اگرسامانه ی مدیریت محتوای شما صفحه های مناسب پرینت می سازد و شما در صفحات سایت خود به آنها پیوند می دهید، در بیشتر موارد گوگل آنها را پیدا می کند، مگر این که شما به طور خاص آنها را بلاک کنید. حال گوگل چه نسخه ای را باید نشان دهد؟ آن یکی که پر شده از تبلیغات و مطالب خارجی یا آن یکی که با مقاله ی شماست؟

  • WWW /بدون-WWW

از قدیمی ترین ثبت شده ها، ولی بعضی اوقات موتورهای جستجو اشتباه می کنند: تکرار مطالب از نوع “WWW/بدون-WWW”، وقتی که هر دو نسخه ی سایت شما قابل دسترسی اند. یک موقعیت کمتر رایج که من دیده ام: تکرار مطالب از نوعhttps /http که محتوای یکسان بر روی هر دو وجود دارد.

۲ راه حل مفهومی: یک آدرس “کانونی”

همان طور که بالا مشخص شده، این واقعیت که چندین آدرس به یک محتوی می رسند یک مشکل است، اما نی تواند حل شود. کسی که در یک انتشارات کار می کند معمولا می تواند به سادگی به شما بگوید که چه آدرسی برای یک مقاله ی مشخص باید درست باشد. با این وجود، خنده دار این است که بعضی اوقات که شما از سه نفر که در یک شرکت کار می کنند می پرسید سه جواب متفاوت می دهند…

آن مشکلی است که در آن موارد نیاز به حل شدن دارد، زیرا در انتها، فقط یک آدرس می تواند وجود داشته باشد. آن آدرس درست برای قطعه ای محتوی، توسط موتور های جستجو آدرس کانونی را مضاعف کرده است.

  1. شناسایی مسائل مطالب تکراری

ممکن است نفهمید که مشکل محتوای تکراری را با سایتتان دارید یا با محتوایتان. بگذارید روش هایی برای پی بردن به آن معرفی کنم.

  • ابزار های وب مستر گوگل

ابزار خوبی برای شناسایی محتوای تکراری. اگر به این مکان برای سایتتان می روید، قسمت ظاهر جستجو>> ارتقای HTML

(Search Appearance » HTML Improvements) را نگاه بیندازید. این را می بینید:

اگر صفحه ها عناوین یا توضیحات اضافه دارند دارند، این اصلا چیز خوبی نیست. کلیک بر روی آن آدرس هایی که عناوین یا توضیحات تکراری دارند را آشکار خواهد کرد و به شما کمک می کنند مشکل را شناسایی کنید. مسئله این است که اگر شما مقاله ای مثل “کلمه ی کلیدی x” دارید، و در دو دسته بندی ظاهر می شود، احتمالا عناوین باید متفاوت باشند. برای مثال باید ایم گونه باشند:

کلمه ی کلیدی x  – دسته بندی x – متن

کلمه ی کلیدی x  – دسته بندی y – متن

گوگل آنها را به صورت عناوین تکراری برنخواهد داشت اما شما می توانید آنها را از طریق “جستجو” پیدا کنید.

  • جستجو برای عناوین و اسنیپت ها

چندین “اپراتور سرچ” .جود دارند که برای مواردی مثل این خیلی مفیدند. اگر ی خواهید همه ی آدرس هایی را که درون سایتتان شامل Keyword x می باشند پیدا کنید، این عبارت جستجو را در گوگل وارد کنید:

site:example.com intitle:”Keyword X”

سپس گوگل تمام صفحاتی را که در آن سایت در مورد آن مطلب وجود دارد را به شما نشان خواهد داد. هرچه آن قسمت عنوان را خاص تر کنید، پیدا شدن مطالب تکراری آسان تر خواهد شد. شما می توانید از همین روش برای شناسایی مطالب تکراری در وب استفاده کنید. فرض کنید عنوان کامل مقاله ی شما “Keyword X – why it is awesome” می باشد. شما جستجو خواهید کرد:

intitle:”Keyword X – why it is awesome”

و گوگل همه ی صفحات با آن عنوان را برای شما خواهد آورد. گاهی اوقات ارزشش را دارد که حتی یک یا دو جمله ی کامل را از مقاله تان جستجو کنید، چون ممکن است بعضی اسکرپر ها عنوان را تغییر دهند. در بعضی موارد وقتی مثل آن جستجو می کنید،گوگل ممکن است در آخرین صفحه ی نتایج این تذکر را نشان دهد:

این نشانه ای است که گوگل برای نتایج دزدگیر گذاشته است. این هنوز خوب نیست، پس ارزشش را دارد بر روی لینک کلیک کنید و همه ی نتایج را ببینید تا ببینید آیا می توانید آنها را درست کنید.

۴ راه حل های عملی برای مطالب تکراری

یک بار که تصمیم گرفتید کدام آدرس، آدرس کانونی محتوایتان باشد، باید پروسه ی کانونی کردن را شروع کنید. این اساسا به این معنی است که اجازه دهیم موتور جستجو در مورد نسخه ی کانونی یک صفحه مطلع شود و آن را سریعا پیدا کند. به ترتیب اولویت چهار روش برای حل این مشکل وجود دارد:

  1. نساختن محتوای تکراری
  2. تغییر مسیر نحتوای مضاعف به آدرس کانونی
  3. اضافه کردن ابزار لینک کانونی به صفحه ی تکراری
  4. اضافه کردن یک لینک HTML از صفحه ی تکراری به صفحه ی کانونی

  • دوری از مطلب تکراری

duplicate-content-1

بعضی از علل بالا برای مطالب تکراری راه حل های ساده ای دارند:

  • شناسه ی نشست در آدرس هایتان وجود دارد؟

به سادگی از تنظیمات سیستم خود می توان آنها را غیرفعال کرد.

  • صفحه های مناسب پرینت مضاعف شده دارید؟

این ها کاملا غیرضروری اند: شما فقط باید از Print Style Sheet استفاده کنید.

  • از صفحه بندی نظرات در وردپرس استفاده می کنید؟

شما فقط باید این ویژگی را غیرفعال کنید (در تنظیمات>> بحث) (setting » discussion)

  • پارامتر ها در ترتیبی دیگر می باشند؟

به برنامه نویس خود بگویید تا یک پردازه یا اسکریپت (script) بسازد تا پارامترها را همواره طبق یک ترتیب یکسان مرتب کند ( از این غالبا به عنوان یک کارخانه ی آدرس یاد می شود.)

  • مشکلاتی پیرامون ردیابی لینک ها دارید؟

در بیشتر موارد، شما می توانید از ردیابی کمپین به وسیله ی هشتگ به جای استفاده از پارامترها کمک بگیرید.

  • مشکلات WWW/بدون-WWW؟

یکی را انتخاب کرده و به وسیله ی تغییر مسیر از یکی به دیگری، به همان پایبند باشید. همچنین می توانید اولویت بندی ای را در ابزارهای وب مستر گوگل ترتیب ببینیدو ولی باید هر دو نسخه ی نام دامنه (آدرس – domain)  را مطالبه کنید.

اگر نتوانستید مشکلتان را به این راحتی حل کنید، شاید ارزش این را داشته باشد که کمی برایش تلاش کنید. هدف این است که از نمایش همزمان محتوای تکراری جلوگیری شود. این تا الان بهترین راه حل بوده است.

  • تغییر مسیر ۳۰۱ محتوای تکراری

در بعضی موارد، غیرممکن است که به طور کامل جلوی سیستمی که استفاده می کنید را از ساختن آدرس های نادرست برای محتوی گرفت، اما می توان تغییر مسیر داد. اگر این برای شما منطقی نیست ( که من درک می کنم)، وقتی با توسعه دهندگان خود صحبت می کنید آن را در نظر داشته باشید. اگر از مشکلات مطالب تکراری خلاص می شوید، مطمئن شوید که همه ی آدرس های محتواهای تکراری قدیمی را به آدرس های کانونی مناسب تغییر مسیر می دهید.

  • استفاده از پیوند های rel=”canonical”

بعضی اوقات نمی خواهید یا نمی توانید از شر یک نسخه ی قدیمی مقاله ای خلاص شوید و حتی وقتی می دانید که آن آدرس اشتباهی است. برای این مسئله ی خاص، موتور های جستجو ابزار لینک کانونی را معرفی کرده اند. این ابزار در بخش<head> سایت شما قرار گرفته و این گونه است:

<link rel=”canonical” href=”http://example.com/wordpress/seoplugin/>;

درقسمت href  لینک کانونی، آدرس کانونی درست را برای مقاله تان قرار می دهید. وقتی موتور جستجویی که از لینک کانونی پشتیبانی می کند این ابزار لینک را پیدا می کند، چیزی را اجرا می کند که اساسا یک تغییر مسیر نرم ۳۰۱ است. بیشتر ارزش لینک که توسط آن صفحه به دست آمده را به صفحه ی کانونی شما انتقال می دهد. هرچند این پروسه کمی کند تر از تغییر مسیر ۳۰۱ است، پس اگر بتوانید یک تغییر مسیر ۳۰۱ انجام دهید بهتر است.

  • پیوند به محتوای اصلی

اگر نتوانستید هیچ کدام از موارد بالا را انجام دهید، احتمالا چون نمی توانید بخش <head> سایتی که محتوایتان در آن ظاهر می شود را کنترل کنید، افزودن پیوندی به مطلب اصلی در بالا یا پایین مقاله همیشه راه خوبی است. این شاید چیزی باشد که شما می خواهید در *RSS feed خود انجام دهید: افزودن پیوندی برگشتی به مقاله ای که در آن است. بعضی از اسکریپرها آن پیوند را حذف کنند، ولی بعضی آن را باقی می گذارند. اگر گوگل با چند پیوند منتهی به مقاله ی شما مواجهه شود، زود متوجه خواهد شد که آن نسخه ی کانونی مقاله است.

*)هم‌نشری سراسر ساده] یا آراس‌اس Rich Site Summary یا RSS خانواده‌ای از قالب‌های خورد فید در وب است که برای انتشار محتویاتی که در بازه‌های زمانی خاص به‌روزرسانی می‌شوند مانند وب‌نوشتها، عناوین اخبار، و پادکستها استفاده می‌گردد.(

۵ نتیجه: محتوای مضاعف شده درست شدنی است و باید رفع شوند

محتوای تکراری همه جا رخ می دهد. من تا الآن با بیش از ۱۰۰۰ صفحه برخورد کرده ام که حداقل یک مشکل کوچک محتوای تکراری نداشته اند. این چیزی است که که شما نیاز دارید همواره روی آن نظارت داشته باشید. اما به هر حال درست شدنی است، و پاداش بعد از آن نیز زیاد خواهد بود. محتوای با کیفیت شما شاید در رتبه بندی ها اوج بگیرد تنها با خلاص شدن از محتوای تکراری در سایتتان!

 

عضویت در خبرنامه آکادمی

با عضویت در خبرنامه هر شنبه به صورت صد در صد رایگان آخرین و داغ‌ترین مباحث روز بازاریابی را در ایمیل خود دریافت کنید.

envelope-o
این مقاله را با دوستان‌تان به اشتراک بگذارید

دریافت رایگان کتاب ۷ مزیت میلرلایت
 بر سایر سیستم های ایمیل مارکتینگ

کتاب رایگان ۷ اصل اساسی برای برندسازی

۷ اصل اساسی در برند سازی و برندینگ

برندسازی تنها راه افزایش قطعی فروش و درآمد شماست. داشتن چهره‌ای متفاوت از سایر رقباست که باعث می‌شود نسبت به دیگران ترجیح داده شوید.

همین الان این کتاب را به رایگان در ایمیل خود دریافت کنید

x