تا به حال فکر کرده اید که موتورهای جستجو چگونه سایت شما را مشاهده می کنند؟ اصلاً می دانید که موتور جستجو چگونه صفحات سایت شما را ارزش گذاری می کنند؟ در جواب تان باید بگوییم: سایت مپ.

اینترنت دنیایی بزرگ است و روز به روز با سرعت زیادی، رشد خود را ادامه می دهد. بر اساس مطالعات انجام شده توسط سایت Netcraft در سال ۲۰۱۲، بیش از نیم میلیارد سایت در اینترنت وجود دارد (اگر دقیق تر بگوییم حدود ۶۴۴,۲۷۵,۷۵۴ سایت در فضای مجازی وجود دارد که البته همانطور که گفتیم این آمار مربوط به سال ۲۰۱۲ است) و مطمئناً این مقدار تا سال ۲۰۱۶ افزایش چشمگیری داشته است.

حالاسوال اینجاست که صاحبان سایت های کوچک برای ایندکس شدن محتوای خود باید چه کاری انجام دهند؟ دانستن این نکته، بخش مهمی از روند بهینه سازی سایت شما محسوب می شود. در پاسخ باید گفت یکی از بهترین ابزارها برای تغذیه کردن موتورهای جستجو، سایت مپ یا همان نقشه سایت مبتنی بر XML است.

سایت مپ چیست؟

سایت مپ در واقع، فایلی است که لیستی از مهم ترین محتواهای موجود در سایت را در بر دارد تا کراولر های موتورهای جستجو بتوانند به راحتی سایت را ایندکس کنند. در مقابل این نوع Sitemap یک نوع نقشه سایت دیگر نیز وجود دارد (که با حروف کوچک نوشته می شود: sitemap) که مبتنی بر HTML است و در آن لیستی از مهم ترین فایل های موجود در سایت قرار دارد. این نوع نقشه سایت، بیشتر برای کاربران انسانی مورد استفاده قرار می گیرد تا بتوانند محتوای موجود در سایت را بیابند و از آن استفاده کنند.

موتورهای جستجو از نقشه سایت XML استفاده می کنند تا ساختار سایت ها را یاد بگیرند. باید به خاطر داشته باشید که قرار دادن URL صفحاتِ سایت در سایت مپ، حضور سایت در ایندکس های جستجو را تضمین می کند.

این موضوع به این معنی است که اگر نقشه سایتی از کدهای XML خوب استفاده کند، آدرس های معتبر و تمیزی را برای کارولرها فراهم کند و سایر نیازمندی های موتور های جستجوگر را برآورده سازد، URL های موجود در آن در Crawl های بعدی مورد توجه قرار خواهند گرفت. همین امر شانس دیده شدن صفحات مختلف در موتورهای جستجوگر را افزایش می دهد. اگرچه سایت مپ در هر شرایطی برای وبسایت مفید خواهد بود، اما در شرایط زیر بسیار موثر و کارساز است:

  • داشتن یک سایت جدید با صفحات جدیدی که هنوز به خوبی به آنها لینک داده نشده است (لینک داخلی و خارجی).
  • سایت هایی که از URL های داینامیک برای محتوای خود استفاده می کنند.
  • سایت هایی که محتوای آرشیو شدۀ آنها به خوبی به صفحات فعال، لینک نشده اند.
  • سایت هایی که تشخیص و شناسایی صفحاتشان بسیار دشوار است یا دارای محتوای غیر متنی سنگین، مانند فلش هستند.

می توان گفت سایت مپ ها، در واقع ابزاری برای خوراک دادن و شناساندن سایت به موتورهای جستجوگر هستند.

ساختار نقشه سایت XML

همه موتورهای جستجوی مهم از پروتکل های XML رسمی که در سایت Sitemaps.org تعریف شده است، استفاده می کنند. نمونه کد XML که در سایت مپ مورد استفاده قرار می گیرد را در ادامه مشاهده می کنید:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2012-04-30</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.com/about-us.html</loc>
<changefreq>yearly</changefreq>
<priority>0.4</priority>
</url>
</urlset>

کدهای XML سایت مپ حاوی تگ های اختیاری و الزامی هستند. کدهای XML معتبر با تگ های شروع (بازشونده) “<?xml> “  آغاز می شوند و این یک صفت الزامی است. سپس این تگ با تگ دیگری همچون “<urlset>” دنبال می شود که حاوی حداقل یک صفت Xmlns است که ساختار کلی XML را تعریف می کند.

هر آدرسی که در سایت مپ قرار می گیرد باید دارای دو تگ <url> و یک تگ <loc> باشد. بقیه تگ ها اختیاری هستند. تگ هایی که در نقشه سایت XML مورد استفاده قرار می گیرد را در جدول زیر مشاهده می کنید:

حتما بخوانید:  لینک بیلدینگ چیست و چه اهمیتی دارد؟
تگ ها وضعیت توضیحات
<?xml> الزامی تگ آغازین فایل نیازمند دو مورد زیر است:

  • version=”۱٫۰″
  • encoding=”UTF-8″
<urlset> الزامی تنها یکبار مورد استفاده قرار می گیرد. این تگ حاوی صفت فضای نام الزامی است. گوگل از فضای نام و مقادیر نیز برای انواع داده های ترکیبی استفاده می کند که شامل موارد زیر است:

  • xmlns=” http://www.sitemaps.org/ schemas/ sitemap/ 0.9″
  • تصاویر:
    xmlns:image= http://www.google.com /schemas/ sitemap-image/1.1
  • ویدئو:
    xmlns:video=” http://www.google.com /schemas/ sitemap-video/1.1″
  • موبایل:
    xmlns:mobile=” http://www.google.com /schemas/ sitemap-mobile/1.0″
  • جستجوی کد:
    xmlns:codesearch=” http://www.google.com /codesearch/ schemas/ sitemap/ 1.0″
  • اخبار:
    xmlns:news=” http://www.google.com /schemas /sitemap-news/ 0.9″
<url> الزامی تگ والِد برای هر آدرسی افزوده شده است. بقیه تگ ها در داخل این تگ قرار می گیرد.
<loc> الزامی آدرس صفحات سایت است. از آدرس کامل که حاوی پروتکل است استفاده کنید. این  مقدار نباید از ۲۰۴۸ کاراکتر بیشتر باشد.
<lastmod> اختیاری تاریخ آخرین به روزرسانی صفحه مورد نظر است که به شکل YYYY-MM-DD نوشته می شود.
<changefreq> اختیاری موتورهای جستجوگر، تعداد تجدید نظر و بروزرسانی صفحه را به عنوان یک مقدار در نظر گرفته می گیرند. مقادیر معتبر شامل موارد زیر است:

  • همیشه (هر زمانی که صفحه در دسترس باشد تغییر می کند.)
  • ساعتی
  • روزانه
  • هفتگی
  • ماهانه
  • سالانه
  • هرگز
<priority> اختیاری میزان اولویت یک صفحه، نسبت به سایر صفحات سایت است. مقادیر معتبر محدوده ۰ تا ۱ را شامل می شود که مقدار پیش فرض ۰٫۵ است.

 

فرمت فایل نقشه سایت و انواع آن

موتورهای جستجوی گوگل و بینگ، فرمت XML را برای نقشه سایت به عنوان یک پروتکل پذیرفته اند. با این حال، آنها Feed نقشه سایت را که از پروتکل های RSS 2.0، Atom 1.0 و فایل های متنی ASCII استفاده می کنند را نیز می پذیرند. سایت مپ را می توان به شکل XML نیز مورد استفاده قرار داد یا در صورتی که حجم بالایی دارد با استفاده از ابزار Gzip، فشرده سازی کرد.

علاوه بر استانداردهای نقشه سایت برای محتوای وب، گوگل از فرمت های خاصی برای سایت مپ پشتیبانی می کند که برای رسانه های خاصی مورد استفاده قرار می گیرد. این موارد شامل نقشه هایی برای فایل های ویدئویی، تصاویر، محتوای موبایلی، کد منبع نرم افزار و محتوای خبری هستند. بعد از اینکه فرمت مناسب نقشه سایت در فضای نام اعلام شد، می توان تمامی محتواهای اضافی دیگر را به آن افزود.

نکات مهم درباره فرمت فایل سایت مپ

  • بینگ از فرمت هایی که توسط گوگل پشتیبانی می شود حمایت نمی کند، اما یکی از مسئولان بینگ بیان کرده است هر چیزی که پشتیبانی نشود، نادیده گرفته خواهد شد. بنابراین وبمسترها می توانند از این موارد در سایت مپ خود به راحتی استفاده کنند.
  • گوگل توصیه می کند که نقشه سایتِ حاویِ محتوایِ خبری را به عنوان یک فایل جداگانه در نظر بگیرید زیرا این نوع سایت مپ بیشتر از سایر فایل ها خزیده می شوند.

موتورهای جستجوی گوگل و بینگ از فایل های Media RSS به عنوان جایگزینی برای تشخیص توضیحات متای فایل های ویدئویی استفاده می کنند. از آنجایی که بینگ نیز از این نوع فایل پشتیبانی می کند، توسعۀ Feed ویدئویی mRSS راهکاری هوشمندانه خواهد بود که از هدر رفتن وقت تان جلوگیری می کند.

محدودیت های موجود در فایل سایت مپ

بهتر است بدانید در فایل نقشه سایت، قوانین و محدودیت هایی نیز وجود دارد. این محدودیت ها شامل موارد زیر هستند:

  • فضای نام یا namespace نقشه سایت را مشخص کنید: نقشه سایت باید فضای نام XML پیش فرض را به خوبی مشخص کند: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
  • محدودیت در اندازه: فایل نقشه سایت نباید بیشتر از ۵۰۰۰۰ آدرس در خود داشته باشد. همچنین اندازه این فایل نباید بیشتر از ۵۰ مگابایت باشد. اگر به ورودی بیشتری برای آدرس های خود نیاز داشتید، از فایل ایندکس نقشه سایت استفاده کنید.
  • نیازمندیهای متنی: فایل نقشه سایت باید به صورت UTF-8 باشد و از کاراکترهای entity-escaped در URL استفاده شود (به عنوان مثال جایگزین کردن کاراکتر “&” با کاراکتر “&amp;” در آدرس های داینامیک).
  • قواعد نحوی سازگار: همه آدرس هایی که در نقشه سایت نوشته می شوند باید از قواعد یکسانی پیروی کنند. این موضوع به این معناست آدرس هایی که با WWW آغاز می شوند را نمی توان با آدرس های بدون پیشوند WWW ترکیب کرد. همچنین آدرس هایی که دارای شناسه جلسه (session ID) هستند را نیز در این فایل قرار ندهید.
  • موقعیت: فایل نقشه سایتی که در دایرکتوری ذخیره شده است، تنها می تواند آدرس هایی را نشان دهد که در آن دایرکتوری یا زیر دایرکتوری های آن ذخیره شده اند. آدرس های موجود در دایرکتوری های موازی، دایرکتوری های والد، Subdomain های مختلف یا آنهایی که از پروتکل متفاوت استفاده می کنند مرجع های معتبری نیستند. ذخیره کردن نقشه سایت در دایرکتوری ریشه می تواند از به وجود آمدن مرجع نامعتبر جلوگیری کند.
  • لینک های پاک: به این نکته توجه داشته باشید که نقشه سایت تان نباید بیش از ۱% خطای لینک داشته باشد. در غیر اینصورت کل نقشه دور انداخته می شود. خطای لینک، هر نوع کد پاسخ HTTP است که شامل تغییر مسیر ۴۰۴ برای لینک های شکسته و ریدایرکت ۳۰۱ و ۳۰۲ برای لینک های تغییر مسیر یافته است. این موضوع برای بینگ نیز یک قانونِ شناخته شده است. استفاده از لینک های صحیح در قوانین سئو برای تمامی موتورهای جستجو الزامی است. شما می توانید کد پاسخ HTTP برای هر URL را با استفاده از ابزار Header Checker بررسی کنید. برای آدرس های متعدد در یک سایت، می توان از ابزارهایی همچون Find Broken Link و Find Broken Links, Redirects & Google Sitemap Generator Free Tool استفاده کرد.
  • مراجع کراس سایت از لحاظ جهانی کاربردی نیست: گوگل اجازه ثبت URL کراس سایت در نقشه سایت را به افرادی داده است که بتوانند ثابت کنند همه سایت های مرجع متعلق به خودشان است. این تایید معمولاً از طریق اکانت وبمستر تولز انجام می شود. به خاطر داشته باشید که این موضوع در بینگ سازگار نیست و برای کاربرد جهانی توصیه نمی شود.
حتما بخوانید:  محتوای تکراری چیست؟

فایل ایندکس نقشه سایت

بیشتر سایت های بزرگ بیش از ۵۰۰۰۰ آدرس URL دارند که ایندکس شدنشان در موتورهای جستجو اهمیت دارد. از آنجایی که در نقشه سایت تنها اجازه ورود ۵۰۰۰۰ آدرس وجود دارد، وبمسترها می توانند یک فایل ایندکس نقشه سایت برای خود ایجاد کنند. فایل ایندکس نقشه سایت می تواند بیش از ۵۰۰۰۰ ورودی داشته باشد.

از لحاظ تئوری این موضوع بدین معناست که شما می توانید تا ۲٫۵ میلیارد آدرس را در فایل خود ثبت کنید. ساختار کد XML فایل ایندکس بسیار شبیه نقشه سایت است. نمونه کد XML فایل ایندکس نقشه سایت را در ادامه مشاهده می کنید:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap01.xml</loc>
<lastmod>2012-04-30</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap02.xml</loc>
<lastmod>2012-04-30</lastmod>
</sitemap>
</sitemapindex>

همانند فرمت نقشه سایت استاندارد، فایل ایندکس نیز حاوی تگ های الزامی و اختیاری است. در یک فایل ایندکس معتبر نیز کدهای XML با تگ آغازین استاندارد شروع می شود. این تگ با تگ “<sitemapindex>” دنبال خواهد شد که حاوی صفت “xmlns” می باشد که طرح کلی XML فایل ایندکس را تعریف می کند.

هر نقشه سایت در فایل ایندکس نیازمند تگ <sitemap> و تگ <loc> در داخل آن است. تگ هایی که در فایل ایندکس نقشه سایت به کار می رود را در جدول زیر مشاهده می کنید:

تگ ها وضعیت توضیحات
<?xml> الزامی  تگ آغازین فایل حاوی صفات زیر است:

  • version=”۱٫۰″
  • encoding=”UTF-8″
<sitemapindex> الزامی تنها یکبار مورد استفاده قرار می گیرد. این تگ حاوی صفت فضای نام الزامی است.

xmlns=” http://www.sitemaps.org/ schemas/ sitemap/ 0.9″.

<sitemap> الزامی تگ والد برای هر آدرسی افزوده شده است. بقیه تگ ها در داخل این تگ قرار می گیرد.
<loc> الزامی آدرس نقشه سایت است. از آدرس کامل استفاده کنید که حاوی پروتکل است.
<lastmod> اختیاری تاریخ آخرین به روزرسانی صفحه مورد نظر است که به شکل YYYY-MM-DD نوشته می شود.

به کارگیری و اجرای سایت مپ

فرایند به کارگیری نقشه سایت و در دسترس قرار دادن آن برای موتورهای جستجو بسیار ساده است. کافیست مراحل زیر را به دقت دنبال کنید:

  1. ابتدا محتوای صفحاتی که برای جستجو مهم است را شناسایی کنید: شما می توانید صفحات سبد خرید، صفحات لاگین کاربران یا هر صفحه نامتعارف دیگر را نادیده بگیرید.
  2. سایت مپ را با یک CMS یا ابزار خارجی ایجاد کنید: اگر سایت شما بر روی سیستم های مدیریت محتوا اجرا می شود، می توانید از ابزار تولید کننده نقشه سایت که در آن وجود دارد، استفاده کنید. با این حال اگر CMS نداشتید یا سایتتان کوچک بود، می توانید از ابزارهای دیگری برای اینکار استفاده کنید. ابزارهایی همچون Find Broken Links، Find Broken Links, Redirects & Google Sitemap Generator Free Tool در دسترس شما قرار دارد. در هر مورد، شما می توانید فایل به دست آمده را ویرایش کنید تا مطمئن شوید همه چیز به درستی در آن قرار گرفته است.
  3. فایل سایت مپ خود را اعتبار سنجی کنید: پیش از اینکه فایل خود را در اختیار خزنده های موتور جستجو قرار دهید، باید اعتبار آن را تایید کنید. ابزارهای اعتبار سنجی زیادی برای این کار موجود است.
  4. فایل نقشه سایت را بر روی سایت خود قرار دهید: همانطور که قبلاً هم ذکر کردیم، روت دایرکتوری (دایرکتوری ریشه) بهترین مکان برای قرار دادن نقشه سایت است. زمانی که از فایلِ ایندکسِ نقشه سایت استفاده می کنید، پُست کردن نقشه سایت در دایرکتوری URL ای که حاوی آن است، استراتژی خوبی محسوب می شود. همچنین بعد از اینکه نقشه سایت پُست شد باید مطمئن شوید که فایل robots.txt را بروزرسانی می کنید. به انتهای فایل robots.txt کدی شبیه کد زیر را اضافه کنید:

Sitemap: http://www.example.com/sitemap.xml

  1. سایت مپ خود را در گوگل و بینگ ثبت کنید: بر خلاف فایل robots.txt، موتورهای جستجو نمی توانند به صورت خودکار به دنبال نقشه سایت بگردند و آن را بخوانند. بنابراین همه چیز باید واضح و روشن باشد. بهترین روش برای انجام اینکار، استفاده از وبمستر تولز گوگل (مسیر Site configuration > Sitemaps > Add/Test Sitemap) و وبمستر تولز بینگ (مسیر Crawl > Sitemaps (XML, Atom, RSS) > Add Feed ) است. اگر در حال حاضر اکانتی در این ابزارها ندارید بهتر است همین امروز دست به کار شوید.
  2. با تغییر محتوای سایت، نقشه سایت را بروزرسانی کنید: سایت شما دارای محتوای ثابت و استاتیک نخواهد بود. تغییرات جدید ایجاد شده را در دوره های زمانی مختلف در نقشه سایت نشان دهید. اینکه چند وقت یک بار به این به روزرسانی نیاز دارید به محتوای سایت و تغییرات ایجاد شده بستگی دارد. برخی از سایت ها می توانند نقشه سایت را به صورت ماهانه به روز کنند.

امیدواریم که این مطلب توانسته باشد به سوالات شما پاسخ دهد. در صورتی که در زمینه آموزش سئو سوالی دارید می توانید آن را در قسمت دیدگاه ها مطرح کنید تا کارشناسان نوین، پس از بررسی سوال شما در قالب یک دیدگاه یا مقاله به شما پاسخ دهند.