دزد دریایییک دریای پهناور را در نظر بگیرید. در این دریا، کشتی‌های مسافربری، باربری، تجاری و... مختلفی روی سطح آب شناورند. هرکدام از این کشتی‌ها برای اینکه بتوانند در حوزه فعالیت خودشان به خوبی عمل کنند، سعی دارند سوخت بیشتر و با کیفیت‌تری به موتور خانه برسانند.

اما در این بین، چند کشتی دزد دریایی هم هستند که به جای فعالیت عادی، تصمیم گرفته‌اند که به سوخت بقیه کشتی‌ها دستبرد بزنند و از آن برای ادامه کارشان استفاده کنند.

در مثال بالا، دریا همان دنیای وب است. کشتی‌ها سایت‌ها هستند و سوخت آن‌ها برای رقابت، محتوایی است که روی سایتشان قرار می‌دهند. کشتی‌هایی هم که به جای خرید یا تولید سوخت، سوخت کشتی‌های دیگر را می‌دزدند، همان سایت‌های سارق محتوا هستند.

حالا یک سازمان نظارت‌کننده روی این دریای پهناور - یعنی گوگل - برای جلوگیری از دزدی و مقابله و با دزدان دریایی، دست به کار می‌شود. نتیجه این دست به کار شدن‌، الگوریتم Pirate یا همان دزد دریایی گوگل است. در این مقاله با ما همراه باشید تا Pirate را بشناسیم و ببینیم که گوگل این بار برای مقابله با خرابکارها دست به چه اقداماتی زده است!

الگوریتم دزد دریایی گوگل یا Pirate چیست؟

رابطه الگوریتم دزدان دریایی و دزدیدزد دریایی یکی از این الگوریتم‌های مهم گوگل است که در سال 2012 معرفی و در سال 2014 به‌روزرسانی شد.

وظیفه الگوریتم pirate، شناسایی محتوای دزدی (یا همان کپی) است!

این الگوریتم، برای مبارزه با نقض قانون کپی‌رایت آمده است و با هر نوع محتوای کپی یا دزدی برخورد می‌کند.

الگوریتم Pirate چه محتوایی را از نتایج گوگل حذف می‌کند؟

بیشتر مواقع زمانی که حرف از محتوا می‌زنیم، ذهن مخاطبان به سمت مقاله‌های متنی می‌رود. اما منظور از ما از حذف محتوا به دست الگوریتم دزد دریایی، فقط محتوای متنی نیست. تمرکز اصلی این الگوریتم بیشتر روی محصولات و محتوای غیر رایگان است تا محتوای رایگانی که الگوریتم پاندا می‌تواند آن را شناسایی کند.

محتوای دیجیتال

به طور کلی انواع محتوایی که این الگوریتم می‌تواند برای حذف صفحه آن از نتایج اقدام کند عبارتند از:

  • تصویر
  • متن
  • ویدیو
  • صوت
  • محصول

این یعنی شما برای تصویر، محتوای متنی و حتی محصول دانلودی و غیر دانلودی خودتان هم می‌توانید به گوگل شکایت کنید و گزارش کنید که سایت دیگری با این محتوای به سرقت رفته از شما، در نتایج رتبه دارد.

نمونه‌ای از نتیجه شکایات که به تازگی در سطح وب فارسی اتفاق افتاد، سایت معروف p30download بود که به صورت ناگهانی و یک شبه، رتبه تمامی کلمات کلیدی خودش در سطح وب را از دست داد و با افت شدید ترافیک روبرو شد. در حال حاضر هم فقط در صورت جستجو نام برند این سایت، آن را در نتایج گوگل پیدا می‌کنید.

دلیل این اتفاق شکایت‌های پی‌در‌پی سایت‌های فارسی و غیر فارسی از آن، به دلیل انتشار محصولات دانلودی آن‌ها به صورت رایگان بود. این محصولات بیشتر نرم‌افزارهای دانلودی مثل فتوشاپ، دانلود منیجر‌ها و همینطور بازی‌های غیر رایگان خارجی بود.

در ادامه درباره گزارش محتوای کپی به گوگل صحبت خواهیم کرد، ولی قبل از آن، اجازه دهید مقایسه‌ای بین قبل و بعد الگوریتم Pirate داشته باشیم.

الگوریتم دزد دریایی گوگل، چه تغییراتی در نتایج جستجو ایجاد کرد؟

قبل از اینکه سروکلۀ الگوریتم دزد دریایی گوگل پیدا شود، با جستجوی عبارتی مثل «watch toy story 4»، سایت‌هایی را می‌دیدید که یا  برای جذب بازدیدکننده فیلم را بطور رایگان برای دانلود گذاشته بودند، یا اینکه برای دانلود غیرقانونی فیلمی که کپی شده، پول می‌گرفتند.

اما الان، حداقل در نتایج اولیه گوگل، نتایج معتبری را می‌بینید که شما را به سمت تماشای قانونی فیلم هدایت می‌کنند (مثل تصویر زیر).

تاثیر الگوریتم دزد دریایی گوگل بر نتایج جستجو

تاثیر الگوریتم دزد دریایی گوگل بر نتایج جستجو

با اجرای الگوریتم دزدان دریایی، سایت‌های زیادی که دانلود رایگان نرم‌افزارها و محتوای پولی را فراهم کرده بودند، دچار افت شدید رتبه و ریزش شدید کاربران شدند.

Google Pirate Update

یک نکتۀ مهم_ احتمالاً الان دارید پیش خودتان فکر می‌کنید که ما در ایران هنوز هم بهترین فیلم‌های دنیا را رایگان دانلود می‌کنیم و می‌بینیم. پس این الگوریتم چرا هیچ کاری نمی‌کند؟ خب حق با شماست؛ همین الان هم اگر به فارسی سرچ کنید «تماشای فیلم اسباب بازی ها 4»، خیلی راحت به لینک‌های دانلود رایگان می‌رسید.

در واقع، در کشور ما هنوز قانون کپی‌رایت جدی گرفته نمی‌شود و از طرفی گوگل هم هنوز در برخی کشورها، از جمله ایران، آن‌قدرها برای کپی‌رایت سخت نمی‌گیرد؛ مگر آنکه مانند p30download تعداد زیادی گزارش نقض قانون کپی‌رایت دریافت کند.

چگونه محتوای دزدیده شده را به گوگل گزارش دهیم؟

انجام این کار اصلاً سخت نیست و با DMCA گوگل انجام می‌شود، اما جواب گرفتن از گوگل ممکن است مدت زیادی طول بکشد. اما قبل از اینکه به سراغ نحوۀ گزارش محتوای کپی به گوگل برویم، بیایید با DMCA بیشتر آشنا شویم.

سرویس DMCA گوگل چیست؟

DMCA مخفف عبارت Digital Millennium Copyright Act به معنای «قانون حق چاپ هزاره دیجیتال» است که در سال 1988 به دست رئیس جمهور آمریکا امضا شد. پس از آن و از سال 2012، واحد DMCA در شرکت گوگل، شروع به کار کرد. هدف این واحد حمایت از قانون کپی رایت در حوزه وب بود.

با استفاده از این سرویس، افرادی که محتوایشان به سرقت رفته، می‌توانند درخواست بدهند تا صفحه سایت خطاکار، از نتایج جستجوی گوگل حذف شود.

این یعنی اگر محتوای متنیِ رایگان یا غیر رایگان، ویدیویی، محصول و هر نوع محتوای دیگری که دارید، به دست فرد و افرادی دزدیده و روی سایتشان منتشر شده باشد، می‌توانید آدرس صفحه سارق را به بخش DMCA گوگل گزارش دهید. این بخش گزارشات (یا noticeها) را در اسنادی ذخیره می‌کند و اگر تعداد Notice ها زیاد شود، الگوریتم Pirate به بررسی آن‌ها می‌پردازد.

DMCA و الگوریتم دزدان دریایی گوگل، ارتباط نزدیکی باهم دارند. در واقع این الگوریتم با استفاده از گزارش کاربران و کمک اپراتورهای انسانی است که تصمیم می‌گیرد کدام صفحات و سایت‌ها از نتایج گوگل حذف شوند.

مراحل گزارش محتوای کپی شده به DMCA گوگل

برای گزارش کافیست به پیشخان DMCA گوگل مراجعه کنید؛ روی Create new notice کلیک کنید و بعد طبق تصویر زیر، مراحل را انجام دهید و گزارشتان را برای گوگل ارسال کنید.

گزارش محتوای کپی به گوگل

گزارش محتوای کپی به گوگل DMCA

لطفاً به این چند نکته دقت کنید:

  • متن پیام و مشخصات شما، حتماً باید به زبان انگلیسی باشد
  • گزارش خود را دقیق بنویسید و فقط به اسم و آدرس آن سایت بسنده نکنید
  • آدرس صفحات مورد نظرتان را وارد کنید؛ نه آدرس دامنه سایت
  • گزارشات شما توسط نیروی انسانی گوگل بررسی می‌شود

خب تا اینجا فهمیدیم که الگوریتم دزد دریایی گوگل، چطور با محتوای دزدی مقابله می‌کند. اما یک سؤال؛ مطالب این مقاله به این معنی است که ما با انتشار محتوای یک سایت دیگر در سایتمان و در ادامه شکایت صاحب محتوا، به طور کلی از نتایج گوگل حذف می‌شویم؟ در ادامه به جواب این سؤال می‌رسید:

دزد دریایی گوگل چقدر سختگیر است؟

الگوریتم pirate گوگلاول این نکته را بگوییم که تمرکز و اولویت اول Google Pirate روی حذف URL یا همان صفحه است، نه کل سایت؛ ولی اگر گوگل برای بیش از 50% محتواهای ایندکس شدۀ شما گزارش کپی بودن دریافت کند، به احتمال خیلی زیاد دچار پنالتی سخت و سنگین Pirate شوید. در مثالی هم که برای سایت پی‌سی دانلود زدیم، باید بدانید که این سایت محتواهای بسیاری زیادی داشت که بیشتر آنها محتوای نقض کننده قانون کپی رایت بودند و به همین دلیل کل سایت دچار جریمه شد.

در مورد شدت سختگیری الگوریتم دزد دریایی هم راستش را بخواهید، گوگل در خیلی از موارد از شکایت‌های DMCA چشم پوشی می‌کند! یعنی مجبور است که خیلی از آن‌ها را نادیده بگیرد. چرا؟‌

تصور کنید که شما در گوگل عبارت دانلود فتوشاپ را سرچ می‌کنید. گوگل هم به خاطر شکایت‌های شرکت Adobe (سازنده فتوشاپ) از سایت‌های ارائه دهنده این برنامه، تمامی آن‌ها را از نتایج حذف کرده است.

آیا این موضوع باعث می‌شود تا شما راضی به خرید برنامه فتوشاپ به قیمت چند صد دلار از Adobe شوید؟ نه! ولی باعث می‌شود شما به جای گوگل، در موتور جستجوی دیگری مثل بینگ، به دنبال دانلود برنامه فتوشاپ باشید.

پس گوگل در نهایت برای اینکه مخاطبان خودش را از دست ندهد، مجبور است در برخی مواقع بیخیال شکایت‌های شرکت‌های صاحب اثر محتوا بشود. اما در هر حال این شرایط برای همه محتواها هم به وجود نمی‌آید، پس مراقب باشید!

یک نکته_ احتمالاً اغلب مخاطبان این مقاله، وبمسترانی هستند که از مقاله‌های تکراری در سایتشان استفاده نمی‌کنند؛ اما با مطالعه این مطالب این سؤال در ذهنشان به وجود آمده که: چطور یک سایت می‌تواند مطالب سایت من را، در حالی که آن را منتشر کرده‌ام بدزدد؟ مگر پاندای گوگل با آن مقابله نمی‌کند؟

در ادامه توضیحات بیشتری می‌دهیم.

دزدان محتوا و آموزش مقابله با آن‌ها

هزینه‌ای که الآن باید برای نوشتن یک مقاله هزار کلمه‌ای به نویسنده محتوا بدهید، چیزی بین 20 تا 100 هزار تومان است. حالا فرض کنید سایت دیگری بدون پرداخت حتی یک ریال، مقاله‌ای را که برای آن هزینه کرده‌اید، می‌دزدد و به عنوان صاحب آن محتوا شناخته می‌شود! چطور؟!

ربات هاسایت‌هایی در سطح وب وجود دارند که نه به دست وبمستر و مدیر، بلکه به دست ربات‌های خودکار مدیریت می‌شوند. این ربات‌ها به صورت اتوماتیک محتوای یک سایت را کپی می‌کنند و در سایت خودشان قرار می‌دهند.

محتوایی که از طرف این سایت‌های سارق دزدیده و منتشر می‌شود، تعداد و سرعت بالایی دارد و این موضوع باعث می‌شود که ربات‌های گوگل و بقیه موتورهای جستجو، با سرعت بیشتری برای بررسی و ایندکس محتواها به آن سر بزنند.

حالا تصور کنید که اگر یکی از این ربات‌ها به کمک وبمستر، سایت شما را هدف قرار بدهد چه اتفاقی می‌افتد؟ محتوای جدید شما امروز ساعت 17 عصر در سایتتان منتشر می‌شود، اما گوگل تا 2 روز دیگر برای ایندکس مقاله به سایت شما سر نمی‌زند. در این حالت ربات در همان ابتدای کار محتوای دست اول‌تان را در سایت خودش منتشر و از طرف گوگل به عنوان صاحب محتوا شناخته می‌شود! حالا محتوای شما از نظر گوگل کپی است و احتمالا در صورت تکرار، با خشم پاندا روبرو می‌شوید.

جلوگیری از کپی محتواراه مقابله با دزدی محتوا

راه پیشنهادی گوگل، کمک گرفتن از الگوریتم دزد دریایی است. به این صورت که شما باید به سایت گوگل و سرویس dmca در پنل گوگل کنسول سایتتان بروید و در آنجا با ارائه شواهدی مثل زمان انتشار محتوا در سایتتان یا دیگر راه‌ها به کارشناسان گوگل بفهمانید که سایت شما، صاحب اصلی محتواست.

و پیشنهاد ما:

1) بعد از انتشار محتوا، آن را در شبکه‌های اجتماعی (مخصوصا توییتر) به اشتراک بگذارید تا با سرعت بیشتری ایندکس شود.

2) با استفاده از ابزار سرچ کنسول گوگل ربات‌های موتور جستجو را از انتشار محتوا در سایت باخبر کنید تا سریعاً برای ایندکس آن اقدام کنند.

برای این کار کافیست وارد سرچ کنسول شوید، گزینه URL Inspection را انتخاب کنید، آدرس صفحه را در کادر وارد کنید و اینتر را بزنید. در اینجا اگر محتوای شما ایندکس نشده باشد، می‌توانید گزینه Request Indexing را انتخاب کنید تا در اولین فرصت، ربات‌های گوگل محتوای‌تان را بخوانند.

3) انتشار محتوای سایتتان را در یک زمان خاص انجام دهید. به طور مثال، یک شنبه‌ها و سه شنبه‌ها در ساعت 5 عصر محتواهایتان را منتشر کنید. به این صورت ربات‌های خزنده شرطی می‌شوند و دقیقاً در همین روز و ساعت برای ایندکس مقالات به شما مراجعه می‌کنند.

4) در تمامی محتواها از لینک‌سازی داخلی استفاده کنید و گاهی هم به صفحه اصلی لینک بدهید

کلام آخر: حواس جمع باشید!

موتور جستجوی گوگل از هوش مصنوعی فوق‌العاده قدرتمندی استفاده می‌کند. اما خوشبختانه یا متأسفانه این هوش مصنوعی هنوز هم توانایی مقابله با هوش انسان را ندارد. پس در این حالت بهتر است به جای اینکه فقط به گوگل اعتماد کنیم تا ما را به عنوان یک سایت معتبر، درستکار و با کیفیت تشخیص بدهد، خودمان هم دست به کار شده و با بررسی‌های دقیق، مطمئن شویم که کپی‌کننده‌ها از سایت ما سوء استفاده نمی‌کنند.

امیدواریم مطالب این مقاله در مورد الگوریتم دزد دریایی گوگل و همین‌طور مقابله با دزدی محتوا برای شما مفید بوده باشد. در صورتی که نکتۀ دیگری درباره کپی و دزدی محتوا می‌دانید که ممکن است به درد ما و سایر خوانندگان این بخورد، خیلی خوشحال می‌شویم آن را مطرح کنید.

همینطور اگر علاقه به مطالعه کامل‌ترین آرشیو مربوط به الگوریتم ها و آپدیت‌های گوگل هستید، به دسته‌بندی الگوریتم های گوگل در نوین مراجعه کنید.