چه تکنولوژی می‌خواهید یاد بگیرید؟

نظرات و انتقادات خود را با ما در میان بگذارید

آپدیت روزانه

بیش از 1500 مطلب آموزشی

نیازهای روز

گزارش سایت‌های دزد محتوا به گوگل

در این مقاله به همراه یک مثال نحوه گزارش سایت‌های دزد محتوا(Scraper) به گوگل، آشنا خواهید شد.

google-logo

مقدمه:

ویکی‌پیدیا واژه Web Scraping را این چنین تعریف می‌کند، تکنیک نرم افزاری در کامیپوتر جهت دریافت اطلاعات از وب سایت‌ها را Web Scraping گویند و Scraping Site یا وب سایت‌های دزد محتوا به وب سایت‌های گفته می‌شود که اطلاعات موجود در سایت‌های دیگر را با استفاده از Web Scraping برای خود کپی می‌کنند. Web Scraping یک پروسه اتماتیکی جهت جمع آوری اطلاعات بر روی شبکه جهانی وب است.

یکی از مشکلات افرادی که در زمینه تولید محتوا و انتشار مطلب تخصصی فعالیت می‌کنند سایت‌های می‌باشند که به راحتی با کپی کردن مطلب مخاطبان بیشتری برای خود جذب می‌کنند.

امکان داره شما هم مثل بنده یک مقاله‌ای جدید انتشار داده و بعد از یک روز همون مطلب در سایت دیگر در نتیجه جستجو مشاهده کنید اما خبری از لینک مطلب انتشار شده سایت خودتون نباشد!!! این سوال پیش می‌آید چرا مطلبی که توسط من تهیه و منتشر شده جایگاه پایین‌تری نسبت به وب‌سایت‌های دزد محتوا دارد؟

گوگل و سایت‌های مرجع یا دزد محتوا:

مت کاتس در سال 2000 به گوگل پیوست و از سال 2004 به عنوان مدیر ارشد مبارزه با اسپم گوگل فعالیت می‌کند. در یکی از توییتر شخصی ارسال شده آقای کاتس به موضوع دزد محتوا اشاره نموده و از مدیران سایت درخواست کرده تا از طریق فرم مشخص آنها، وب سایت‌های دزد محتوا را به گوگل معرفی نمایند.

در این فرم از شما درخواست می‌شود اطلاعات مورد نظر را وارد نموده تا توسط تیم مبارزه با اسپم گوگل برسی شود.

اطلاعات مورد نظر گوگل جهت ارسال گزارش:

  1. آدرس صفحه‌ای از سایت شما که مقاله را در آن منتشر نموده‌اید.
  2. آدرس صفحه‌ای که محتوا سایت شما را کپی کرده است.
  3. آدرس صفحه نتایج جستجو که نشان می‌دهد سایت دزد محتوا رتبه بهتری نسبت به شما کسب کرده است.
  4. و در نهایت پذیرش قوانین و شرایط تکمیل فرم.

گزارش سایت‌های دزد محتوا:

اولین گام لازم است وب سایت خودتون رو در Search Console ثبت کنید البته اجباری در کار نیست.  مرحله بعد رفتن به صفحه گزارش ادعا نقض قوانین حق تکثیر است و در نهایت پر کردن فیلدهای موجود و ثبت گزارش، مثال زیر را دنبال کنید:

چند هفته پیش مقاله ایجاد صفحات داینامیک در ASP.Net MVC رو انتشار دادم که بعد از یک شبانه روز در نتیجه جستجو ظاهر شد ولی نتیجه چیزی نبود که انتظار داشتم، سایت xxxxx همون مطلب بنده رو کپی نموده بود و در بخش مرجع به سایت بنده لینک داده نشد، ناراحت شدم و بیشتر برای اون بخش که عکس‌های که تهیه کرده بودم رو با آرم خودشون تو سایت گذاشته بودن :).

 این تازه شروع بود، متوجه شدم ایجاد صفحات داینامیک تنها مقاله‌ای نبود که توسط عضو نویسنده این سایت به سرقت رفته بلکه حدس زدم مقالات دیگر هم کپی شده هستند، لازم بود اقدام کنم، برای شروع چند بار در زمان‌های مختلف برای مدیر سایت ایمیلی مبنی بر حق کپی رایت ارسال شد اما جوابی دریافت نکردم، خوب مرحله بعد باید به صورت قانونی وارد عمل می‌شدم، چند مقاله با زبان فارسی و انگلیسی مطالعه کردم و نهایت سایت رو به گوگل گزارش دادم،  یک هفته گذشت و پاسخ گوگل رو دریافت کردم:

Thanks for reaching out to us.
In accordance with the Digital Millennium Copyright Act, we have completed processing your infringement notice. The following URLs will be removed from Google’s search results shortly:
http://xxxxx.ir/convert-dt-gnlist/
Upon recent review of the following URLs, we were unable to locate the content in question:
http://xxxxxir/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D8%A7%DB%8C%D8%AC%D8%A7%D8%AF-%D8%B5%D9%81%D8%AD%D8%A7%D8%AA-%D8%AF%D8%A7%DB%8C%D9%86%D8%A7%D9%85%DB%8C%DA%A9-%D8%AF%D8%B1-asp-net-mvc/
If this matter is still a concern, please reply to this email with detailed information to enable us to locate the content and we will further investigate your request.
Regards,
The Google Team
_________________________
When replying to this message, please do not change the subject line. Doing so may prevent us from receiving your message, and will cause you to receive a "bounced" auto-response. If you receive that "bounce" response, please resend your message by replying to this original email without changing the subject line. If you still receive an auto-response, submit a new request through our forms at http://support.google.com/legal.
_________________________

 از قضا فردا همون روز آقای ..... با بنده در تلگرام تماس گرفتن، صحبت‌های بین بنده و ایشون درد و بدل شد و ایشون اسرار داشتن که آدرس سایت رو در انتشار این مقاله درج نکنم و به گفته خودشون دو هفته مرخصی بودن و به کنترل پنل سایت دسترسی نداشتن و ما هم باور می‌کنیم و در آخر از بنده بابت این مشکل معزرت خواهی کردن و ما هم پذیرفتیم.  اما نحوه گزارش سایت‌های دزد محتوا به گوگل:

اینجا کلیک کنید تا صفحه گزارش ادعا نقض قوانین حق تکثیر باز شود، فرمی به صورت زیر نمایان خواهد شد فیلدهای لازم را وارد کنید:

report alleged copyright infringement- web search

 

به منظور اثبات ادعای خود مبنی بر اینکه محتوا تهیه شما در جایی دیگری کپی شده است باید اطلاعات کافی در اختیار گوگل قرار دهید که از طریق فرم زیر امکان پذیر است:

detailed-info 

 

در فیلداول توضیح محتوای کپی شده را تایپ میکنید، در مورد اینکه محتوا شما در وب سایت دیگری کپی شده است.

در فیلد دوم لازم است آدرس مطلب موجود در سایت خودتون رو وارد کنید.

در فیلد سوم آدرس مطلب‌های کپی شده قرار خواهد گرفت، نتیجه جستجو در گوگل  که به تیم اسپم گوگل کمک می‌کنید تا به درخواست شما برای حذف آن مطلب رسیدگی شود.

 در نهایت چند چک باکس وجود دارد که باید آنها را تیک بزنید در واقع سوگند یاد می‌کنید ادعا دروغی نیست.

امضا دیجیتالی(SIGNATURE):

  • تاریخ ثبت درخواست.
  • نام و نام خانوادگی.

sworn statements

 در وارد کردن اطلاعات دقت نماید تا منجر به جریمه خود شما نشود. برسی و ارسال نتیجه به شما ممکن است یک الی دو هفته کاری زمان ببرد. در صورت تایید آدرس صفحه وب سایت دزد محتوا از نتیجه گوگل حذف خواهد شد.

نکته:

  • بعد از ثبت درخواست یک ایمیل مبنی بر اطلاع رسانی به شما ارسال خواهد شدتوجه داشته باشید هیچ محتوای که نشان میدهد درخواست شما تایید یا با عدم تایید درخواستتان؛ در ایمیل دریافت نمی‌کنید.
  • برای ثبت گروه جدید، زیر فرم بر روی دکمه Add a new group کلیک کنید(تنها قادر به ارسال 10 گروه در یک فرم هستید).
  • لازم است بخش امضا دیجیتالی(SIGNATURE) توسط شما وارد شود.

بعد از ثبت درخواست به صفحه Removal Dashboard - Web Search هدایت می‌شوید، در این بخش لیست از درخواست‌های شما نمایان خواهد شد.

removal dashboard - web search

 

نکته:

Pending URLs = لینک‌های درخواستی جهت پیگیری.

Rejected URLs = لینک‌های تایید نشده.

Approved URLs = لینک‌های تایید شده.

Totoal URLs = کل لینک‌ها.

نتیجه گزارش به گوگل:

در مثال بالا 4 آدرس گزارش داده شده با موفقیت تایید شد.

approved urls in google webmaster tools www.omidnasri.com.png

 مآخذ:

امید نصری

0 نظر:

تعداد دیدگاه‌های کاربران : 0 دیدگاه
مهمان گرامی! برای ارسال نظر نیاز است وارد سایت شوید.


You must log on to comment.