Content Scraping

Autor: Robert Simon
Erstelldatum: 19 Juni 2021
Aktualisierungsdatum: 24 Juni 2024
Anonim
What is Web Scraping and What is it Used For? | Definition and Examples EXPLAINED
Video: What is Web Scraping and What is it Used For? | Definition and Examples EXPLAINED

Inhalt

Definition - Was bedeutet Content Scraping?

Content Scraping ist eine illegale Methode, um Originalinhalte von einer legitimen Website zu stehlen und die gestohlenen Inhalte ohne Wissen oder Erlaubnis des Inhabers auf einer anderen Website zu veröffentlichen. Content Scraper versuchen häufig, gestohlenen Content als ihren eigenen Content auszugeben, und geben den Eigentümern des Contents keine Zuschreibung.

Das Scraping von Inhalten kann durch manuelles Kopieren und Einfügen oder mithilfe komplexerer Techniken erfolgen, z. B. mithilfe von spezieller Software, HTTP-Programmierung oder HTML- oder DOM-Parsern.

Ein Großteil des Inhalts, der dem Scraping zum Opfer fällt, ist urheberrechtlich geschütztes Material. Eine erneute Veröffentlichung ohne Erlaubnis des Urhebers ist strafbar.Scraper-Sites werden jedoch auf der ganzen Welt gehostet, und Scraper, die zum Entfernen von urheberrechtlich geschütztem Inhalt aufgefordert werden, wechseln möglicherweise einfach die Domains oder verschwinden.


Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Content Scraping

Content Scraper sind in der Lage, den Datenverkehr auf ihre Websites zu lenken, indem sie qualitativ hochwertige Inhalte mit hoher Keyword-Dichte von anderen Websites entfernen. Blogger sind besonders anfällig dafür, wahrscheinlich, weil einzelne Blogger keinen legalen Angriff auf Schaber starten. Scraper werden ermutigt, diese Praxis fortzusetzen, da Suchmaschinen noch keinen effektiven Weg gefunden haben, um eindeutige Inhalte aus den Scrap-Inhalten herauszufiltern, so dass Scraper weiterhin davon profitieren können.

Website-Administratoren können sich durch einfache Maßnahmen, z. B. das Hinzufügen von Links zu ihrer eigenen Website innerhalb des Inhalts, vor dem Schaben schützen. Auf diese Weise können sie zumindest einige Zugriffe auf den Inhalt von Scrap-Inhalten erhalten. Anspruchsvollere Methoden für das Scraping durch Bots sind:


  • Kommerzielle Anti-Bot-Anwendungen
  • Fang Bots mit einem Honeypot und blockiere deren IP-Adressen
  • Bots mit JavaScript-Code blockieren