Bayes'scher Filter

Inhalt

Definition - Was bedeutet Bayes'scher Filter?
Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.
Techopedia erklärt Bayesian Filter

Definition - Was bedeutet Bayes'scher Filter?

Ein Bayes'scher Filter ist ein Computerprogramm mit Bayes'scher Logik oder Bayes'scher Analyse, die synonym sind. Es wird verwendet, um den Header und den Inhalt von s auszuwerten und festzustellen, ob es sich um Spam handelt oder um das elektronische Äquivalent von Massen- oder Junk-Mail in Papierform. Ein Bayes-Filter wird am besten zusammen mit Antivirenprogrammen verwendet.

Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Bayesian Filter

Ein Bayes'scher Filter arbeitet mit Wahrscheinlichkeiten für bestimmte Wörter, die in der Kopfzeile oder im Inhalt von angezeigt werden. Bestimmte Wörter weisen auf eine hohe Wahrscheinlichkeit hin, dass es sich um Spam handelt, z. B. Viagra und Refinanzierung. Der Filter erkennt nicht die Wahrscheinlichkeit, dass ein Wort auf eine hohe Wahrscheinlichkeit von Spam hinweist. Benutzer müssen den als Spam manuell identifizieren. Wenn genügend Vorkommen des Wortes gefunden wurden und das Wort als Spam identifiziert wurde, „lernt“ der Bayes'sche Filter, das Wort mithilfe von Wahrscheinlichkeitsfunktionen zu identifizieren. Dies gilt auch für viele andere Wörter und Ausdrücke. Mit der Zeit wird der Bayes'sche Filter immer wirksamer, um Spam für einen bestimmten Benutzer zu identifizieren. Wenn die Wahrscheinlichkeit einen bestimmten Schwellenwert erreicht, z. B. 95 Prozent, wird das als Spam identifiziert und häufig in einen Junk-Ordner verschoben (oder manchmal sogar automatisch gelöscht). Der Benutzer kann es regelmäßig anzeigen und entscheiden, ob es gelöscht werden soll oder nicht. Alternativ verschieben einige Spam-Programme sie an einen Quarantäne-Speicherort, an dem Benutzer die Entscheidung der Software anzeigen und überprüfen können.

Das anfängliche „Training“ kann oft verfeinert werden, um falsche Positive oder falsche Negative zu reduzieren, wenn falsche Urteile gefunden werden. Auf diese Weise kann sich der Bayes'sche Filter der Software an die sich ständig weiterentwickelnde Natur von Spam anpassen.

Einige Spam-Filter verwenden neben dem Bayes-Filter auch Heuristiken. Der Benutzer richtet vordefinierte Regeln ein, um die Genauigkeit der Identifizierung als Spam weiter zu erhöhen. Diese Regeln können die Anzahl der Vorkommen eines bestimmten Wortes beinhalten, neutrale Wörter wie "the", "a" oder "some" eliminieren oder ignorieren oder Sequenzen von Werken wie "Viagra ist gut für" identifizieren, anstatt eine Wahrscheinlichkeit anzuwenden Funktion zu allen vier einzelnen Wörtern.

Spammer können eine Technik verwenden, die als Bayes'sche Vergiftung bezeichnet wird, um die Wirksamkeit von Spam-Filtern mithilfe der Bayes'schen Filterung zu verringern. Einige Techniken umfassen das Injizieren von legitimen Inhalten aus Nachrichten- oder Literaturquellen, die Verwendung von zufälligen harmlosen Wörtern, die in Spam selten vorkommen, oder das Ersetzen durch Bilder.

Viele Clients deaktivieren die Anzeige von Bildern aus Sicherheitsgründen. Somit kann der Spam weniger Empfänger erreichen.

Mit einem Bayes'schen Filter, der Bayes'sche Logik verwendet, können alle Arten von Daten klassifiziert werden. Medizin, Wissenschaft und Technik haben alle Verwendung gefunden. Interessanterweise haben wissenschaftliche Forscher spekuliert, dass sogar das menschliche Gehirn die Bayes'sche Logikmethode verwenden könnte, um Reize zu klassifizieren und spezifisches Antwortverhalten zu bestimmen.