Regular Expressions, Informationen zur Verwendung von Regular
Expressions bei der Mailfilterung.
Regular Expressions ( zu deutsch "Reguläre Ausdrücke" ) bezeichnen genau definierte Suchmuster mit deren
Hilfe sich in einer Zeichenkette bestimmte Inhalte suchen und bei Bedarf ersetzen lassen. In der Fachsprache werden Regular
Expressions der Einfachheit wegen lediglich als "RegExes" (Einzahl: "RegEx") bezeichnet. RegExes werden sehr häufig in Programmiersprachen
wie Perl oder PHP verwendet, aufgrund der Mächtigkeit dieser regulären Ausdrücke ist das Anwendungsgebiet nahezu unbegrenzt.
Wie können RegExes bei der Filterung von E-Mails sinnvoll eingesetzt werden?
Die Einsatzmöglichkeiten der Regular Expressions bei der Filterung Ihres E-Mail Verkehrs sind äusserst
vielfältig, aufgrund der Komplexität und Mächtigkeit der RegExes kann die Verwendung der regulären Ausdrücke jedoch bei falscher
Konfiguration auch äusserst gefährlich sein! Nachfolgend finden Sie daher einige sinnvolle und praktische Beispiele, wie Sie
RegExes bei der Filterung Ihres Mailverkehrs nutzen können.
Hierzu ist es jedoch zunächst erforderlich, kurz auf die Grundelemente der RegExes
einzugehen:
(?i) |
Hiermit definieren Sie, dass die RegEx sowohl Groß- und Kleinschreibung berücksichtigen
soll. |
[148ahle] |
Ein beliebiges aus der Menge der in eckigen Klammern angegebenen Zeichen soll vorkommen.
Wenn mehrere der Zeichen in der Menge hintereinander kommen, kann man diese durch ein - abkuerzen, z.B. [a-f] für [abcdef]. |
[a-z]
|
Durch diese Angabe werden alle Kleinbuchstaben von "a" bis "z" berücksichtigt. |
[A-Z]
|
Analog zu den Kleinbuchstaben werden hiermit alle Großbuchstaben von "A" bis "Z" berücksichtigt. |
[0-9] |
Umfasst alle Ziffern von "0" bis "9". |
\d |
Alternativ zur Angabe [0-9] können mit dieser Angabe auch alle Ziffern angegeben werden. |
\s |
Ein beliebiges Whitespace (Leerzeichen oder Tabulator). |
| |
Dies ist das "Oder"-Zeichen für Regular Expressions. |
. |
Der Punkt steht für ein beliebiges Zeichen. |
* |
Das vorangegangene Zeichen kann beliebig oft (auch gar nicht) vorkommen. |
+ |
Das vorangegangene Zeichen kann beliebig oft,es muss jedochmindestens einmal vorkommen. |
? |
Das vorangegangene Zeichen ist optional. |
Nachfolgend finden Sie nun einige praktische
und einfache Beispiele für die Verwendung von Regular Expressions:
(?i)v[i1]agra - die zu überprüfende Zeichenkette muss nun folgende Bedingungen erfüllen, damit die
Regular Expression zutrifft (matcht):
1. (?i) : Die Groß- und Kleinschreibung spielt keine
Rolle 2. v: In der Zeichenkette muss ein "v" vorhanden sein UND 3.
[i1]: Dem "v" muss entweder ein "i" ODER eine "1" folgen UND 4. agra: Den oben beschriebenen
Zeichen muss die Zeichenfolge "agra" folgen.
Unter anderem können durch das oben beschriebene Beispiel folgende Schreibweisen
abgedeckt werden: ViAgrA V1aGRa viagra
(?i)t[e3]{2}n - die zu überprüfende Zeichenkette muss nun folgende Bedingungen erfüllen, damit
die Regular Expression zutrifft (matcht):
1. (?i) : Die Groß- und Kleinschreibung spielt
keine Rolle 2. t: In der Zeichenkette muss ein "t" vorhanden sein UND 3.
[e3]{2}: Dem "t" müssen entweder "ee" , "e3" , "33" oder "3e" folgen. Durch die Angabe "{2}" definieren wir,
dass das vorangestellte Zeichen zweimal vorhanden sein muss. Da es sich hierbei um eine Menge handelt, müssen zwei Zeichen
aus der menge hintereinander folgen UND 4. n: Den oben beschriebenen Zeichen muss das
Zeichen "n" folgen.
Unter anderem können durch das oben beschriebene Beispiel folgende Schreibweisen abgedeckt werden:
teen t33n T33N te3n
(?i)v\s*[i|1]\s*[a4@]\s*g\s*r\s*[a4@] - die zu überprüfende Zeichenkette muss nun folgende
Bedingungen erfüllen, damit die Regular Expression zutrifft (matcht):
1. (?i) : Die Groß-
und Kleinschreibung spielt keine Rolle 2. v: In der Zeichenkette muss ein "v" vorhanden sein
UND 3. \s*:
Es koennen beliebig viele Whitespaces kommen UND 4. [i|1]: Es muss ein "i", ein "|"
oder eine "1" folgen UND 5. \s*: Es koennen beliebig viele Whitespaces kommen UND 6. [a4@]: Es muss ein "a", eine "4" oder ein "@" folgen UND 7.
\s*: Es koennen beliebig viele Whitespaces kommen UND 8. g: Es muss der Buchstabe "g" vorhanden
sein UND 9. \s*: Es koennen beliebig viele Whitespaces kommen UND 10.
r: Es muss der Buchstabe "r" vorhanden sein UND 11. \s*: Es koennen beliebig viele Whitespaces
kommen UND 12. [a4@]: Es muss ein "a", eine "4" oder ein "@" folgen
Unter anderem können
durch das oben beschriebene Beispiel folgende Schreibweisen abgedeckt werden: viagra vi@gr@ v | @ g r @ v 1a g r@
Wie Sie bereits an diesen einfachen Beispielen erkennen können, ist die Anwendungsvielfalt der Regular Expressions schier
unbegrenzt. Bereits bei der Verwendung von simplen Angaben kann eine Vielfalt an Zeichenketten abgedeckt werden und eine deutlich
größere Trefferquote bei der Filterung von Mails erzielt werden. ACHTUNG:
Wir möchten nochmals darauf hinweisen, dass Regular Expressions nur mit größter Sorgfalt eingesetzt werden sollten, da
bei einer Fehlkonfiguration die Gefahr, dass auch erwünschte Mails gefiltert werden, äussert hoch ist!
Wo kann ich ausführliche Informationen zu RegExes in Erfahrung bringen?
Zurück Virenschutz - Spam Teil 7 |

|
Weiter Virenschutz - Reverse Look Up Spam Teil 9 |

|
|