P A S S W O R T T E S T
Erstes Passwort eins
Zweites Passwort zwei
Drittes Passwort
drei
Viertes Passwort: vier
Fünftes Passwort : fünf
Sechstes Passwort
sechs
Siebtes Passwort
sieben
Achtes Passwort
acht
Neuntes Passwort: Max Mustermann
Ergebnis: (besser als ich dachte)
Hier wurde nur 'Max Mustermann' nicht gefunden. D.h. Passwörter mir Leerzeichen werden nicht gefunden.
Wenn ich aber die Zeile mit "Neuntes Passwort..." weglasse, dann wird übrigens auch 'acht' nicht gefunden.
Aber der Doppelpunkt wird wohl ausmaskiert
[
"acht",
"Max",
"eins",
"sieben",
"vier</span><br",
"vier",
"zwei",
"zwei</span><br",
"eins</span><br",
"fünf",
"drei",
"sechs",
"fünf</span><br"
]
Wenn ich JD dasselbe als Plain-Text parsen lasse, sieht es besser aus. Und dann würden auch komplexere Folgen von HTML-Steuerzeichen nicht dazu führen, dass manche Passwörter ausgelassen werden.
Wie schon gesagt: Das Parsen nach Passwörtern sollte nur in Plain-Text erfolgen. D.h. den HTML-Source zuvor in Plaintext umwandeln - natürlich
ausschließlich für die Passwort-Suche.
[
"acht",
"Max",
"eins",
"vier",
"zwei",
"sieben",
"fünf",
"drei",
"sechs"
]