View Single Post
  #13  
Old 04.02.2023, 13:10
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default Test-Text

P A S S W O R T T E S T

Erstes Passwort eins


Zweites Passwort zwei


Drittes Passwort drei


Viertes Passwort: vier


Fünftes Passwort : fünf


Sechstes Passwort
sechs


Siebtes Passwort


sieben


Achtes Passwort acht


Neuntes Passwort: Max Mustermann

Ergebnis: (besser als ich dachte)
Hier wurde nur 'Max Mustermann' nicht gefunden. D.h. Passwörter mir Leerzeichen werden nicht gefunden.

Wenn ich aber die Zeile mit "Neuntes Passwort..." weglasse, dann wird übrigens auch 'acht' nicht gefunden.

Aber der Doppelpunkt wird wohl ausmaskiert

[
"acht",
"Max",
"eins",
"sieben",
"vier</span><br",
"vier",
"zwei",
"zwei</span><br",
"eins</span><br",
"fünf",
"drei",
"sechs",
"fünf</span><br"
]


Wenn ich JD dasselbe als Plain-Text parsen lasse, sieht es besser aus. Und dann würden auch komplexere Folgen von HTML-Steuerzeichen nicht dazu führen, dass manche Passwörter ausgelassen werden.

Wie schon gesagt: Das Parsen nach Passwörtern sollte nur in Plain-Text erfolgen. D.h. den HTML-Source zuvor in Plaintext umwandeln - natürlich ausschließlich für die Passwort-Suche.

[
"acht",
"Max",
"eins",
"vier",
"zwei",
"sieben",
"fünf",
"drei",
"sechs"
]
Reply With Quote