JDownloader Community - Appwork GmbH
 

Notices

Reply
 
Thread Tools Display Modes
  #21  
Old 13.02.2023, 19:30
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 484
Default

Quote:
Originally Posted by pspzockerscene View Post
...
Und nochmal (ich glaube zum dritten Mal):
Aus deinen Beispielen geht nach wie vor nicht hervor, welche konkreten Fälle du im _echten_Leben_ hast bei denen Passwörter nicht erkannt werden.
Ich kann mittlerweile nur erahnen, dass es Fälle sind, in denen du HTML als Input hast, mehr nicht....
Ich darf nochmal abschließend zusammenfassen ...

... auch von mir nochmal (auch zum dritten Mal ): Ich benötige die Funktion nicht. Ich wollte sie deshalb auch nur deaktivieren können, mehr nicht.

Wie seinerzeit auch direkt erläutert, war mir aufgefallen, dass beim Einkopieren von html-Passagen in den LinkGrabber diverse Textbruchstücke als vermeintliche Passwörter angezeigt wurden und den Ordner 'archives' gefüllt haben.

Nur - und das schreibe ich jetzt auch mindestens zum zweiten Mal - in dem Zusammenhang interessierten mich die Algorithmen und RegEx's für eine ganz andere Anwendung, in der ich auch bestimmte Begriffe/Strings automatisiert aus Dokumenten extrahieren/zuordnen wollte.

Und in der Diskussion und den von dir erhaltenen Infos fielen mir dann Punkte auf, die man imho optimieren/korrigieren könnte, wenn man denn eine automatische Passworterkennung verbessern und fehlerfreier gestalten möchte. Als ersten, einfachen Schritt hatte ich das Parsen von Plain-Text statt von html angeregt. Denn nur Text, und nicht html, sieht ja auch der Anwender, der manuell ein Passwort auf einer Webseite liest.

Dehalb habe ich mich erdreistet zu sagen, dass zur Passwort-Extraktion das Parsen von html suboptimal sei...

Aber auch ich glaube, dass diese Passwort-Funktion kaum jemand verwendet, obgleich während ihrer Entwicklung ja Bedarf bestanden haben muss.
Reply With Quote
  #22  
Old 13.02.2023, 19:38
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 484
Default

Quote:
Originally Posted by pspzockerscene View Post
Dies wandelt das HTML eben nicht in Text um!
Mach das mal z.B. mit der google.com Hauptseite und füge das was du kopiert hast z.B. in Word oder ein vergleichbares Textbearbeitungsprogramm ein.
Ergebnis: Teile der Google Webseite/html Code werden in deinem Texteditor landen (nicht nur der rohe Text!)....
Doch!!!
Google aufrufen, nach z.B. "Wasser" suchen, Webseite im Browser mit STRG-A markieren, mit STRG+C kopieren, notepad (aus Windows) starten, Clipboard-Inhalt mit STRG+V einfügen.

Ergebnis: Plain-Text

Bevor ich hierfür ein Perl-Script verwendet habe, habe ich das immer so gemacht, wenn ich Plain-Text haben wollte.

Soeben extra für dich nochmal gestestet.

Natürlich geht das auch mit neueren Word-Versionen. Da musst du dann unter Paste Options "Plain Text" wählen.
Reply With Quote
  #23  
Old 13.02.2023, 20:04
pspzockerscene's Avatar
pspzockerscene pspzockerscene is offline
Community Manager
 
Join Date: Mar 2009
Location: Deutschland
Posts: 71,140
Default

Quote:
Originally Posted by StefanM View Post
... auch von mir nochmal (auch zum dritten Mal ): Ich benötige die Funktion nicht. Ich wollte sie deshalb auch nur deaktivieren können, mehr nicht.
Das habe ich anders verstanden, aber nun wäre das geklärt.

Quote:
Originally Posted by StefanM View Post
Ich wollte sie deshalb auch nur deaktivieren können, mehr nicht.
Dies ist ja nun nach dem nächsten Update möglich.

Quote:
Originally Posted by StefanM View Post
Nur - und das schreibe ich jetzt auch mindestens zum zweiten Mal - in dem Zusammenhang interessierten mich die Algorithmen und RegEx's für eine ganz andere Anwendung, in der ich auch bestimmte Begriffe/Strings automatisiert aus Dokumenten extrahieren/zuordnen wollte.
Ebenso verstanden.
Leider bin ich derzeit weniger in Plauderlaune daher würde ich diesen Thread abhaken, wenn es nichts konkretes zu fixen gibt bzw. keine konkrete Feature-Anfrage.
Ich werde hier keinen Code erklären.
Falls du dich weiter mit dem Thema befassen möchtest, kannst du Java lernen oder Freunde/Bekannte fragen, die die von mir verlinkten Java Klassen verstehen können.

Quote:
Originally Posted by StefanM View Post
Als ersten, einfachen Schritt hatte ich das Parsen von Plain-Text statt von html angeregt. Denn nur Text, und nicht html, sieht ja auch der Anwender, der manuell ein Passwort auf einer Webseite liest.
Auch verstanden, aber:
Nochmal: Das ist eben nicht so einfach!
Ein html Schnipsel kann auch weiteren- in einem "code" Tag eingebetteten html code usw usw erhalten.
Eine .html Webseite kann auch mit dem Content-Type Header "text" ausgeliefert werden, die im Browser z.B. dazu führen würde, dass der html Code nicht interpretiert- sondern als Text angezeigt wird.
Beispiel:
ia800801.us.archive.org/18/items/sound_canvas_midi_collection/SC-88Pro/Squaresoft/Rudra%20no%20Hihou/8695.html
Man müsste also ggf. den kompletten html Code parsen und da stellt sich wieder die Frage, ob sich dies lohnt.

Quote:
Originally Posted by StefanM View Post
Dehalb habe ich mich erdreistet zu sagen, dass zur Passwort-Extraktion das Parsen von html suboptimal sei...
Gar kein Problem.

Quote:
Originally Posted by StefanM View Post
Aber auch ich glaube, dass diese Passwort-Funktion kaum jemand verwendet, obgleich während ihrer Entwicklung ja Bedarf bestanden haben muss.
...oder es war einfach eine Idee eines Entwicklers, der Zeit hatte und sie direkt umgesetzt hat.
Viele JD Features sind so entstanden.

Quote:
Originally Posted by StefanM View Post
Doch!!!
Google aufrufen, nach z.B. "Wasser" suchen, Webseite im Browser mit STRG-A markieren, mit STRG+C kopieren, notepad (aus Windows) starten, Clipboard-Inhalt mit STRG+V einfügen.
Nein.
Du hast es noch immer nicht verstanden:
Also nochmal:
Im Clipboard landet bei dem Kopieren _auch_ der html Code.
Nun fügst du den ein in:
Beispiel 1: Word:
Word sieht den html Code und zeigt ihn zunächst 1:1 so an (siehe mein Screenshot im letzten Post).
(In den Einstellungen lkässt sich das Standardverhalten festlegen.)

Beispiel 2: Notepad/Notepad++
Notepad sieht den Clipboard Inhalt und sagt "oh html das kann ich nicht -> Ich zeige also nur den Plaintext an".

Beispiel 3: JDownloader
JDownloader sieht den html Code und der wird entsprechend vom Parser verarbeitet.

Du hast aber keinen Plaintext im Clipboard...nur wenn du den Text explizit nochmals aus deinem Texteditor kopierst...

Quote:
Originally Posted by StefanM View Post
Natürlich geht das auch mit neueren Word-Versionen. Da musst du dann unter Paste Options "Plain Text" wählen.
Natürlich geht das.
Du bestimmst eben einfach, wie verschiedene Programme mit dem Zwischenablageninhalt umgehen.
Für JDownloader gibt es an dieser Stelle noch keine Option und ich bin mir wie gesagt unsicher, ob es einer bedarf.

Als alternative Lösung könntest du dir ein externes Script basteln, das alle in die zwischenablage kopierten Inhalte vom html Code befreit, sodass du beim Einfügen in JD nur noch Plaintext hast...falls dir das helfen würde.
__________________
JD Supporter, Plugin Dev. & Community Manager

Erste Schritte & Tutorials || JDownloader 2 Setup Download
Spoiler:

A users' JD crashes and the first thing to ask is:
Quote:
Originally Posted by Jiaz View Post
Do you have Nero installed?
Reply With Quote
  #24  
Old 13.02.2023, 21:06
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 484
Default

Quote:
Originally Posted by pspzockerscene View Post
Als alternative Lösung könntest du dir ein externes Script basteln, das alle in die zwischenablage kopierten Inhalte vom html Code befreit, sodass du beim Einfügen in JD nur noch Plaintext hast...falls dir das helfen würde.
Du liest immer nur die Hälfte...

Ich hatte doch gerade erst geschrieben, dass ich dafür ein Perl-Script habe...
bzw. ich es verwenden könnte, wenn ich die JD-Passwort-Funktion nutzen wollen würde...

Quote:
Originally Posted by oEFLKQzikCqw View Post
Der Quelltext steht als zusätzlicher Inhalt in der Zwischenablage. Welcher Inhalt beim Kopieren in Anwendungen dort ankommt ist von der Anwendung abhängig. Bei einem Texteditor kommt in der Regel nur Text an. Manchmal kann man aber auch wählen, was man einfügt. Dann hat man in der Regel zusätzlich die Möglichkeit nur Text einzufügen.
Hierzu hatte ich schon rückgefragt: "Quelltext als zusätzlicher(?) Inhalt"
Wenn das zutrifft (Plain-Text und zusätzlich Quelltext), dann wäre es noch einfacher. Aber ich nehme mal an, dem ist nicht so und oEFLKQzikCqw sich hier etwas missverständlich ausgedrückt hat.
Reply With Quote
  #25  
Old 13.02.2023, 23:39
pspzockerscene's Avatar
pspzockerscene pspzockerscene is offline
Community Manager
 
Join Date: Mar 2009
Location: Deutschland
Posts: 71,140
Default

Quote:
Originally Posted by StefanM View Post
Du liest immer nur die Hälfte...
Dem kann ich nur widersprechen.
Bei ~100 Antworten pro Tag können passieren regelmäßig Fehler und ich habe keine Probleme damit, diese einzugestehen.
Evtl. lege ich die Antworten auf deine Threads in Zukunft an den Supportanfang dann sollten weniger Fehler passieren.

Quote:
Originally Posted by StefanM View Post
Ich hatte doch gerade erst geschrieben, dass ich dafür ein Perl-Script habe...
Dies habe ich tatsächlich überlesen.

Quote:
Originally Posted by StefanM View Post
Wenn das zutrifft (Plain-Text und zusätzlich Quelltext), dann wäre es noch einfacher.
Eine kurze Googlesuche nur bezogen auf Windows und ohne tiefer einzutauchen zeigt:
Der kopierte Inhalte ist in mehreren formaten verfügbar:
superuser.com/questions/378278/how-to-access-raw-clipboard-data-on-windows

Das würde die Sache natürlich super einfach machen.
Das "InsideClipboard" Tool zeigt die möglichen Formate sehr übersichtlich an.
__________________
JD Supporter, Plugin Dev. & Community Manager

Erste Schritte & Tutorials || JDownloader 2 Setup Download
Spoiler:

A users' JD crashes and the first thing to ask is:
Quote:
Originally Posted by Jiaz View Post
Do you have Nero installed?
Reply With Quote
Reply

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off

Forum Jump

All times are GMT +2. The time now is 10:12.
Provided By AppWork GmbH | Privacy | Imprint
Parts of the Design are used from Kirsch designed by Andrew & Austin
Powered by vBulletin® Version 3.8.10 Beta 1
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.