JDownloader Community - Appwork GmbH
 

Notices

Reply
 
Thread Tools Display Modes
  #1  
Old 12.09.2022, 13:14
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default Frage zum LinkGrabber-Filter

Nach langer Zeit wieder mal eine Frage zum LinkGrabber-Filter

Bei Galerien sieht die URL wie folgt aus:
  • ...websiteXY.com/gallery_Irgendwas1
  • ...websiteXY.com/gallery_Irgendwas2
Wie muss ich das Filter konfigurieren, damit mir die Bilder aus den einzelnen Galerien in Ordner mit den Namen
  • d:\JD\Irgendwas1
  • d:\JD\Irgendwas2
sortiert werden?

Früher funktionierte es sinngemäß so:

Code:
sourceurl(s)   contains:   ...websiteXY.com/gallery_*    Häkchen für RegEx nicht gesetzt

package name   <jd:source:1>


Danke im Voraus!
Reply With Quote
  #2  
Old 12.09.2022, 13:58
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM:
sourceURL - contains - *websiteXY.com/gallery_*
then set
package name - <jd:source:2>

Und bitte daran denken das die Regeln von oben nach unten abgearbeitet werden. Wenn also eine Regel unter dieser Regel was am Paketnamen verändert, dann ist die vorherige Änderung überschrieben.

Ansonsten bitte echte BeispielLinks, dann können wir bei der Regel genauer/besser helfen.
__________________
JD-Dev & Server-Admin

Last edited by Jiaz; 12.09.2022 at 15:58.
Reply With Quote
  #3  
Old 12.09.2022, 15:50
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
@StefanM:
sourceURL - contains - *websiteXY.com/gallery_*
then set
package name - <jd:source2>
Hast du hier bewusst source2 statt source:2 geschrieben?

Quote:
Originally Posted by Jiaz View Post
@StefanM:
Und bitte daran denken das die Regeln von oben nach unten abgearbeitet werden. Wenn also eine Regel unter dieser Regel was am Paketnamen verändert, dann ist die vorherige Änderung überschrieben.
Das weiß ich :-)

Funktioniert leider nicht so, wie du es beschrieben hast, weder mit noch ohne den Doppelpunkt.

Es wird nach wie vor alles in <jd:simpledate:yyyy-MM-dd> gespeichert, obwohl diese Regel erst an Platz 3 steht. Meine Regel für die obigen Gallerien steht auf Platz 0, also an oberster Position.

Interessenhalber gefragt:
Inwieweit hat "Inforamtion overwrites packagizer rules" im "Analyze and Add Links"-Fenster hier Einfluss?

Früher hat das, was ich als Beispiel schrieb, funkioniert.
Nun hast du ja - auf meine Anregung hin - das Handling von Wildcards geändert/korrigiert.

Hier zwei existierende Besipiel-Links:
  1. **External links are only visible to Support Staff****External links are only visible to Support Staff**
  2. **External links are only visible to Support Staff****External links are only visible to Support Staff**

Als Ordnername soll jeweils der String nach dem letzen / verwendet werden.
Reply With Quote
  #4  
Old 12.09.2022, 15:53
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Hast du hier bewusst source2 statt source:2 geschrieben?
Ja, weil ich ja 2 Platzhalter Wildcards genutzt habe.
Update: Sorry, jetzt hab ich den Typo gesehen, natürlich mit : , also
Quote:
<jd:source:2>
Quote:
sourceURL - contains - *websiteXY.com/gallery_*
und der zweite gewünscht ist
__________________
JD-Dev & Server-Admin

Last edited by Jiaz; 12.09.2022 at 15:58.
Reply With Quote
  #5  
Old 12.09.2022, 15:55
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Es wird nach wie vor alles in <jd:simpledate:yyyy-MM-dd> gespeichert, obwohl diese Regel erst an Platz 3 steht. Meine Regel für die obigen Gallerien steht auf Platz 0, also an oberster Position.
Die Regeln werden von oben nach unten abgearbeitet Es werden ALLE Regeln durchlaufen und entsprechend und entsprechend ist das die Ursache. Du musst diese Regel an Ende der Regeln setzen, damit diese zuletzt verarbeitet wird und andere Regeln das Ergebnis/die Veränderung nicht überschreiben
__________________
JD-Dev & Server-Admin
Reply With Quote
  #6  
Old 12.09.2022, 15:56
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Interessenhalber gefragt:
Inwieweit hat "Inforamtion overwrites packagizer rules" im "Analyze and Add Links"-Fenster hier Einfluss?
Diese Checkbox besagt das im AddLinks Dialog gesetzte Infos jene von Regeln gesetzte Infos überschreiben. Es
darf also kein Paketname angegeben sein, sofern du möchtest das deine Regeln hier greifen
__________________
JD-Dev & Server-Admin
Reply With Quote
  #7  
Old 12.09.2022, 16:00
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Hier zwei existierende Besipiel-Links:
  1. **External links are only visible to Support Staff****External links are only visible to Support Staff**
  2. **External links are only visible to Support Staff****External links are only visible to Support Staff**
Als Ordnername soll jeweils der String nach dem letzen / verwendet werden.
Aber deine Beispiele stimmen ja nicht mit deinem Pattern von hier, https://board.jdownloader.org/showpo...93&postcount=1
Quote:
..websiteXY.com/gallery_Irgendwas1
überein und entsprechend brauchst du hier eine andere Regel.
Hast du eine LinkCrawler Regel für die Webseite? da ohne Cookie ja zunächst der *bla bla Content Warnung* Banner kommt.
Wenn du bzgl einer LinkCrawler Regel Fragen hast oder Hilfe brauchst, geb Bescheid
__________________
JD-Dev & Server-Admin

Last edited by Jiaz; 12.09.2022 at 16:15.
Reply With Quote
  #8  
Old 12.09.2022, 16:44
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Die Regeln werden von oben nach unten abgearbeitet Es werden ALLE Regeln durchlaufen und entsprechend und entsprechend ist das die Ursache. Du musst diese Regel an Ende der Regeln setzen, damit diese zuletzt verarbeitet wird und andere Regeln das Ergebnis/die Veränderung nicht überschreiben
Erstmal danke für diesen detailliert erklärten Hinweis. Hatte es bisher anders verstanden...

Ich bin jetzt sehr überrascht!
Wenn ich die Regel ans Ende setze, funktioniert es. Aber als es früher funktioniert hat - und da bin ich mir zu 99,9 % sicher - hat diese Regel an erster Stelle und die <jd:simpledate:yyyy-MM-dd>-Regel darunter gestanden.

Wurde da evtl. beim JD etwas verändert?
Oder erinnere ich mich falsch? Will das nicht zu 100 sondern nur zu 99,9 % ausschließen.

Ergänzende Frage (bevor ich alles mit Trial and Error herausfinden muss)
Wie muss ich andere Regeln in der Reihenfolge platzieren?
z.B. eine Regel, mit der ich definiere, dass - wenn die URL bestimmte Strings enthält - Dateien mit 'Thumbnail' im Namen nicht geladen werden sollen.
Reply With Quote
  #9  
Old 12.09.2022, 16:47
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Ich bin jetzt sehr überrascht!
Wurde da evtl. beim JD etwas verändert?
Es gab hier keinerlei Änderungen und die Regeln wurden schon immer (seit dem es den Packagizer gibt) von oben nach unten abgearbeitet.
__________________
JD-Dev & Server-Admin
Reply With Quote
  #10  
Old 12.09.2022, 16:50
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
wenn die URL bestimmte Strings enthält - Dateien mit 'Thumbnail' im Namen nicht geladen werden sollen.
Das geht mit dem Packagizer gar nicht. Hier bedarf es den Linkgrabber Filtern und diese werden ebenfalls von oben nach unten verarbeitet, aber im Gegensatz zum Packagizer, wird bei der erstem positiven(Regel matched) Regel gestoppt.
__________________
JD-Dev & Server-Admin
Reply With Quote
  #11  
Old 12.09.2022, 17:36
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Also was damit geht, ist Download 'disable'.
Das benutze ich auch schon seit längerem.

Last edited by StefanM; 12.09.2022 at 17:38.
Reply With Quote
  #12  
Old 12.09.2022, 17:39
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Es gab hier keinerlei Änderungen und die Regeln wurden schon immer (seit dem es den Packagizer gibt) von oben nach unten abgearbeitet.
ja, so ist das mit dem Gedächtnis, wenn man älter wird :-(
Reply With Quote
  #13  
Old 12.09.2022, 17:48
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Also was damit geht, ist Download 'disable'.
Das benutze ich auch schon seit längerem.
Okay, ja. Das geht natürlich auch Oder bewusst in ein *DO NOT DOWNLOAD- TRASH* Paket deaktiviert verschieben und dann von Hand aufräumen/löschen. Über Linkgrabber Filter kann man halt den Link komplett blockieren.
__________________
JD-Dev & Server-Admin
Reply With Quote
  #14  
Old 14.09.2022, 16:52
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Über Linkgrabber Filter kann man halt den Link komplett blockieren.
Dann möchte ich doch noch mal nachfragen:
Ich benutze dort bisher nur die 'Custom Views'. Dort kann ich natürlich ein Filter definieren, das Bild-Dateien mit 'thumb' im Namen ausblendet, aber natürlich genausowenig blockiert, wie die 'Package-Lösung'.

Könntest du mir bitte eine Filterkonfiguration senden, bei der der Download von Bild-Dateien mit 'thumb' als Namensbestandteil komplett blockiert wird?

Als Beispiel würde mir ein Filter für jp*g, bmp, png, gif reichen.

Besten Dank!

Last edited by StefanM; 14.09.2022 at 17:36.
Reply With Quote
  #15  
Old 14.09.2022, 17:28
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Dann möchte ich doch noch mal nachfragen:
Ich benutze dort bisher nur die 'Custom Views'. Dort kann ich natürlich ein Filter definieren, dass Bild-Dateien mit 'thumb' im Namen ausblendet, aber natürlich genausowenig blockiert, wie die 'Package-Lösung'.
Könntest du mir bitte eine Filterkonfiguration senden, bei der der Download von Bild-Dateien mit 'thumb' als Namensbestandteil komplett blockiert wird?
Als Beispiel würde mir ein Filter für jp*g, bmp, png, gif reichen.
Hier ist zunächst zu unterscheiden zwischen thumb im Namen oder thumb in der URL.
In der URL kann direkt geprüft werden. Der Name kann jedoch auch evtl erst durch die eigentliche Prüfung bekannt sein. Du meinst aber wahrscheinlich thumb in der URL, also zum Beispiel "*thumb*(jp*g|bmp|png|gif)" (PseudoCode) ?
Aber zusätzlich musst du auch deinen View-Filter entsprechend konfigurieren. Denn sobald ein View-Filter greift, dann wird dieser Link NICHT blockiert, auch bei passendem Filter,
da durch den View-Filter ja explizit gewünscht wird diese Links per View An/Auszuschalten.

Also du wünscht eine Filter Regel welche für thumbs und Bild Extension in der URL blockiert? richtig?
Entsprechend musst du dann zusätzlich noch den View Filter umkonfigurieren/abschalten/entfernen.
__________________
JD-Dev & Server-Admin
Reply With Quote
  #16  
Old 14.09.2022, 17:54
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Also du wünscht eine Filter Regel welche für thumbs und Bild Extension in der URL blockiert? richtig?
Erstmal danke für die zusätzlichen Erklärungen.
Zur obigen Frage: Nein!

Einfache Antwort:
Es geht um Begriff 'thumb' im Bild-Dateinamen

Detaillierte Antwort:
Wie bei den Galerien, die ich als Beispiele genannt hatte, enthält die URL, die normalerweise im 'Deep Link Analyze Mode' gecrawlt werden müssen, diese Infos nicht, weil dies nur die URL zur Galerie-Seite ist (TGP).

Erst beim Crawlen werden die URLs der Bild-Dateien gefunden:
  • URL1/BildAThumb.jpg
  • URL2/BildA.jpg
  • URL1/BildBThumb.jpg
  • URL3/BildB.jpg
  • ...
URL1 und URL2 bzw. URL3 können identisch sein, müssen aber nicht.
Oft sind Teile von URL2, URL3,... kryptisch und bei jedem Bild verschieden, um zu verhindern, dass man einfach durch Hochzählen die übrigen Bilder finden kann.

Oder kann JD in diesen typischen TGPs die Speicherung von Dateien mit bestimmten Namensbestandteilen in die LinkGrabber-Liste gar nicht verhindern? (Außer mit Hoster-spezifischen PlugIns)
Reply With Quote
  #17  
Old 14.09.2022, 17:59
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM: Nein nein, meine Annahme mit thumb in der URL sind schon korrekt weil
Quote:
URL1/BildAThumb.jpg
Hier ist Thumb in der URL

Aber es könnte auch eine URLX/download.zip sein welche dann aber Thumb.jpg als Dateinamen beim Download hat. Das ist
eben jener Unterschied den ich meine. Das obere kann direkt auf der URL geprüft werden, während es für zweiteres eben eine Prüfung benötigt um den *finalen* Dateinamen zu erhalten.

Kurz: Du möchtest alle URLs blockieren wo Thumb (+BildExtension) vorhanden ist?
__________________
JD-Dev & Server-Admin
Reply With Quote
  #18  
Old 14.09.2022, 18:16
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
@StefanM: Nein nein, meine Annahme mit thumb in der URL sind schon korrekt weil

Hier ist Thumb in der URL

Aber es könnte auch eine URLX/download.zip sein welche dann aber Thumb.jpg als Dateinamen beim Download hat. Das ist
eben jener Unterschied den ich meine. Das obere kann direkt auf der URL geprüft werden, während es für zweiteres eben eine Prüfung benötigt um den *finalen* Dateinamen zu erhalten.

Kurz: Du möchtest alle URLs blockieren wo Thumb (+BildExtension) vorhanden ist?
Nimm enfach mal dieses Beispiel:
**External links are only visible to Support Staff****External links are only visible to Support Staff**
hier erhalte ich im Deep Scan sowohl die Fullsize-Bilder als auch tn_00.jpg, tn_01.jpg ... in der LinkGrabber-Liste.
Diverse Galerien dieser Art findet man hier:
**External links are only visible to Support Staff****External links are only visible to Support Staff**

Und richtig, ich möchte - in diesem Test-Fall - Dateien mit tn_*.jpg blockieren. Sollte aber eine Lösung sein, in der ich sehe, wie ich auch andere Extensions (z.B. png) blockieren, damit ich nicht für jede Extension ein neues Filter benötige.
Reply With Quote
  #19  
Old 14.09.2022, 18:24
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@Stefan: und die Info "Thumbnail" steckt hier in der URL via tn_ und nicht im Dateinamen, welcher anders sein kann, wenn zb der Server hier für tn_01.jpg zb Bild.jpg zurückgibt Daher hier die Unterscheidung auf URL und Dateiname. Für diese Seite zb eine LinkFilter Regel mit
Code:
sourceURL/QuellURL - contains/enthält - .*DOMAINNAME\.org/.*/tn_[^/]+\.(jpe?g|png|gif|webm|bmp)
(und die Regex-Checkbox aktivieren)
__________________
JD-Dev & Server-Admin
Reply With Quote
  #20  
Old 14.09.2022, 19:34
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
@Stefan: und die Info "Thumbnail" steckt hier in der URL via tn_ und nicht im Dateinamen, welcher anders sein kann, wenn zb der Server hier für tn_01.jpg zb Bild.jpg zurückgibt Daher hier die Unterscheidung auf URL und Dateiname. Für diese Seite zb eine LinkFilter Regel mit
Code:
sourceURL/QuellURL - contains/enthält - .*DOMAINNAME\.org/.*/tn_[^/]+\.(jpe?g|png|gif|webm|bmp)
(und die Regex-Checkbox aktivieren)
Vielleicht geht das, was ich suche, gar nicht.
Ich will eigentlich einfach nur verhindern, dass eine Datei mit einem bestimmten String im Dateinamen (z.B. thumb) gar nicht erst in die LinkGrabber-Liste kommt - so wie du es ganz zu Anfang gesagt hattest.

Das soll nicht zwingend Seiten- oder Hoster-spezifisch sein.

Ideal wäre natürlich ein Filter definieren zu können, in dem man Strings aus den zu crawlenden URLs eingeben kann.

Beispiel:
Für alle URLs, die den String blogspot beeinhalten.
Das geht ja alles im Packagizer, nur eben, dass ich die Dateien irgendwo hinschieben muss und "nur" den Download disablen kann.
Reply With Quote
  #21  
Old 14.09.2022, 19:37
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM: Natürlich geht das, warum auch nicht? Mein Beispiel war halt aben auf tn_ gemünzt, weil in deinem Beispiel eben nicht "thumb" vorkommt sondern "tn_". Du kannst natürlich einfach *blind* alles blockieren was irgendwie "thumb" in der URL hat, was aber eben auch zu False-Positives führen kann.
Quote:
Originally Posted by StefanM View Post
Für alle URLs, die den String blogspot beeinhalten.
Das geht ja alles im Packagizer, nur eben, dass ich die Dateien irgendwo hinschieben muss und "nur" den Download disablen kann.
LinkFilter -> sourceURL - contains - blogspot

Ich verstehe gerade nicht wo genau das Problem ist? Habe doch ein funktionierendes Beispiel für deine Website gegeben und ebenfalls den Grund gegen ein großflächiges Blockierung von "thumb" in der URL, aber das heisst nicht das es nicht geht!?
__________________
JD-Dev & Server-Admin

Last edited by Jiaz; 14.09.2022 at 19:39.
Reply With Quote
  #22  
Old 16.09.2022, 11:39
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Code:
sourceURL/QuellURL - contains/enthält - .*DOMAINNAME\.org/.*/tn_[^/]+\.(jpe?g|png|gif|webm|bmp)
(und die Regex-Checkbox aktivieren)
Sorry, wenn ich momentan vielleicht etwas schwer von Begriff bin. Mit RegEx tue ich mich auch nach wie vor schwer, diese selbst zu erstellen.


Quote:
Originally Posted by Jiaz View Post
@StefanM: Du kannst natürlich einfach *blind* alles blockieren was irgendwie "thumb" in der URL hat, was aber eben auch zu False-Positives führen kann.

LinkFilter -> sourceURL - contains - blogspot
..., aber das heisst nicht das es nicht geht!?
Frage ich mal anders:

1. Wie ist den das angehängte Beispiel-Filter zu verstehen? Als UND-Bedingung? Heißt: Nur wenn beide Bedinungen erfüllt sind, d.h. wenn der Dateiname thumb enthält UND die zugehörige Source-URL blogspot enthält, dann werden Dateien mit thumb im Dateinamen nicht in die LinkGrabber-Liste eingetragen. Korrekt?

2. Kann ich mehrere URLs in ein Filter schreiben? Wenn ja: Wie?
blogspot|TGP mit RegEx aktiviert?

3. Dasselbe für Dateinamen:
thumb|tn__

4. Wie werden mehrere Filter behandelt?
Die Reihenfolge kann man ja nicht ändern. Also werden alle aktiven Filter - unabhängig von der Reihenfolge - berücksichtigt?

Sorry wenn ich nerve...
Attached Thumbnails
thumbs blockieren.jpg  
Reply With Quote
  #23  
Old 16.09.2022, 13:13
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Sorry, wenn ich momentan vielleicht etwas schwer von Begriff bin. Mit RegEx tue ich mich auch nach wie vor schwer, diese selbst zu erstellen.
Kein Problem. Der Einstieg/Lernkurve für Pattern/Regex ist natürlich erstmal sehr steil, aber die Möglichkeiten sind wirklich nahezu grenzenlos

Quote:
Originally Posted by StefanM View Post
2. Kann ich mehrere URLs in ein Filter schreiben? Wenn ja: Wie?
blogspot|TGP mit RegEx aktiviert?
Du kannst natürlich UND/ODER integrieren, zb ein ODER ala
Quote:
.*(hallo\.org|nicedomain\.com|nixgut\.de)/.*/tn_[^/]+\.(jpe?g|png|gif|webm|bmp)
Zb in regex101.com einfügen und links den FLAVOR auf Java8 stellen.
Dann kannst du unten deinen Test/Text einfügen und rechts wird dir angezeigt ob/was das Pattern matched und auch detaillierte Erklärtung des Pattern selbst.


Quote:
Originally Posted by StefanM View Post
3. Dasselbe für Dateinamen:
thumb|tn__
Analog zum Beispiel drüber
Quote:
.*(hallo\.org|nicedomain\.com|nixgut\.de)/.*/(thumb|tn_)[^/]+\.(jpe?g|png|gif|webm|bmp)

Quote:
Originally Posted by StefanM View Post
4. Wie werden mehrere Filter behandelt?
Die Reihenfolge kann man ja nicht ändern. Also werden alle aktiven Filter - unabhängig von der Reihenfolge - berücksichtigt?
Die Filter werden von oben nach unten abgearbeitet, also ja, alle aktiven Filter werden geprüft.
Aber der erste Filter der *matched/übereinstimmt* stoppt den Vorgang und somit gilt der Link als gefiltert.
ABER nur wenn es keinen passenden View-Filter gibt.
Zunächst wird geschaut ob es einen passenden View-Filter gibt, wenn ja, dann werden keine weiteren Filter geprüft und
der Link wird entsprechend verarbeitet sodass dann im Linkgrabber der View-Filter verfügbar ist. Kein View-Filter, dann
werden die (Blockier) Filter geprüft.


Quote:
Originally Posted by StefanM View Post
1. Wie ist den das angehängte Beispiel-Filter zu verstehen? Als UND-Bedingung? Heißt: Nur wenn beide Bedinungen erfüllt sind, d.h. wenn der Dateiname thumb enthält UND die zugehörige Source-URL blogspot enthält, dann werden Dateien mit thumb im Dateinamen nicht in die LinkGrabber-Liste eingetragen. Korrekt?
Mein Beispiel sucht nicht nach thumb in der URL sondern lediglich nach tn_ weil in deinem Beispiel die Thumbnails mit tn_ in der URL waren. Aber du kannst natürlich die Domain oder andere Teile des Pattern auch als Optional gestalten.


In deinem Beispiel/Screenshot muss die URL blogspot enthalten und der Dateiname thumb. ABER: Wenn du auf Dateiname prüfst, dann kann das dazu führen, das der Link länger/tiefer verarbeitet wird als nötig, da zb der Dateiname erst beim eigentlichen Download vorhanden/bekannt ist. Sofern du dich auf die URL beschränkst, dann können Links bereits sehr frühzeitig gefiltert werden ohne das dafür überhaupt ein Request nötig sein muss.
__________________
JD-Dev & Server-Admin

Last edited by Jiaz; 16.09.2022 at 13:15.
Reply With Quote
  #24  
Old 16.09.2022, 13:16
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Sorry wenn ich nerve...
Keine Sorge tust du nicht
__________________
JD-Dev & Server-Admin
Reply With Quote
  #25  
Old 16.09.2022, 13:57
pspzockerscene's Avatar
pspzockerscene pspzockerscene is offline
Community Manager
 
Join Date: Mar 2009
Location: Deutschland
Posts: 70,922
Default

Quote:
Originally Posted by Jiaz View Post
Wenn du auf Dateiname prüfst, dann kann das dazu führen, das der Link länger/tiefer verarbeitet wird als nötig, da zb der Dateiname erst beim eigentlichen Download vorhanden/bekannt ist. Sofern du dich auf die URL beschränkst, dann können Links bereits sehr frühzeitig gefiltert werden ohne das dafür überhaupt ein Request nötig sein muss.
Da du das schon mehrmals erklärt hast und ich das Gefühl habe, dass Stefan es evtl. noch nicht verstanden hat, möchte ich hier etwas hinzufügen:

Nur weil ein Link z.B. mit "irgendwas.jpg" endet heißt das nicht, dass das auch der "richtige" Dateiname ist, den die Datei beim Download erhält.
Wenn du den Link öffnest, kann im Response-Header ein Dateiname enthalten sein, der anders ist als der, der im Link steht.
Mehr Infos dazu:
developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Content-Disposition
Sofern möglich, würde ich das was im Link steht zum Filtern verwenden, um eben diese http Anfrage zu vermeiden und den Filterprozess somit schneller zu gestalten.
Beispiel anhand einer selbst hochgeladenen Datei:
Folgender Link sieht so aus als würde er zu einer Datei "dasIstNichtDerRichtigeDateiname.jpg" führen, aber das stimmt nicht. Der echte Dateiname ist "10MB.rar":
Code:
ddownload.com/j71q99uuapc2/dasIstNichtDerRichtigeDateiname.jpg
Kurzlink:
Code:
ddownload.com/j71q99uuapc2
In den meisten Fällen dürfte die Prüfung auf "das was im Link steht" ausreichen.
__________________
JD Supporter, Plugin Dev. & Community Manager

Erste Schritte & Tutorials || JDownloader 2 Setup Download
Spoiler:

A users' JD crashes and the first thing to ask is:
Quote:
Originally Posted by Jiaz View Post
Do you have Nero installed?
Reply With Quote
  #26  
Old 16.09.2022, 15:56
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
...dann können Links bereits sehr frühzeitig gefiltert werden ohne das dafür überhaupt ein Request nötig sein muss.
Danke für die Erläuterungen! Mit RegEx101 arbeite ich schon :-)

Muss ich alles in Ruhe versuchen zu verstehen.
Reply With Quote
  #27  
Old 16.09.2022, 16:33
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM: Wenn du hierzu noch weitere Fragen hast, nur her damit
__________________
JD-Dev & Server-Admin
Reply With Quote
  #28  
Old 16.09.2022, 16:52
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Kein Problem. Der Einstieg/Lernkurve für Pattern/Regex ist natürlich erstmal sehr steil, ..
Laut RegEx101 kein Match. Siehe Screenshot.

???

Aber da mache ich wohl wieder was falsch, nehme ich an?
Attached Thumbnails
no match.jpg  
Reply With Quote
  #29  
Old 16.09.2022, 16:57
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM: dein Pattern definiert
Quote:
../.*/....
aber in der URL gibt es nur ein /
versuch es mit
Code:
..../.*/?(thumb...
__________________
JD-Dev & Server-Admin
Reply With Quote
  #30  
Old 16.09.2022, 17:03
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
@StefanM: dein Pattern definiert

aber in der URL gibt es nur ein /
versuch es mit
Code:
..../.*/?(thumb...
Das ist DEIN pattern
Aber auch mit der vorgeschlagenen Änderung zeigt mit RegEx101 kein Match.
Reply With Quote
  #31  
Old 16.09.2022, 17:11
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Das ist DEIN pattern
Aber auch mit der vorgeschlagenen Änderung zeigt mit RegEx101 kein Match.
Ja Dein/Mein...das Pattern hab ich definiert um auf dein Beispiel zu matchen
__________________
JD-Dev & Server-Admin
Reply With Quote
  #32  
Old 16.09.2022, 17:13
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Aber auch mit der vorgeschlagenen Änderung zeigt mit RegEx101 kein Match.
Geht hier wunderbar, gerade getestet. Zeig mal bitte dein Pattern. Nur damit es keine Verwirrung gibt, ich habe lediglich den Teil des Pattern gezeigt der geändert werden muss, nicht das komplette Pattern
__________________
JD-Dev & Server-Admin
Reply With Quote
  #33  
Old 16.09.2022, 17:17
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
Geht hier wunderbar, gerade getestet. Zeig mal bitte dein Pattern. Nur damit es keine Verwirrung gibt, ich habe lediglich den Teil des Pattern gezeigt der geändert werden muss, nicht das komplette Pattern
Ich nehmen auch an, dass ICH den Fehler mache. Aber ich brauche Hilfe, den Fehler zu finden.
Attached Thumbnails
2.jpg  
Reply With Quote
  #34  
Old 16.09.2022, 17:25
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

@StefanM: Ist da ein Leerzeichen hinter dem Pattern (der Punkt)? also hinter "bmp)" ? Der muss natürlich weg
__________________
JD-Dev & Server-Admin
Reply With Quote
  #35  
Old 16.09.2022, 17:29
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by Jiaz View Post
@StefanM: Ist da ein Leerzeichen hinter dem Pattern (der Punkt)? also hinter "bmp)" ? Der muss natürlich weg
Siehst du!
Hab ja gesagt, dass ICH den Fehler gemacht habe.
Copy and Paste und dabei gab es dann wohl ein Blank am Ende :-)

RegEx Patterns lesen ist mithilfe von RegEx101 nicht ganz so schwer für mich, so dass ich dann kleinere Modifikationen selbst machen kann.

Aber mehr in der Regel nicht.
Reply With Quote
  #36  
Old 16.09.2022, 17:30
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

Quote:
Originally Posted by StefanM View Post
Siehst du!
Hab ja gesagt, dass ICH den Fehler gemacht habe
Aber evtl. kannst dir mal meine Frage zum Packagizer ansehen, bitte?
Reply With Quote
  #37  
Old 16.09.2022, 17:41
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Aber evtl. kannst dir mal meine Frage zum Packagizer ansehen, bitte?
Schon getan
__________________
JD-Dev & Server-Admin
Reply With Quote
  #38  
Old 16.09.2022, 17:42
Jiaz's Avatar
Jiaz Jiaz is offline
JD Manager
 
Join Date: Mar 2009
Location: Germany
Posts: 79,290
Default

Quote:
Originally Posted by StefanM View Post
Aber mehr in der Regel nicht.
Du kannst gerne jederzeit bei Fragen/Unklarheiten oder Problemen fragen
__________________
JD-Dev & Server-Admin
Reply With Quote
  #39  
Old 17.09.2022, 13:49
StefanM's Avatar
StefanM StefanM is offline
JD VIP
 
Join Date: Oct 2020
Posts: 485
Default

@pspzockerscene

Quote:
Originally Posted by pspzockerscene View Post
Da du das schon mehrmals erklärt hast und ich das Gefühl habe, dass Stefan es evtl. noch nicht verstanden hat, möchte ich hier etwas hinzufügen: ...
Danke auch für deinen Input!
Reply With Quote
Reply

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off

Forum Jump

All times are GMT +2. The time now is 02:31.
Provided By AppWork GmbH | Privacy | Imprint
Parts of the Design are used from Kirsch designed by Andrew & Austin
Powered by vBulletin® Version 3.8.10 Beta 1
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.