Guten Morgen,
ich musste noch zwei kleine Änderungen vornehmen, es gibt auch Benutzernamen die Zahlen enthalten, und hab dann noch einen Sonderfall bemerkt, es gibt noch Panorama Bilder die nur height=500 sind, was aber direkt durch den deep scan gefunden wird und keine REWRITE Regel benötigt, hab einfach die Pixel angabe von =1000 zu =(5|10)00 geändert.
Das ist also die fertige Regel:
Code:
{
"name": "DEEPDECRYPT fotocommunity.de",
"rule": "DEEPDECRYPT",
"enabled": true,
"logging": false,
"maxDecryptDepth": 1,
"pattern": "https?://(www\\.)?fotocommunity\\.de/photo/([A-Za-z0-9-]+)/[0-9]+",
"deepPattern": "(https?://img\\.fotocommunity\\.com/[A-Za-z0-9-]+\\.jpg\\?[A-Za-z]+=(5|10)00)",
"packageNamePattern": "<meta property=\"og:url\" content=\"https?://(?:www\\.)?fotocommunity\\.de/photo/([^/]+)/[0-9]+\"\\s*>"
},
{
"name": "REWRITE fotocommunity.de",
"rule": "REWRITE",
"enabled": true,
"pattern": "(https?://img\\.fotocommunity\\.com/([A-Za-z0-9-]+)\\.jpg\\?)[A-Za-z]+=1000",
"rewriteReplaceWith": "$1height=1080"
}
Ich würde nur nochmal was zu den doppel Backslashes sagen, um das Missverständniss auszuräumen, denn ich hab mich nochmal mit der Seite "regex101.com" beschäftigt, und bemerkt, dass ich zunächst die Funktionsweise des Tools nicht ganz begriffen hab.
In der knowledge Base steht:
Quote:
Useful online tool for testing regular expressions: regex101.com -> Make sure to set the "Flavor" in the left side to "Java 8"!
|
Daher hab ich zu Beginn gedacht, wenn man in dem "Flavor" Menü wie in der Knowledgebase empfohlen, "Java 8" auswählt, muss in das "REGULAR EXPRESSION" Feld, der reguläre Ausdruck, dem "Java" Standard entsprechend mit z.B. zwei Backslashes vor einem Punkt, eingefügt werden, um ihn zu überprüfen, so wie er später in die Linkcrawler Regel geschrieben wird.
Das war falsch, wenn man den Regulären Ausdruck so einfügt, wird er in dem Test nicht erkannt, man muss also den regulären Ausdruck in dem Standart mit NUR EINEM Backslash zum escapen einfügen, wie er z.B. auf meiner Seite "regex-generator.olafneumann.org" unter Punkt "4 Regular Expression" generiert wird.
Wenn man auf der Seite "regex101.com" dann den korrekten regulären Ausdruck ermittelt hat, wählt man im "TOOLS" Menü auf der linken Seite unter dem "FLAVOR" Menü den einzigen Punkt "Code Generator" aus, und es erscheint ein Fenster mit Java Code in dem der reguläre Ausdruck mit doppel Backslash vor dem Punkt, dem Java standard entsprechend, enthalten ist, den man dann kopieren und z.B. in der Linkcrawler Regel benutzen kann.
Ich fasse kurz zum besseren Verständnis zusammen:
Da ich ja beim erstellen der Regel gesehen hab, dass zum escapen von Punkten in den Linkcrawler Regeln zwei Backslashes benötigt werden und in der Knowledgebase ja der Hinweis mit "Java 8" für die Seite "regex101.com" gegeben wird, hab ich also auf "regex101.com" einen regulären Ausdruck zum überprüfen eingefügt, der dem Java Standart entspricht, so wie ich ihn unter "Java" im Menüpunkt "5" ganz untenauf der Seite "regex-generator.olafneumann.org" generiert bekommen habe, und hab auch das "Java 8" in dem Menü ausgewählt, und mich anschließend lange gewundert, wieso der Ausdruck nicht erkannt wird, obwohl er scheinbar korrekt war.
So damit wäre alles erledigt, jetzt kann ich meine über 9000 Links von der fotocommunity.de in den JDownloader einfügen, erspare mir tage- oder wochenlange, sehr stumpfsinnige Arbeit, und dafür BEDANKE ICH MICH HERZLICH (=^ェ^=).