|
#1
|
|||
|
|||
How to fix many links quickly?
How to fix many links quickly?
Mini-example: https%3A%2F%2Fwww. |
#2
|
||||
|
||||
google: html entities
__________________
raztoki @ jDownloader reporter/developer http://svn.jdownloader.org/users/170 Don't fight the system, use it to your advantage. :] |
#3
|
|||
|
|||
But this is a completely different coding than such, and it is not known what a huge number of coding.
I do not mean this HTML: **External links are only visible to Support Staff****External links are only visible to Support Staff** |
#4
|
||||
|
||||
sorry its urlencoding,
htmlentities & prefix urlencoding % prefix not sure why I said the other, basically you have to reverse the encoding raztoki
__________________
raztoki @ jDownloader reporter/developer http://svn.jdownloader.org/users/170 Don't fight the system, use it to your advantage. :] |
#5
|
|||
|
|||
DECODING of links works, but the links still contain binary characters. And do not just extract the correct links?
Example binary char Én;… 0 H È ` and Example ENCODING: http%3A%2F%2Fgosvopros.ru%2Fjob%2Frabochie-otnosheniya%2Fhandwritten%2F%26prev%3Dsearch%20%20%20%0E%20%20%20T%20B%01u%20m%20a%20c%20z%20%20%20G %20o%20o%20g%20l%20e%20%C4%9Ab%20%20%C4%8Cb%20%20%1B%20%20%20%C5%94b%20%20%18%20%20%20%20%20%20%20%1 0%20%20%20%20%20%20%20%10%20%20%20%20%20%20%20%08%20%20%20%20%20%20%20%60%20%20%20%20%20%20%20X%20%2 0%20%20%20%20%20%60%01%20%20%20%20%20%20%C2%A0%01%20%20%20%20%20%20%20%20%20%20%20%20%20%20%C2%A8%01 %20%20%20%20%20%20%20%20%20%20%04%20%20%20(%04%20%20%20%20%20%20%C2%B8E%CB%98T%C3%8E%E2%80%9A%05%20% C4%85E%CB%98T%C3%8E%E2%80%9A%05%20h%04%20%20%20%20%20%20%E2%82%AC%04%20%20%20%20%20%20%10%20%20%20%2 0%20%20%20%08%20%20%20%20%20%20%20%C3%BA%20%20%20y%20%20%20h%20t%20t%20p%20s%20%3A%20%2F%20%2F%20t%2 0r%20a%20n%20s%20l%20a%20t%20e%20.%20g%20o%20o%20g%20l%20e%20.%20p%20l%20%2F%20t%20r%20a%20n%20s%20l %20a%20t%20e%20%3F%20h%20l%20%3D%20p%20l%20%26%20s%20l%20%3D%20r%20u%20%26%20u%20%3D%20h%20t%20t%20p %20%3A%20%2F%20%2F%20g%20o%20s%20v%20o%20p%20r%20o%20s%20.%20r%20u%20%2F%20j%20o%20b%20%2F%20r%20a%2 0b%20o%20c%20h%20i%20e%20-%20o%20t%20n%20o%20s%20h%20e%20n%20i%20y%20a%20%2F%20h%20a%20n%20d%20w%20r%20i%20t%20t%20e%20n%20%2F %20%26%20p%20r%20e%20v%20%3D%20s%20e%20a%20r%20c%20h%20%20%20%20%20%20%20%10%20%20%20%20%20%20%20%08 %20%20%20%20%20%20%204%20%20%20%16%20%20%20h%20t%20t%20p%20s%20%3A%20%2F%20%2F%20w%20w%20w%20.%20g%2 0o%20o%20g%20l%20e%20.%20p%20l%20%2F%20%20%20%20%20%10%20%20%20%20%20%20%20%08%20%20%20%20%20%20%20% 08%20%20%20%20%20%20%20p |
#6
|
|||
|
|||
I did it in EmEditor
Decode -> Percent-encoding to Unicode (UTF-8) Find URL: (news|http|ftp|https):\/\/[\w\-_]+(\.[\w]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])? Extract Options: Display Matches Strings Only |
Thread Tools | |
Display Modes | |
|
|