Sad og kedede mig lidt idag – fandt ud af hvordan man striper alle billederne ud af en hjemmeside, laver fil med absolute links til dem og batch henter dem med wget. Alt fra en shellprompt i linux.
wget http://www.micom.net/oops/
Hent hjemmesiden.
mv index.html oopindex.html
rename hjemmesidefilen.
cat oopsindex.html | cut -s -d'"' -f2 | grep jpg | awk ' { print "http://www.micom.net/oops/" $_ } ' > ooplist.txt
Vi antager der er et link i hver line i siden og at de er delimited med ", -s er for at tage højde for billeder med mellemrum i navnet; cutter dem ud; tager kun dem med der er jpg's; tilføj den absolute sti foran billede urlen.; skriv til hentefil.
wget -i ooplist.txt
Hent alle urlerne i filen.
Så har jeg leget lidt og skrevet en playlist generator ud fra Eve online hjemmeside med ingame musik:
cat evemusic.htm | sed 's/br/\n/g' | grep '.mp3' | grep -v 'href="http://ccp">' | cut -d'"' -f4 | awk ' { print "http://www.eve-online.com/download/music/" $_ } ' > evemusic.m3u
Og her blev jeg så bekendt med sed's evner 🙂