Linux Strip billeder fra hjemmeside

Sad og kedede mig lidt idag – fandt ud af hvordan man striper alle billederne ud af en hjemmeside, laver fil med absolute links til dem og batch henter dem med wget. Alt fra en shellprompt i linux.

wget http://www.micom.net/oops/
Hent hjemmesiden.

mv index.html oopindex.html
rename hjemmesidefilen.

cat oopsindex.html | cut -s -d'"' -f2 | grep jpg | awk ' { print "http://www.micom.net/oops/" $_ } ' > ooplist.txt
Vi antager der er et link i hver line i siden og at de er delimited med ", -s er for at tage højde for billeder med mellemrum i navnet; cutter dem ud; tager kun dem med der er jpg's; tilføj den absolute sti foran billede urlen.; skriv til hentefil.

wget -i ooplist.txt
Hent alle urlerne i filen.

Så har jeg leget lidt og skrevet en playlist generator ud fra Eve online hjemmeside med ingame musik:

cat evemusic.htm | sed 's/br/\n/g' |  grep '.mp3' | grep -v 'href="http://ccp">' | cut -d'"' -f4 | awk ' { print "http://www.eve-online.com/download/music/" $_ } ' > evemusic.m3u

Og her blev jeg så bekendt med sed's evner 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *

Siden før kendt som "SKRID, Lukket server"