Jeg skal sikre tekst / grafik m.m. fra et website inden det tages offline om få dage.
Det er ikke muligt at logge ind i systemet og tage en backup fra serveren. Siden kører på et ukendt CMS, men det er skrevet i PHP.
Jeg leer nu efter et værkstøj der kan løbe hele siden igennem og gennem tekst og grafik for mig. Det skal helst give mig en offline version af siden, som jeg senere kan gennemgå for at flytte indholdet over i et nyt wordpress site.
Nogle gode forslag?
Det kan gøres med wget, hvis du ikke er bange for Terminal. Noget ala følgende, efter det er installeret:
wget --mirror --convert-links --html-extension --wait=2 https://hjemmeside.test/
Der er rigtig mange muligheder, så det er bestemt værd at nærlæse manualen for at tilpasse kommandolinjen præcis til dit behov.
Det installeres lettest via Homebrew, faktisk er det netop wget de bruger som eksempel på forsiden.
SiteSucker bør kunne gøre det. Koster kr. 45,- på Appstore, se også https://ricks-apps.com/osx/sitesucker/index.html
/Carsten
Du skriver det ikke er muligt at logge ind i systemet... Mener du det ukendte CMS eller serveren (ftp) ?
PHP bliver eksekveret på serveren, så hvis du ikke kan komme ind via ftp så vil du aldrig kunne se koden i dens komplette form. Nu ved jeg jo ikke hvor vigtigt dette er for dig i dette eksempel, eller om du bare vil hive billeder og tekst ud.
Michael Rasmussen skrev:Det kan gøres med wget, hvis du ikke er bange for Terminal. Noget ala følgende, efter det er installeret:
wget --mirror --convert-links --html-extension --wait=2 https://hjemmeside.test/Der er rigtig mange muligheder, så det er bestemt værd at nærlæse manualen for at tilpasse kommandolinjen præcis til dit behov.
Det installeres lettest via Homebrew, faktisk er det netop wget de bruger som eksempel på forsiden.
Det ligner en god løsning, jeg har desværre bare ikke tid til at sætte mig ind i det hele lige nu da siden forsvinder meget snart. Tak for tippet.
Carsten Sigsgaard Mortensen skrev:SiteSucker bør kunne gøre det. Koster kr. 45,- på Appstore, se også https://ricks-apps.com/osx/sitesucker/index.html
/Carsten
Købt og testet, ser ud til at være den løsning jeg manglede for at hente en masse pdf filer fra siden.
Tak for hjælpen.
Felle skrev:Du skriver det ikke er muligt at logge ind i systemet... Mener du det ukendte CMS eller serveren (ftp) ?
PHP bliver eksekveret på serveren, så hvis du ikke kan komme ind via ftp så vil du aldrig kunne se koden i dens komplette form. Nu ved jeg jo ikke hvor vigtigt dette er for dig i dette eksempel, eller om du bare vil hive billeder og tekst ud.
Et CMS udviklet af leverandør af den her løsning, leverandøren blev opkøbt at andet firma. Ny ejer opsiger de sidst kunder på løsningen og jeg tilbød at hjælpe med at oprette nyt website. Desværre er der kun ganske få dage tilbage før siden går offline og såvidt jeg kan gennemskue, er kommunikationen imellem kunde og leverandør lige nu afhængig af købt support og det ligner ikke at det sker.
Med andre ord imens jeg ikke ved ret meget vil jeg sikre vitale data.
Der er tale om en egenudviklet PHP CMS og jeg har ikke adgang til backend, men jeg vil primært have fingre i en masse PDF filer og det ser ud til at et forslag længere oppe i tråden kan køre det for mig.
Ah ok - håber du får fingrene i alt du har brug for :)
jeg vil da starte først med at få leverandør til at give kopi af data.
alt andet er bare lappeløsning, som du nok ikke få særlig meget ud af end at spild af tid og tab af data du forsøger at redde.
du kan måske godt hente data ned med en webcrawler eller wget (som nævnt tidligere) men spørgsmål er om den bliver blokeret midt i processen.
evt., hvis du er heldig, så findes der en kopi af website på https://archive.org/