ArchiveBox

ArchiveBox

🗃 Det selvhostede webarkiv med open source.Tar browserhistorik / bogmærker / Pocket / Pinboard / osv., Gemmer HTML, JS, PDFs, medier og mere.
  • Gratis
Da moderne websteder er komplicerede og ofte er afhængige af dynamisk indhold, arkiverer ArchiveBox siderne i flere forskellige formater ud over, hvad offentlige arkiveringstjenester som Archive.org og Archive.is er i stand til at gemme.ArchiveBox importerer en liste over webadresser fra stdin, ekstern url eller fil, og tilføjer derefter siderne til en lokal arkivmappe ved hjælp af wget til at oprette en gennemsøgt html-klon, youtube-dl til at udtrække medier og en fuld forekomst af Chrome hovedløs til PDF,Screenshot og DOM-dumps og mere ... Ved hjælp af flere metoder og den markedsdominerende browser til at udføre JS sikrer vi, at vi kan gemme selv de mest komplekse, finicky websteder i mindst et par høje kvalitet, langvarige dataformater.### Kan importere links fra: - Pocket, Pinboard, Instapaper - RSS, XML, JSON eller almindelig tekstlister - Browserhistorik eller bogmærker (Chrome, Firefox, Safari, IE, Opera og mere) - Shaarli, Delicious, RedditGemte indlæg, Wallabag, Unmark.it og enhver anden tekst med links i det!### Kan gemme disse ting for hvert websted: - `favicon.ico` favorit af webstedet -` eksempel.com / side-navn.html` wget-klon af webstedet, med .html vedhæftet, hvis ikke til stede - `output.pdf` Printet PDF af webstedet ved hjælp af headless chrome - `screenshot.png` 1440x900 screenshot af site ved hjælp af headless chrome -` output.html` DOM Dump af HTML efter gengivelse ved hjælp af headless chrome - `archive.org.txt` Et link tilgemt sted på archive.org - `warc /` for html + gzipped warc-filen.gz - `media /` alle mp4, mp3, undertekster og metadata, der findes ved hjælp af youtube-dl - `git /` klon af ethvert arkiv til github-, bitbucket- eller gitlab-links - `index.html` &` index.json`HTML- og JSON-indeksfiler, der indeholder metadata og detaljer Arkiveringen er additiv, så du kan planlægge `. / Arkiv« til at køre regelmæssigt og trække nye links ind i indekset.Alt det gemte indhold er statisk og indekseres med JSON-filer, så det lever for evigt og er let at dele, det kræver ingen backend, der altid kører.

Kategorier

Alternativer til ArchiveBox til Safari med open source-licens