ArchiveBox

ArchiveBox

🗃 Det selvhostede webarkiv med open source.Tar browserhistorik / bogmærker / Pocket / Pinboard / osv., Gemmer HTML, JS, PDFs, medier og mere.
  • Gratis
Da moderne websteder er komplicerede og ofte er afhængige af dynamisk indhold, arkiverer ArchiveBox siderne i flere forskellige formater ud over, hvad offentlige arkiveringstjenester som Archive.org og Archive.is er i stand til at gemme.ArchiveBox importerer en liste over webadresser fra stdin, ekstern url eller fil, og tilføjer derefter siderne til en lokal arkivmappe ved hjælp af wget til at oprette en gennemsøgt html-klon, youtube-dl til at udtrække medier og en fuld forekomst af Chrome hovedløs til PDF,Screenshot og DOM-dumps og mere ... Ved hjælp af flere metoder og den markedsdominerende browser til at udføre JS sikrer vi, at vi kan gemme selv de mest komplekse, finicky websteder i mindst et par høje kvalitet, langvarige dataformater.### Kan importere links fra: - Pocket, Pinboard, Instapaper - RSS, XML, JSON eller almindelig tekstlister - Browserhistorik eller bogmærker (Chrome, Firefox, Safari, IE, Opera og mere) - Shaarli, Delicious, RedditGemte indlæg, Wallabag, Unmark.it og enhver anden tekst med links i det!### Kan gemme disse ting for hvert websted: - `favicon.ico` favorit af webstedet -` eksempel.com / side-navn.html` wget-klon af webstedet, med .html vedhæftet, hvis ikke til stede - `output.pdf` Printet PDF af webstedet ved hjælp af headless chrome - `screenshot.png` 1440x900 screenshot af site ved hjælp af headless chrome -` output.html` DOM Dump af HTML efter gengivelse ved hjælp af headless chrome - `archive.org.txt` Et link tilgemt sted på archive.org - `warc /` for html + gzipped warc-filen.gz - `media /` alle mp4, mp3, undertekster og metadata, der findes ved hjælp af youtube-dl - `git /` klon af ethvert arkiv til github-, bitbucket- eller gitlab-links - `index.html` &` index.json`HTML- og JSON-indeksfiler, der indeholder metadata og detaljer Arkiveringen er additiv, så du kan planlægge `. / Arkiv« til at køre regelmæssigt og trække nye links ind i indekset.Alt det gemte indhold er statisk og indekseres med JSON-filer, så det lever for evigt og er let at dele, det kræver ingen backend, der altid kører.
archivebox

Kategorier

Alternativer til ArchiveBox til Linux

Wget

Wget

GNU Wget er en gratis softwarepakke til hentning af filer ved hjælp af HTTP (S) og FTP, de mest anvendte internetprotokoller.
HTTrack

HTTrack

En webstedskopieringstjeneste, der downloader hele websteder og bygger dem rekursivt lokalt.
wallabag

wallabag

wallabag er et opensource-program, der er vært, til selv at gemme websider. ## Komfortabel læsning
Stash.ai

Stash.ai

Stash er en smart bogmærke-app på tværs af enheder, der støttes af kunstig intelligens.Gem artikler, videoer og andet.De kategoriseres automatisk for dig.
PageArchiver

PageArchiver

PageArchiver (tidligere kaldet "Scrapbook for SingleFile") er en Chrome-udvidelse, der hjælper dig med at arkivere websider til offline læsning. De vigtigste funktioner er:
Fossilo

Fossilo

Fossilo.com arkiverer kontinuerligt komplette websteder som pdf og flere andre formater, der let kan åbnes og ses uden nogen afhængighed i fremtiden.Du kan navigere i arkiverne i plattformen eller downloade den som en uafhængig pakke.
WebArchives

WebArchives

En seer på webarkiver, der tilbyder muligheden for at gennemse millioner af artikler fra store samfundsprojekter som Wikipedia eller Wikisource.Features offline.