5
DiffBot
* Hent data fra websider automatisk: Diffbots computervisions API'er omdanner internettet til din database.* AUTOMATISKE API'er: Ekstraher automatiskHent struktureret indhold fra artikler, produkter og andre kendte sidetyper.
- Betalt
- Web
Hvorfor Diffbot?Vi fokuserer udelukkende på at få dig bedre webdata.Nogle af grundene til, at hundreder af kunder foretager (hundreder af) millioner af opkald hver måned: # Internets bedste indholdsekstraktor: Diffbot fungerer automatisk - uden regler eller træning.Der er ingen bedre måde at udtrække data fra websider.Se, hvordan Diffbot stabler op til andre indholdsekstraktionsmetoder: Funktion Sammenligning Tekstudtrækning Kvalitet Shootout # Identificer sider automatisk: Brug Analyser API til automatisk at finde og udpakke alle produkter, artikler, diskussioner eller billeder, mens du gennemsøger ethvert websted.Analyser API #Detaljerede produktdata: Produkt-API'en returnerer automatisk komplette produktinfo, inklusive alle prisdata, produkt-id'er, mærke og fulde specifikationstabeller.Produkt API # Rens tekst og html: Artikler, diskussionstråde, produktbeskrivelser og billedtekst returneres i ren tekst og desinficeret HTML.Begynd at teste i dag # Struktureret søgning: Søg i struktureret indhold fra enhver gennemsøgning on-the-fly ved hjælp af vores Search API, og returner kun de matchende resultater.Plus ... ¤ Alle API'er udfører Javascript, så indholdet er parset som en almindelig browser.¤ Fungerer på de fleste ikke-engelske sider takket være visuel behandling.¤ Dato normalisering: Datostempler normaliseres og præsenteres i RFC 1123 (HTTP / 1.1) standardformat.¤ Flere sideartikler kobles automatisk sammen i et enkelt API-svar.¤ Ekstraktion af enheder: automatisk mærkning identificerer vigtige emner og enheder i artiklteksten.¤ Løs eventuelle problemer i realtid med API Toolkit.¤ Bulk API tillader ekstraktion af hundreder til hundreder af tusinder af sider.¤ Få adgang til Crawlbot og Bulk jobdata i fulde JSON- eller CSV-formater.¤ Gennemsøg eventuelt ved hjælp af en række forskellige IP-adresser.