ZDNET galvenie pārņemšana
- Starpniekservera servisa platforma OxyLabs piedāvā milzīgu ētiski iegūtu dzīvojamo starpniekservera kopumu, kas nozīmē, ka jūs, visticamāk, iegūsit labas kvalitātes datus, bez atgrūšanas no vietnēm, kuras apmeklējat.
- OxyLabs API un AI sajaukums ļāva mums viegli veikt testa zvanus, un tam vajadzētu nodrošināt stabilu pamatu lietotņu nokasšanai.
- OxyLabs ir lieliska dokumentācija un videoklipi, kuriem vajadzētu palīdzēt jums piecelties un darboties ar viņu rīkiem
- Tas ir vienkāršs course of.
Oksilāti Nodrošina tīmekļa nokasīšanas un ar to saistīto pakalpojumu klāstu. Tajos ietilpst starpniekservera mašīnas, izstrādātāju API nodrošināšana piekļuvei un pieprasījumu iesniegšanai caur šīm mašīnām, kā arī atbalsta pakalpojumu sniegšana (ieskaitot nokrišņu zāļu AI), lai parsētu iegūtos datus, lai tos izmantotu lietojumprogrammās.
Milzīgi starpniekservera baseini
Salīdzinot ar citiem starpniekservera pakalpojumiem, piemēram, iProyal vai marsproxies, Oxylabs piedāvā daudz lielāku dzīvojamo starpniekserveru aparātu. Marsproksijas ziņo tikai par miljonu mašīnu savā starpniekserverī, Iproyal ziņojumi 32 miljonu dzīvojamo mašīnu baseins, savukārt OxyLabs piedāvā vairāk nekā 175 miljonus dzīvojamo māju pilnvaru 195 valstīs.
Runājot par nepārtrauktām nokasīšanas operācijām, jo pieejamākas mašīnas, jo mazāk jebkura mašīna tiks apzīmēta kā uzmācīga vietņu operatori. Tas gan samazina slodzi vietnēs, gan palielina iespējamību, ka nokasīšanas operācijas izdosies.
Viena lieta, kas man ienāca prātā, pārskatot šo informāciju: kā tieši tāds uzņēmums kā OxyLabs iegūst piekļuvi 175 miljoniem mašīnu, jo īpaši tāpēc, ka viņi saka, ka viņi to dara ētiski? Oxylabs nodrošina obligāti jāizlasa ziņojums kurā apskatīti viņu iepirkuma procesi un politika.
Arī: Labākie starpniekservera servera pakalpojumi: eksperts ieteica
Izrādās, ka uzņēmums maksā dzīvojamo māju īpašniekiem nelielu summu apmaiņā pret viņu joslas platuma šķēli. To visu veicina vairākas dažādas lietotnes, kas lietotājiem piedāvā finansiālu atlīdzību par dalību šajās programmās.
Es jau iepriekš esmu veicis šo lietotņu reklamēšanu, wager es nenojautu to raison d’être: lai nodrošinātu piekļuvi izplatītām mašīnām datu iegūšanas tīkliem. Neviens individuāls datora lietotājs negrasās bagāti no šīm līdzdalības programmām, wager, ja jūs esat kāds, kurš taupīgi izmanto joslas platumu, tas var būt veids, kā paņemt dažus papildu dolārus.
Along with residential proxies, the corporate presents ISP proxies (which use residential IPs however are hosted in an ISP’s knowledge middle for extra stability), cellular proxies (which run on and report back to websites as cellular gadgets, for mobile-specific testing), knowledge middle proxies (for rock-solid efficiency, however much less anonymity), and devoted knowledge middle proxies (which provide you with limitless bandwidth and devoted IP for high-performance darbs).
Kodēšanas interfeisa pārbaude
Oxylabs ļaudis man deva piekļuvi viņu kodēšanas interfeisam, tāpēc es varēju izjust to, kas nepieciešams, lai izmantotu viņu starpniekus, sagatavotu datu pieprasījumus un parsētu datus par lietojumprogrammu lietošanu.
Uzņēmums saņem kudos par to, kā viņi sniedz informāciju par lietošanu. Viņiem ir Ļoti noderīgs YouTube kanāls ar 425 videoklipiem. Man bija laiks tikai noskatīties daļu no viņiem, wager tie ir skaidri, līdz galam un ļoti informatīvi.
Uzņēmumam ir viegli saprotams informācijas panelis, kas ir sākumpunkts visām operācijām.
Viņi piedāvā arī testēšanas platformu ar nosaukumu API Playground. Šeit jūs varat ielīmēt kodu segmentos un redzēt, kā tie darbojas. Ņemiet vērā, ka uzņēmums piedāvā iepriekš uzrakstītus kodu blokus Curl, Python, PHP, C#, Go, Java, Node.js un JSON. Tas ir pluss, jo daudzi API pārdevēji to nedara. Es vienmēr jūtos ērtāk, kad redzu kodu piemērus programmēšanas vidē, kuru izmantoju.
Lietas kļuva patiešām interesantas, kad es sāku ķerties pie Oxy AI, ko sauc par Oxycopilot. Pirmkārt, es iesaku Oxy mainīt AI vārdu, jo Copilot ir Microsoft termins, un, iespējams, būs Redmonda preču zīmju izpildes komandas atgriešanās.
Arī: slēptā datu krīze, kas apdraud jūsu AI pārveidošanas plānus
Tas nozīmē, ka oksikopilots ir foršs. Viens no izaicinošākajiem tīmekļa nokasīšanas darbību aspektiem ir tas, ka, kad dati atgūstat, jums ir jāizdomā, kā iegūt izmantojamu informāciju. Tā kā jūs burtiski atgūstat visu HTML lapu (piepildīta ar reklāmām, HTML tagiem un tonnu nesaistītas informācijas), šis pēcapstrādes course of ir algoritmiski ne-triviāls.
Kreisajā pusē ir nokasīt datus, kurus Oxylabs ievilka atpakaļ testa skrāpēšanas laikā viņu rotaļu laukumā. Labajā pusē ir produkts, kuru es nokasīju, visu laiku mīļākais tehnoloģiju produkts. Vienīgais dīvainais ir tas, ka es devu Oxycopilot URL angļu valodā angļu valodas lapai, un priekšskatījums, ko tas parāda, ir spāņu valodā, lai gan cenu noteikšanas informācija ir tāda pati.
Ievērojiet, cik izaicinoši ir neapstrādāti atgrieztie dati. Wager tad es veicu to pašu operāciju, izmantojot oksikopilotu. Es sāku, dodot tam URL, lai nokasītu.
Pēc tam es izlaidu garām skrāpja parametriem, lai AI sniegtu dažus parsēšanas instrukcijas. Viss, ko es jautāju, bija: “Lūdzu, iegūstiet pašreizējo produkta nosaukumu un cenu. Norādiet, vai cena ir ar atlaidi vai parastā cena.”
Rezultāts ir šī interesanta forma. Ņemiet vērā, ka tas pareizi izvilka cenu datus. Tas man parādīja datus kā JSON bloku. Wager interesants ir parsēšanas instrukciju cilne galēji labajā pusē.
Tas, ko AI ir izdarījis, ir izveidot JSON struktūru, kuru jūs ievadāt OxyLabs API, nosūtot nokasīšanas pieprasījumu. API ievēros instrukcijas, kas iestrādātas šajā JSON struktūrā, un atdos jums tikai jūsu pieprasītos datus.
Esmu veicis tīmekļa lapu parsēšanu daudzkārt iepriekš, un tas ir ļoti laikietilpīgs, nogurdinošs uzdevums. Tas man prasīja mazāk piecas minūtes.
ZDNET pirkšanas padoms
Tātad, vai jums vajadzētu izmantot šo pakalpojumu? Paturiet prātā, ka piedāvājumi šajā līmenī ir biznesa un darbības lēmumi. No ētiskas iegūšanas viedokļa, Oksilāti šķiet laba izvēle. Un, spriežot pēc manas ierobežotās pārbaudes, tā ir arī laba izvēle no programmēšanas un algoritmiskā viedokļa.
Kas attiecas uz to, vai tas ir rentabls, tas pilnībā ir atkarīgs no jūsu lietošanas gadījuma. Tikai jūs un jūsu komanda to var izlemt.
Arī: kā Cisco plāno apturēt Rogue AI aģentu uzbrukumus jūsu tīklā
Visbeidzot, kad runa ir par dokumentāciju un apmācības materiāliem, OxyLabs ir augstvērtīgs. Mani ļoti pārsteidza kopējais saturs viņu vietnē un vietnē YouTube. Tas mani ļoti ātri uzcēla.
Kā ar tevi? Vai savā darbā vai pētījumos esat izmantojis starpniekservera vai tīmekļa nokasīšanas pakalpojumus, piemēram, OxyLabs? Ar kādiem izaicinājumiem jūs saskaraties ar datu vākšanu mērogā, un kā jūs pārvietojāties ar ētiskiem vai tehniskiem šķēršļiem? Vai esat mēģinājis integrēt AI rīkus, piemēram, OxyCopilot, lai racionalizētu jūsu darbplūsmas nokasīšanu? Paziņojiet mums komentāros zemāk.
Jūs varat sekot maniem ikdienas projekta atjauninājumiem sociālajos medijos. Noteikti abonējiet mans iknedēļas atjaunināšanas biļetensun sekojiet man Twitter/X plkst @DavidgeWirtzFb plkst Facebook.com/davidgewirtzInstagram plkst Instagram.com/davidgewirtzuz blūzky plkst @Davidgewirtz.comun vietnē youtube plkst Youtube.com/davidgewirtztvAppuse