Home Tehnoloģija NYSE paātrināja savus reāllaika straumēšanas datus 5x ar Redpanda

NYSE paātrināja savus reāllaika straumēšanas datus 5x ar Redpanda

29
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Reāllaika straumēšanas dati var būt vērtīgi daudzām lietojumprogrammām un mērķiem dažādās nozarēs. Gadījumā Ņujorkas birža (NYSE), straumēšanas dati ir burtiski nauda.

NYSE ir viena no lielākajām finanšu apmaiņām pasaulē, un tai ir ilgstoša vēsture, ka var dalīties ar saviem finanšu tirgus datiem.

Pirms simts gadiem informācijas koplietošanai tā izmantoja uz telegrāfu balstītu Ticker lenti. Mūsdienu laikmetā tas ir izstrādājis savas zemas latentuma, augstas veiktspējas tehnoloģijas, kas izvietotas uz vietas, ar kurām citas organizācijas var sazināties.

Tagad tas sper nākamo soli uz priekšuModeļa izmantošana, pamatojoties uz atvērtā koda Apache Kafka straumēšanas tehnoloģiju, kas AWS mākonim sniedz NYSE labāko cenu un Trades (BQT) datus.


AI mērogošana sasniedz savas robežas

Strāvas robežas, pieaugošās marķiera izmaksas un secinājumu kavēšanās ir uzņēmuma AI pārveidošana. Pievienojieties mūsu ekskluzīvajam salonam, lai atklātu, kā ir labākās komandas:

  • Enerģijas pārvēršana par stratēģisku priekšrocību
  • Arhitektējot efektīvus secinājumus par reālu caurlaidspējas pieaugumu
  • Konkurences IA atbloķēšana ar ilgtspējīgām AI sistēmām

Nostipriniet savu vietu, lai paliktu priekšā:


Lai to izdarītu, NYSE sadarbojās ar straumēšanas datu platformas pārdevēju Redpandakas ir izstrādājusi savu Kafka ieviešanu, kas rakstīta C ++ programmēšanas valodā.

NYSE Redpanda C ++ balstītās straumēšanas platformas izvietošana panāca 4-5x veiktspējas uzlabojumus Vairāk nekā tradicionālie Kafka konkurenti, pakļaujot galvenos ierobežojumus, kā vairums organizāciju rīkojas ar pārsprāgušām datu darba slodzēm.

Šī veiktspējas atšķirība kļūst kritiska, jo uzņēmumi mērogo AI lietojumprogrammas, kas prasa konsekventu datu piekļuvi zemu latentumu. Kafka bāzētai datu straumēšanai ir arī potenciāls dot iespēju sazināties ar aģentu līdz aģentam, konkurējot ar citām pieejām, piemēram, Google A2A, un to var arī paplašināt, lai nodrošinātu modeļa konteksta protokolu (MCP).

“Tirgus darbs ir tāds, ka visi lielie pamatu modeļi patiešām ir indeksējuši publisko datu kopas, un nākamā robeža ir privātas datu kopas, un Redpanda patiešām atbloķē privātās datu kopas aģentiskai piekļuvei,” VentureBeat sacīja Redpanda dibinātājs un izpilddirektors Alekss Gallego.

Ko NYSE būvē mākonī

NYSE izveidoja savu mākoņu straumēšanas platformu, lai apkalpotu klientus, kuri nevar tieši piekļūt tā datu centriem. Trade ir paredzēta fintech uzņēmumiem un mazumtirdzniecības brokeru tirgotājiem, kuriem nepieciešama AWS balstīta piekļuve reāllaika tirgus datiem.

“Ne katrs mūsu tirgus datu patērētājs spēj ierasties mūsu datu centrā, paņemt plūsmu un izmantot šo barību,” VentureBeat pastāstīja Vinil Bhandari, Cloud un Full Stack Engineering vadītājs NYSE. “Guess jūs zināt, ka nelielam veikalam Honkongā ir pieeja, piemēram, izveidot savu AWS kontu, un tieši tās auditorijas mēs cenšamies rūpēties.”

NYSE straumē savu BQT (labākās cenas un darījumi) plūsmu, kas apkopo reālā laika datus no visām septiņām NYSE biržām. Izvietošanai bija nepieciešama jaunas infrastruktūras izveidošana, nevis esošo sistēmu paplašināšana.

Kāpēc NYSE izvēlējās Redpanda un kā ir svarīga programmēšanas valodas izvēle

NYSE katru dienu apstrādā vairāk nekā 500 miljardus ziņojumu septiņās biržās. Tirgus nepastāvības laikā, Ziņojuma apjoms mikrosekundēs var palielināt 1000x virs vidējā līmeņa.

Tradicionālās Java ieviešana cīnās ar šiem modeļiem, jo atkritumu savākšana rada neparedzamus latentuma tapas.

“Klasiskā Kafka ieviešana tika uzrakstīta Java programmēšanas valodā, kas padara šo plīstošo satiksmi, jūs zināt, tas nav ļoti labi ar Java atkritumu kolekciju, kas notiek programmēšanas valodā,” skaidroja Bhandari. “Redpanda ir veikusi KAFKA ieviešanu, pārrakstot Kafka protokolu C ++, tāpēc, kad mēs saņemam trafika pārrāvumu no mūsu tirgus aktivitātes, nepastāvība, mēs varam labāk pārvaldīt šo straumēšanu no datiem.”

Programmēšanas valodas izvēle ir arī iemesls, kāpēc NYSE devās ar Redpanda datu straumēšanai, nevis citām iespējām, piemēram, Confluent vai Amazon, pārvaldīja straumēšanu Kafka (MSK).

Šī tehniskā lēmuma rezultātā tika veikti izmērāmi veiktspējas uzlabojumi.

“Mēs esam droši to noteikt Datu piegādē mēs esam vismaz četras līdz piecas reizes ātrāki, izmantojot Redpanda Salīdzinot ar dažiem no mūsu lielajiem biļešu pielāgotajiem konkurentiem, kuri izmanto Kafka tehnoloģiju, lai straumētu līdzīgus datus, ”atzīmēja Bhandari.

Uzņēmumiem, kas novērtē straumēšanas platformas, šis salīdzinājums uzsver kritisku apsvērumu: Java balstīta datu straumēšanas ieviešana var cīnīties trafika tapu laikā, savukārt C ++ balstītas alternatīvas var saglabāt konsekventu veiktspēju.

Novērojamība izrādās kritiska misijai kritiskai izvietošanai

Bhandari uzsvēra novērojamību kā būtisku ražošanas straumēšanas izvietošanai. Redpanda iebūvētās telemetrijas iespējas nodrošināja tūlītēju darbības vērtību.

“Jo vairāk, ka šādai izvietošanai var būt novērojamība un telemetrija par notiekošo zem pārsega, jo labāk būs datu ražotājs un datu patērētāji,” skaidroja Bhandari.

Šī novērojamība ļauj proaktīvu problēmu atklāšanu un izšķirtspēju, pirms problēmas ietekmē klientus. Bez visaptverošas uzraudzības uzņēmumi riskē atklāt darbības problēmas tikai pēc tam, kad tie ietekmē ražošanas darba slodzi un klientu pieredzi.

Arhitektūras filozofijas maiņa: straumēšana kā AI pamats

NYSE straumēšanas datu iespējas izmantos diezgan tradicionālā veidā, vismaz sākotnēji. Tas ir dati no tā tirgus apmaiņas ir pieejami lietotājiem patērēt.

Virziens, kurā Redpanda ir vadīta, norāda uz aģentiskāku AI nākotni, kuru tādi lietotāji kā NYSE, iespējams, izmantos turpmākajos gados. Redpanda izpilddirektors Gallego apgalvo, ka uzņēmumiem AI laikmetā straumēšanas arhitektūru vajadzētu skatīt atšķirīgi.

“Straumēšanai ir pareizais arhitektūras modelis, nevis ātrums, wager gan tāpēc, ka tā ir pareizā arhitektūra reaktīvajām un aģentiskajām lietojumprogrammām,” skaidroja Gallego.

Papildus tradicionālo straumēšanas veiktspējas problēmu risināšanai Redpanda ir pārcēlusies uz to, ko Gallego sauc par aģentu uzņēmumu. Uzņēmums ir iesaiņojis savus datu savienotājus MCP (modeļa konteksta protokols), ļaujot AI aģentiem tieši piekļūt uzņēmuma datu avotiem.

Šī pieeja atrisina skaitļošanas sarežģītības problēmu, kas rodas, kad uzņēmumi izvieto vairākus AI aģentus.

“Bez Kafka API jums ir N kvadrāta komunikācijas problēma, kurā katram aģentam ir jābūt piekļuvei visiem citiem aģentiem,” sacīja Gallego. “Un, kad jūs iepazīstināt ar Kafka API, tad tas samazinās no N kvadrāta skaitļošanas sarežģītības līdz lineāram.”

Pēc Gallego teiktā, bankas jau izvieto simtiem aģentu. Viens Redpanda klients nākamo divu gadu laikā plāno būvēt 1000 aģentu. Cits pašlaik 18 mēnešu laikā būvē 130 aģentus ražošanas izvietošanai. Šīs mēroga prasības padara aģentu koordinācijas arhitektūras lēmumus kritiskus ilgtermiņa AI stratēģijas panākumus.

Ko tas nozīmē uzņēmuma datu stratēģijai

Reāllaika straumēšanas dati ir iestatīti tā, lai kļūtu par arvien kritiskāku daudzu organizācijas darbību aspektu.

NYSE novērtēšanas course of atklāj kritiskus lēmumu pieņemšanas kritērijus uzņēmuma lēmumu pieņēmējiem, kas novērtē straumēšanas infrastruktūru:

Java bāzētā Kafka hits veiktspējas sienas ar plīsumu. Organizācijām, kas apstrādā neparedzamas darba slodzes, pirms ražošanas izvietošanas palielināšanas jānovērtē uz C ++ balstītas alternatīvas. 4-5x veiktspējas atšķirība nav margināla optimizācija, wager gan būtiska spēju atšķirība.

Pirmās mākoņu straumēšanas stratēģijas var sasniegt ražošanas pakāpi. Tas ļauj globāliem datu piekļuves modeļiem, kas iepriekš bija nepraktiski latentuma ierobežojumu dēļ, atverot jaunas tirgus iespējas uz datiem balstītiem uzņēmumiem.

Aģenta koordinācijai nepieciešama straumēšanas arhitektūra. Tā kā AI izvietošana paplašinās ārpus atsevišķiem aģentiem, straumēšanas platformas kļūst par būtisku infrastruktūru, nevis veiktspējas optimizāciju. Skaitļošanas sarežģītības priekšrocības kļūst kritiskas mērogā.

Organizācijām, kas plāno AI ieviešanu, ir svarīgi prioritizēt straumēšanas platformas, kas atbalsta gan MCP integrāciju, gan aģentu koordināciju. Skaitļošanas sarežģītības priekšrocības kļūst kritiskas mērogā un modernizējošā koordinācijas arhitektūra pēc vairāku aģentu izvietošanas izrādās eksponenciāli grūtāk nekā to pareizi veidot jau pašā sākumā.

Organizācijām, kas gaida AI pieņemšanu, būtu jāatzīst, ka šodien pieņemtie arhitektūras lēmumi, kas pieņemti šodien, tiks ierobežotas nākotnes AI iespējas, nekā vairums vadītāju saprot.


avots