Ugur Tigli je hlavným technickým riaditeľom spoločnosti MinIOlíder v oblasti vysokovýkonného ukladania objektov pre AI. Ako CTO pomáha Ugur klientom navrhovať a nasadzovať API-riadenú, cloudovú a škálovateľnú dátovú infraštruktúru podnikovej triedy pomocou MinIO.
Môžete opísať svoju cestu k tomu, aby ste sa stali CTO spoločnosti MinIO, a ako vaše skúsenosti formovali váš prístup AI a dátovú infraštruktúru?
Svoju kariéru som začal v inžinierstve infraštruktúry v Merrill Lynch ako správca zálohovania a obnovy. Pokračoval som v rôznych výzvach a rôznych technických pozíciách. Do Bank of America som prišiel cez akvizíciu Merrill Lynch, kde som bol viceprezidentom Storage Engineering. Napriek tomu sa moja úloha rozšírila o výpočtovú techniku a inžinierstvo dátových centier.
V rámci svojej práce som tiež spolupracoval s rôznymi spoločnosťami rizikového kapitálu (VC) a ich portfóliovými spoločnosťami, aby som priniesol najnovšie a najlepšie technológie. Počas jedného z mojich stretnutí s General Catalyst som bol oboznámený s myšlienkou a ľuďmi stojacimi za MinIO. Oslovilo ma to, ako pristupovali k dátovej infraštruktúre — líšila sa od všetkých ostatných na trhu. Spoločnosť si uvedomila dôležitosť úložiska objektov a štandardných rozhraní API, s ktorými aplikácie začínali. Počas týchto rokov mohli predpovedať budúcnosť výpočtovej techniky a AI pred nikým iným alebo ešte predtým, ako sa to nazývalo tak, ako je to dnes. Chcel som byť súčasťou realizácie tejto vízie a budovania niečoho skutočne jedinečného. MinIO je teraz najrozšírenejším objektom na planéte.
Vplyv mojich predchádzajúcich úloh a skúseností na to, ako pristupujem k novým technológiám, konkrétne AI a dátová infraštruktúra, je tiež jednoducho súhrnom mnohých projektov, na ktorých som sa podieľal počas rokov podpory aplikačných tímov vo veľmi náročnej firme poskytujúcej finančné služby.
Od dní s obmedzenou šírkou pásma siete, čo viedlo k tomu, že technológia Hadoop bola najnovšou technológiou pred 15 rokmi, až po rôzne technológie dátových médií od pevného disku (HDD) po disk SSD (SSD), mnohé z týchto technologických zmien formovali môj súčasný pohľad. z AI ekosystému a dátovej infraštruktúry.
MinIO je uznávaný pre svoje vysokovýkonné možnosti ukladania objektov. Ako konkrétne MiniIO uspokojuje potreby AIdnes riadené podniky?
Keď AB a Garima koncipovali MiniIO, ich prvou prioritou bolo premýšľať o probléme – vedeli, že údaje budú naďalej rásť a existujúce technológie ukladania sú nezlučiteľné s týmto rastom. Rýchly vznik AI premenil ich predvídavý pohľad na trh na skutočnosť. Odvtedy sa ukladanie objektov stalo základom AI infraštruktúra (všetky hlavné LLM ako OpenAI a Anthropic sú postavené na objektových skladoch) a moderné dátové centrum je postavené na základoch objektového skladu.
MinIO nedávno spustilo novú platformu na ukladanie objektov s kritickými funkciami na podnikovej úrovni na podporu organizácií v ich činnosti AI iniciatívy: MinIO Enterprise Object Store. Je navrhnutý pre výkon a rozsahové výzvy, ktoré prináša masívne AI pracovné zaťaženie a umožňuje zákazníkom jednoduchšie riešiť výzvy spojené s miliardami objektov, ako aj stovkami tisícov kryptografických operácií na uzol za sekundu. Má šesť nových komerčných funkcií, ktoré sa zameriavajú na kľúčové prevádzkové a technické výzvy, ktorým čelia AI pracovné zaťaženie: Katalóg (toto rieši problém s menným priestorom objektového úložiska a vyhľadávanie metadát), Firewall (účelovo vytvorený pre dáta), Key Management System (rieši problém narábania s miliardami kryptografických kľúčov), Cache (funguje ako cachovacia služba ), Pozorovateľnosť (umožňuje správcom zobraziť všetky systémové komponenty v každej inštancii) a nakoniec Enterprise Console (slúži ako jedna tabuľa skla pre všetky inštancie MinIO v organizácii).
Manipulácia AI vo väčšom rozsahu je čoraz dôležitejšie. Mohli by ste upresniť, prečo je to tak a ako MinIO uľahčuje tieto požiadavky pre moderné podniky?
Takmer všetko, čo organizácie stavajú, je teraz na objektovom úložisku, ktoré sa zrýchli len vtedy, keď infraštruktúra so zariadením narazí na stenu vo veku moderných dátových jazier a AI. Organizácie hľadajú nové infraštruktúry na správu všetkých údajov prichádzajúcich do ich systému a potom nad nimi budujú aplikácie zamerané na údaje – to si vyžaduje mimoriadny rozsah a flexibilitu, ktorú môže podporovať iba ukladanie objektov. To je miesto, kde prichádza MiniIO a prečo bola spoločnosť vždy míľovými krokmi pred konkurenciou, pretože je určená na čo AI potreby – ukladanie obrovských objemov štruktúrovaných a neštruktúrovaných údajov a poskytovanie výkonu vo veľkom rozsahu.
Podobne ako potreby strojového učenia (ML) v predchádzajúcich generáciách AIdáta a moderné dátové jazerá boli rozhodujúce pre úspech akéhokoľvek „prediktívneho“ AI. Avšak s pokrokom „generatívneho“ AIsa táto krajina rozšírila o mnoho ďalších komponentov, ako napr AI Ops dátové a dokumentačné potrubia, základné modely a vektorové databázy.
Všetky tieto dodatočné komponenty využívajú ukladanie objektov a väčšina z nich sa priamo integruje s MinIO. Napríklad Milvus, vektorová databáza, používa MinIO a mnoho moderných dotazovacích nástrojov sa integruje s MinIO prostredníctvom S3 API.
AI technický dlh je čoraz väčším problémom mnohých organizácií. Aké stratégie používa MinIO, aby pomohla klientom vyhnúť sa tomuto problému, najmä pokiaľ ide o efektívnejšie využitie GPU?
Reťaz je taká silná ako jej najslabší článok – a váš AIInfraštruktúra /ML je len taká rýchla ako váš najpomalší komponent. Ak trénujete modely strojového učenia s GPU, vaším slabým článkom môže byť riešenie úložiska. Výsledkom je to, čo nazývam „problém hladovania GPU“. Problém hladovania GPU nastáva, keď vaše sieťové alebo úložné riešenie nedokáže poskytnúť tréningové údaje vašej tréningovej logike dostatočne rýchlo na to, aby plne využilo vaše GPU, pričom na stole zostáva cenný výpočtový výkon. Niečo, čo môžu organizácie urobiť, aby plne využili svoje GPU, je najprv pochopiť znaky zlej dátovej architektúry a ako to môže priamo viesť k nedostatočnému využívaniu AI technológie. Aby sa spoločnosti vyhli technickému dlhu, musia zmeniť spôsob, akým prezerajú (a ukladajú) údaje.
Organizácie môžu nastaviť úložné riešenie, ktoré je v rovnakom dátovom centre ako ich výpočtová infraštruktúra. V ideálnom prípade by to bolo v rovnakom klastri ako váš počítač. Keďže MinIO je softvérovo definované úložné riešenie, je schopné poskytnúť výkon potrebný na napájanie hladných GPU – nedávne benchmark dosiahol 325 GiB/s na GET a 165 GiB/s na PUT len s 32 uzlami bežne dostupných NVMe SSD.
Máte bohaté skúsenosti s vytváraním vysokovýkonných dátových infraštruktúr pre globálne finančné inštitúcie. Ako tieto skúsenosti ovplyvňujú vašu prácu v MinIO, najmä v oblasti architektonických riešení pre rôzne potreby priemyslu?
Pomohol som vybudovať prvý súkromný cloud pre Bank of America a táto iniciatíva ušetrila miliardy dolárov poskytovaním funkcií a funkcií dostupných vo verejných cloudoch interne za nižšiu cenu. Nielen táto hlavná iniciatíva, ale aj mnohé iné požiadavky na rôzne aplikácie, na ktorých som pracoval v BofA Merrill Lynch, formovali moju prácu v MinIO, keďže sa týka architektonických riešení pre našich dnešných zákazníkov.
Napríklad, naučiť sa to nesprávnym alebo „tvrdým“ spôsobom pracovalo s tímom, ktorý vytvoril klastre Hadoop, ktoré používali iba komponenty na ukladanie údajov servera, pričom serverové CPU udržiavali nedostatočne využívané alebo takmer nečinné. Jednoduché príklady alebo poznatky, ako je tento, mi umožnili použiť rozčlenené údaje a výpočtové riešenia v dnešnej modernej dátovej infraštruktúre a zároveň pomôcť našim zákazníkom a partnerom, čo sú technicky lepšie a lacnejšie riešenia využívajúce dnešné sieťové technológie s vysokou šírkou pásma a vysokovýkonné úložiská objektov, ako je MinIO. a akýkoľvek dotaz alebo procesor na spracovanie.
Hybridný cloud predstavuje jedinečné výzvy a zložitosti. Mohli by ste to podrobne rozobrať a vysvetliť, ako hybridný „prepad“ modelu MinIO do cloudu pomáha efektívne kontrolovať náklady na cloud?
Prechod na multicloud by nemal viesť k nafukovaniu rozpočtov na IT a neschopnosti dosahovať míľniky – mal by pomôcť riadiť náklady a urýchliť plán organizácie. Je potrebné zvážiť repatriáciu cloudu – realita je taká, že presun operácií z cloudu do lokálnej infraštruktúry môže viesť k značným úsporám nákladov v závislosti od prípadu a na cloud by ste sa mali vždy pozerať ako na prevádzkový model, nie ako cieľ. Organizácie napríklad spúšťajú inštancie GPU, ale potom trávia čas predbežným spracovaním údajov, aby sa zmestili do GPU. Tým sa stráca drahocenný čas a peniaze – organizácie sa musia lepšie optimalizovať výberom natívnych cloudových a, čo je dôležitejšie, cloudových prenosných technológií, ktoré dokážu odomknúť výkon multicloudu bez výrazných nákladov. Používanie princípov prevádzkového modelu cloud-first a dodržiavanie tohto rámca poskytuje agilnosť na prispôsobenie sa meniacim sa prevádzkovým požiadavkám.
Natívne riešenia Kubernetes sú kľúčové pre modernú infraštruktúru. Ako integrácia MinIO s Kubernetes zvyšuje jeho škálovateľnosť a flexibilitu AI dátová infraštruktúra?
MinIO je dizajnovo natívny Kubernetes a od začiatku je kompatibilný s S3. Vývojári môžu rýchlo nasadiť trvalé ukladanie objektov pre všetky svoje cloudové natívne aplikácie. Kombinácia MinIO a Kubernetes poskytuje výkonnú platformu, ktorá umožňuje aplikáciám škálovať naprieč akoukoľvek multi-cloudovou a hybridnou cloudovou infraštruktúrou a pritom byť centrálne spravované a zabezpečené, čím sa zabráni blokovaniu verejného cloudu.
S Kubernetes ako motorom je MinIO schopný bežať kdekoľvek Kubernetes – čo v modernom, cloudovom natívnom/AI svete, je v podstate všade.
Pri pohľade do budúcnosti, aký je budúci vývoj alebo vylepšenia, ktoré môžu používatelia očakávať od MinIO v kontexte AI dátová infraštruktúra?
Naše nedávne partnerstvá a uvedenie produktov na trh sú znakom toho, že v dohľadnej dobe nespomalíme a budeme pokračovať tam, kde to bude mať pre našich zákazníkov zmysel. Nedávno sme napríklad uzavreli partnerstvo so spoločnosťou Carahsoft, aby sme sprístupnili portfólio softvérového ukladania objektov MinIO pre sektory vlády, obrany, spravodajstva a vzdelávania. To umožňuje organizáciám verejného sektora budovať dátovú infraštruktúru akejkoľvek rôznorodej škály, od rozsiahlych moderných dátových balíkov až po riešenia na ukladanie dát špecifické pre misiu na autonómnej hranici. Spoločne prinášame tieto špičkové, jedinečné riešenia zákazníkom verejného sektora, čím im umožňujeme jednoducho a efektívne riešiť problémy dátovej infraštruktúry. Toto partnerstvo prichádza v čase, keď sa zvyšuje tlak na to, aby verejný sektor mohol byť AI– pripravený, s nedávnymi požiadavkami OMB, ktoré uvádzajú, že všetky federálne agentúry potrebujú šéfa AI Dôstojník (okrem iného). Celkovo partnerstvo pomáha posilňovať priemysel AI postoj a dáva verejnému sektoru cenné nástroje potrebné na úspech.
Okrem toho má MinIO veľmi dobrú pozíciu do budúcnosti. AI dátová infraštruktúra je stále v plienkach. Mnohé jeho oblasti budú jasnejšie v najbližších rokoch. Napríklad väčšina podnikov bude chcieť použiť svoje vlastné údaje a dokumenty so základnými modelmi a technológiou Retrieval Augmented Generation (RAG). Ďalšia integrácia do tohto vzoru nasadenia bude pre MinIO jednoduchá, pretože všetky tieto architektonické voľby a vzory nasadenia majú jednu spoločnú vec – všetky tieto údaje sú už uložené na MinIO.
Napokon, pre technologických lídrov, ktorí chcú vybudovať alebo zlepšiť svoju dátovú infraštruktúru AIčo by ste poradili na základe svojich skúseností a postrehov v MinIO?
Aby bolo možné urobiť nejaké AI Ak je iniciatíva úspešná, musíte sa držať troch kľúčových prvkov: mať správne údaje, správnu infraštruktúru a správne aplikácie. Naozaj to začína pochopením toho, čo potrebujete – nekupujte drahé GPU len preto, že sa bojíte, že prídete o AI čln. Pevne verím tomu podniku AI stratégie zlyhajú v roku 2024, ak sa organizácie zamerajú len na samotné modely a nie na údaje. Myslenie model nadol verzus dáta hore je kritická chyba – musíte začať s dátami. Vybudujte správnu dátovú infraštruktúru. Potom premýšľajte o svojich modeloch. Ako organizácie smerujú k a AI-prvá architektúra, je nevyhnutné, aby vaša dátová infraštruktúra umožňovala vaše dáta – nie ich obmedzovala.
Ďakujeme za skvelý rozhovor, čitatelia, ktorí sa chcú dozvedieť viac, by mali navštíviť MinIO.