Utálja a Szilícium-völgy játszmáit, befektető nélkül építette fel a mesterséges intelligencia iparág egyik legfontosabb háttércégét. Úgy látja, rossz irányba fordulhatnak a dolgok, ezért lép ki a fényre a szektor legújabb milliárdosa.
A Google, a Facebook és a Twitter egykori munkatársa, Edwin Chen az MI-forradalom hátterében építette fel adatcímkéző cégét, a Surge-öt.
Surányi. Bajnai. Péterffy. A pénz egyenlő a szabadsággal? Gyere el a Forbes Money Summitra október 14-én!
Egy reggel, miután manhattani otthonában átnézett még egy adatállományt, elolvasott néhány tudományos kutatást és játszott egy keveset pár élvonalbeli MI-modellel, Edwin Chen rövid sétát tett a kilencedik sugárúton található, háromszintes, elegáns Starbucks felé. Tengerészkék Vuori pólóban, egyik vállán tigrismintás vászontáskával lement az alsó szintre és letelepedett egy sötét sarokasztalnál.
Miközben egy kis zöld teát kortyolt („mert itt túl sokáig tart kávét rendelni”), a Surge AI alapító-vezérigazgatója két órán át megállás nélkül beszél az amerikai Forbes újságírójának a Szilícium-völgy kultúrájáról (utálja), a riválisairól („mind csak munkaerő-kiközvetítők”) egészen addig, hogyan kommunikálhatnának az emberek a Földre érkező idegenekkel.
„Nem beszélnek angolul. Akkor hogyan kommunikálnál velük? Hogyan fejtenéd meg a nyelvüket? Remélhetőleg lesz rá valamilyen matematikai módszer”
– mondja a nyelvészetért rajongó Chen. Ez a dilemma jelenik meg kedvenc novellájában is, Ted Chiang 1998-as sci-fi írásában, az Életed történetében, amely az Érkezés című film alapjául szolgált. Ebben egy nyelvész próbál az idegenekkel kommunikálni a beszédük és írásuk mintázatainak azonosításával. Ez volt Chen egyik inspirációja is, amikor 2020-ban megalapította a Surge-öt.
A cég adatok címkézésével foglalkozik, ami nem tűnik túl izgalmasnak, de elengedhetetlen napjaink legfontosabb forradalmához. A nyers adatok (például szöveg, kép, videó, hang vagy szenzoradatok) önmagukban nem mindig használhatók MI-modellek tanítására. Az adatokhoz emberi vagy félig automatikus módszerekkel címkéket, leírásokat, kategóriákat kell rendelni. Az így előkészített adatok szolgálnak alapul a mesterséges intelligencia és gépi tanulási modellek betanításához. Minél pontosabb és változatosabb a címkézés, annál intelligensebb lesz a modell. A nagy tech cégeknek éppen ezért nagy számban és jó minőségben van szüksége – ahogy az iparágban nevezik – annotált adathalmazokra, lehetőleg minél többre és minél gyorsabban.
Vagy ahogy mindezt Chen lefordítja a maga számára:
az emberi tapasztalatok és tudás teljes gazdagságát szeretné belekódolni a mesterséges intelligenciába.
Itt a gazdagság nemcsak a mennyiséget jelenti, hanem azt a sokféleséget, árnyaltságot, kulturális és nyelvi rétegek megkülönböztetését, amelyek az emberi gondolkodást jellemzik – és amelyeket Chen szerint a mesterséges intelligencia csak akkor tud visszaadni, ha az adatok címkézéseben és betanításában valódi, intelligens emberek vesznek részt. Nem akárkik, a legjobbak, akik elérhetők. Professzorokat hívott a Stanfordról, a Princetonról és a Harvardról, hogy saját szakterületük tudását fordítsák át a nyelvi modellek bájtokba rendezett világába.
De Chen nem állt meg itt. A Surge több mint ötven ország egymillió szabadúszó „annotátorát”, azaz tesztelőjét is mozgósítja. Ők kérdésekkel teszik próbára a mesterséges intelligenciát, értékelik a modellek válaszait, kijavítják a hibákat és új szabályokat alkotnak. Chen szerint nélkülük az AGI – az általános mesterséges intelligencia, amikor az MI eléri vagy meghaladja az emberi képességeket – sosem jönne létre. „És én azt akarom, hogy létrejöjjön” – teszi hozzá.
Briliáns és excentrikus – Chen talán a legsikeresebb technológiai vállalkozó, akiről sosem hallottál. Ez azért van, mert egészen a közelmúltig így akarta, annak ellenére, hogy az MI-közösségben jól ismert. Ő az adattudós, aki dolgozott a Twitternél, a Google-nél és a Facebooknál, kerülte a hagyományos kockázati tőkét, és hét éve elhagyta a Szilícium-völgy buborékját. A több mint tíz, big technél töltött év alatt összespórolt pár millió dollárt, ebből indította el a Surge-öt.
„Az egyik oka annak, hogy saját erőből indultunk, az az, hogy mindig is utáltam a Szilícium-völgy státuszharcait”
– mondja Chen, aki tudatosan hátat fordított annak a startupkultúrának, ahol a státuszt nem az üzlet valódi teljesítménye, hanem a látszat – a befektetett pénz, a híres befektetők és a külsőségek – határozza meg. Mintha csak a meggazdagodás gyors receptje lenne a lényeg, nem a valódi innováció.
Azt is utálja ebben a modellben, hogy túl sok pénzt vonnak be a startupok, amit aztán muszáj elkölteni, szerinte épp emiatt sokkal többen dolgoznak ezekben a cégekben, mint amennyire szükség lenne. A Surge-nek jelenleg mindössze 250 alkalmazottja van (és ebben minden benne van: teljes, részmunkaidős és tanácsadó is). Ezzel szemben legnagyobb riválisa, a Scale AI négyszer ennyi embert foglalkoztat kevesebb bevétellel.
A Surge 2024-ben, vagyis alig öt évvel alapítása után 1,2 milliárd dollár bevételt ért el. Ügyfelei között ott van a Google, a Meta, a Microsoft és olyan mesterségesintelligencia-laborok, mint az Anthropic és a Mistral. Chen szerint a cég szinte az első naptól nyereséges volt. Ezek alapján a vállalat értéke becslések szerint 24 milliárd dollár.
A Forbes úgy tudja, a Surge jelenleg 1 milliárd dollár tőkebevonásról tárgyal 30 milliárdos értékelés mellett, bár a kör még nem zárult le.
Chen döntése, hogy egészen eddig maga finanszírozta a céget, bőségesen megtérült: körülbelül 75 százalékos részesedése 18 milliárd dollárt ér, ami elegendő volt ahhoz, hogy a leggazdagabb amerikaiakat rangsoroló idei Forbes 400 listán a leggazdagabb új belépő legyen.
Sőt, Amerika leggazdagabbjai között 37 évesen ő a legfiatalabb.
Chen ugyanolyan könnyen kérdez egy állásinterjún az író David Foster Wallace-ról vagy nyelvészetről, mint ahogy kódolásra vagy problémamegoldásra kér a táblánál. „Értékeljük a kreativitást” – mondja.
A Surge állítja: megközelítésük nem olyan, mint a hagyományos adatcímkézés, amikor emberek – gyakran a déli félteke kevésbé fejlett országaiból – fillérekért ülnek a gép előtt, és macskát kutyától különböztetnek meg. Chen annotátorai – köztük szakemberek és professzorok – ehelyett instrukciók alapján csetbotokkal lépnek interakcióba. Előfordulhat, hogy azt a feladatot kapják, hogy próbálják meg hibás válaszra rávenni a csetbotot, majd írjanak helyette jobbat. Vagy össze kell hasonlítaniuk több, MI-alapú választ ugyanarra a kérdésre, és megmagyarázni, miért jobb az egyik a többinél.
Bevétel alapján a Surge jelenleg a legnagyobb szereplő az iparágban, de a versenytársak sem lazsálnak. Ott van köztük a már említett Scale AI, amelynek 49 százalékát a Meta 14 milliárd dollárért vásárolta meg júniusban, de akadnak még más szereplők is, mint a Turing, a Mercor és az Invisible AI. A tech ipari kutatócég, az IDC becslése szerint a vállalatok 2024-ben 104 milliárd dollárt költöttek MI-infrastruktúrára, és idén még többet fognak – az OpenAI és a Larry Elisson-féle Oracle nemrég bejelentett gigaüzlete pedig azt mutatja, még annál is több pénz lesz ezen a piacon, mint amit eddig gondoltunk.
„Az adat ennek az infrastruktúrának ugyanolyan fontos része, mint a számítási kapacitás vagy az energia” – mondja Jonathan Siddharth, a kaliforniai Palo Altóban működő Turing vezérigazgatója.
„Érthető, hogy egy cég a számítási költségei 10–20 százalékát adatra költi.”
Mindenki akar egy szeletet a tortából: májusban Jeff Bezos vezetett egy 72 millió dolláros befektetési kört a holland adatcímkéző cégben, a Tolokában. Az Uber 2024-ben saját adatait kezdte címkézni. A régi szereplők, mint az ausztrál Appen – amely egyre inkább kínai modellezőknek dolgozik – szintén újrapozícionálják magukat a generatív MI-re.
Mindeközben Chen csendben építette cégét és hírnevét. „Szerintem a Surge egyszerűen nem akart semmit felfedni abból, amit csinál” – mondja egy, a neve elhallgatását kérő, jelenlegi metás kutató a Forbesnak.
De ahogy az iparág fejlődik, Chen már nem elégedhetett meg azzal, hogy a háttérben maradjon.
Komoly aggodalmai vannak afelől, hogy a mai MI-modelleket rossz dolgokra optimalizálják, felhasználóikat „tévképzetek nyúlüregébe” hajtva – hasonlóan ahhoz, ahogyan a YouTube- és Twitter-algoritmusokat kattintásvadász tartalomra optimalizálták, amikor még ott dolgozott.
Chen nemcsak építeni akarja a saját cégét, hanem az egész iparág fejlődési irányát is befolyásolni akarja.
Azt szeretné, ha a Surge nemcsak szolgáltató lenne, hanem egy olyan vállalat, amely képes kormányrudat adni a mesterséges intelligenciás fejlesztésekhez. Ami azt jelenti, hogy ő maga is nyíltan vállalja a gondolkodó, vitákat indító, trendeket kijelölő szerepet: nemcsak vállalkozóként, hanem szellemi vezetőként kíván jelen lenni az MI korszakában. „Ideje volt már” – mondja az említett metás kutató.
Ritka esetekben a Surge még annotátorokat is állományba vesz – így történt ez Juliet Stanton esetében is, aki a New York University korábbi nyelvészprofesszora, az MIT-n szerzett doktori fokozattal. Stanton 2024 áprilisában kezdte projektalapon a munkát a Surge-nél „némi pluszpénz” céljából, mára pedig teljes állású alkalmazott lett.
A cég olyan embereket keres, akik „analitikus és kreatív gondolkodásra képesek” – mondja Stanton, hozzátéve, hogy Chen azt szeretné, ha az annotátorok segítenék az MI-t a különböző nyelvi, kulturális és társadalmi kontextusok megragadásában. Például más nyelvezetet használsz, amikor egy baráthoz beszélsz, és mást, amikor a főnöködhöz. Egyes nyelvekben külön szavak léteznek a romantikus és a nem romantikus kontextusokra – ezek mind olyan dolgok, amelyeket az emberi annotátorok taníthatnak meg az MI-nek.
Ám egy részmunkaidős munkásokból álló hadsereg – akik közül sokan valójában főállásként annotálnak adatokat, de nem kapják meg az ezzel járó juttatásokat – jogi kockázatot is jelenthet. A jelenség nem példa nélküli, hiszen a Surge és a versenytárs Scale is használja így az úgynevezett platformgazdaság (gig economy) erőforrásait.
A megbízásos vagy platformgazdaság modellje az, hogy bárki szerezhet egy kis mellékest a főállása mellett egy platformon, ahol az algoritmusok hatékonyan kötik össze a keresletet a kínálattal, ilyen a Wolt vagy az Uber modellje is. Ez a felállás ugyanakkor alkalmas arra, hogy a platformok üzemeltetői elkerüljék a foglalkoztatás legköltségesebb elemeinek finanszírozását (szabadság, betegszabadság stb.). A Surge ellen is indult jogi kereset emiatt.
„Lényegében amit a Surge AI csinál, nem más, mint tömeges bérlopás. A Surge AI tudatos döntése, hogy dolgozóit kizsákmányolja a profit érdekében, része annak a szélesebb trendnek, amelyet továbbra is látni fogunk, amíg a tech óriások versenyeznek a mesterséges intelligencia uralásáért. Hacsak nem vonjuk őket felelősségre” – mondta Glenn Danas, a Los Angeles-i Clarkson Law Firm partnere a Forbesnak.
„Úgy véljük, a kereset megalapozatlan” – mondja Chen, aki szerint meg fogják védeni cégük értékeit. A per folyamatban van.
De fejlődik-e olyan ütemben az MI, hogy eljön az idő, amikor egyáltalán nem lesz szükség emberi adatannotációra? Ez létkérdés a Surge AI-nak és versenytársainak. A Meta Llama 4 modellje – amelyet 2024 áprilisában adtak ki – már erősen támaszkodott az MI által önmaga számára létrehozott és megcímkézett, úgynevezett szintetikus adatokra.
A Surge ezzel szemben a human-in-the-loop módszert alkalmazza. Az MI létrehozza és megcímkézi a saját adatait, de emberek értékelik a teljesítményét. Chen szilárdan hisz abban, hogy az emberek elengedhetetlenek ebben a folyamatban, hogy
amikor az emberek és az MI együtt dolgoznak, felülmúlják mindazt, amit külön-külön tennének.
De még ha az emberek részben benne is maradnak a folyamatban, az önállóan tanuló gépekre helyezett nagyobb hangsúly komolyan érintené a Surge bevételét, hiszen a betanítás sokkal olcsóbbá válna.
Az MI-szektort elöntötte a kockázati tőke, és ez is egy kockázat, amivel Chennek számolnia kell. A pénzben úszó konkurenciának ugyanis nem kell sokat törődnie a nyereségességgel (legalábbis rövid távon), ami iparági szinten lefelé nyomja az árakat, és így a profitszámokat is.
Két kulcsfontosságú Surge-ügyfél már távozott. Az OpenAI szóvivője megerősítette, hogy már nem dolgoznak a Surge-dzsel, miközben egyik legkorábbi ügyfelük, a Cohere gyakorlatilag minden
adatannotációját házon belülre vitte.
Végső soron ez egy ilyen piac: az MI-modelleket készítő cégekben kevés a lojalitás, ha egyáltalán ismerik a kifejezést.
A legtöbb Surge-ügyfél a versenytársakkal is szerződésben áll. A Meta például továbbra is használja a Surge-öt, annak ellenére, hogy milliárdokat költött arra, hogy megvásárolja a Scale felét.
„Ez nem az a piac, ahol egy győztes visz mindent” – mondja Ashu Garg, a Turing befektetője és a Foundation Capital partnere. Ha az MI- és adatszolgáltató cégek képesek betörni a világ legnagyobb vállalatainak IT-költségvetésébe, és elhódítani a hagyományos IT-szolgáltatók piaci részesedését, akkor szerinte ez egy billió dolláros piac lehet.
Bárhogy is alakuljon az iparág, Chen azt tervezi, hogy a Surge-öt addig vezeti, amíg el nem jön az általános mesterséges intelligencia kora – feltéve, hogy egyáltalán eljön. Sam Altman, az OpenAI vezére például biztos benne, hogy mindez már a küszöbön áll. Chen becslése sokkal óvatosabb, szerinte nagyjából húsz év múlva érkezik el.
A jövőre gondolva Chen azt mondja, „teljesen hidegen hagyja” egy esetleges felvásárlás, és nincs szándékában tőzsdére lépni sem. „Miért vágyna bárki is a tőzsde nyilvánosságára? A nyilvános cégek egyik legnagyobb problémája, hogy állandóan a rövid távú eredmények miatt kell aggódniuk.”
Chent egyszerűen nem vonzza a tőzsde logikája: nem érdekli a negyedéves jelentéseknek való megfelelés és a rövid távú befektetői elvárások. Hosszú távon akar építkezni, és nem hajlandó kompromisszumot kötni emiatt. Nick Heiner, a Surge termékfejlesztési vezetője szerint ez Chen személyiségének egyenes következménye.
„Ha a Surge nem is létezne, Edwin akkor is adatokat gyártana és MI-t trénelne – számára ez a játék, ez a szórakozás. Csak történetesen ebből egy dollármilliárdos vállalat lett. Olyan, mint Michael Jordant nézni zsákolás közben: egyszerűen erre született.”