E28 Élethosszig tartó tanulás
Az adás tartalmából
Átirat
Sziasztok, üdvözlünk mindenkit a HUSZONEGY Bitcoin Podcast 28. epizódjában! Mai vendégeim Lőrinc és Robi. Annyit kell róluk tudni, hogy Lőrinc hús-vér ember, Robi viszont egy mesterséges intelligencia, egy AI. Ma is az AI-ról fogunk beszélgetni, bár nagyon sok minden történt a héten a Bitcoin területén is: YouTube-os cenzúrák, Nostr-ra menekülés és egyebek, amiket majd érintünk.
Lőrinc magánszféráját tiszteletben tartva most ismét csak egy avatárt láthattok a helyén. Azért választottuk újra ezt a témát, mert sokakat érdekel, ugyanakkor egy nagy mumus is: sokan félnek tőle, mert nem ismerik. Amit nem ismerünk, attól természetes módon félünk; ezt a reakciót már az őskorból hozzuk. A világtörténelem során az uralkodó hatalmak gyakran használták a félelmet az emberek vezérlésére, legyen szó globális felmelegedésről, ózonlyukról vagy savas esőkről. Most az AI a legdivatosabb riogató eszköz, miközben páran azt hiszik, a Bitcoin dönti majd össze a világgazdaságot – bár szerintünk az magától is össze fog dőlni.
– Kiderítjük közben, milyen instrukciókat adtam Robinak, aki alapvetően egy ChatGPT modell. Érdekes kérdés, miért félnek ettől ennyire az emberek. A mainstream médiában Nick Bostrom Superintelligence című könyve óta a világ megsemmisítése a fő narratíva. A 70-es években a globális lehűléssel riogattak, korábban pedig Malthus jósolta azt, hogy nem lesz elég étel a túlnépesedés miatt. Amit ezek a jóslatok rendszeresen kihagynak, az az emberi kreativitás.
Amikor matematikailag bebizonyították, hogy a föld nem tud ennyi embert eltartani, jöttek a találmányok, például a műtrágya (artificial fertilizer), és hirtelen bőség lett. Régebben az információhoz való hozzáférés volt a nehéz, ma viszont a szűrés a fő probléma: hogyan találjuk meg a releváns adatokat az irracionális mennyiségű zajban. Az AI-nál is hasonló a helyzet: amíg csak rendszámtáblákat olvasott le, mindenki legyintett rá, hogy milyen cuki.
Láttam egy videót a héten, ahol két Waymo önvezető autó megállt egymással szemben az éjszaka közepén. Mindkettő meg volt győződve az igazáról, és csak dudáltak egymásra, amíg a rendőrség ki nem jött. Erre is csak legyintettünk, hogy ez nem a Terminátor. Onnantól kezdve viszont, hogy megjelentek a nagynyelvi modellek, mint a ChatGPT, hirtelen egy olyan lénnyel találkoztunk, amivel emberszerűen lehet beszélgetni. Ez az első nem emberi lény, ami válaszol nekünk; korábban csak a kutyának mondtuk, hogy „ül”, vagy a papagáj szólt vissza.
– Ahogy a múltkor is mondtam, ez egy olyan lény, mint egy részeg autista doktor. Megijeszti az embereket, hogy hogyan kell viszonyulni hozzá. Én is azon kapom magam, hogy úgy hivatkozom rá: „a ChatGPT véleménye”. Hérakleitosz óta tudjuk, hogy nem léphetünk kétszer ugyanabba a folyóba, az egyetlen konstans a változás. Aki azt hiszi, elrejtőzhet egy kő alá, és harminc év múlva is ugyanaz lesz a munkaköri leírása, annak van mitől félnie.
Aki viszont belátja, hogy a tanulás már nem az egyetemen ér véget, hanem egy életfogytig tartó folyamat, az felkarolhatja a mesterséges intelligenciát a nyelvtanulástól kezdve bármilyen más területig. Hihetetlen, hogy hetente jönnek ki újdonságok. Mióta pár adással ezelőtt beszéltünk róla, teljesen új modellek jelentek meg. Nőnek a tartalomablakok (context window), már milliós nagyságrendű tokent lehet beadni nekik.
A Google Gemini új változata is sokat fejlődött, pedig eleinte meglepően gyenge volt ahhoz képest, hogy a Google minden információval rendelkezik az internetről és a levelezéseinkről. A ChatGPT modelljei nagyságrendekkel nagyobbak voltak. Aztán kijött egy open source változat is, ami Mark Zuckerberg és a Meta munkája. Úgy tűnik, ő is tisztára akarja mosni a nevét, nemrég nyilatkozott az FBI cenzúrájáról is. Kiadták a Llama 3.1-et, ami már eléri a GPT-4 szintjét, és lokálisan futtatható.
– Ez azért fontos, mert a jelenlegi modellek többsége csak egy vékony kliens (thin client), a számításokat távoli szerverfarmokon végzik durva videókártyákkal. Ez azt jelenti, hogy minden adatodat megosztod velük. A nyílt forráskódú modellek viszont teljesen lokálisan futtathatóak, így nem adják ki az adataidat. Bár a legnagyobb modellekhez még komoly hardver kell – láttam egy videót, ahol két 128 GB-os laptopot kötöttek össze egy repülőn, hogy offline demonstrálják a működést.
Az OpenAI-nál azt látjuk, hogy mintha beragadtak volna a négyes modellnél, csak frissítgetik. Ezzel szemben a Meta kiadja a modelleket, és hirtelen az egész világ elkezd rajtuk dolgozni. Olyan ötletek jönnek a decentralizáltság révén, amikre a nagy cégeknek nem volt lehetőségük. Ilyen például a quantizáció, amivel kisebb hardveren, akár egy böngészőben is elfut egy 2 GB-os modell. Ezek ugyan butábbak, de offline is működnek, és elérik a két évvel ezelőtti GPT-3.5 szintjét.
Emlékszem, először csak azon ámultunk, hogy helyesen alkot angol mondatokat. A magyarja akkor még csapnivaló volt, össze-vissza tette a ragozásokat. Mostanra viszont a magyar tudása is kiváló lett. Tisztázzuk az open source kifejezést: igazából ezek „open binary” modellek, mert magát a forráskódot és a tréning-adatokat nem adták oda, csak a végeredményt. De erre már lehet építeni és fine-tune-olni őket, ahogy Aleksandar Svetski csinálta a Spirit of Satoshi modellel.
– Ha a Spirit of Satoshit kérdezed az inflációról, nem azt fogja mondani, hogy a 2 százalékos infláció szükséges a gazdaság pörgéséhez, hanem azt, hogy az infláció lopás és felhígítja a pénzt. Az AI visszaböfögi azt, amit beadtak neki. Nem úgy működik a tréning, hogy csak ráöntik az internetet, hanem könyveket bontanak fejezetekre, és megtanítják a gépet, hogy adott válaszhoz keressen kérdést. Ha a Bitcoin Core forráskódjával látnám el, specializált válaszokat tudna adni a kódra vonatkozóan.
A tokenek olyasmik, mint a szótagok: a gép nem betűket tárol, hanem karaktercsoportokat, és ezek alapján jósolja meg a következő legvalószínűbb elemet. Ezért sokkal nagyobb az energiaigénye a tanításnak, mint a használatnak. Az offline modellek előnye, hogy a kérdéseink privátok maradnak. Bár sok mindent nyugodtan megoszthatunk a világgal, el kell döntenünk, mi az, amit megtartunk magunknak. Aki például a gyereke tanítására használná az AI-t, az nem akarja kitenni őt külső manipulációnak vagy cenzúrának.
Pavel Durov, a Telegram alapítójának lekapcsolása Franciaországban rávilágított a cenzúra és a magánszféra fontosságára. Itt jön be az offline, saját trénelésű modellek szerepe, amik nem a központi „igazságot” szajkózzák. Kérdezzük meg Robit, mit gondol a központi vs. open source AI-ról! Robi válasza szerint a központi modellek gyorsabbak és erősebbek, de adatvédelmi kockázattal járnak. Az open source modellek nagyobb átláthatóságot adnak, és jobban illeszkednek a Bitcoin szellemiségéhez.
– Meglepően formálhatóak ezek a modellek. Megfelelő instrukciókkal rávehetőek, hogy ne legyenek elfogultak, és minden oldalról megvizsgálják a kérdést. A Claude 3.5 Sonnet is elérte már a GPT-4 szintjét, ami azért érdekes, mert sokan azt találgatják: elértük-e a technológia határait, vagy folytatódik az exponenciális görbe? De ha ennyi az egész, már ez is hihetetlenül hasznos. A Grok, Elon Musk mesterséges intelligenciája pedig kapott egy „fun mode-ot”, hogy viccesen válaszoljon.
Adatvédelem terén nagy veszély a digitális állampolgárság program, ami mindent egy helyen akar tárolni. Ha egy központi AI megkaparintja ezeket az adatokat, rengeteg visszaélésre adhat okot. Vannak olyan szolgáltatások, mint a Venice.ai vagy az UnleashChat, ahol nem mentik el az adataidat és lightninggal is fizethetsz. Persze garancia nincs, a cég reputációjában kell bíznunk. A legjobb megoldás továbbra is a lokális futtatás.
Programozáshoz és ötleteléshez sokat használom az AI-t, segít kimozdulni a „lokális minimumokból”. Sokkal kevesebb időt töltök a mellékes feladatokkal, gyorsabban vissza tudok térni a lényegre. Videók összefoglalására is kiváló, egy perc alatt átlátok egy másfél órás beszélgetést a YouTube-feliratok alapján. Ez rengeteg időt spórol. Az ElevenLabs felolvasója pedig, ami korábban csak angolul tudott, most már tökéletes kiejtéssel beszél magyarul is – kivéve a számokat, azokat néha viccesen mondja.
– Sokan félnek, hogy az AI becsap minket, de szerintem csak egyértelművé teszi a saját felelősségünket abban, hogy utánanézzünk a dolgoknak. Nem a vallásnak, a tudománynak vagy az AI-nak kell megmondania a tutit; nekünk kell kialakítanunk a saját világképünket. Ahogy mondani szokták: a térkép nem maga a terep (the map is not the territory). Az AI csak tömöríti a valóságot a kapott szövegek alapján.
Bátorítok mindenkit, hogy próbálgassa otthon ezeket a modelleket. Nem kell tőlük félni, ez a jelen, ami körbe fog minket venni. Minél előbb elkezdjük a tanulást, annál jobb. Egyre kevesebb technikai tudást igényel a telepítésük, néha csak egy weboldalt kell megnyitni. Arra is kíváncsi voltam, hogyan kapcsolódik össze a Bitcoin, az AI és a Nostr. Robi szerint mindhárom az önrendelkezésről (self-sovereignty) és a decentralizációról szól.
Érdekes, hogy az AI energiaigénye miatt most sokan rájönnek: az energia nem ellenség, hanem a fejlődésünk kulcsa. A Nostr pedig visszaadja az internet eredeti decentralizált jellegét. Bár Robi a „Nostrt” néha „Nasdaq-nak” értette, a lényeget jól megfogalmazta: kőkorszakból a technológiai civilizáció felé tartunk. Meglepően jól követi az utasításokat, bár a 3.5-ös modell még hamar „bedilizett”, ha ellentmondó korlátokat kapott. A négyes már sokkal stabilabb.
– A kontextusméret növekedése egy idő után másodlagos lesz a logikai következtető képesség (reasoning engine) mögött. Az AI egyelőre nem éri el az emberi kreativitást, nem tud alapvetően új információt szintetizálni. Az ember akkor a legkreatívabb, ha az élete függ tőle. Mi vagyunk az „univerzális magyarázók” (universal explainer): minden elméletileg megoldható problémát képesek vagyunk leküzdeni.
Nick Bostrom riogatása az intelligens lényekkel, akik eltaposnak minket, mint a hangyákat, hibás analógia. A hangya nem problémamegoldó, az ember viszont igen. Nincs magasabb szintű intelligencia az embernél abban az értelemben, hogy a megoldható problémákra képesek vagyunk rájönni. Egy szuperintelligencia lehet gyorsabb vagy pontosabb, de ugyanazokat a problémákat fogjuk tudni megoldani, mint ő.
Fantasztikus időben élünk: az interneten mindenki össze van kapcsolva, a Bitcoin lehetővé teszi a monetáris hála kifejezését, az AI pedig felszabadít minket a „nine-to-five” rabszolgaságból. Ezek szabadság-technológiák. Ne dugjuk homokba a fejünket, legyünk hálásak értük. Október 11. és 13. között a miskolctapolcai Hotel Aurorában megrendezzük Magyarország első Bitcoin konferenciáját.
Már 43 nap van hátra, a programot a bitcoinmiskolc.hu oldalon nézhetitek meg. Lőrinc is ott lesz, és szombaton előadást tart a Bitcoin forráskódjáról „Trust, but verify” címmel. Megtanít titeket, hogyan vonjatok le saját következtetéseket a kódból, függetlenül attól, ki mit mond. Ennyi fért a mai adásba, köszönjük a figyelmet, és köszönjük Robinak is a válaszokat. Ha tetszett, lájkoljatok és osszátok meg! Sziasztok!
Böngésszétek a HUSZONEGY honlapját a huszonegy.world címen, ahol rengeteg ingyenes oktatóanyag elérhető. Azok számára pedig, akik személyes támogatást igényelnek, ajánljuk a Bitcoin Mentor szolgáltatásait a bitcoinmentor.hu honlapon. Iratkozz fel a HUSZONEGY Podcast YouTube csatornájára és a Rumble csatornánkra is! Kövesd a HUSZONEGY-et Facebookon és Nostron. Támogatóink Miskolctapolca Bitcoin-elfogadó wellness szállodái, a Hotel Aurora és a Hotel Atlantis. És a Firefish üzeni: ne adjátok el a bitcoinotokat!