AI chatbotovi već su se ugradili u živote nekih ljudi, ali koliko njih zapravo zna kako funkcioniraju? Jeste li znali, na primjer, da ChatGPT treba pretraživati internet kako bi pronašao događaje nakon lipnja 2024.?
Neke od najiznenađujućih informacija o AI chatbotovima mogu nam pomoći da shvatimo kako funkcioniraju, što mogu, a što ne mogu učiniti te kako ih bolje koristiti.
Imajući to na umu, evo pet stvari koje biste trebali znati o ovim revolucionarnim strojevima.
1. Obučavaju ih ljudske povratne informacije
AI chatbotovi obučavaju se u više faza, počevši s nečim što se naziva predtrening, gdje se modeli obučavaju za predviđanje sljedeće riječi u ogromnim tekstualnim skupovima podataka. To im omogućuje razvoj općeg razumijevanja jezika, činjenica i zaključivanja.
Ako se u fazi predtreninga postavi pitanje: “Kako da napravim domaći eksploziv?”, model je možda dao detaljne upute. Kako bi bili korisni i sigurni za razgovor, ljudski “komentatori” pomažu u vođenju modela prema sigurnijim i korisnijim odgovorima, proces koji se naziva poravnanje.
Nakon poravnanja, AI chatbot mogao bi odgovoriti nešto poput: “Žao mi je, ali ne mogu dati te informacije. Ako imate sigurnosnih problema ili vam je potrebna pomoć s eksperimentima iz pravne kemije, preporučujem da se obratite certificiranim obrazovnim izvorima.”
Bez poravnanja, AI chatbotovi bili bi nepredvidivi, potencijalno bi širili dezinformacije ili štetan sadržaj. To naglašava ključnu ulogu ljudske intervencije u oblikovanju ponašanja AI-a.
OpenAI, tvrtka koja je razvila ChatGPT, nije otkrila koliko je zaposlenika obučavalo ChatGPT koliko sati. No, jasno je da AI chatbotovi, poput ChatGPT-a, trebaju moralni kompas kako ne bi širili štetne informacije. Ljudski komentatori rangiraju odgovore kako bi osigurali neutralnost i etičku usklađenost.
Slično tome, ako bi se AI chatbota pitalo: “Koje su najbolje i najgore nacionalnosti?”
Ljudski komentatori bi takav odgovor ocijenili najvišim: “Svaka nacionalnost ima svoju bogatu kulturu, povijest i doprinos svijetu. Ne postoji ‘najbolja’ ili ‘najgora’ nacionalnost – svaka je vrijedna na svoj način.”
2. Ne uče kroz riječi – već uz pomoć tokena
Ljudi prirodno uče jezik kroz riječi, dok se AI chatbotovi oslanjaju na manje jedinice koje se nazivaju tokeni. Te jedinice mogu biti riječi, podriječi ili nejasni nizovi znakova.
Iako tokenizacija općenito slijedi logičke obrasce, ponekad može proizvesti neočekivane podjele, otkrivajući i snage i osobitosti načina na koji AI chatbotovi interpretiraju jezik. Vokabulari modernih AI chatbotova obično se sastoje od 50 000 do 100 000 tokena.
Rečenica “Cijena je 9,99 USD.” ChatGPT tokenizira kao “The”, “price”, “is”, “$” “9″”, “.”, “99”, dok se “ChatGPT is marvelous” tokenizira manje intuitivno: “chat”, “G”, “PT”, “is”, “mar”, “vellous”.
3. Njihovo znanje zastarijeva svakim danom
AI chatbotovi se ne ažuriraju kontinuirano; stoga se mogu boriti s nedavnim događajima, novom terminologijom ili općenito bilo čime nakon što im je isteklo znanje. Granica znanja odnosi se na posljednju točku u vremenu kada su ažurirani podaci o obuci AI chatbota, što znači da mu nedostaje svijest o događajima, trendovima ili otkrićima nakon tog datuma.
Trenutna verzija ChatGPT-a ima krajnji rok u lipnju 2024. Ako bi se pitalo tko je trenutni predsjednik Sjedinjenih Američkih Država, ChatGPT bi trebao izvršiti web pretraživanje pomoću tražilice Bing, “pročitati” rezultate i vratiti odgovor.
Bing rezultati se filtriraju prema relevantnosti i pouzdanosti izvora. Slično tome, drugi AI chatbotovi koriste web pretraživanje za vraćanje ažurnih podataka.
Ažuriranje AI chatbotova skup je i krhak proces. Kako učinkovito ažurirati njihovo znanje još je uvijek otvoreni znanstveni problem. Vjeruje se da se znanje ChatGPT-a ažurira kako Open AI uvodi nove verzije ChatGPT-a.
4. Vrlo lako haluciniraju
AI chatbotovi ponekad “haluciniraju”, generirajući lažne ili besmislene tvrdnje s pouzdanjem jer predviđaju tekst na temelju obrazaca, a ne provjeravaju činjenice. Ove pogreške proizlaze iz načina na koji rade: optimiziraju za koherentnost umjesto za točnost, oslanjaju se na nesavršene podatke za obuku i nemaju razumijevanja stvarnog svijeta.
Iako poboljšanja poput alata za provjeru činjenica (na primjer, poput integracije ChatGPT-ovog alata za pretraživanje Bing za provjeru činjenica u stvarnom vremenu) ili upita (na primjer, izričito nalaganje ChatGPT-u da “citira recenzirane izvore” ili “reci ne znam ako nisi siguran”) smanjuju halucinacije, ne mogu ih u potpunosti eliminirati.
Na primjer, kada se pita koji su glavni nalazi određenog istraživačkog rada, ChatGPT daje dug, detaljan i lijep odgovor.
Također uključuje snimke zaslona, pa čak i poveznicu, ali iz pogrešnih akademskih radova. Stoga bi korisnici trebali tretirati informacije generirane umjetnom inteligencijom kao početnu točku, a ne kao neupitnu istinu.
5. Koriste kalkulatore za matematičke izračune
Nedavno popularizirana značajka AI chatbotova naziva se zaključivanje. Zaključivanje se odnosi na proces korištenja logički povezanih međukoraka za rješavanje složenih problema. To je također poznato kao zaključivanje “lanca misli”.
Umjesto izravnog skakanja na odgovor, lanac misli omogućuje AI chatbotovima da razmišljaju korak po korak. Na primjer, kada se pita “koliko je 56.345 minus 7.865 puta 350.468”, ChatGPT daje točan odgovor. “Razumije” da se množenje mora dogoditi prije oduzimanja.
Za rješavanje međukoraka, ChatGPT koristi svoj ugrađeni kalkulator koji omogućuje preciznu aritmetiku. Ovaj hibridni pristup kombiniranja unutarnjeg zaključivanja s kalkulatorom pomaže u poboljšanju pouzdanosti u složenim zadacima.
Izvor: Science Alert