Modele AI: między brakiem danych a szansami na innowacje

Generative modele sztucznej inteligencji, uważane za prawdziwe cuda nowoczesnej technologii, stoją przed znacznymi wyzwaniami z powodu zanieczyszczenia danych i groźby pogorszenia się własnej jakości. Te tak zwane "halucynacje" sztucznej inteligencji, podczas których generowane są fikcyjne wydarzenia historyczne, nieistniejące osoby i błędne teorie naukowe, rodzą pytania dotyczące niezawodności i przyszłości tych systemów, w które zainwestowano miliardy. Niedawno opublikowane w "Nature" badanie oświetla ryzyka zanieczyszczenia danych w procesie uczenia systemów AI i możliwego upadku modeli. Naukowcy odkryli, że obecne generacyjne modele AI coraz częściej korzystają z danych syntetycznych, które jednak mogą naruszać integralność zestawów danych treningowych. "Niedyskryminacyjne użycie treści generowanych przez modele prowadzi do nieodwracalnych defektów," ostrzega zespół badawczy kierowany przez Ilię Shumailova z Uniwersytetu Oksfordzkiego. Ta wrażliwość modeli przypomina mityczny obraz węża Ouroboros zjadającego własny ogon. W związku z tym rozwój generatywnej sztucznej inteligencji może się spowolnić, ponieważ wysokiej jakości dane stają się coraz rzadsze. Epoch AI prognozuje, że dostępne obecnie 300 bilionów tokenów tekstów generowanych przez człowieka może wyczerpać się do 2028 roku. Niemniej jednak może istnieć przewaga konkurencyjna dla wcześniejszych modeli, które były trenowane na nieskażonych danych. Mogłoby to zwiększyć wartość świeżych, prywatnie generowanych danych ludzkich i zwrócić uwagę wydawców. Teoretyczne zagrożenia związane z upadkiem modelu nie są nowe, ale selektywne wykorzystanie danych syntetycznych pozostaje wartościowe. Jednak naukowcy muszą inwestować znacznie więcej czasu i pieniędzy w oczyszczanie swoich zestawów danych. Pionierem w tej dziedzinie jest platforma Hugging Face, która rozwija wysoko kuratorowane zestawy treningowe i małe modele językowe w konkretnych dziedzinach, takich jak medycyna i nauka. Pomimo rosnących ograniczeń generatywnych modeli AI, rewolucja sztucznej inteligencji pozostaje na kursie. Możliwy jest teraz zwiększony nacisk na sąsiadujące dziedziny badań nad AI, które dotychczas były zaniedbywane. Postępy w ucieleśnionej AI, jak przy robotach i pojazdach autonomicznych, mogą przynieść nowe przełomy. Kognitywistka Alison Gopnik podkreśla, że robotyka, która nie jest ograniczona do informacji z Internetu, ale korzysta z danych ze świata rzeczywistego, może być kluczowa dla rozwoju prawdziwej inteligencji. Tak jak biologiczna inteligencja wyłoniła się dawno temu z praoceanu, nasze najnowsze modele generatywne AI mogą jeszcze wiele nauczyć się od prostych robaków i gąbek, które ponad pół miliarda lat temu uczyniły pierwsze kroki w kierunku inteligentnego życia.

EULERPOOL DATA & ANALYTICS

Make smarter decisions faster with the world's premier financial data

Eulerpool Data & Analytics

Eulerpool News·
1.08.2024

Make smarter decisions faster with the world's premier financial data

Nowy

SAP w centrum uwagi: Wyniki kwartalne mogą wyznaczyć kurs DAX

Sure, the translation of the heading to Polish is: "Netflix: Gigant streamingowy z imponującym zyskiem kwartalnym i optymistycznymi prognozami

Norris zmaga się z „niszczycielem nastroju” po rozczarowującym Grand Prix USA.

Francja zabezpiecza wpływy na dział zdrowia konsumenckiego Sanofi.

Here is the translation of the heading into Polish: Sztuczna inteligencja: Zainwestuj w przyszłość – Bez potrzeby Nvidia

Czyste napięcie: Ott Tänak zapewnia pełne emocji zwycięstwo na Rajdzie Europy Środkowej

Pojedynek gigantów AI: Nvidia kontra SoundHound AI w porównaniu

Zarządzanie długiem w firmie Intel: balansowanie z potencjałem

Trump obiecuje zniesienie podatku na ubezpieczenia społeczne: nadzieje i wyzwania dla emerytów

Eksplozja goli w dogrywkach: Mecze NHL zachwycają fanów

Modele AI: między brakiem danych a szansami na innowacje

Eulerpool News·1.08.2024

Make smarter decisions faster with the world's premier financial data

Nowy

Eulerpool News·
1.08.2024