ChatGPT pārliecina kā izcils loģiķis – un tas ir problēma

Eulerpool News 2024. g. 7. jūl. 17:19

Vai lielie valodu modeļi var atrisināt loģiskās mīklas? Lai to noskaidrotu, Fernando Perez-Cruz un Hyun Song Shin jautāja GPT-4. Shin, Starptautisko norēķinu bankas pētniecības vadītājs, ieviesa mīklu "Šerilas dzimšanas diena", kurā Albertam un Bernardam ir jāuzmin, kad ir Šerilas dzimšanas diena. Šerila sniedz viņiem norādes, un pēc kāda laika viņi abi var uzzināt datumu. Bet tas nebija īstais pārbaudījums. Pētnieki mainīja mīklas vārdus un mēnešus, un GPT-4 nespēja pareizi atrisināt modificēto versiju, pat ja tas prasmīgi izskaidroja oriģinālo mīklu.

Der Beweis zeigt, dass GPT-4 zwar logisch und überzeugend klingt, aber tatsächlich oft nur bekannte Antworten wiedergibt, ohne die Logik wirklich zu verstehen. Dieser Schein von Brillanz birgt Risiken, wenn es um wichtige Entscheidungen geht.

Translating this heading to Latvian:
Tas parāda, ka GPT-4, lai arī skan loģiski un pārliecinoši, bieži vien tikai atkārto zināmas atbildes, neizprotot loģiku. Šis spožums var būt riskants svarīgu lēmumu pieņemšanā.

Vēl viens piemērs ir Monty-Hall problēma, kurā kandidātam jāizvēlas starp trim durvīm, aiz vienām no tām slēpjas balva. Viktorīnas vadītājs atver durvis, kurās nav balvas, un piedāvā kandidātam mainīt izvēli. Pareizā stratēģija ir mainīt durvis, taču, kad Perez-Kruzs uzdeva mīklu ar papildu sarežģījumiem, GPT-4 atkal kļūdījās, lai gan pareizi izskaidroja pamatus.

Šie piemēri ilustrē pamata problēmu: lieliem valodas modeļiem, piemēram, GPT-4, ir pārsteidzoši labi spējumi ģenerēt ticamas, bet kļūdainas atbildes. Tās var pārliecinoši izklausīties, pat ja tās ir nepareizas, kas padara to izmantošanu riskantu. Kā uzsver Perez-Krus un Šins, kļūdains valodas modelis var radīt fatālas sekas, ja to izmanto būtiskos lēmumu pieņemšanas procesos.

Šķietami pareizs, bet patiesībā nepareizs valodu modelis ir bīstams ierocis. Tas ir tāpat kā paļauties uz izklājlapu, kura laiku pa laikam aizmirst, kā darbojas reizināšana. Šie secinājumi jāuztver kā brīdinājums izmantot valodu modeļus piesardzīgi un vienmēr kritiski izvērtēt to atbildes.

ChatGPT pārliecina kā izcils loģiķis – un tas ir problēma

Veic labākos ieguldījumus savā dzīvē
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Jaunumi

Meta pārtrauc multimodālo KI modeļu ieviešanu Eiropā

Ryanair brīdina par peļņas kritumu – patērētāji nav gatavi augstām biļešu cenām

Hammerson pārdod Bicester Village daļas L Catterton par 600 miljoniem mārciņu

Nenoteiktība par GCAP programmu: Starmers slavē progresu, taču paliek neskaidrs

Vodafone pārdod vēl 10 procentus Vantage Towers par 1,3 miljardiem eiro