ChatGPT überzeugt als brillanter Logiker – und das ist ein Problem

Eulerpool News 7 июл. 2024 г., 17:19

Могут ли большие языковые модели решать логические загадки? Чтобы это выяснить, Фернандо Перес-Крус и Хён Сонг Шин спросили GPT-4. Шин, руководитель исследования в Банке международных расчетов, предложил загадку «День рождения Шерил», в которой Альберту и Бернарду нужно угадать, когда у Шерил день рождения. Шерил даёт им подсказки, и после некоторых размышлений оба смогли найти дату. Но это был не настоящий тест. Исследователи изменили имена и месяцы в загадке, и GPT-4 не смогла правильно решить модифицированную версию, хотя оригинальную загадку объяснила мастерски.

Это показывает, что хотя GPT-4 звучит логично и убедительно, он на самом деле часто просто воспроизводит известные ответы, не понимая полностью логику. Этот видимый блеск несет риски, когда дело касается важных решений.

Вот еще один пример: задача Монти Холла, в которой кандидат должен выбрать одну из трех дверей, за одной из которых скрывается приз. Ведущий открывает одну из дверей без приза и предлагает кандидату изменить свой выбор. Правильная стратегия состоит в том, чтобы поменять дверь, но когда Перес-Крус усложнил задачу, GPT-4 снова совершил ошибки, несмотря на то, что правильно объяснил основы.

Эти примеры иллюстрируют основную проблему: большие языковые модели, такие как GPT-4, удивительно хороши в создании правдоподобных, но ложных ответов. Они могут выглядеть убедительно, даже если они ошибочны, что делает их использование рискованным. Как отмечают Перес-Крус и Шин, ошибочная языковая модель может иметь фатальные последствия, если ее использовать в важных процессах принятия решений.

Модель языка, которая кажется абсолютно правильной, но на самом деле совершенно ошибочной, является опасным оружием. Это все равно, что полагаться на электронную таблицу, которая иногда забывает, как работает умножение. Эти выводы должны служить предупреждением о необходимости осторожного использования языковых моделей и постоянной критической оценки их ответов.

Business

ChatGPT überzeugt als brillanter Logiker – und das ist ein Problem

Определите недооцененные акции за один взгляд.
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Новости

Meta setzt Einführung multimodaler KI-Modelle in Europa aus can be translated to Russian as: Meta приостанавливает внедрение мультимодальных моделей ИИ в Европе

Ryanair предупреждает о снижении прибыли – потребители не готовы к высоким ценам на билеты

Хаммерсон продает долю в Bicester Village компании L Catterton за 600 миллионов фунтов

Неопределенность вокруг программы GCAP: Стармер хвалит прогресс, но остается неопределенным

Водафон продаёт ещё 10 процентов акций Vantage Towers за 1,3 миллиарда евро