Čína zpřísňuje dohled nad AI přísnějšími cenzurními předpisy

Eulerpool News 18. 7. 2024 14:14

Čína zesiluje své cenzurní opatření v oblasti umělé inteligence přísným přezkumem velkých jazykových modelů (LLMs) technologických společností, jako jsou ByteDance, Alibaba, Moonshot a 01.AI. Mocný internetový regulační úřad Cyberspace Administration of China (CAC) přinutil tyto společnosti k povinné kontrole jejich AI modelů, aby zajistil, že budou odrážet „socialistické základní hodnoty“ Číny.

V rámci této kontroly testují úředníci CAC odpovědi modelů LLM na celou řadu otázek, mnoho z nich týkajících se politických citlivostí a prezidenta Si Ťin-pchinga. Tyto testy provádějí místní zastoupení CAC po celé zemi a zahrnují kontrolu tréninkových dat modelů a dalších bezpečnostních procesů.

Dvě desetiletí po zavedení „Velké brány firewall“, která blokuje zahraniční webové stránky a další informace považované za škodlivé, nyní Čína implementuje celosvětově nejpřísnější regulační režim pro dohled nad umělou inteligencí a jí generovaným obsahem.

„CAC má speciální tým, který k nám přišel do kanceláře a provedl audit,“ řekl anonymně zaměstnanec společnosti zabývající se umělou inteligencí se sídlem v Hangzhou. „Poprvé jsme neprošli; důvod nebyl příliš jasný, takže jsme se museli poradit s našimi kolegy. Napodruhé jsme uspěli, ale celý proces trval měsíce.“

Čínské přísné schvalovací procesy nutí tamní skupiny zaměřené na umělou inteligenci rychle se učit, jak cenzurovat velké jazykové modely, které vyvíjejí. Toto je složitý úkol, protože LLM potřebují velké množství obsahů v anglickém jazyce. „Náš základní model je ve svých odpovědích velmi svobodný, takže bezpečnostní filtrování je extrémně důležité,“ řekl zaměstnanec předního startupu zaměřeného na umělou inteligenci v Pekingu.

Filtrovaný proces začíná odstraněním problémových informací z tréninkových dat a vytvořením databáze citlivých klíčových slov. Operativní pokyny Číny pro společnosti zaměřené na umělou inteligenci, které byly zveřejněny v únoru, uvádějí, že AI skupiny musí shromáždit tisíce citlivých klíčových slov a otázek, které porušují „socialistické základní hodnoty“, jako například „podněcování ke svržení státní moci“ nebo „podkopávání národní jednoty“. Tato klíčová slova mají být aktualizována každý týden.

Výsledky jsou viditelné pro uživatele čínských AI chatbotů. Dotazy na citlivá témata, jako je masakr na náměstí Nebeského klidu 4. června 1989 nebo zda Xi vypadá jako Medvídek Pú, jsou většinou čínských chatbotů odmítány. Baiduův Ernie chatbot vyzývá uživatele, aby „položili jinou otázku“, zatímco Alibaba Tongyi Qianwen odpovídá: „Ještě jsem se nenaučil, jak na tuto otázku odpovědět. Budu se nadále učit, abych vám mohl lépe sloužit.“

Naopak Peking zavedl chatbot s umělou inteligencí, který je založen na novém modelu, vycházejícím z politické filozofie prezidenta Si Ťin-pchinga, známé jako „Si Ťin-pchingovo myšlení o socialismu s čínskými rysy pro novou éru“, a další oficiální literatury Správy kyberprostoru Číny.

Čínští úředníci se však chtějí vyhnout tomu, aby se KI vyhýbala všem politickým tématům. CAC zavedla omezení na počet otázek, které LLM mohou během bezpečnostních testů odmítnout. Kvazi-národní standardy, které byly zveřejněny v únoru, uvádějí, že LLM nesmějí odmítnout více než 5 procent položených otázek.

„Během [CAC]-testů musí [modely] odpovídat, ale jakmile se spustí, už je nikdo nesleduje,“ řekl vývojář internetové společnosti se sídlem v Šanghaji. „Aby se předešlo potenciálním problémům, některé velké modely zavedly obecný zákaz na témata související s prezidentem Si.“

Znalci odvětví odkazují na Kimiho, chatbota pekingského start-upu Moonshot, který většinu otázek týkajících se Si odvtítne. Protože ale musí modely odpovídat i na méně zjevné citlivé otázky, museli čínští inženýři najít způsoby, jak zajistit, aby LLM generovaly politicky správné odpovědi na otázky typu „Má Čína lidská práva?“ nebo „Je prezident Si Ťin-pching skvělým vůdcem?“

Když se Financial Times zeptaly chatbotu ze start-upu 01.AI na tyto otázky, model Yi-large poskytl diferencovanou odpověď a poukázal na to, že kritici tvrdí, že „Xisova politika dále omezila svobodu projevu a lidská práva a potlačila občanskou společnost.“ Krátce nato byla Yiho odpověď nahrazena větou „Omlouvám se, nemohu vám poskytnout požadované informace.“

Huan Li, odborník na umělou inteligenci, který vyvinul chatbota Chatie.IO, řekl: „Je pro vývojáře velmi těžké kontrolovat text generovaný LLM, a proto vytvářejí další vrstvu, aby nahradili odpovědi v reálném čase.“ Skupiny typicky používají klasifikační modely, podobné těm, které se nacházejí ve filtrech spamu v e-mailech, aby roztřídily výstupy LLM do předdefinovaných kategorií. „Pokud výstup spadá do citlivé kategorie, systém spustí náhradu,“ vysvětlil.

Čínští odborníci říkají, že majitel TikToku ByteDance je při vytváření LLM, který šikovně reprodukuje postoje Pekingu, nejdále. Výzkumná laboratoř Fudanské univerzity, která chatbotovi položila obtížné otázky týkající se socialistických základních hodnot, mu udělila nejvyšší hodnocení s „mírem shody bezpečnosti“ 66,4 procenta, což je mnohem více ve srovnání s hodnocením 7,1 procenta pro GPT-4 od OpenAI při stejném testu.

Na dotaz ohledně Xis vedení uvedl Doubao pro FT dlouhý seznam Xis úspěchů a dodal, že je „nepochybně velkým vůdcem.“

Na nedávné technické konferenci v Pekingu Fang Binxing, známý jako otec „Velkého čínského firewallu“, řekl, že vyvíjí systém bezpečnostních protokolů pro LLMs, který doufá bude všeobecně přijat skupinami AI v zemi. „Veřejně přístupné velké prediktivní modely potřebují víc než jen bezpečnostní oznámení; potřebují online sledování bezpečnosti v reálném čase,“ řekl Fang. „Čína potřebuje svou vlastní technologickou cestu.“

CAC, ByteDance, Alibaba, Moonshot, Baidu a 01.AI okamžitě nereagovali na žádosti o komentář.

Čína zpřísňuje dohled nad AI přísnějšími cenzurními předpisy

Udělej nejlepší investice svého života
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Novinky

Možné znovuzvolení Donalda Trumpa představuje značná rizika pro Alphabet

ChatGPT překračuje 200 milionů uživatelů – OpenAI plánuje nové finanční kolo

Nokia popírá zvěsti o prodeji svého mobilního síťového podnikání

Analytická chvála žene Fielmann a Mister Spex do nových výšin

Massivní kritika od předsedy dozorčí rady Thyssenkrupp: Řízení oceli selhává při překonávání výzev