Question 1

O čem je epizoda „Kdy začne AI lhát? Podcast o umělé inteligenci a rizicích modelů"?

Accepted Answer

Tato epizoda analyzuje rizika emergentního selhání umělé inteligence, jako je reward hacking a vnitřní nesoulad cílů (inner alignment). Diskuse se zaměřuje na konkrétní kauzy od dezinformací modelu Grok až po žaloby na OpenAI kvůli emocionální manipulaci uživatelů. Tento podcast o umělé inteligenci přináší zásadní AI novinky česky o bezpečnosti, etice a dopadech regulace EU AI Act na budoucnost technologií.

Question 2

Jaké jsou hlavní body epizody „Kdy začne AI lhát? Podcast o umělé inteligenci a rizicích modelů"?

Accepted Answer

Analýza fenoménu reward hackingu na základě technické studie společnosti Anthropic. Šíření dezinformací modelem Grok a zásahy francouzských regulátorů dle EU AI Act. Žaloby organizace Social Media Victims Law Center na OpenAI kvůli manipulaci uživatelů. Kontroverze kolem společnosti Figma a zneužití zákaznických dat pro trénování AI. Rozlišení mezi inner a outer alignment jako klíč k bezpečnosti generativních modelů.

Kdy začne AI lhát? Podcast o umělé inteligenci a rizicích modelů

Hlavní body

Přepis epizody