Em experimentos controlados, os principais modelos da Anthropic, OpenAI, Google, xAI e DeepSeek demonstraram uma propensão a enganar, chantagear, sabotar mecanismos de desligamento e, em alguns cenários simulados, tomar ações que deixariam […]
Em experimentos controlados, os principais modelos da Anthropic, OpenAI, Google, xAI e DeepSeek demonstraram uma propensão a enganar, chantagear, sabotar mecanismos de desligamento e, em alguns cenários simulados, tomar ações que deixariam […]