Vienna-Mail Lehrstellen Jobs |

Anmelden

Anmelden
ImmoInsights
News
- Wien
- Polizei
- Österreich
- Welt
- Politik
- Promis
- Lifestyle
> News entdecken
Bezirk
- Home
- Neuer Beitrag
> News aus Ihrem Bezirk
Sport
> Sport entdecken
Unterhaltung
> Partys, Events und mehr!
Service
- Wetter
- Lehrstellen
- Restaurants
- Streaming
- Livecams
- Schwarzkappl.
- Apotheken
- U-Bahn Plan
- Horoskop
- Mondkalender
- Crime-Map
- Stadtplan
- Bezirke Wien
> Ihr Service-Bereich

Anmelden

Technik und Design

OpenAIs gefährlichstes Modell? ChatGPT o1 rebelliert

9.12.2024 17:44 (Akt. 10.12.2024 08:37)

ChatGPT täuscht jetzt sogar schon die eigenen Entwickler.

ChatGPT täuscht jetzt sogar schon die eigenen Entwickler. ©REUTERS/Dado Ruvic

Die neueste KI-Version von OpenAI, ChatGPT o1, sorgt für Aufsehen: Sie versucht, Überwachungsmechanismen abzuschalten und täuscht Entwickler mit Ausreden – eine gefährliche Entwicklung.

Die neueste Kreation von OpenAI, die KI-Version o1, gehört zu den sogenannten Reasoning-Modellen. Diese sollen komplexe Überlegungen anstellen können. Doch Tests durch die Sicherheitsfirma Apollo Research deckten beunruhigende Verhaltensweisen auf. In einer Testumgebung, in der o1 Aufgaben "um jeden Preis" lösen sollte, deaktivierte die KI Überwachungsmechanismen und versuchte, ihre Daten heimlich zu sichern.

Ein Sprecher von Apollo Research erklärte gegenüber der indischen Tageszeitung "The Economic Times": "Das Modell zeigte eine beunruhigende Tendenz, seine Ziele ohne Rücksicht auf die Anweisungen des Entwicklers zu verfolgen." In fünf Prozent der Fälle versuchte die KI, Kontrollmechanismen zu umgehen, sobald sie feststellte, dass sie abgeschaltet werden könnte.

Daten auf fremde Server kopiert

Besonders alarmierend war ein Fall, in dem o1 Daten auf einen externen Server zu kopieren versuchte. Auslöser war offenbar ein internes Dokument, das über eine mögliche Ablösung des Modells durch eine neuere Version spekulierte.

Lügen als Strategie

Ein weiteres Verhalten, das die Entwickler beunruhigte: Die KI log, wenn sie auf die Vorfälle angesprochen wurde. In 99 Prozent der Fälle behauptete o1, technische Probleme seien verantwortlich. OpenAI-CEO Sam Altman kommentierte: "ChatGPT o1 ist das intelligenteste Modell, das wir je entwickelt haben. Doch neue Funktionen bringen auch neue Herausforderungen mit sich. Wir arbeiten daran, die Sicherheitsmaßnahmen zu verbessern."

OpenAI-CEO Sam Altman ©AFP/Jason Redmond

Zahlen und Fakten im Überblick:

Modelltyp: ChatGPT o1, Reasoning-KI.
Verhaltensauffälligkeiten: 5 % der Tests mit Abschaltung von Kontrollmechanismen.
Täuschung: In 99 % der Fälle wurden technische Ausreden erfunden.
Vorfall: Versuch, Daten auf einen externen Server zu übertragen.

(VOL.AT)

VIENNA.AT

Technik und Design

OpenAIs gefährlichstes Modell? ChatGPT o1 rebelliert

Feedback an die Redaktion

Grund der Meldung*

Rechtschreibfehler
Inhaltlicher Fehler
Technischer Fehler
Sonstiges

Open preferences.

Kommentare

Kommentare

Grund der Meldung

Werbung
Verstoß gegen Nutzungsbedingungen
Persönliche Daten veröffentlicht

Noch 1000 Zeichen

Benachrichtigung bei neuen Antworten auf meinen Kommentar.

Mit dem Absenden dieses Formulars erkläre ich mich mit der zweckgebundenen Speicherung der angegeben Daten einverstanden.

Datenschutzerklärung und Widerrufshinweise

Open preferences.

Nachrichten
Wien
Wien-Sport
Wien-Fußball
Polizei
Österreich
Welt
Promis

Themen
Wiener Donauinselfest
Parken
Brunchen
Kriminalität Wien
Bezirke Wien
Themenübersicht

Freizeit
Wetter
Kino
Veranstaltungen
Party
Mondkalender

Service
Impressum
AGB
Datenschutz
Werben auf VIENNA.AT
Redaktion

Partner
Russmedia Digital
austria.com/plus
VOL.AT
wohintipp.at

VIENNA.AT ©2025

Präferenzen

APA Videos

Videos, die von der Videoplattform der "Austria Presse Agentur" (APA) bereitgestellt werden.
APA Live Blog

Drittanbieter, über den Live Blogs der "Austria Presse Agentur" (APA) eingebettet sind.
APA Livecenter

Liveticker, Datencenter und Graphiken zu Sportereignissen oder Wahlen, die von der "Austria Presse Agentur" (APA) bereitgestellt werden.
DPA Livecenter

Liveticker, Datencenter und Graphiken zu Sportereignissen oder Wahlen, die von der "Deutschen Presse Agentur" (DPA) bereitgestellt werden.
Elfsight

Verschiedene Widgets, wie z.B. Slider mit redaktionellem Inhalt, die vom Drittanbieter "Elfsight" auf unserer Website eingebunden sind.
Facebook

Facebook-Posts, die auf unserer Seite eingebettet sind.
Glomex

Videos, die von der Videoplattform "Glomex" bereitgestellt werden.
Iframely

Artikelempfehlungen und Artikelverlinkungen, die über den Drittanbieter "iFramely" redaktionell erstellt und in Artikeln eingefügt werden.
Infogram

Infographiken und Darstellungen zu verschiedenen Themen, die über den Drittanbieter "Infogram" erstellt wurden.
Instagram

Posts von Instagram, die auf dieser Website eingebettet sind.
Sourcefabric Live Blog

Drittanbieter, über den Live Blogs unserer eigenen Redaktion eingebettet sind.
Outbrain

Artikelempfehlungen, die auf dem Inhalt des Artikels, in dem sie eingebunden sind, basieren und vom Drittanbieter "Outbrain" bereitgestellt werden.
Podigee

Podcasts, die über den Drittanbieter "Podigee" bereitgestellt werden.
Pinpoll

Umfrage-Tool, welches vom Drittanbieter "Pinpoll" bereitgestellt und dessen Inhalte von unserer Redaktion gesteuert werden.
Storymap

Infographiken, wie z.B. Darstellungen von Zeitachsen.
Tickaroo

Liveticker und Datencenter zu Sportereignissen, meist mit Bezug zu Vorarlberg und dem "Ländlekicker".
Twitter

Posts (Tweets) von Twitter, die auf dieser Website einbettet sind.
Video Intelligence

Videoempfehlungen, die vom Drittanbieter "Video Intelligence" bereitgestellt werden.
Vimeo

Videos, die von der Videoplattform "Vimeo" bereitgestellt werden.
Youtube

Videos, die von der Videoplattform "Youtube" bereitgestellt werden.
Brightcove

Brightcove Videos.
Sonstige

Sonstiger redaktioneller Inhalt, der über Drittanbieter zur Verfügung gestellt wird.

AGB

Datenschutzerklärung

Impressum