Google setzt dabei auf den eigenen GPT-4-Konkurrenten Gemini, den es in einem aktuellen Demo-Video in Szene gesetzt hat. In einem Kommentarbereich, Bloomberg Google erkennt den Videotitel an „Hands-on mit Gemini: Kommunikation mit multimodaler KI“ Es wurde nicht nur bearbeitet, um Veröffentlichungen zu beschleunigen (in der Videobeschreibung angekündigt), sondern es gibt auch praktisch keine implizite Sprachkommunikation zwischen dem menschlichen Benutzer und der KI.
Stattdessen wurde die eigentliche Demo „unter Verwendung von Standbildern aus Szenen und Eingabeaufforderungen per Text“ erstellt, anstatt Gemini als Reaktion auf – oder Vorhersagen – in Echtzeit Objekte auf dem Tisch zeichnen oder ändern zu lassen. Es ist viel weniger beeindruckend, als das Video uns in die Irre führen möchte, und schlimmer noch: Das Fehlen einer Leugnung der eigentlichen Eingabemethode stellt die Bereitschaft der Zwillinge in Frage.
Dass Google hier, wie bereits erwähnt, jegliches Fehlverhalten leugnet, ist überraschend an der Kante In dem von Gemini-Co-Präsident Oriol Vinales verfassten X-Beitrag heißt es, dass „alle Benutzeraufforderungen und -ausgaben im Video echt sind“ und dass sein Team das Video erstellt habe, „um Entwickler zu inspirieren“. Angesichts des jüngsten Branchen- und Regulierungsfokus auf KI könnte der Technologieriese bei seinen Präsentationen in diesem Bereich sensibler sein.
Ich freue mich sehr über das Interesse an unserem „Hands-on with Gemini“-Video. In unserem Entwicklerblog gestern haben wir beschrieben, wie Gemini zum Bau verwendet wurde. https://t.co/50gjMkaVc0
Wir präsentierten Gemini-Arrays mit verschiedenen Modi – in diesem Fall Bild und Text – und es musste reagieren … pic.twitter.com/Beba5M5dHP
– Oriole Vinales (@OreoleVinealesML) 7. Dezember 2023