So testen Sie Apples neuen KI-Fotoeditor

Es gibt einen neuen Fotoeditor von Apple, falls Sie wissen, wo Sie danach suchen müssen. iPhone Kings hat sich mit Forschern der University of California, Santa Barbara, zusammengetan, um ein Tool zu entwickeln, mit dem Sie Fotos und Bilder mithilfe von Textanweisungen bearbeiten können. Es gibt keine offizielle Veröffentlichung, aber Forscher veranstalten eine Demo, die Sie selbst ausprobieren können und die zum ersten Mal entdeckt wurde Extreme Technologie.

Das Projekt heißt Multimodal Large Language Model Guided Image Editing (MGIE). Heutzutage gibt es viele KI-Fotobearbeitungssoftware auf dem Markt. Photoshop verfügt jetzt über integrierte KI-Tools, und andere wie DALL-E von OpenAI ermöglichen es Ihnen, Bilder zu bearbeiten und sie aus ganzen Stoffen zu erstellen. Wenn Sie jedoch schon einmal versucht haben, sie zu verwenden, wissen Sie, dass es etwas frustrierend sein kann. In vielen Fällen hat die KI Schwierigkeiten, genau zu verstehen, wonach Sie suchen.

Die Innovation bei MGIE fügt eine weitere Ebene der KI-Interpretation hinzu. Wenn Sie der KI mitteilen, was Sie sehen möchten, verwendet MGIE zunächst textbasierte KI, um Ihre Anweisungen klarer und aussagekräftiger zu gestalten. „Experimentelle Ergebnisse zeigen, dass ausdrucksstarke Anweisungen für die anweisungsbasierte Bildbearbeitung unerlässlich sind“, sagten die Forscher in einem Artikel. Papier Veröffentlicht auf arXiv. „MGIE kann zu erheblichen Verbesserungen führen.“

Apple hat eine Open-Source-Version der Software veröffentlicht Github. Wenn Sie schlau sind, können Sie eine Kopie von MGIE selbst zum Laufen bringen, aber die Forscher haben das Tool auf … eingerichtet. Gesichtsumarmung. Es läuft etwas langsam, wenn viele Leute es benutzen, aber es macht Spaß.

Siehe auch  Kleines, aber wichtiges Update

Tech-Giganten wie Apple geben Milliarden von Dollar für Projekte aus, die niemand jemals sehen wird. Daher ist es durchaus möglich, dass das sogenannte MGIE-Tool nie offiziell veröffentlicht wird. Apple reagierte nicht sofort auf eine Bitte um Stellungnahme.

Wir haben es hier im Gizmodo-Büro ausprobiert. Ich habe ein Foto von meinem Kollegen und engsten Berater Kyle Barr mit seltsamer Sonnenbrille hochgeladen, das ich auf Netflix aufgenommen habe … Consumer Electronics Show in diesem Jahr. Ich sagte zu Amnesty International: „Der Mann steht in der Wüste.“ Vor der Erstellung des Bildes extrapoliert MGIE Folgendes:

„Der Mann trägt einen Metallhelm und steht in einer Wüstenumgebung. Die Umgebung ist karg und karg, mit Sanddünen, die sich erstrecken, so weit das Auge reicht.“

Nachdem man viel länger mit dem Tool herumgespielt hat, als es hätte sein sollen, ist klar, dass es vielen der gleichen Einschränkungen unterliegt wie jeder andere KI-Bildgenerator. Oftmals sind die Ergebnisse seltsam und entsprechen überhaupt nicht dem, was Sie bestellt haben. Aber in einigen Fällen hat es beeindruckende Arbeit geleistet, und zur Verteidigung der Software muss man sagen, dass die KI bei vertrauten Themen besser abschnitt. „Vertraut“ würde man Kyles Sonnenbrille nicht nennen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert