Es gibt einen neuen Fotoeditor von Apple, falls Sie wissen, wo Sie danach suchen müssen. iPhone Kings hat sich mit Forschern der University of California, Santa Barbara, zusammengetan, um ein Tool zu entwickeln, mit dem Sie Fotos und Bilder mithilfe von Textanweisungen bearbeiten können. Es gibt keine offizielle Veröffentlichung, aber Forscher veranstalten eine Demo, die Sie selbst ausprobieren können und die zum ersten Mal entdeckt wurde Extreme Technologie.
Das Projekt heißt Multimodal Large Language Model Guided Image Editing (MGIE). Heutzutage gibt es viele KI-Fotobearbeitungssoftware auf dem Markt. Photoshop verfügt jetzt über integrierte KI-Tools, und andere wie DALL-E von OpenAI ermöglichen es Ihnen, Bilder zu bearbeiten und sie aus ganzen Stoffen zu erstellen. Wenn Sie jedoch schon einmal versucht haben, sie zu verwenden, wissen Sie, dass es etwas frustrierend sein kann. In vielen Fällen hat die KI Schwierigkeiten, genau zu verstehen, wonach Sie suchen.
Die Innovation bei MGIE fügt eine weitere Ebene der KI-Interpretation hinzu. Wenn Sie der KI mitteilen, was Sie sehen möchten, verwendet MGIE zunächst textbasierte KI, um Ihre Anweisungen klarer und aussagekräftiger zu gestalten. „Experimentelle Ergebnisse zeigen, dass ausdrucksstarke Anweisungen für die anweisungsbasierte Bildbearbeitung unerlässlich sind“, sagten die Forscher in einem Artikel. Papier Veröffentlicht auf arXiv. „MGIE kann zu erheblichen Verbesserungen führen.“
Apple hat eine Open-Source-Version der Software veröffentlicht Github. Wenn Sie schlau sind, können Sie eine Kopie von MGIE selbst zum Laufen bringen, aber die Forscher haben das Tool auf … eingerichtet. Gesichtsumarmung. Es läuft etwas langsam, wenn viele Leute es benutzen, aber es macht Spaß.
Tech-Giganten wie Apple geben Milliarden von Dollar für Projekte aus, die niemand jemals sehen wird, daher ist es durchaus möglich, dass das sogenannte MGIE-Tool nie eine offizielle Veröffentlichung erhält. Apple reagierte nicht sofort auf eine Bitte um Stellungnahme.
Wir haben es hier im Gizmodo-Büro ausprobiert. Ich habe ein Foto von meinem Kollegen und engsten Berater Kyle Barr mit seltsamer Sonnenbrille hochgeladen, das ich auf Netflix aufgenommen habe … Consumer Electronics Show in diesem Jahr. Ich sagte zu Amnesty International: „Der Mann steht in der Wüste.“ Vor der Erstellung des Bildes extrapoliert MGIE Folgendes:
„Der Mann trägt einen Metallhelm und steht in einer Wüstenumgebung. Die Umgebung ist karg und karg, mit Sanddünen, die sich erstrecken, so weit das Auge reicht.“
Nachdem man viel länger mit dem Tool herumgespielt hat, als es sollte, ist klar, dass es vielen der gleichen Einschränkungen unterliegt wie jeder andere KI-Bildgenerator. Oftmals sind die Ergebnisse seltsam und entsprechen überhaupt nicht dem, was Sie bestellt haben. Aber in einigen Fällen hat es beeindruckende Arbeit geleistet, und zur Verteidigung der Software muss man sagen, dass die KI bei vertrauten Themen besser abschnitt. „Vertraut“ würde man Kyles Sonnenbrille nicht nennen.
„Kaffeeliebhaber. Introvertiert. Stolzer Problemlöser. Entdecker. Freundlicher Musikfan. Zombie-Nerd.“
More Stories
Die Ankündigung der PlayStation 5 Pro ist für einige Wochen geplant
Kuo: Das RAM-Upgrade auf 12 GB im nächsten Jahr wird auf das iPhone 17 Pro Max beschränkt sein
Midjourney, ein Unternehmen für künstliche Intelligenz, stellt ein Hardwareprodukt in neuer Form vor