Je tu nový editor fotografií od Applu, pokud víte, kde ho hledat. iPhone Kings se spojil s výzkumníky z Kalifornské univerzity v Santa Barbaře, aby vytvořili nástroj, který vám umožní upravovat fotografie a obrázky pomocí textových pokynů. Nemá oficiální vydání, ale výzkumníci pořádají demo, které si můžete vyzkoušet sami a které bylo spatřeno poprvé Extrémní technologie.
Projekt se nazývá Multimodal Large Language Model Guided Image Editing (MGIE). V dnešní době je na trhu spousta AI softwaru pro úpravu fotografií. Photoshop nyní přichází s vestavěnými nástroji AI a další, jako je OpenAI DALL-E, vám umožňují upravovat obrázky a také je vytvářet z celé látky. Pokud jste je však zkoušeli používat již dříve, víte, že to může být trochu frustrující. V mnoha případech má umělá inteligence potíže s pochopením toho, co přesně hledáte.
Inovace v MGIE přidává další vrstvu interpretace AI. Když řeknete AI, co chcete vidět, MGIE nejprve použije textovou AI, aby vaše pokyny byly jasnější a popisnější. „Experimentální výsledky ukazují, že expresivní pokyny jsou nezbytné pro úpravu obrázků na základě pokynů,“ uvedli vědci v článku. papír Publikováno na arXiv. „MGIE může vést k výraznému zlepšení.“
Apple zveřejnil open source verzi softwaru na github. Pokud jste chytří, můžete si spustit kopii MGIE sami, ale výzkumníci tento nástroj nastavili na… Objímání obličeje. Běží trochu pomalu, když ho používá hodně lidí, ale je to zábavný zážitek.
Techničtí giganti jako Apple utrácejí miliardy dolarů za projekty, které nikdo nikdy neuvidí, takže je zcela možné, že takzvaný nástroj MGIE nikdy nedostane oficiální verzi. Apple na žádost o komentář okamžitě neodpověděl.
Probrali jsme to tady v kanceláři Gizmodo. Nahrál jsem fotku svého kolegy a nejbližšího poradce Kylea Barra v podivných slunečních brýlích, které jsem si vzal na Netflix v… Letošní výstava spotřební elektroniky. Řekl jsem Amnesty International: „Ten muž stojí v poušti.“ Před vytvořením obrazu MGIE extrapoluje následující:
„Muž má na sobě kovovou přilbu a stojí v pouštním prostředí. Okolní prostředí je pusté a pusté, s písečnými dunami, kam až oko dohlédne.“
Poté, co si s tímto nástrojem hrál mnohem déle, než by měl, je jasné, že podléhá mnoha stejným omezením jako kterýkoli jiný generátor obrázků AI. Výsledky jsou často podivné a nic podobného tomu, co jste si objednali. Ale v některých případech to odvedlo působivou práci a na obranu softwaru si AI vedla lépe se známými tématy. „Familiar“ není něco, co byste nazvali Kyleovými slunečními brýlemi.