Alibaba uderza w Photoshop. Koniec z męczącą edycją zdjęć
Alibaba wchodzi na rynek z modelem Qwen-Image-Layered, który potrafi „rozebrać” zwykłe zdjęcie na zestaw przezroczystych warstw RGBA, gotowych do szczegółowej obróbki niczym w Photoshopie, ale bez wychodzenia z samego modelu.
Twórcy przekonują, że dzięki temu można niemal całkowicie wyeliminować problem przypadkowego „rozjeżdżania się” obrazu przy poprawianiu tylko jednego elementu kadru.
Nowy system Qwen AI przekształca płaski plik RGB w stos rozdzielonych warstw, osobno dla obiektów, tła, tekstu czy innych elementów sceny. Każda warstwa ma własne kanały koloru i przezroczystości, więc można ją niezależnie przesuwać, skalować, przekolorowywać, usuwać lub podmieniać, bez naruszania tego, co znajduje się pod spodem.
Qwen-Image-Layered wywodzi się z architektury diffusion i korzysta z RGBA-VAE, które wrzuca zarówno klasyczne obrazy, jak i warstwowe kompozycje do jednej przestrzeni latentnej (ukrytej), co ułatwia ich dalszą obróbkę. Model obsługuje zmienną liczbę warstw, a każdą z nich można dodatkowo podzielić na kolejne „plastry”, gdy projekt wymaga jeszcze precyzyjniejszej kontroli.
Model został udostępniony w pełni na licencji Apache 2.0, wraz z kodem i demami na GitHubie, Hugging Face oraz ModelScope, więc można go już testować i wdrażać w komercyjnych produktach. Z kolei niektórzy zaczynają oferować Qwen-Image-Layered jako usługę, serwując gotowe stosy warstw, maski i metadane prosto do silników montażowych czy aplikacji webowych.