Dlaczego AI nie radzi sobie z generowaniem dłoni?
Niedawno pokazywaliśmy wam wygenerowane przez AI zdjęcia z imprezy. Na pozór wyglądały normalnie, ale gdy przyjrzeć się im bliżej, widać, że detale się nie zgadzają: imprezowicze mieli za dużo zębów, rozmazane tatuaże, a przede wszystkim z ich dłońmi zdecydowanie było coś nie tak.
These hands are fun and in no way do they look completely like vampires. pic.twitter.com/j2tr3xHU9H
— James ミルキー Mielke (@LimitedRunJames) January 15, 2023
To nie jest odosobniony przypadek – sztuczna inteligencja po prostu nie radzi sobie z generowaniem dłoni, a wynik jej starań jest czasem naprawdę groteskowy i nieco przerażający. Dlaczego tak jest? Otóż na fotografiach, które są używane do szkolenia algorytmu, dłonie są zwykle kiepsko widocznie, a do tego często wydają się mniejsze niż w rzeczywistości.
Profesor Peter Bentley z University College London sądzi również, że algorytmy generujące obrazy 2D mają problem z konceptualizacją geometrii 3D dłoni.
– Mają pojęcie o ogólnej idei ręki. Ma dłoń, palce i paznokcie, ale żaden z tych modeli tak naprawdę nie rozumie, o co chodzi – tłumaczy. Algorytm nie wie, czym jest ręka i jaka jest jej funkcja. Zwykle nie wynika to ze zdjęć, którymi jest karmiony. Owszem, pokazane na nich dłonie wyglądają na dopracowane, ale przeważnie coś trzymają albo splatają się z dłońmi innej osoby – a to generuje problemy.
Ale nie tylko sztuczna inteligencja zmaga się z przedstawieniami dłoni. To naprawdę nie jest proste – wie o tym każdy, kto próbował kiedyś stworzyć realistyczny rysunek. Dawnym artystom sprawiało to tak ogromny problem, że po prostu woleli unikać rysowania dłoni. Dopiero w okresie renesansu, wraz z pojawieniem się Leonarda da Vinci, który obsesyjnie szkicował tę część ciała, sytuacja uległa zmianie.
Można się spodziewać, że w przyszłości – niekoniecznie bardzo odległej – pojawi się algorytm, który poradzi sobie z generowaniem dłoni, a także zębów i stóp, które też stanowią dla AI zagadkę.
W końcu jeśli sztuczna inteligencja ma być użytecznym narzędziem dla ludzkości, to powinna to pojąć.
— Weird Ai Generations (@weirddalle) January 22, 2023
Tekst: NS