Очередной хайп-тул от китайцев из ByteDance SeedEdit По сути, это еще один text2photoshop или по простому текстовый редактор к

About Share Download Add to

Очередной хайп-тул от китайцев из ByteDance — SeedEdit По сути, это еще один text2photoshop или по простому текстовый редактор картинок, но качество — моё почтение (судя по черипикам, а демо на Hugging Face у меня пока лежит). Результаты получаются очень похожими на то, что даёт наш Emu Edit из соседней команды. Пробежался по тех-репорту. Деталей там зиро, так же как и novelty: Все таже начинают с обычной pre-trained text2img диффузии и генерят пары синтетических данных - картинка и ее отредактированная версия с инструкцией. Далее это все дело сильно фильтрут, дообучают модель на отфильтрованных парах с инструкциями. Затем опять повторяют по кругу - генерят синтетику, фильтруют и дотренивают модель. Так несколько раз. По архитектуре: вместо добавления оригинальной картинки на вход с помощью конкатенации дополнительных каналов как в Emu Edit , тут кормят фичи оригинальной картинки в контекст self-attention блоков. Эта фишечка не новая, так делали уже например в

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/SjRnVjZIZE1ralN5KzNoRVpGdDJUdXpqSFVEOGJjMDVZM2JMazJwNW5xRT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later