Читать в бразуре
Как создавать изображения с помощью ИИ: мини-курс

Выпуск №128 5 октября 2022.

Подпишитесь на tweekly — email-рассылка с бизнес-трендами. 10 новых бизнес-идей со всей планеты каждую пятницу.
Помните, были такие профессии — «художник» и «иллюстратор»? Ещё пару лет назад говорили, что ИИ не сможет заменить креативные профессии, но с приходом доступных нейросетей многие поменяли точку зрения. DALL-E и Stable Diffusion уже могут создавать картинки, забирающие призы на конкурсах художников. 

Это приведёт к тому, что к 2025 году ИИ отберёт работу у 85 млн человек. Но в то же время создаст огромное количество новых рабочих мест и возможностей для бизнеса. Поэтому сегодня в мини-курсе — обзор самого яркого направления ИИ на сегодня: генерации и редактирования изображений.

10 шагов:
1. Получаем доступ к DALL-E
2. Учимся писать запросы к ИИ
3. Генерируем изображения с помощью Stable Diffusion
4. Генерируем арт в MidJourney
5. Используем inpainting для редактирования изображений
6. Удаляем фон и ненужные объекты на изображении
7. Используем дипфейки для замены лиц
8. Генерируем 3D-изображения
9. Создаём дипфейк-видео
10. Изучаем основы машинного обучения
1. Получаем доступ к DALL-E
Технология генерации изображений из текста совершила мощный рывок за последний год. OpenAI первыми произвели фурор с их моделью DALL-E. 
На днях они открыли доступ без листа ожидания: регистрироваться здесь, также доступен API. К сожалению, не для всех стран — при попытке создать аккаунт с номером телефона РФ/Беларуси/Украины выходит ошибка.
Поэтому план действий таков:
  • Подключаем VPN с туннелем из поддерживаемой страны
  • Указываем виртуальный номер телефона при регистрации — есть много сервисов по типу OnlineSim, Receive SMS и других. Лучше купить платный номер — большинство бесплатных забанены. 
  • После регистрации будет доступно 50 бесплатных генераций, ещё 15 будут давать ежемесячно. Когда триал закончится, попросят привязать карту из «дружественной страны». Для коммерческих проектов придётся открывать счет за рубежом.
2. Учимся писать запросы к ИИ
Основной навык, который требуется при работе со всеми генераторами — написание текстовых запросов (промтов). Появилась целая наука «prompt architecture» — как спросить у нейросетки, чтобы получить интересные результаты.

Вкратце, процесс можно описать так:

  • «Сырой запрос» — описываем объект, который мы хотим сгенерировать, на английском языке. Примеры: panda, a warrior with a sword, skeleton.
  • Добавляем к сырому запросу требуемый стиль изображения. Примеры: realistic, oil painting, pencil drawing, concept art. 
  • Стиль художника. Может полностью преобразить изображение. Например, если вы хотите что-то абстрактное, можно добавить «made by Pablo Picasso».
  • Завершающие штрихи. Тут фантазия может разыграться, что приводит к запросам длиннее этой рассылки. Вы можете добавить к промту что угодно, вот некоторые популярные штрихи: surrealism, the most beautiful image ever seen, 4K, dramatic lighting, epic composition. В общем, алгоритму можно сказать что-то вроде «максимальное количество деталей» и он их нарисует.

Для более полного погружения рекомендуем эти гайды:

  • DALL-E Prompt Book — подробный гайд на 80 страниц про архитектуру запросов к DALL-E 2.
  • Руководство по использованию нейросети Midjourney — как правильно писать запросы, какие параметры прописывать и т.д. 
  • Prompt Builder — пошаговый конструктор запросов к популярным генераторам. 
  • Prompt Base — маркетплейс промтов для DALL-E, Stable Diffusion и GPT-3. За пару баксов можно узнать выигрышные запросы по разным категориям. Можно продавать и свои удачные промты. 
3. Генерируем изображения с помощью Stable Diffusion
В отличие от OpenAI (который далеко не Open), ребята из стартапа Stability AI решили сделать «открытый генератор». Он заточен на создание своих сервисов — код открыт, параметры модели также выложили в опенсорс. При этом качество генерации сопоставимо с DALL-E 2.

Протестировать Stable Diffusion проще всего с помощью Dream Studio — веб-сервиса для генерации картинок. Зарегистрироваться может любой желающий, каждому выдаётся 200 кредитов бесплатно (от 20 до 200 генераций, в зависимости от параметров). 

Далее настраиваем сами параметры генерации:

  • Width, height — размеры картинки в пикселях.
  • Cfg Scale — параметр «случайности». Чем он выше, тем ближе будет генерация к вашему запросу, но качество может пострадать. 
  • Steps — число шагов генерации. Чем больше шагов, тем дольше идёт генерация и выше качество картинки. Также быстрее проедаются кредиты, из-за более высокой нагрузки на сервер. 
  • Number of Images — число вариантов финального изображения по вашему запросу.

Получите доступ к 10-шаговым мини-курсам. Подписка включает более 60 мини-курсов. Каждый месяц — ещё 4 новых курса (выпуски по средам)


Попробовать полную версию можно всего за 1 рубль. Пробный период — 7 дней и дальше 750 руб. в месяц
Попробовать за 1 ₽
Годное чтиво за эту неделю
  1. Почему сейчас? События, после которых начинается рост или падение продукта: кризисы, новые технологии, изменение поведения и др.
  2. История взлёта индийского e-commerce проекта —Shiprocket.
  3. Какие делать тарифы для продуктов, чтобы сохранялись и рост и маржа.
  4. Переписка Илона Маска (pdf), которую обязали сделать публичной в рамках сделки по Twitter.
  5. Как использовать токены для создания сообщества.
Твит недели
Джордж Буш записал свой онлайн-курс.

«Ты можешь закончить Йель, потом Гарвард. Потом стать губернатором, потом Президентом США, заработать миллионы долларов. Но всё равно будешь недоволен собой, пока не запустишь свой онлайн-курс».
Над выпуском работали
Алексей Черняк
Подписаться на Telegram-канал Алексея 
Александр Басиров
© 2020 Product University
119311, Москва, Вернадского 9/10
a@productuniversity.ru
+7 499 938 66 46