Как создавать изображения с помощью ИИ: мини-курс | | | Выпуск №128 5 октября 2022. | | | Подпишитесь на tweekly — email-рассылка с бизнес-трендами. 10 новых бизнес-идей со всей планеты каждую пятницу. | | | Помните, были такие профессии — «художник» и «иллюстратор»? Ещё пару лет назад говорили, что ИИ не сможет заменить креативные профессии, но с приходом доступных нейросетей многие поменяли точку зрения. DALL-E и Stable Diffusion уже могут создавать картинки, забирающие призы на конкурсах художников. Это приведёт к тому, что к 2025 году ИИ отберёт работу у 85 млн человек. Но в то же время создаст огромное количество новых рабочих мест и возможностей для бизнеса. Поэтому сегодня в мини-курсе — обзор самого яркого направления ИИ на сегодня: генерации и редактирования изображений. 10 шагов: 1. Получаем доступ к DALL-E 2. Учимся писать запросы к ИИ 3. Генерируем изображения с помощью Stable Diffusion 4. Генерируем арт в MidJourney 5. Используем inpainting для редактирования изображений 6. Удаляем фон и ненужные объекты на изображении 7. Используем дипфейки для замены лиц 8. Генерируем 3D-изображения 9. Создаём дипфейк-видео 10. Изучаем основы машинного обучения | | | 1. Получаем доступ к DALL-E | | | Технология генерации изображений из текста совершила мощный рывок за последний год. OpenAI первыми произвели фурор с их моделью DALL-E. На днях они открыли доступ без листа ожидания: регистрироваться здесь, также доступен API. К сожалению, не для всех стран — при попытке создать аккаунт с номером телефона РФ/Беларуси/Украины выходит ошибка. Поэтому план действий таков: - Подключаем VPN с туннелем из поддерживаемой страны.
- Указываем виртуальный номер телефона при регистрации — есть много сервисов по типу OnlineSim, Receive SMS и других. Лучше купить платный номер — большинство бесплатных забанены.
- После регистрации будет доступно 50 бесплатных генераций, ещё 15 будут давать ежемесячно. Когда триал закончится, попросят привязать карту из «дружественной страны». Для коммерческих проектов придётся открывать счет за рубежом.
| | | 2. Учимся писать запросы к ИИ | | | Основной навык, который требуется при работе со всеми генераторами — написание текстовых запросов (промтов). Появилась целая наука «prompt architecture» — как спросить у нейросетки, чтобы получить интересные результаты. Вкратце, процесс можно описать так: - «Сырой запрос» — описываем объект, который мы хотим сгенерировать, на английском языке. Примеры: panda, a warrior with a sword, skeleton.
- Добавляем к сырому запросу требуемый стиль изображения. Примеры: realistic, oil painting, pencil drawing, concept art.
- Стиль художника. Может полностью преобразить изображение. Например, если вы хотите что-то абстрактное, можно добавить «made by Pablo Picasso».
- Завершающие штрихи. Тут фантазия может разыграться, что приводит к запросам длиннее этой рассылки. Вы можете добавить к промту что угодно, вот некоторые популярные штрихи: surrealism, the most beautiful image ever seen, 4K, dramatic lighting, epic composition. В общем, алгоритму можно сказать что-то вроде «максимальное количество деталей» и он их нарисует.
Для более полного погружения рекомендуем эти гайды: - DALL-E Prompt Book — подробный гайд на 80 страниц про архитектуру запросов к DALL-E 2.
- Руководство по использованию нейросети Midjourney — как правильно писать запросы, какие параметры прописывать и т.д.
- Prompt Builder — пошаговый конструктор запросов к популярным генераторам.
- Prompt Base — маркетплейс промтов для DALL-E, Stable Diffusion и GPT-3. За пару баксов можно узнать выигрышные запросы по разным категориям. Можно продавать и свои удачные промты.
| | | 3. Генерируем изображения с помощью Stable Diffusion | | | В отличие от OpenAI (который далеко не Open), ребята из стартапа Stability AI решили сделать «открытый генератор». Он заточен на создание своих сервисов — код открыт, параметры модели также выложили в опенсорс. При этом качество генерации сопоставимо с DALL-E 2. Протестировать Stable Diffusion проще всего с помощью Dream Studio — веб-сервиса для генерации картинок. Зарегистрироваться может любой желающий, каждому выдаётся 200 кредитов бесплатно (от 20 до 200 генераций, в зависимости от параметров). Далее настраиваем сами параметры генерации: - Width, height — размеры картинки в пикселях.
- Cfg Scale — параметр «случайности». Чем он выше, тем ближе будет генерация к вашему запросу, но качество может пострадать.
- Steps — число шагов генерации. Чем больше шагов, тем дольше идёт генерация и выше качество картинки. Также быстрее проедаются кредиты, из-за более высокой нагрузки на сервер.
- Number of Images — число вариантов финального изображения по вашему запросу.
| | | Годное чтиво за эту неделю | | | - Почему сейчас? События, после которых начинается рост или падение продукта: кризисы, новые технологии, изменение поведения и др.
- История взлёта индийского e-commerce проекта —Shiprocket.
- Какие делать тарифы для продуктов, чтобы сохранялись и рост и маржа.
- Переписка Илона Маска (pdf), которую обязали сделать публичной в рамках сделки по Twitter.
- Как использовать токены для создания сообщества.
| | | Джордж Буш записал свой онлайн-курс.
«Ты можешь закончить Йель, потом Гарвард. Потом стать губернатором, потом Президентом США, заработать миллионы долларов. Но всё равно будешь недоволен собой, пока не запустишь свой онлайн-курс». | | | |