Работа с изображениями
№15 Генерация изображений DALL-E v3
Функция даёт возможность попросить бота создать изображение или показать то, о чем он вам написал через генерацию изображений DALL-E v3.
Параметры, которые можно передать в функцию generate_image_dalle:

query - описание изображения. Указывает текстовое описание изображения, которое вы хотите сгенерировать. Пример: "красивый закат над морем".
resolution - разрешение изображения. Доступные варианты:
"1024x1024"
"1792x1024"
"1024x1792"
По умолчанию используется разрешение "1024x1024".
Пример использования:
"Пожалуйста, создай картину с описанием: зеленый лес с озером и разрешением 1792x1024. Стиль фотореализм"
Функция даёт возможность попросить бота создать изображение или показать то, о чем он вам написал через генерацию изображений Kandinsky (Fusion Brain)
Параметры, которые можно передать в функцию generate_image_sber:

query - описание изображения, которое вы хотите сгенерировать.
Пример: query: "зимний пейзаж с горными вершинами и соснами"
Функция позволяет выполнять поиск изображений на Яндекс.Картинки по заданному запросу. Вы можете указать ключевые слова, чтобы получить соответствующие изображения.
Параметры, которые можно передать в функцию yandex_images:

query - поисковый запрос, который определяет, какие изображения вы хотите найти.
Пример: query: "красивый закат".
Функция позволяет получать URL изображения по заданному поисковому запросу в Google. Вы можете использовать эту функцию, чтобы находить изображения, соответствующие вашим запросам.
Параметры, которые можно передать в функцию get_google_image:

query - поисковый запрос для Google.
Примеры использования:

"Найди красивый закат"
Для работы функции нужно указать токен от https://stability.ai/ Функция позволяет генерировать изображения на основе заданного описания с использованием API StabilityAI.
Параметры, которые можно передать в функцию generate_image_stabilityai:

api_key - API KEY для доступа к сервису.
query - описание изображения. Минимум в 10 слов и только на английском языке.
resolution - разрешение изображения. Доступные варианты: "1024x1024", "1792x1024", "1024x1792". По умолчанию используется "1024x1024".
Примеры использования:

"Сгенерируй изображение с описанием: 'A beautiful landscape with mountains, a river, and a clear blue sky.' в разрешении 1024x1024."

В промпте укажите свой ключ api: XXXXXXXXXXXXXXXXXXXXXX".
Для работы функции нужно указать токен от https://apiframe.pro/ Функция позволяет генерировать изображения с использованием Midjourney на основе заданного детализированного запроса. Вы можете использовать эту функцию для создания уникальных изображений по вашему описанию.
Параметры, которые можно передать в функцию generate_image_midjourney:

api_key - API KEY для доступа к сервису Midjourney.
prompt - детализированный запрос для генерации изображения в Midjourney.
aspect_ratio - пропорции изображения. Доступные варианты: "1:1", "2:3", "3:2", "4:5", "5:4", "4:7", "7:4". По умолчанию используется "1:1".
Примеры использования:

Пример вызова функции:

"api: XXXXXXXXXXXXXXXXXXXXXX
нарисуй мне голубоглазую девушку в стиле фотореализм в формате 4:7"
Функция позволяет выполнить замену лиц на изображениях с использованием API Midjourney. Для этого необходимо предоставить API ключ и URL-адреса целевого изображения и изображения для замены. Для работы функции нужно указать токен от https://apiframe.pro/ Токен можно прописать внутри инструкций вашего бота и тогда будет достаточно только запроса на генерацию картинки. https://documenter.getpostman.com/view/33976547/2sA35HXgaH.
Параметры, которые можно передать в функцию faceswap_midjourney:

api_key - ключ API для доступа к Midjourney.
target_image_url - URL целевого изображения, на котором будет происходить замена лица.
swap_image_url - URL изображения, лицо которого будет заменено.
Примеры использования:

"Пожалуйста, замени лицо на изображении по URL 'https://example.com/target_image.jpg' на лицо с изображения по URL 'https://example.com/swap_image.jpg', используя API ключ 'your_api_key_here'."
Функция позволяет сделать скриншот веб-сайта по указанному URL. Вы можете указать URL сайта и токен API для аутентификации.
Параметры, которые можно передать в функцию url_screenshot:

url - URL веб-сайта, для которого вы хотите сделать скриншот.
token - токен API для аутентификации.
Примеры использования:

"Создай скриншот для URL https://openai.com, токен API your_api_token_here."

Функция позволяет выполнять поиск изображений по заданным параметрам, используя Yandex Search API. Это может быть полезно для получения изображений по конкретным критериям.
Параметры, которые можно передать в функцию search_images:

text - текст поискового запроса. Это строка, содержащая ключевые слова для поиска изображений.
groupby - настройки группировки результатов. Это строка, определяющая, как группировать результаты поиска. Пример: "type".
p - номер страницы поисковой выдачи. Это целое число, указывающее, какую страницу результатов вы хотите получить.
fyandex - фильтр "Семейный поиск". Это целое число, которое может принимать значения:
0 - отключить семейный поиск
1 - включить семейный поиск
site - доменное имя сайта для поиска. Это строка, указывающая, на каком сайте следует искать изображения. Пример: "example.com".
itype - формат картинки. Это строка, определяющая формат изображений, которые вы хотите получить. Доступные варианты:
"jpg"
"gif"
"png"
iorient - тип ориентации изображения. Это строка, определяющая ориентацию изображений. Доступные варианты:
"horizontal"
"vertical"
"square"
isize - размер картинки. Это строка, определяющая размер изображений. Доступные варианты:
"enormous"
"large"
"medium"
"small"
"tiny"
"wallpaper"
icolor - цвет картинки. Это строка, определяющая цвет изображений. Можно выбрать из списка: серый, цветной, красный, оранжевый, желтый, зеленый, голубой, синий, фиолетовый, белый или черный.
Примеры использования:

"Пожалуйста, найди изображения по запросу 'красивые пейзажи' с фильтром 'Семейный поиск' включенным."

"Мне нужно получить изображения формата 'jpg' с ориентацией 'horizontal' по запросу 'котята'."

"Ищи изображения на сайте 'example.com' с размером 'large' и цветом 'blue' по запросу 'автомобили'."

Функция позволяет генерировать изображения на основе текстовых подсказок и параметров или выполнять замену лиц на изображении. Это может быть полезно для создания уникальных изображений или редактирования существующих.

API ключ вы можете получить на сайте https://rapidapi.com/ и подключить интеграцию с https://rapidapi.com/MorfranTechnology/api/midjourney-imaginecraft-generative-ai-api

Основной запрос: Вы задаете основной текст, который описывает, что вы хотите увидеть на изображении. Это обязательный элемент, без которого функция не сможет сработать.

Дополнительные запросы: Вы можете добавить вторичный текст, который уточняет ваш запрос. Например, если основной запрос — "кот", то вторичный может быть "в шляпе".

Вес запросов: Вы можете указать, насколько сильно вторичный запрос должен влиять на итоговое изображение. Это делается с помощью числового значения, где большее значение означает большее влияние.

Отрицательные запросы: Если есть что-то, что вы не хотите видеть на изображении, вы можете указать это. Например, "без собак".

Изображения для подсказок: Вы можете предоставить URL-адреса изображений, которые могут помочь в создании вашего изображения. Это может быть изображение стиля или персонажа.

Соотношение сторон: Вы можете задать ширину и высоту изображения, чтобы оно соответствовало вашим требованиям, например, для обложки книги или постера.

Стилизация и уникальность: Функция позволяет настроить уровень стилизации, странности и хаоса, чтобы изображение выглядело так, как вы хотите — от реалистичного до абстрактного.

Дополнительный текст: Вы также можете добавить текст, который будет использован для генерации, если это необходимо.
Параметры, которые можно передать в функцию
rapid_api_midjourney_generate_image_and_face_swap:

rapid_api_key - API ключ. Указывает ключ, необходимый для аутентификации при запросе.
textPrompt - основная текстовая подсказка для генерации изображения.
secondTextPrompt - вторичная текстовая подсказка для генерации изображения.
secondTextPromptWeight - вес вторичной текстовой подсказки. Указывает, насколько сильно вторичная подсказка влияет на результат.
negativePrompt - негативные подсказки, которые следует избегать в изображении.
imagePromptUrl - URL изображения для подсказки.
imageWeight - вес изображения подсказки.
aspectRatioWidth - ширина соотношения сторон.
aspectRatioHeight - высота соотношения сторон.
characterReferenceUrl - URL изображения персонажа для замены лиц.
characterWeight - вес ссылки на персонажа.
styleReferenceUrl - URL изображения стиля.
styleWeight - вес ссылки на стиль.
stylize - параметр стилизации.
tile - нужно ли делать тайлинг изображения. Пример: true.
weird - фактор странности. Пример: 10.
chaos - фактор хаоса. Пример: 5.
textGeneration - текст для генерации.
faceSwapUrl - URL для режима замены лиц.
mode - режим работы функции.
Доступные варианты:
"imagine" - генерация изображения,
"face_swap" - замена лиц.
Примеры использования:

"Сгенерируй изображение с текстовой подсказкой 'красивый закат над морем' с использованием API ключа abcdef1234567890 в режиме imagine."

"Замени лицо на изображении по URL https://example.com/face.jpg, используя API ключ abcdef1234567890 в режиме face_swap."
Функция позволяет создать стикер из изображения в формате JPG или PNG. Это может быть полезно для создания уникальных стикеров для использования в мессенджерах или социальных сетях. Принцип работы:
- Изображение конвертируется в формат RGBA.
- Цвет фона определяется по первому пикселю (0,0).
- Все пиксели, которые совпадают с цветом фона (с учетом заданного коэффициента допуска), становятся прозрачными.
Параметры, которые можно передать в функцию convert_image_to_sticker:

image_url - URL изображения. Это адрес изображения, которое вы хотите преобразовать в стикер.
tolerance - коэффициент допуска для определения прозрачности пикселей. Это целое число, которое определяет, насколько сильно пиксели могут отличаться от цвета фона, чтобы считаться прозрачными. По умолчанию равен 30.
Примеры использования:

"Пожалуйста, создай стикер из изображения по адресу 'https://example.com/image.jpg' с коэффициентом допуска 30."

Функция позволяет распознавать текст на изображении, предоставив URL фото. Это может быть полезно для извлечения информации из документов, вывесок и других текстовых изображений.
Параметры, которые можно передать в функцию easyosr:

url - URL фото для распознавания. Указывает ссылку на изображение, с которого нужно извлечь текст.
Примеры использования:

"Распознай текст на фото по ссылке 'https://example.com/image.jpg'."

Функция позволяет распознавать содержимое изображения, предоставив URL фото и формулировку запроса. Это может быть полезно для получения информации о том, что изображено на фотографии.
Параметры, которые можно передать в функцию sber_vision:

url - URL фото. Указывает ссылку на изображение, которое нужно распознать.
question - формулировка запроса для распознавания, что на фото. Указывает текстовый запрос, который уточняет, что именно нужно распознать на изображении.
Примеры использования:

"'https://example.com/photo.png Какой предмет на фото?"

Функция предназначена для распознавания текста и шаблонных документов с использованием различных моделей. Она позволяет распознавать текст на изображениях или PDF файлах с использованием сервиса Yandex OSR. Это может быть полезно для извлечения текста из документов, фотографий и других изображений.
Параметры, которые можно передать в функцию yandex_osr:

osr_model - модель для распознавания. Это строка, указывающая, какую модель использовать для распознавания текста. Доступные модели:
"page" — подходит для изображений с любым количеством строк текста, сверстанного в одну колонку по умолчанию .
"page-column-sort" — для распознавания многоколоночного текста.
"handwritten" — для распознавания произвольного сочетания печатного и рукописного текста на русском и английском языках.
"table" — для распознавания таблиц на русском и английском языках.
"passport" — основной разворот паспорта.
"driver-license-front" — водительское удостоверение, лицевая сторона.
"driver-license-back" — водительское удостоверение, обратная сторона.
"vehicle-registration-front" — свидетельство о регистрации транспортного средства, лицевая сторона.
"vehicle-registration-back" — свидетельство о регистрации транспортного средства, обратная сторона.
"license-plates" — все регистрационные номера автомобилей на изображении.
file_url - URL изображения или PDF файла для распознавания. Это строка, представляющая адрес файла, который вы хотите обработать.
Примеры использования:

"Пожалуйста, распознай текст на изображении по адресу 'https://example.com/image.jpg' с использованием модели 'page'."
"Мне нужно распознать текст в PDF файле по ссылке 'https://example.com/document.pdf' с моделью 'handwritten'."
"Распознай таблицу на изображении по адресу 'https://example.com/table.png' с моделью 'table'."

Функция позволяет отправить боту URL изображения и получить распознанный текст. Это может быть полезно для извлечения информации из фотографий, документов или других материалов.
Параметры, которые можно передать в функцию gemini_vision:

image_url - URL изображения, из которого необходимо извлечь текст.
Примеры использования:

"Извлеки текст из изображения по ссылке: https://example.com/photo.jpg."

Функция позволяет распознавать текст на изображениях, используя технологии оптического распознавания символов OCR на основе Gemini. Функции нужно отправить ссылку на фото в формате JPG.
Параметры, которые можно передать в функцию osr_combine_ai:

image_url - URL изображения для распознавания. Это строка, представляющая адрес изображения, которое вы хотите обработать.
Примеры использования:

"Распознай текст на фотографии по адресу 'https://example.com/image.jpg'."

Задайте нам вопрос
Укажите ваше имя, тему вопроса
Отправить сообщение
Мы ответим на все ваши вопросы и поможем с настройкой бота