https://huggingface.co/microsoft/git-base
Без дотренировки: the logo of the black cat.
С дотренировкой на менее чем 100 логотипах: bird owl
Удивительно.
Что я делаю?
Иногда сгенерированные логотипы не соответствуют промпту пользователя.
И я хочу прикрутить ИИ который перед отправкой логотипа пользователю будет проверять – соответствует ли сгенерированный логотип промпту или нет.
Один ИИ генерирует, другой проверяет не фигню ли сгенерировал первый.
И если первый все таки сгенерировал фигню, то происходит повторный цикл генерации и проверки.
Кайф.
Но я еще хочу потренировать модельку Zero-Shot-Object-Detection от гугла "OWL-ViT", потому что он даже без дотренировки дает лучше результаты чем стоковый git-base от майкрософта.