Text-to-image
Open source: Stable Diffusion XL, Pixart, Кандинский, Craiyon, IF, Wurstchen и пачка других бесполезных, устаревших еще на момент выхода моделей.
Proprietary: Dall-e 3, Stable Diffusion 1.6, NovelAI, Midjourney, Niji, Adobe AI, Imagen, в ближайшее время перечень пополнится
Text-to-video
Open source: CogVideo, Modelscope
Proprietary: Gen-2, PlaiDay, Nuwa
LLM
Open source: LLAMA и Alpaca, Vicuna, Xwin, пигма и копрольд, StableLM, YaLM, тонны дерьма
Proprietary: Семейство GPT, Claude, Ernie, Firefly
Тут ситуация даже хуже классического противостояния Open Source vs Proprietary Software, в том плане, что для той же закрытой винды ты заплатил один раз за лицензию (ну или скачал кряк) и пользуешься сколько угодно, не боясь, что она у тебя перестанет работать.
А проприетарный ИИ распространяется только по подписочной системе и никто не гарантирует, что эта же система будет доступна через пару дней/полгода/несколько лет. Да и эти системы могут трансформироваться таким образом, что становятся просто неюзабельными. Пример того же CharacterAI показателен - систему настолько задушили фильтрами, что в cai-треде (который теперь aicg) его буквально никто не использует.
Другой момент в том, что аналог любой классической закрытой системы ты можешь написать либо в одно лицо, либо при наличии сообщества энтузиастов. Да, во многих случаях, такие решения будут менее удобны чем коммерческие и менее навороченные. В случае же нейронок, тебе нужна толпа макак чтобы собрать и разметить датасет и кластер с GPU. Такое энтузиасты уже не тянут - просто нет ресурсов на такое.
Сейчас ценности из себя представляют сами модели, обучить которые можно только на GPU-кластерах за много денег. Сам же inference моделей может быть осуществлён на более легковесных системах. К примеру, модель NAI3 от NovelAI доступна только в онлайне за подписку, при этом комфортные лимиты доступны только по подписке $25/мес. Однако, сами NovelAI писали, что их модель - это просто файнтьюн SDXL, который комфортно работает на картах с 12 GB VRAM.
>>LLM
Мне лично из проприетарных только клод нравится, он лучше всех осуществляет переводы с русского. Что касается других задач, работа над создание текстов, эссе, с ними отлично работают локальные модели.
>>Text-to-image
Stable Diffusion, включая XL, отлично справляется со всеми задачами. Все якобы уникальные плюсы проприетарных это маркетинговые выдумки.
Перечни и пост составляла нейросеть?