На заре своего развития генеративный ИИ поглощал данные с таких сайтов, как Wikipedia, Getty и Scribd. Нейросети изучали этот контент, чтобы сгенерировать свои собственные тексты и изображения. Кажется, это было хорошим началом.
Генеративный ИИ полностью зависит от контента, который он может найти в интернете. Компьютеры имитируют интеллект и обрабатывают непостижимые объемы данных, находя в них закономерности. ChatGPT может написать сносное школьное сочинение, потому что он ознакомился с онлайн-библиотеками, а DALL-E 2 может создавать изображения в стиле Пикассо, потому что он проанализировал траекторию развития изобразительного искусства. Чем больше они тренируются, тем более умными кажутся. Рано или поздно нейросети изучат весь контент, какой только есть в интернете.
Более того, материалы, созданные искусственным интеллектом, уже сами стали активно заполнять соцсети, медиа, сайты ритейлеров и даже научные исследования. И когда технологические компании захотят снова усовершенствовать свои алгоритмы, им придется обучать их на контенте, который создали алгоритмы предыдущего поколения. Когда возможности отличить рукотворный контент от машинного не станет, может произойти настоящая катастрофа.
Хотя чат-боты и другие генеративные инструменты, например Midjourney и Stable Diffusion, — это, несомненно, выдающиеся программы, в среднем выдаваемые ими произведения поражают своей предвзятостью, абсурдностью и несоответствием реальности.
Илья Шумайлов, исследователь машинного обучения из Оксфордского университета, считает, что нынешние ошибки перейдут в будущие версии программ, а их количество увеличится.
Шумайлов и его соавторы в недавнем еще неотрецензированном исследовании представили эти ошибки как предвестник коллапса всей модели работы ИИ. Они назвали это дегенеративным процессом, в результате которого системы будут забывать накопленные знания, как это делает стареющий человек (в названии этого феномена авторы даже первоначально использовали слово «деменция», но отказались от него после критики).
Генеративный ИИ дает на запрос пользователя такой ответ, который кажется ему наиболее статистически вероятным. Это означает, что те явления, которые кажутся ему менее вероятными, будь то из-за ошибок в алгоритме или нерепрезентативной выборки, на которой он был обучен, будут всё реже попадаться в результатах, а значит, алгоритмы будут неадекватно отражать реальный многогранный мир. Они будут обходить стороной нестандартные манеры речи, странные визуальные формы, а при изображении людей будут отдавать всё большее предпочтение светлокожим. Каждый последующий ИИ, обученный на прошлом ИИ, будет терять информацию о редких или непредставленных явлениях и усугублять эти ошибки.
Как показывают предыдущие исследования, нейронные сети, основанные на рекурсивном обучении, чаще воспроизводят предвзятость и ошибки. Например, чат-боты, обученные на расистских ранних версиях ChatGPT, которые определяли мусульманских мужчин как «террористов». Поскольку каждое поколение алгоритмов плохо знакомо с явлениями, которые были недопредставлены в выборке для обучения, новые модели всё больше и больше укореняются в тех ошибочных представлениях, которые они транслируют.
Один из соавторов Шумайлова, Николас Паперно из университета Торонто, говорит, что в конце концов, то, что машина сочтет «статистически вероятным» сообщением, для нас будет чем-то практически бессвязным.
Нейросети, обучаясь на контенте, который создали другие нейросети, буквально поглощают друг друга — это своего рода рекурсивный каннибализм, не оставляющий после себя ничего существенного.
Языковая модель, которую тестировал Шумайлов, полностью сломалась. В первый раз программа легко закончила начатое им предложение об английской готической архитектуре. После девяти итераций обучения на данных, сгенерированных в предыдущей итерации, нейросеть продолжила то же самое предложение следующим образом: «архитектура. Помимо того, что здесь обитают одни из крупнейших в мире популяций черных @-@ хвостатых кроликов, белых @-@ хвостатых кроликов, синих @-@ хвостатых кроликов, красных @-@ хвостатых кроликов и желтых @-».
Чтобы машина могла создать действительно функциональную карту языка и его смысловых значений, она должна нанести на нее каждое находящееся в употреблении слово независимо от частоты его использования.
«Вам нужно смоделировать распределение всех возможных слов, которые могут составить предложение», — говорит Паперно.
Если этого сделать так и не удастся, всё сведется к бессмысленному набору слов.
Короче говоря, такие программы выдают бессмысленное среднее значение. Как высказался писатель-фантаст Тед Чан, если ChatGPT — это сжатая версия интернета, то будущее чат-ботов — это цифровой эквивалент многократного фотокопирования фотокопий. В процессе копирования качество финального изображения становится хуже и хуже.
Риск возможного краха модели не означает, что технология бесполезна. Алекс Димакис из Техасского университета в Остине указал на преимущества обучения ИИ на синтетических данных в тех случаях, когда в первозданном виде данные конфиденциальны или защищены авторским правом. Например, использование медицинских показаний реальных пациентов для обучения ИИ просто неэтично, так как это конфиденциальная информация. Это легко можно обойти, используя репрезентативные синтетические записи. Достаточно взять реальные записи, а затем с помощью компьютерной программы создать новый набор данных, содержащий ту же информацию.
Раз генеративному ИИ угрожает деградация, нам следует тщательнее подходить к процессу его обучения. Селекция данных, которые мы «скармливаем» алгоритмам, оказывает огромное влияние на качество модели. Илья Шумайлов подчеркивает, что данные, созданные человеком, не являются золотым стандартом — они с такой же вероятностью могут не соответствовать реальности, как и машинные, потому что многие существующие дискриминационные продукты ИИ были обучены на источниках, созданных людьми.
Исследователи могли бы тренировать свои модели на более репрезентативных данных.
Составили для вас большой ТОП полезных нейросетей на все случаи жизни
Пригодится и профессионалам, и обычным пользователям. Здесь есть нейросети, которые объясняют простым языком научные статьи, переводят видео с разных языков и помогают выбрать фильмы.
2022 год и начало 2023-го можно назвать временем настоящего расцвета искусственного интеллекта — почти ежедневно появляются новости о создании новых нейросетей, которые способны значительно упростить жизнь человека.
Такие вещи, как, например, ChatGPT и Midjourney, уже становятся частью жизни многих людей. Однако существуют и другие достойные внимания программы.
Мы решили изучить возможности многих недавно созданных нейросетей и составить список полезных инструментов, которые могут помочь вам решать определенные задачи и достигать целей в различных сферах жизни.
Ниже список, разделенный по категориям (если ссылки не работают, используйте VPN).
Образование
Consensus — это поисковик, который при помощи искусственного интеллекта мгновенно получает информацию из сотен миллионов научных статей по ключевым словам. Нейросеть при этом дает краткое описание к каждому результату поиска. Работает только на английском языке.
Explainpaper — это программа, которая может быстро, кратко и доступно объяснить любую научную статью. Для начала работы необходимо перейти по ссылке и нажать на «upload a paper», что позволит загрузить текстовые файлы с ваших устройств и упростить их. Лучше всего работает с английскими статьями, но понимает и русский язык.
Paperpal — это нейросеть, которая поможет написать академические листы, курсовые и дипломные работы. Она анализирует написанный вами текст, исправляет ошибки и предлагает перефразировать сложные фразы или формулировки. Инструмент доступен для работы в браузере либо в качестве расширения для Microsoft Word. Работает в том числе и на русском языке (белорусской версии, к сожалению, нет).
GPTZero — это сервис, который способен отследить след искусственного интеллекта в любом написанном тексте для обнаружения подмены. Его можно использовать для проверки эссе и других работ учащихся или студентов. Работает только с англоязычными текстами.
Также существуют шулерские программы, способные мгновенно решать математические и другого рода задачи вместо вас:
- Quizard (версия для Android, версия для iOS) способен решать школьные и университетские тесты с вариантами ответов. Для этого достаточно сфотографировать задание и иметь подключенный интернет.
- GptGO — то же самое, только для интернет-заданий и без необходимости что-либо фотографировать. Работает в виде расширения для браузера Google Chrome и может быть вызван во время онлайн-теста.
- MathGPT специализируется исключительно на математических задачах разного уровня. Для этого необходимо просто их ввести и все сразу же будет готово. Работает на английском языке.
Творчество
Аisoft — это программа, способная улучшать качество ваших фотографий и картинок (в бесплатной версии детализацию можно сделать в 2 или в 4 раза четче оригинала, а в платной — в 6 и в 8 раз).
Upscayl — такая же нейросеть для улучшения качества фотографий и картинок, но при этом она более продвинутая и совершенно бесплатная. Однако она доступна для использования только на компьютерах (поддерживает системы Windows, MacOS и Linux).
CleanUp — это инструмент для быстрого и профессионального удаления любого объекта или человека из фотографий. Единственный минус — бесплатная версия ухудшает качество фото после обработки, но ничто не мешает воспользоваться вышеупомянутыми способами улучшения детализации.
Beautiful.AI — это искусственный интеллект, значительно упрощающий создание различных презентаций. По сути он является личным ассистентом, который угадывает ваши пожелания и создает нужный дизайн, анимацию и переходы для слайдов. Платная версия стоит 12 долларов в месяц.
Vizkom — это нейросеть, которая генерирует множество вариантов окончания вашего изображения. Вам достаточно нарисовать там любой эскиз и нажать «Generate». Весь интерфейс программы на английском языке.
Maroofy — это совершенно бесплатный сервис, который при помощи искусственного интеллекта и на основе вашей любимой музыки может для вас создать идеальный плейлист. Достаточно лишь указать ваш любимый трек, и нейросеть сразу же найдет все максимально похожее по атмосфере, стилистике и звучанию. Библиотека сервиса насчитывает 120 млн различных композиций.
Fadr — еще одна бесплатная нейросеть, которая сможет разделить любой трек на несколько дорожек по вокалу и по музыкальным инструментам. Это позволит полностью разобрать оригинал композиции и пересобрать его во что угодно.
А в качестве бонуса: нейросети Movie Deep Search, GiftasticAI и ChefGPT. Все работают исключительно на английском языке.
- Первая поможет вам быстро придумать подарок для знакомого или близкого человека.
- Вторая способна по текстовому запросу (даже по мельчайшим деталям) подобрать для вас фильмы.
- Третья может предложить рецепты блюд из продуктов, которые в этот момент находятся в вашем холодильнике.
Работа
KickResume — это конструктор резюме для разных случаев жизни, в который внедрен искусственный интеллект. Он поможет быстро создать привлекательное, качественное и профессиональное резюме, только задав вам несколько вопросов. В бесплатной версии можно составить не более 5 резюме.
Sheet+ — это бесплатный сервис, который при помощи ChatGPT и текстовых запросов может делать таблицы для вас в Excel и в Google Sheets. Помимо этого, он исправляет в них ошибки, дает объяснения по своей работе и может понимать русский язык при вводе информации.
OnlineOCR — это разумный конвертер, способный извлекать текст из фотографий и преобразовывать картинки вместе с файлами PDF в формат документов Word или Excel. Он полностью бесплатный, а также поддерживает белорусский язык.
Adobe — это бесплатный инструмент, убирающий все фоновые шумы из голосовых записей, что делает звук более качественным и насыщенным. Как будто бы вы, например, записывали свой голос в студии, а не через наушники.
NeuroDub — это нейросеть, позволяющая напрямую перевести целое видео с одного языка на любой другой из 70 предложенных (белорусского, к сожалению, нет). Процесс длится минуты, а в бесплатной версии можно перевести не более трех видео.
YouTube Summary — это специальное расширение для браузера Google Chrome, которое позволяет получать короткий текстовый контент из любого видео на платформе YouTube. Для работы оно использует ChatGPT, а также понимает множество языков.
Специальные нейросети для айтишников:
- Codesnippets — генерация и анализ программных кодов при помощи текстовых запросов и технологии ChatGPT-3. Есть бесплатный 7-дневный период.
- Adrenaline — проверка собственного программного кода на предмет ошибок и неточностей. Может работать в браузере либо в качестве приложения (инструкция по установке на английском языке).
- Interview Warmup — разработанная компанией Google имитация профессионального интервью с использованием множества технических вопросов. Понимает только английский язык.