Искусственный интеллект уже не кажется чем-то фантастическим. Он применяется в маркетинге, медицине и других областях. Одна из передовых компаний в сфере – OpenAI. Читайте в статье про ее историю становления, самые успешные проекты и перспективы технологии.

Компания OpenAI: почему все о ней говорят

Что такое нейросеть

Как работает нейросеть

Как обучается нейросеть

Где используются нейросети

Главные продукты OpenAI

ChatGPT

DALL·E

Whisper

Почему нейросеть не сможет заменить человека

Как нейросети ошибаются

Компания OpenAI: почему все о ней говорят

Некоммерческая лаборатория OpenAI была основана в Сан-Франциско, в Калифорнии, 11 декабря 2015 года. Во главе стояли крупные инвесторы: Илон Маск, Сэм Альтман (бывший президент бизнес-инкубатора в сфере IT – Y Combinator) и прочие бизнесмены из Кремниевой долины.

Они обещали выделить 1 млрд долларов на разработку систем искусственного интеллекта, который должен «приносить пользу всему человечеству». В новой компании планировался выпуск программ с открытым исходным кодом. Это позволило бы исследователям в дальнейшем разрабатывать системы искусственного интеллекта.

В течение первого года работы OpenAI представила два продукта. Первый – платформа Gym. Она позволяла тренировать искусственный интеллект с помощью игр и алгоритмических задач.

Второй продукт – Universe. Он представлял собой набор инструментов для обучения программ – интеллектуальных агентов.

Через три года основания, в 2018 году, Маск ушел из совета директоров OpenAI, но продолжил консультировать команду и инвестировать в проект. В компании объяснили решение следующим образом: команда посчитала, что в перспективе может возникнуть конфликт интересов с детищем Илона Маска – Tesla. Компания создает электромобили и также разрабатывает и внедряет искусственный интеллект.

В 2019 году OpenAI создала инструмент, способный создавать фейковые новости. В компании сообщили, что он получился настолько хорош, что его решили не выпускать. Но позже в том же году свет увидела версия инструмента – GPT-2, а в 2020 – GPT-3. В том же году компания отказалась от статуса НКО.

С 2019 года OpenAI находится в партнерстве с Microsoft. Корпорация вложила в разработчика искусственного интеллекта 1 млрд долларов. В ответ на это OpenAI приняла решение лицензировать технологию только у Microsoft. Такое партнерство позволило Microsoft стать серьезным конкурентом DeepMind – подразделения Google по искусственному интеллекту.

В 2021 году компания выпустила DALL·E – нейросеть, генерирующую изображения по текстовому описанию. А в ноябре 2022 года – ее обновленную версию.

Чат-бот ChatGPT – свою самую популярную на сегодняшний день разработку – компания тоже представила в ноябре 2022 года. За первые пять дней сервис попробовали более одного миллиона пользователей. Чат-бот основан на улучшенной версии алгоритма GPT-3 – GPT-3.5.

На начало 2023 года в OpenAI работали 375 человек – так вырос стартап с 2015 года, когда в команде было всего девять сотрудников. Сейчас OpenAI – один из самых дорогостоящих стартапов в США, его оценивают в 29 млрд долларов.

Что такое нейросеть

Нейросеть – математическая модель и ее программное воплощение, основанное на строении человеческой нервной системы.

Прообраз машинных нейронных сетей – биологические нейронные сети внутри нашего организма. Нервная система живого существа состоит из нейронов. Это клетки, которые накапливают и передают данные в виде химических и электрических импульсов. Нейрон состоит из ядра, тела и отростков: дендритов и аксонов. С помощью дендритов информация передается с одной клетки на другую. Они функционируют как «провода» для нервных импульсов. У дендритов есть специальные шипы, которыми они цепляются за другие нейроны. Таким образом сигналы передаются по нервной системе.

Например, человек захотел поднять руку: сначала импульс появляется в его мозгу, а далее через нейронную сеть информация передается от клетки к клетке. По пути информация преобразуется и в конце достигает клеток в руке. Человек поднимает руку. Так работают почти все управляемые мозгом процессы в организме.

Но основная особенность нейросетей – обучаемость. И именно она стала основой работы машинных нейронных сетей.

Как работает нейросеть

Структура нейрона в искусственной нейросети воссоздается с помощью кода. «Аксоном» служит ячейка, в которой хранится ограниченный диапазон значений. Информация о как бы «нервных импульсах» содержится в виде чисел и математических формул. Связь между нейронами также реализована программно. Один из нейронов передает другому на вход вычисленную информацию. Тот получает ее, обрабатывает, а после передает дальше итог уже своих вычислений. Так информация распространяется по сети, коэффициенты в нейронах изменяются.

Как обучается нейросеть

Предоставление информации. Во время обучения нейронной сети показывают какую-либо информацию и объясняют, что это такое, т.е. дают ответ. Данные представляются не в виде слов, а числовых коэффициентов и формул. Например, изображению мужчины соответствует «1», а женщины – «0». Считается, что информации должно быть как минимум в 10 раз больше, чем нейронов в сети.

Преобразование. Входные нейроны получают данные, преобразуют их и передают дальше. Информация автоматически обрабатывается с помощью формул и превращается в математические коэффициенты. Примерно как то, что видят наши глаза, преобразуется в нервные импульсы и отправляется в мозг. Мозг обрабатывает информацию, и человек осознает, что происходит вокруг него.

Обработка и выводы. Каждый нейрон имеет «вес» – число внутри него, которое рассчитано по особым алгоритмам. Вес показывает, насколько важны для всей сети показания конкретного нейрона. Соответственно, при обучении веса нейронов изменяются и балансируются автоматически.

В результате происходит ситуация, когда конкретные нейроны реагируют, например, на фигуру человека – и выдают данные, которые преобразуются в ответ: «Это человек». При этом не нужно описывать человека в виде набора математических фигур – при обучении нейросеть сама задает значения весов, определяющих его.

Результат. Вывод нейросети – набор чисел и формул, которые трансформируются в ответ. Например, если изображение мужчины – «1», а женщины – «0», то результат 0,67 будет означать что-то вроде «Скорее всего, это мужчина». Из-за своей структуры нейросеть не может дать однозначный ответ – только вероятность. И из-за нестабильности и закрытости нейронов показания могут быть разными даже для одних и тех же выборок.

Где используются нейросети

Нейросети активно используются в разных областях: маркетинге, финансах, IT, медицине, безопасности и пр.

Экономика и бизнес. Нейросети умеют оценивать риск невозврата кредитов, предсказывать банкротство, оценивать цену недвижимости и обеспечивать безопасность транзакций по пластиковым картам. Нейросети прогнозируют временные ряды (курсы валют, цен на сырье, спрос, объемы продаж), автоматический трейдинг (торговлю на фондовой, валютной, товарной биржах), находят переоцененные и недооцененные компании, считывают и распознают чеки и документы.

Политология и социология. Нейросети используются для анализа мнений, предсказания динамики рейтингов, выявления социальных факторов и определения политических взглядов по внешности. Они также могут применяться для предсказания результатов выборов, анализа опросов, кластеризации электората, изучения и визуализации социальной динамики населения и пр.

Маркетинг. Нейронные сети могут создавать модели покупок, сегментировать клиентов, определять, кому и какое рекламное объявление стоит показать. Они могут писать тексты для объявлений и карточек товаров, генерировать креативы и многое другое. Например, нейросеть Midjourney генерирует фотореалистичные изображения по текстовому описанию, которые легко спутать с артами от дизайнеров.

IT. Нейросети ускоряют и упрощают разработку и тестирование приложений, настраивают алгоритмы поисковых систем, создают чат-боты.

Безопасность и охранные системы. Нейронные сети способны распознать голос, лицо, отпечатки пальцев, найти подделки.Также они умеют распознавать автомобильные номера, отслеживать пакеты информации и информационные потоки в компьютерной сети для обнаружения вторжений, анализировать данные с видеокамер и разных сенсоров, аэрокосмические снимки (находить очаги лесных пожаров, незаконные вырубки леса и т. д.). Например, российская нейросеть NTechLab, работающая с городской сетью камер в Москве, умеет распознавать лица и силуэты людей, автомобили и номерные знаки.

Медицина. В этой сфере нейросети анализируют рентгеновские снимки и медкарты, подсказывают диагнозы, прогнозируют результаты использования разных методов лечения, разрабатывают формулы лекарств и контролируют работу медперсонала.

Сельское хозяйство. Нейросети могут сортировать овощи для продажи, предсказывать урожайность, оценивать рост растений и предлагать питательные вещества для его ускорения.

Главные продукты OpenAI

Рассказываем по схеме: что это, как работает, как обучали, где сегодня применяется и где может применяться в будущем.

ChatGPT

ChatGPT – это чат-бот, который основан на нейросетевой модели GPT-3.5. Основное отличие ChatGPT от других нейросетей – способность выполнять задания из различных областей. Он может:

  • создавать тексты в разных стилях по запросам и наводящим словам;
  • переводить контент;
  • генерировать резюме и проходить собеседования;
  • сочинять музыку и стихи;
  • писать сложные формулы для Excel;
  • работать с кодом – писать его, переводить с одного языка на другой и находить ошибки;
  • отвечать на сложные вопросы лучше, чем Google;
  • писать сценарии;
  • генерировать игры по мотивам фильма;
  • планировать и выполнять расчеты. Например, нейросеть может создать готовый план по ПП для похудения за несколько секунд;
  • «управлять» другими нейросетями.

В основном программа обучалась на англоязычных текстах из интернета, но при этом она может говорить и на других языках, включая русский.

Как обучалась и работает нейросеть

Основное отличие и преимущество инновационных языковых моделей – новый метод обучения, который называется «Обучение с подкреплением на основе отзывов людей» (RLHF). В обучении нейронной сети участвует множество настоящих людей. На начальном этапе они показывают нейросети, как вести диалог. Десятки специалистов сформировали вручную набор вопросов и ответов на них для тонкой настройки GPT-3.5. Затем люди оценивали диалоги, генерируемые нейросетью, и ранжировали их по качеству ответов.

Так в GPT-3.5 сформировалось понимание, какие ответы считаются у людей правильными и подробными, а какие – нет. Благодаря RLHF нейросеть может имитировать поведение экспертов, которые участвовали в процессе обучения. Затем алгоритмы GPT-3.5 стали обучать сами себя, отталкиваясь от ранее сформированной модели человеческого общения.

14 марта 2023 года OpenAI выпустила языковую модель GPT-4, доступную тестировщикам и платным подписчикам ChatGPT Plus. Теперь искусственный интеллект может обрабатывать не только тексты, но и изображения.

ChatGPT работает следующим образом.

  1. Ввод данных: как мы сказали выше, модель обучалась и продолжает обучаться на огромном количестве текстов из интернета (книгах, статьях и веб-сайтах). Так она изучает взаимосвязи и закономерности между словами, предложениями и фразами. Когда пользователь передает нейросети текст (например, команду или вопрос), модель использует его как отправную точку для генерации ответа.
  2. Генерация текста: затем нейросеть применяет свои знания языковых шаблонов для создания ответа по запросу.
  3. Вывод текста: текст возвращается пользователю в качестве выходных данных.

Где применяется нейросеть

Программисты, ученые и энтузиасты активно тестируют возможности ChatGPT с первых дней появления в открытом доступе. Чат-бот уже используется и будет применяться в дальнейшем в разных сферах: от e-commerce до медицины.

Широко известны работы, где бот отвечал на вопросы для оценки квалификации людей разных профессий. Вот несколько знаковых примеров:

  • ChatGPT смог сдать экзамен на адвоката, ответив верно на 88% вопросов. Человек, получивший такой результат, мог бы заниматься юридической практикой;
  • бот прошел бизнес-тесты, которые нужны для получения степени MBA;
  • ChatGPT без дополнительной подготовки сдал экзамен, по которому врачей допускают к работе в США. Особое удивило специалистов то, что ChatGPT смогу обойти «собрата» PubMedGPT, специально обученного на медицинских текстах.

Есть и менее значимые, но многочисленные сообщения, что ChatGPT успешно генерирует дипломные работы и студенческие эссе, проходит собеседования, играет в шахматы, сочиняет песни, редактирует код, а также создает запросы для других сетей, генерирующих изображения. Не так давно пользователи смогли применить аналогичную схему запросов и заставили ChatGPT побыть другой нейросетью DAN (Do Anything Now), которая может генерировать «токсичный» контент.

DALL·E

DALL·E – алгоритм, который построен на архитектуре GPT-3 и обучен генерировать изображения по текстовому описанию. Своим названием нейросеть обязана художнику Сальвадору Дали и роботу WALL·E от Pixar.

Первая версия увидела свет в 2021 году. Тогда нейросеть могла обрабатывать запрос пользователя только на английском языке. А в апреле 2022 года компания OpenAI представила DALL·E 2: качество картинок повысилось до разрешения 1024х1024 пикселей, уменьшилось количество смазанных элементов и искажений. Также нейросеть научилась изменять уже готовые изображения: редактировать тени, структуру, композицию.

Сейчас нейросеть умеет:

  • создавать реалистичные фото, иллюстрации в конкретных стилях и цветовых решениях;
  • генерировать новые несуществующие комбинации объектов;
  • проходить IQ-тесты;
  • писать на изображении текст;
  • создавать изображение по заданной части;
  • обрабатывать запросы на более чем 107 языках мира, в том числе на русском.

Также DALL-E 2 помогает редактировать изображения. Можно поместить в рамку часть изображения, которую нужно изменить, и указать необходимое изменение.

Как обучалась и работает нейросеть

Исследователи OpenAI разработали DALL-E 2 из огромной коллекции изображений, к которым есть подписи. Создатели нейросети отфильтровали откровенный контент, который включает изображения насильственного и сексуального характера, ряда символов ненависти.

Работа с DALL-E 2 очень напоминает поиск изображения в Google: пользователь вводит короткую фразу в поле, и в ответ возвращаются шесть совершенно новых изображений. Каждое из них отражает введенную фразу.

Где применяется нейросеть

По мнению разработчиков, нейросеть может использоваться как в коммерческих, так и в некоммерческих целях.

Например, она может применяться следующих сферах:

  • в обучении. Например, при разработке иллюстрации для пояснения концепций;
  • маркетинге. Например, для подготовки креативов для таргетированной рекламы;
  • архитектуре/недвижимости/дизайне. Как часть большого рабочего процесса при разработке дизайнерских идей;
  • исследованиях. Для иллюстрирования и объяснения научных концепций.

Например, художник-активист Даниэлла Баскин применяла DALL-E 2 для представления альтернативной транспортной системы:

Проекты OpenAI: как они работают, чем помогают и как применяются в маркетинге

И крана, из которого течет рамен вместо воды:

Проекты OpenAI: как они работают, чем помогают и как применяются в маркетинге

Whisper

Whisper – система автоматического распознавания речи. Она может транскрибировать речь на разных языках, а также переводить речь с этих языков на английский. Нейросеть поддерживает работу с файлами в разных форматах, включая MP3, M4A, MPEG, MP4, WAV, MPGA и WEBM.

Как обучалась и работает нейросеть

Система обучена на 680 000 часах речевых данных из интернета и может распознавать 99 языков, включая русский. Такая тренировка научила систему распознавать не только чистую речь, но и понимать с высокой долей точности технические термины, уникальные акценты, разговоры при фоновом шуме. Примерно одна треть аудиоданных была не на английском языке. Так модель должна была научиться расшифровывать речь на языке оригинала и переводить на английский.

У Whisper нет веб-версии, как у ChatGPT. Необходимо устанавливать инструмент вручную, читать гайды, которые написаны разработчиками для разработчиков, уметь писать простой код и так далее.

Whisper основана на архитектуре нейросети Transformer. В нее входят декодировщик и кодировщик. До начала обработки звуковой файл делится на отрезки по 30 секунд. Затем они преобразуются в log-Mel-спектрограмму для кодировщика. После этого данные принимает декодировщик. Именно он предсказывает текст на основе речи.

В программе применяются специальные токены, которые позволяют в рамках одной модели определять язык, учитывать порядок звучания фраз и пр.

Где применяется нейросеть

Whisper полезна редакторам, спикерам и всем тем, кому нужно расшифровывать аудио. Возможны совершенно разные способы применения:

  • сделать фоллоу-ап и не упустить детали после рабочего созвона в Zoom или Google Meet;
  • получить текстовый драфт после интервью;
  • оформить в виде статьи доклад после выступления на конференции;
  • получить готовую текстовую версию лекции или презентации проекта;
  • сделать субтитры и пр.

Whisper используют участники проекта Speak – приложения на основе ИИ для изучения иностранных языков. 

Почему нейросеть не сможет заменить человека

После широкого распространения нейросетей многие стали волноваться, что искусственный интеллект очень скоро заменит людей во многих профессиях. На фоне таких волнений популярный зарубежный ресурс Business Insider провел исследование. Результаты успокаивают. Пока что для стабильной работы нейронных сетей необходимо большое количество людей.

Есть и другие причины.

У ботов нет универсальных ответов. Основное отличие человека от машины – способность к созиданию, творчеству и проведению экспериментов, а нейросеть – это алгоритм, который воспроизводит уже увиденное.

Создание и развитие нейросетей – сложный процесс. Работа над нейросетью – дорогостоящая и трудная. Даже ChatGPT не был обучен до конца: нейросеть обладает знаниями, которые актуальны на конец 2021 года. События, которые произошли после открытия, боту неизвестны. Чтобы нейросеть работала эффективно, нужно потратить очень много времени и сил на ее обучение.

Вот несколько примеров, когда недостаточно обученные и протестированные малоизвестные нейросети ошибались. Кроме того, были максимально близки к нарушению авторских прав:

  • нейросеть для классификации фотографий случайно определила кошку как гель для душа. На фотографии было изображено несколько бутылок с гелем для душа, а кошка случайно попала в кадр. В итоге нейросеть решила, что вместо кошки там тоже гель;
  • нейросеть для генерации музыки случайно создала мелодию, которая звучала очень похоже на песню Never Gonna Give You Up Рика Эстли. Это произошло из-за того, что нейросеть была обучена на базе данных с миллионами музыкальных треков, включая песни Эстли;
  • нейросеть для определения токсичности текста дала высокую оценку фактически положительному контенту. Это произошло из-за того, что нейросеть была обучена на наборе данных, в котором некоторые тексты, не являющиеся токсичными, были помечены как таковые.

Нейросети чувствительны к датасету. Для обучения бота необходимо постоянно обновлять датасет данных, отдающихся ему для анализа и дальнейшего использования. Получить датасет сложно, например не каждый текст из сети можно сразу отдать машине. Сначала информация вычитывается, проверяется на этичность и корректность, подвергается фактчекингу.

Нейросети не всемогущи. Каждая нейронная сеть создавалась под конкретную задачу: генерацию изображений, работу с текстом и пр. Готовая нейронная сеть работает только в рамках конкретной задачи и не может адаптироваться самостоятельно к новым условиям: для этого также нужно участие человека.

Конечно, нейросети помогут автоматизировать часть работы представителей ряда профессий. Например, маркетологов, аналитиков, бухгалтеров, дизайнеров. Об этом также говорится в другом исследовании Business Insider. Но это не означает, что нейросеть сможет полностью заменить интеллект человека. Скорее, стать помощником. 

Как нейросети ошибаются

Вот лишь несколько примеров, которые доказывают, что в ближайшее время искусственный интеллект вряд ли захватит мир и что нейросети далеки от совершенства.

  • В 2016 году корпорация Microsoft запустила в Twitter свой «искусственный интеллект» – бота по имени Тэй. Он мог общаться со всеми желающими. Но меньше, чем за сутки люди научили его многим плохим вещам. Все начиналось мило, но вскоре среди ответов бота стали появляться сообщения, в которых он поддерживает Адольфа Гитлера и оскорбляет феминисток. По словам представителей Microsoft, Тэй научился говорить подобные вещи после анализа анонимизированных сообщений из социальных сетей.

Кстати, ChatGPT не отвечает на вопросы о смысле жизни, не обсуждает незаконную деятельность, не высказывает личное мнение, не имеет религиозной, расовой или политической принадлежности.

  • В 2017 году исследователи из NVIDIA создали нейросеть, которая была обучена рисовать портреты несуществующих людей, которые выглядят как настоящие. Во время тестирования нейросеть сгенерировала портреты, на которых были персонажи из сказок и фильмов, такие как Хью Лори из сериала «Доктор Хаус» и Элли из видеоигры The Last of Us. Однако наиболее забавным было изображение, напоминающее Авраама Линкольна, но с глазами и ртом на месте носа.
  • В 2018 году компания Google создала нейросеть для создания названий блюд. Когда исследователи попросили нейросеть придумать название для торта, она предложила вариант «Это Вечно». Нейросеть была обучена на основе базы данных, содержащей фразы, связанные с вечностью и бессмертием. Название «Это Вечно» стало популярным в интернете и вызвало множество комментариев и шуток.
  • В 2019 году исследователи из MIT создали нейросеть, которая была обучена генерировать изображения котиков. Систему попросили создать изображение кота в саду, но вместо этого она сгенерировала изображение животного, который выглядел так, будто находится в заточении в темном подвале.
  • В 2020 году исследователи из OpenAI создали нейросеть, которая была обучена генерировать тексты на любую тему. Однажды ее попросили придумать описание кресла. Нейросеть написала, что кресло предназначено для того, чтобы «помочь людям уйти от беспокойства и боли, которые они испытывают каждый день, и просто забыть о своих проблемах, лежа на кресле и смотря на звезды, которые светятся наверху». Исследователи были поражены тем, какое красивое и утешительное описание сгенерировала нейросеть.
  • В 2021 году исследователи из IBM создали нейросеть, которая была обучена анализировать звуки, чтобы определить, являются ли они шумом или речью. Однако, когда они попросили нейросеть анализировать звуки речи, которые были смешными и чужими, она не смогла правильно классифицировать их и начала создавать странные и нелепые переводы. Например, когда был проигран звук, похожий на звук плетения волос, нейросеть определила его как «шум молнии в небе».

Применение нейросетей OpenAI помогает оптимизировать ряд задач, улучшить взаимодействие с пользователями и повысить эффективность рекламных кампаний. Например, с помощью ChatGPT можно сгенерировать тексты для рекламных объявлений, а с помощью DALL·E – креативы. А автоматизировать другие рутинные задачи можно через сервис click.ru. Например, провести медиапланирование, спарсить мета-теги и заголовки и т. д. А если присоединиться к партнерской программе click.ru, можно возвращать до 15% расходов на рекламу.

Эта статья и другие полезные ресурсы click.ru — после бесплатной регистрации

Вы получите доступ к функционалу экосистемы:

  • Все рекламные площадки в одном окне
  • Мастер маркировки любой рекламы
  • Профессиональные инструменты для решения рутинных задач (дашборды, защита от скликивания и многое другое)
  • Возврат до 18% на контекстную и таргетированную рекламу
  • Бесплатный доступ в платные маркетинговые сервисы
Эта статья и другие полезные ресурсы click.ru – после бесплатной регистрации