В последние полгода такие чатботы, как ChatGPT, и генераторы изображений вроде Midjourney быстро стали культурным феноменом. Но модели искусственного интеллекта (ИИ) или “машинного обучения” существуют уже достаточно давно.
В этом руководстве для начинающих мы выйдем за пределы чата и рассмотрим различные типы искусственного интеллекта – и увидим, какую роль он уже играет в нашей жизни.
Как учится ИИ?
Ключом ко всему машинному обучению является процесс, который называется тренировкой, во время которой компьютерная программа получает большое количество данных (иногда с объяснениями, что это за данные), и набор инструкций.
Инструкция может быть, например, такой: “найти все изображения, содержащие лицо” или “распределить эти звуки по категориям”.
Затем программа будет искать закономерности в предоставленных ей данных для достижения поставленных целей.
Возможно, на этом пути ей понадобятся некоторые подсказки – вроде “это не лицо” или “эти два звука разные” – но то, что программа изучает с помощью этих данных и предоставленных подсказок, становится моделью ИИ, и этот тренировочный материал в итоге определяет ее способности.
Чтобы понять, как этот тренировочный процесс может создать разные типы ИИ, представим разных животных.
В течение миллионов лет природная среда обитания заставила животных развивать определенные способности – так же миллионы раз, которые ИИ пересматривают предоставленный ему тренировочный материал, формируют способ его развития и создают специализированные модели искусственного интеллекта.
Итак, каковы примеры того, как мы научили ИИ развивать разные навыки?
Что такое чатботы?
Представьте, что чатбот – это попугай. Он может повторять услышанные слова, определенным образом понимая их контекст, но не понимая полного значения.
Чатботы делают то же – хотя и на более сложном уровне – и находятся на пороге смены наших отношений с письмом.
Но откуда эти чаты знают, как писать?
Они являются разновидностью искусственного интеллекта, известного как большие языковые модели (ВММ), и тренируются по огромным объемам текста.
ВММ способны учитывать не только отдельные слова, но и целые предложения и сравнивать использование слов и фраз в отрывке с другими примерами во всем массиве тренировочных данных.
С помощью этих миллиардов сравнений слов и фраз ВММ может прочитать вопросы и сгенерировать ответ – как предиктивный ввод текста у вас на телефоне, но в значительно большем масштабе.
Удивительная вещь великих языковых моделей состоит в том, что они могут изучать правила грамматики и понимать значение слов самостоятельно без помощи человека.
“Я думаю, что через десять лет у нас будут чатботы, которые будут работать как эксперты в любой отрасли. Поэтому вы сможете спросить врача-эксперта, преподавателя-эксперта, юриста-эксперта обо всем, что вам нужно, и заставить эти системы делать необходимые вам вещи”, – говорит Сэм Альтман – генеральный директор компании OpenAI, разработчика ChatGPT.
Можно ли поговорить с искусственным интеллектом?
Если вы пользовались Alexa, Siri или любой другой системой распознавания голоса – то вы пользовались ИИ.
Представьте кролика с большими ушами, приспособленными улавливать малейшие колебания звука.
ИИ записывает звуки, когда вы говорите, удаляет фоновый шум, разделяет ваш язык на фонетические единицы – отдельные звуки, составляющие произнесенное слово – и затем сопоставляет их с библиотекой звуков языка.
Затем ваша речь превращается в текст, в котором любые потенциальные ошибки восприятия на слух можно исправить до того, как ИИ ответит.
Этот тип искусственного интеллекта называется обработка природного языка.
Эту технологию используют во многих ситуациях – от того, как вы говорите “да”, чтобы подтвердить транзакцию в мобильном банкинге, до того, как интересуетесь у своего смартфона о погоде на следующие несколько дней в городе, куда собрались уехать.
Понимает ли ИИ изображение?
Замечали, как ваш телефон создает альбомы фотографий с названиями типа “На пляже” или “Вечерки”?
Значит, вы пользовались ИИ, не осознавая этого. Алгоритм ИИ обнаружил закономерности в ваших фото и сгруппировал их для вас.
Такие программы тренировались путем просмотра кучи изображений, сопровождавших простое описание.
Если вы предоставите такому типу ИИ достаточно изображений со значком “велосипед”, он начнет распознавать, как выглядит велосипед и чем он отличается от лодки или автомобиля.
Иногда искусственный интеллект тренируют выявлять крохотные отличия в подобных изображениях.
Так работает технология распознавания лица, обнаруживающая малейшие мелочи черт вашего лица, делающие его уникальным по сравнению с любым другим лицом на планете.
Такие же алгоритмы учились выявлять опасные для жизни опухоли на рентгеновских снимках или томографиях – они могут обработать тысячи снимков за то время, за которое человек просмотрит только один.
Как ИИ создает новые изображения?
Недавно распознавание изображений адаптировали к моделям ИИ, которые научились, почти как хамелеоны, манипулировать узорами и цветами.
Такие генераторы изображений могут с помощью сложных визуальных шаблонов, которые они собирают из миллионов фотографий и рисунков, создавать совершенно новые изображения.
Вы можете попросить искусственный интеллект создать фотографическое изображение чего-то, чего на самом деле никогда не было – например, фотографию человека, идущего по поверхности Марса.
Или вы можете проявить творчество и указать стиль будущего изображения: “Сделай портрет тренера сборной Англии по футболу, нарисованный в стиле Пикассо”.
Новейшие ИИ начинают процесс генерации этого нового изображения из набора пикселей произвольного цвета.
Они ищут в этих случайных точках любой намек на узор, который они изучили во время тренировки – шаблоны для создания разных объектов.
Эти шаблоны постепенно совершенствуются путем добавления дальнейших слоев случайных точек, пока наконец не возникнет сходство.
Соберите вместе все необходимые шаблоны, например “поверхность Марса”, “астронавт” и “хождение” – и вы получите новое изображение.
Поскольку новое изображение состоит из слоев случайных пикселей, в результате мы получаем кое-что новое, чего никогда раньше не существовало – но одновременно оно базируется на миллиардах шаблонов, которым ИИ научился из массива тренировочных изображений.
Теперь общество встает перед вызовом – как согласовать такие новообразования с авторским правом и этикой, учитывая, что ИИ учится на результатах упорного труда настоящих художников, дизайнеров и фотографов.
А как насчет беспилотных автомобилей?
Беспилотные автомобили в течение десятилетий были в центре разговоров вокруг искусственного интеллекта, а научная фантастика крепко закрепила их в нашем воображении.
Этот тип ИИ называют автономным управлением, а беспилотные авто оснащены камерами, радаром и лазерами для измерения расстояния.
Иллюстрация стрекозы с выделенными глазами и крыльями.
Представьте стрекозу, которая имеет зрение на 360 градусов и датчики на крыльях, которые помогают ей маневрировать и корректировать движения во время полета.
Подобным образом модель искусственного интеллекта использует данные со своих датчиков, чтобы идентифицировать объекты и выяснить, двигаются ли они, и если да, то какой это движущийся объект – другая машина, велосипед, пешеход или что-то другое.
Тысячи часов тренировки, направленной на то, чтобы понять, как выглядит правильное вождение, позволили ИИ управлять автомобилем и избегать столкновений в реальном мире.
Алгоритмы прогнозирования много лет пытались справиться с часто непредсказуемым поведением реальных водителей, однако теперь беспилотные автомобили уже собрали миллионы километров данных на реальных дорогах. В Сан-Франциско такие автомобили уже возят пассажиров за деньги.
Автономное управление также является ярким примером того, как новым технологиям приходится преодолевать не только технические препятствия.
Различное законодательство и правила безопасности, а также глубоко укоренившееся чувство тревоги по поводу того, что произойдет, когда мы передаем управление машинам, до сих пор являются потенциальными препятствиями для полностью автоматизированного будущего на наших дорогах.
Мнение эксперта: “Безопаснее людей”
“Думаю, все соглашаются, что мы хотим более безопасных дорог. И сейчас очень интересно говорить об этом, когда люди и работы относительно схожи в своем управлении. Но в течение следующих нескольких лет, учитывая скорость усовершенствования этих систем, я думаю, что эти разговоры будут уже в прошлом. Потому что они будут намного лучше людей, и мы вообще уже не будем”, – говорит Кайл Фогт – генеральный директор компании Cruise, создающей автономные авто.
Что ИИ знает обо мне?
Некоторые ИИ просто имеют дело с числами, собирая и совмещая их, чтобы создать рой информации, что может иметь очень ценные результаты.
Вероятно, в мировой паутине уже есть несколько профилей по вашей финансовой и социальной активности, которые можно использовать для прогнозирования вашего поведения.
Ваша карта лояльности в супермаркете отслеживает ваши привычки и вкусы из-за ваших еженедельных закупок. Кредитные агентства отслеживают, сколько денег у банка и долгов по кредитным картам.
Netflix и Amazon отслеживают, сколько часов видео вы просмотрели прошлым вечером. Ваши аккаунты в социальных сетях знают, сколько видео вы прокомментировали сегодня.
И речь идет не только о вас – эти цифры существуют по всем, что позволяет моделям искусственного интеллекта работать с ними, ища социальные тенденции.
Эти модели искусственного интеллекта уже формируют вашу жизнь: от решения того, можете ли вы получить ссуду или ипотеку, до влияния на то, что вы покупаете, путем подбора рекламы для вас в интернете.
Сможет ли ИИ делать все?
Возможно ли объединить эти навыки в единую гибридную модель ИИ? Именно это делает одно из последних достижений в области искусственного интеллекта.
Оно называется мультимодальным ИИ и позволяет модели просматривать различные типы данных, такие как изображения, текст, аудио или видео и обнаруживать новые связи между ними.
Этот мультимодальный подход стал одной из причин огромного скачка в возможностях ChatGPT после обновления с версии ChatGPT3.5, которая тренировалась только на текстах, к версии ChatGPT4, которая училась также и на изображениях.
Идея единой модели искусственного интеллекта, способной обрабатывать любые данные и, следовательно, выполнять любые задачи, от перевода между языками до разработки нового лекарства, известна как искусственный общий интеллект (СИИ).
Для одних это – конечная цель всех исследований искусственного интеллекта; для других – путь к тем научно-фантастическим антиутопиям, в которых мы высвобождаем интеллект настолько далеко за пределы нашего понимания, что больше не в состоянии его контролировать.
Как тренируется ИИ?
До недавнего времени ключевой процесс тренировки большинства ИИ был известен как “контролируемое обучение” или обучение с учителем.
Люди давали ярлыки с объяснением огромным наборам учебных данных, а ИИ должен был найти закономерности в этих данных.
Затем искусственный интеллект просили применить найденные закономерности к новым данным и дать комментарий по их точности.
Представьте, что вы даете ИИ 12 фотографий – шесть с ярлыком “автомобиль”, а шесть – “фургон”.
Затем просите искусственный интеллект разработать визуальный шаблон, сортирующий автомобили и фургоны на две группы.
Как вы думаете, что произойдет, когда вы попросите его классифицировать это фото?
Учитывая ограниченное количество изображений, на которых он тренировался, ИИ решил, что главным способом различения автомобилей и фургонов есть цвет.
Но самое удивительное в программе искусственного интеллекта то, что она пришла к этому выводу сама – и мы можем помочь ей этот вывод скорректировать.
Мы можем сказать ей, что она неправильно определила два новых объекта – и это заставит найти новые закономерности на изображениях.
Но самое важное то, что мы можем исправить недостаток в наших тренировочных данных – предоставить ИИ более разнообразные изображения.
Эти два простых действия вместе – и в огромных масштабах – научили большинство систем ИИ принимать чрезвычайно сложные решения.
Как ИИ учится сам?
Контролируемое обучение – невероятно мощный метод, однако многие из последних прорывов в ИИ стали возможны благодаря спонтанному обучению, или обучению без учителя.
Проще говоря, благодаря использованию сложных алгоритмов и огромных наборов данных, искусственный интеллект может учиться без всякой помощи человека.
Самый известный пример – ChatGPT.
Объемы текста в интернете и оцифрованных книгах настолько огромны, что за многие месяцы ChatGPT смог научиться самостоятельно совмещать слова осмысленным способом, а люди потом помогали точнее настроить его ответы.
Представьте, что у вас есть большая куча книг на иностранном языке, возможно, некоторые из них – с иллюстрациями.
В конце концов вы увидите, что всякий раз, когда вы видите в книге изображение дерева, на странице рядом с ним появляется одно и то же слово, а когда фото дома – то другое.
Постепенно вы обнаружите и другие закономерности.
ChatGPT провел такой тщательный анализ связей между словами, чтобы создать огромную статистическую модель, которую можно использовать для прогнозирования и создания новых предложений.
Она полагается на огромную вычислительную мощность, которая позволяет ИИ запоминать огромное количество слов – в одиночку, группами, предложениями – а затем читать и сравнивать, как они употребляются, и делать это снова и снова только за долю секунды.
Быстрый прогресс, достигнутый моделью глубинного обучения за последний год, вызвал новую волну энтузиазма и беспокойства по поводу потенциала искусственного интеллекта – и пока нет никаких признаков его замедления.
Обещания и оговорки научной фантастики, кажется, внезапно подкрались к нам уже в реальной жизни – и мы обнаружили, что живем в мире, где искусственный интеллект начинает проявлять свои удивительные бесчеловечные способности.
“Ответ на вопрос, как мы можем подготовить машины к этому миру со сложной этикой, кроется в том, как мы воспитываем собственных детей и готовим их к встрече с нашим сложным миром. Когда мы воспитываем детей, мы не знаем, с какими именно ситуациями они столкнутся. Мы не даем им ответа на все возможные вопросы”, – подытожил Мо Гавдат – автор и бывший главный бизнес-директор Google X.
Спасибо!
Теперь редакторы в курсе.