Если вы надеетесь, что мир преодолеет лихорадку искусственного интеллекта в 2024 году, то вы глубоко ошибаетесь. Повсеместные достижения в области аппаратного и программного обеспечения открывают шлюзы для динамического развития приложений генеративного искусственного интеллекта, что позволяет предположить, что 2023 год был годом, когда мы лишь только начали прикасаться к этой теме. В этом году — году Дракона по китайскому календарю — мы увидим широкую и стратегическую интеграцию искусственного интеллекта во всех секторах.
Когда риски оценены, а стратегии начинают формироваться, компании готовы использовать искусственный интеллект не только как новую технологию, но и как основной компонент своих операционных и стратегических структур. Короче говоря, генеральные директора и бизнес-лидеры, осознав потенциал и необходимость искусственного интеллекта, теперь активно стремятся внедрить эту технологию в свои процессы. В результате мы оказались в ситуации, в которой внедрение искусственного интеллекта становится не просто одним из вариантов, а важным фактором инноваций, эффективности и конкурентоспособности. Этот преобразующий сдвиг означает переход от предварительных исследований к уверенному и осознанному его применению.
Объем и разнообразие
Ключевым аспектом является растущее понимание того, как технологии искусственного интеллекта позволяют увеличивать объем и разнообразие приложений, идей и контента. Ошеломляющее количество контента, созданного искусственным интеллектом, будет иметь последствия, которые мы только начинаем обнаруживать. Из-за огромного объема этого контента (с 2022 года пользователи искусственного интеллекта в совокупности создали более 15 млрд. изображений, на создание которых людям раньше требовалось 150 лет) историкам придется рассматривать интернет после 2023 года, как нечто совершенно иное, чем то, что было раньше. Однако независимо от того, что технологии искусственного интеллекта делают с интернетом, для предприятий эта тенденция повышает стандарты во всех областях и сигнализирует о критическом этапе, когда отказ от использования данной технологии может быть не просто упущенной возможностью, а конкурентным недостатком.
Нечеткая граница
В 2023 году мы узнали, что искусственный интеллект поднимает планку не только во всех отраслях, но и в возможностях сотрудников. В опросе YouGov, проведенном в прошлом году, 90% работников заявили, что искусственный интеллект повышает их производительность. Каждый четвертый респондент использует искусственный интеллект ежедневно (73% работников используют искусственный интеллект хотя бы раз в неделю). Еще одно исследование показало, что при правильном обучении сотрудники выполняли 12% задач на 25% быстрее с помощью искусственного интеллекта, а общее качество работы выросло на 40%. При этом наибольший прирост получили сотрудники с более низким уровнем квалификации. Однако для задач, выходящих за рамки возможностей искусственного интеллекта, сотрудники на 19% реже давали правильные решения. Эта двойственность привела к тому, что эксперты называют «jagged frontier» возможностей искусственного интеллекта. Работает это следующим образом: на одном конце спектра мы являемся свидетелями замечательного мастерства искусственного интеллекта: задачи, которые когда-то казались непреодолимыми для машин, теперь выполняются с высокой точностью и эффективностью. Однако, с другой стороны, есть задачи, в которых искусственный интеллект дает сбои, пытаясь соответствовать человеческой интуиции и адаптивности. Такие области, отмеченные нюансами, контекстом и сложным процессом принятия решений, — области, где двоичная логика машин соответствует своему значению.
Дешевый искусственный интеллект
В этом году, когда предприятия начнут преодолевать эту нечеткую границу и осваивать ее, мы увидим, как проекты на базе искусственного интеллекта начнут становиться нормой. В основе этого внедрения лежит снижение стоимости обучения базовых больших языковых моделей (LLM) благодаря достижениям в области разработки новых процессоров. В сочетании с возросшим спросом и в условиях глобального дефицита рынок чипов для искусственного интеллекта надеется стать более доступным в 2024 году, так как альтернативы лидерам отрасли, таким как NVIDIA, появляются практически каждый день. Аналогичным образом новые методы точной настройки, которые могут вырастить сильные LLM из слабых без необходимости использования дополнительных данных, аннотированных человеком, такие как Self-Play Fine-tuNing (SPIN), используют синтетические данные, чтобы работать с меньшим вмешательством человека.
Ввод в действие «modelverse»
Такое снижение затрат открывает доступ к технологиям искусственного интеллекта для более широкого круга компаний, позволяя им заниматься разработкой и внедрением собственных моделей на базе существующих LLM. Последствия этого могут оказаться весьма интересными и разнообразными, но ясная траектория развития событий такова, что в ближайшие несколько лет произойдет всплеск на рынке инновационных приложений на основе LLM. Аналогичным образом в 2024 году мы начнем наблюдать переход от преимущественно облачных моделей к локально выполняемым задачам в области искусственного интеллекта. Эта эволюция частично обусловлена достижениями в области аппаратного обеспечения.
С точки зрения бизнеса, малые языковые модели (SLM) станут более популярными среди крупных и средних предприятий, поскольку они удовлетворяют более конкретным нишевым потребностям. Как следует из названия, SLM легче LLM, что делает эту модель идеальной для создания приложений в реальном времени и их интеграции с различными платформами. Таким образом, в то время как LLM обучаются на огромных объемах разнообразных данных, SLM обучаются на большом количестве данных, специфичных для предметной области и часто получаемых внутри предприятия, что делает их адаптированными к конкретным отраслям или сценариям использования, гарантируя при этом актуальность и конфиденциальность.
Переход к моделям большого видения (LVM)
По мере перехода к 2024 году внимание также сместится от LLM к моделям большого видения (LVM), особенно предметно-ориентированным, которые призваны совершить революцию в обработке визуальных данных. В то время как LLM, обученные на работе с текстом в интернете, хорошо адаптируются к проприетарным документам, LVM сталкиваются с уникальной проблемой: изображения в интернете преимущественно содержат мемы, кошек и селфи, которые значительно отличаются от специализированных изображений, используемых в таких секторах, как производство или наука. Таким образом, общий LVM, обученный на изображениях в интернете, может неэффективно идентифицировать важные функции в специализированных областях.
Однако LVM, адаптированные к конкретным областям, таким как производство полупроводников или медицинские патологии, показывают заметно лучшие результаты. Исследования доказывают, что адаптация LVM к конкретному домену с использованием около 100 тысяч неразмеченных изображений может значительно снизить потребность в размеченных данных, повышая уровень производительности. Эти модели, в отличие от обычных LVM, адаптированы к конкретным бизнес-областям и превосходно справляются с задачами компьютерного зрения, такими как обнаружение дефектов или определение местоположения объектов.
В некоторых странах мы также увидим, как предприятия внедряют большие графические модели (LGM). Эти модели превосходно справляются с табличными данными, обычно содержащимися в электронных таблицах или базах данных. Они выделяются своей способностью анализировать данные временных рядов, предлагая свежий взгляд на понимание последовательных данных, часто встречающихся в бизнес-контексте. Эта возможность имеет решающее значение, поскольку подавляющее большинство корпоративных данных попадает в эти категории. А это проблема, которую существующие модели искусственного интеллекта, включая LLM, еще не решили должным образом.
Этические дилеммы
Конечно, эти разработки должны быть подкреплены строгими этическими правилами. По общему мнению, политика в отношении предыдущих технологий общего назначения (технологии, которые имеют широкое применение, глубоко влияют на различные области человеческой деятельности и фундаментально меняют экономику и общество) была совершенно ошибочна. Принося огромные преимущества, такие инструменты, как смартфоны и социальные сети, также имели негативные внешние последствия, которые пронизывали все аспекты нашей жизни, независимо от того, взаимодействуем ли мы с ними напрямую или нет.
В эпоху искусственного интеллекта вопросы регулирования должны иметь первостепенное значение, чтобы гарантировать, что прошлые ошибки не повторятся снова. Однако это правило может потерпеть неудачу, подавить инновации или занять время перед вступлением в силу. Также мы увидим организации, выступающие против того, чтобы правительства возглавили функции регулирования.
Пожалуй, самой известной этической встряской, с которой искусственный интеллект столкнулся в прошлом году, стала проблема авторских прав. По мере быстрого развития технологий искусственного интеллекта на передний план вышли актуальные вопросы о правах интеллектуальной собственности. Суть проблемы заключается в том должен ли и каким образом контент искусственный интеллект, который часто использует существующие произведения, созданные человеком для обучения, подпадать под действие законов об авторском праве.
Противоречие между искусственным интеллектом и авторским правом существует, поскольку закон об авторском праве был создан для предотвращения незаконного использования интеллектуальной собственности других людей. Чтение статей или текстов для вдохновения разрешено, но копирование — нет. Если человек читает Шекспира целиком и создает свою собственную версию, это считается вдохновением, однако проблема заключается в том, что искусственный интеллект может потреблять безграничные объемы данных, в отличие от ограничений, свойственных человеку.
Дебаты об авторских правах и интеллектуальной собственности — это лишь один из аспектов постоянно меняющихся средств массовой информации. В 2024 году мы увидим результаты таких знаковых прецедентных дел, как дело NYT против OpenAI, хотя неясно, дойдет ли это когда-нибудь до суда или это просто инструмент торга со стороны издателя, и станем свидетелями того, как медиа-ландшафт адаптирует к новой реальности искусственного интеллекта.
Дипфейки набирают обороты
С точки зрения геополитики, история искусственного интеллекта неизбежно будет связана с тем, как эта технология пересекается с крупнейшим годом выборов в истории человечества. В этом году более половины населения мира направляется на избирательные участки. Президентские, парламентские и референтные выборы запланированы в таких странах, как США, Тайвань, Индия, Пакистан и т.д. Подобное вмешательство уже имело место в Бангладеш, где в январе этого года прошли выборы. Некоторые проправительственные СМИ и влиятельные лица активно продвигали дезинформацию, созданную с использованием недорогих инструментов искусственного интеллекта. В одном случае на дипфейковом видео, которое впоследствии было удалено, было показано, как оппозиционный деятель отказывается от поддержки народа Газы, а такая позиция могла нанести ему вред в стране, где большинство мусульман солидарны с палестинцами.
Угроза дипфейков, созданных с помощью искусственного интеллекта, не является теоретической. Недавние исследования показали, что тонкие изменения, призванные обмануть искусственный интеллект при распознавании изображений, также могут влиять на человеческое восприятие. Статья, опубликованная в журнале Nature Communications, подчеркивает параллели между человеческим и машинным зрением, но, что более важно, оно подчеркивает необходимость проведения дополнительных исследований влияния подобных изображений как на людей, так и на системы искусственного интеллекта. Эти эксперименты показали, что даже минимальные вмешательства в изображение, незаметные для человеческого глаза, могут искажать человеческие суждения, подобно решениям, принимаемым моделями искусственным интеллектом.
Несмотря на то, что вокруг концепции водяных знаков как средства отличить подлинный контент от синтетического на изображениях, сгенерированных искусственным интеллектом, сегодня формируется глобальный консенсус, решение по-прежнему сопряжено с рядом сложностей. Например, будет ли такая возможность универсальной? Если да, то как мы можем помешать людям не злоупотреблять этим, навешивать ярлыки на работу, которая является синтетической, хотя она таковой не является? С другой стороны, лишение всех возможностей обнаруживать такие дипфейки дает власть тем, у кого она есть. И мы снова зададимся вопросом: «А кто решает, что это реально?».
Поскольку общественное доверие во всем мире остается на самом низком уровне, 2024 год станет годом, когда крупнейшие в мире выборы пересекутся с наиболее определяющими технологиями нашего времени. Хорошо это или плохо, но 2024 год станет годом, когда искусственный интеллект будет применяться самым реальным и осязаемым образом. Держитесь крепче!
Эллиот Ливи (Elliot Leavy), основатель первой в Европе консалтинговой компании ACQUAINTED по генеративному искусственному интеллекту. Перевод материала, размещенного на сайте venturebeat.com.