banner
Центр новостей
Грамотно и компетентно владеют своим опытом.

LlamaIndex добавляет частные данные в большие языковые модели

Jul 25, 2023

Прошлой осенью, поэкспериментировав с моделью ИИ, генерирующей текст GPT-3 от OpenAI — предшественницей GPT-4, — бывший научный сотрудник Uber Джерри Лю обнаружил то, что он называет «ограничениями» в способности модели работать с частными данными (например, личные файлы). Чтобы решить эту проблему, он запустил проект с открытым исходным кодом LlamaIndex, предназначенный для раскрытия возможностей и вариантов использования больших языковых моделей (LLM), таких как GPT-3 и GPT-4.

«LLM предлагают невероятные возможности для извлечения знаний и рассуждений — они могут отвечать на вопросы, обобщать, извлекать идеи и даже последовательно принимать решения во внешней среде», — сказал Лю TechCrunch в интервью по электронной почте. «Но у LLM есть пределы».

По мере того, как популярность проекта росла (до 200 000 загрузок в месяц), Лю объединил усилия с Саймоном Суо, одним из своих старых коллег в Uber, чтобы превратить LlamaIndex в полноценную компанию. Сегодня LlamaIndex (компания) предлагает платформу, помогающую разработчикам использовать возможности LLM помимо своих личных или организационных данных.

«LlamaIndex [помогает] разработчикам управлять своими данными для приложений LLM», — сказал Лю. «Наш набор инструментов содержит наибольшую глубину в этом аспекте, и мы упрощаем его интеграцию с другими инструментами, которые использует разработчик».

Кредиты изображений:ЛамаИндекс

Платформа LlamaIndex позволяет разработчикам подключать данные из таких файлов, как PDF-файлы, PowerPoint, приложения, такие как Notion и Slack, и базы данных, такие как Postgres и MongoDB, к LLM. Платформа включает в себя соединители для приема источников данных и форматов данных, а также способы структурирования данных, чтобы их можно было легко использовать с LLM.

Кроме того, LlamaIndex имеет интерфейс поиска данных и запросов, который позволяет разработчикам вводить любые входные запросы LLM, чтобы получить обратно — как описывает это Лю — «дополненные контекстом и знаниями» выходные данные.

«Существуют и другие платформы приложений LLM, которые предлагают базовые строительные блоки для приложений и агентов LLM», — сказал Лю. «Особенность LlamaIndex заключается в том, что мы уделяем особое внимание подключению ваших источников данных к LLM, и у нас есть обширные инструменты для приема данных, управления данными, их индексирования и поиска данных в отношении приложений LLM».

Перспектива расширения LLM таким образом привлекла инвесторов, которые пообещали выделить $8,5 млн в пользу LlamaIndex в недавно закрытом раунде начального финансирования. Грейлок возглавил проект при участии инвесторов-ангелов, в том числе Джека Альтмана, Ленни Рачицкого и Чарльза Се.

Так на что же LlamaIndex потратит деньги? Лю говорит, что он будет использован для создания «корпоративного решения» на основе проекта с открытым исходным кодом LlamaIndex, запуск которого запланирован на конец этого года. Одна возможность позволит клиентам использовать соединители данных «уровня защиты» для анализа и транспортировки больших объемов данных, а другая, связанная с ней возможность, позволит им индексировать данные, «специфичные для предметной области».

«LlamaIndex не привязан к конкретной технологии, поэтому мы можем продолжать использовать LLM по мере развития технологии», — сказал Лю. «Индустрия искусственного интеллекта развивается так быстро, что любые первоначальные стеки, которые появляются, вероятно, изменятся в течение следующих нескольких месяцев».

Кредиты изображений: