Компания Bloomberg, один из ведущих поставщиков информации для профессиональных участников финансовых рынков, представила новую модель искусственного интеллекта, которая призвана перевернуть индустрию финансов. В исследовательском документе, опубликованном компанией на arXiv, подробно описывается разработка «BloombergGPT» — новой большой языковой модели, которая была обучена работе с огромным объёмом финансовых данных для решения различных задач обработки естественного языка (NLP) в финансовой отрасли.
Простыми словами, BlooombergGPT — это передовое программное обеспечение на базе машинного обучения, которое может быстро анализировать финансовые данные, чтобы помочь людям оценивать возможные риски, судить о финансовых настроениях и даже автоматизировать задачи бухгалтерского учёта, аудита и многое другое. BloombergGPT получит доступ к огромному количеству данных, доступных в терминале Bloomberg — компьютерной системе, используемой инвесторами и финансовыми профессионалами для доступа в режиме реального времени к рыночным данным, последним финансовым новостям, исследованиям и всевозможной аналитике.
«Мы видим огромную ценность в разработке первой LLM, ориентированной на финансовую отрасль. BloombergGPT позволит нам работать со многими новыми типами приложений, обеспечивая более высокую производительность прямо «из коробки», чем пользовательские модели, оптимизированные для каждого отдельного приложения», — заявил Шон Эдвардс, технический директор Bloomberg.
Чтобы произвести обучение BloombergGPT, инженеры компании использовали «всеобъемлющий набор данных из 363 миллиардов токенов», содержащих финансовые документы на английском языке, которые хранятся в существующей базе данных Bloomberg. Инженеры также обучили модель общеглобальным наборам данных с целью создания «лучшей в своём классе» финансовой искусственной интеллектуальной системы, которая также достаточно конкурентоспособна в выполнении общих задач. Итоговый продукт, по заявлениям компании, способен декодировать около 50 миллиардов различных параметров для выполнения поставленных задач.
«Благодаря коллекции финансовых документов, которую Bloomberg накапливал более четырёх десятилетий, мы смогли создать большой и чистый набор данных для конкретной предметной области, чтобы создать и обучить большую языковую модель, наиболее подходящую для использования в финансовой сфере», — заявил Гидеон Манн, глава Bloomberg по продуктам машинного обучения.