Еще фильтры

Data Scientist LLM (Global markets)

#16765167, 0
Договорная
Тип объявленияБесплатное
Занятость
Полная
График работы
Полный день
Опыт работы
Более 3 лет

Кто мы? Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера. Что мы делаем? Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты. Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных. Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей . Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.Обязанности Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4); Построение пайплайна обработки данных и обучения LLM (LLM цепочек); Разработка векторизованных баз знаний с использованием LangChain, ChromaDB; Организация процесса мониторинга качества LLM; Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения; Участие в формировании требований и необходимых данных по улучшению моделей; Оценка как полученное решение достигает поставленных целей; Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике; Разработка документации и руководства для пользователей и разработчиков; Подготовка и анализ новостей для обучения модели. Требования Основные навыки Знание Python на уровне middle-разработчика; Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly); Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests); Опыт работы с БД (ORM); Опыт создания dashboards (streamlit/gradio/dash); Опыт асинхронного программирования (asyncio); Linux; Git; Docker. Навыки NLP Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении; Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу; Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений; Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений; Знание методов Prompt Engineering. Личностные качества Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов. Проекты Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM; Наличие блога по NLP/LLM. Условия Формат работы: офис (ул.Вавилова,19). Возможен гибрид; ДМС с первого дня; Скидки на продукты банка и экосистемы; Развитая IT архитектура; Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях; Развитое DS community, регулярные митапы, дайджесты и конференции.



avatar

СБЕР

Контактное лицо: СБЕР
Москва
Связаться с работодателем
Жалоба на вакансию

Похожие объявления

Data Engineer
Москва
500 000
SRE Lead
Москва
400 000