Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción a Large Language Models (LLMs)
- Descripción general de los LLM
- Definición y significado
- Aplicaciones de la IA en la actualidad
Arquitectura de transformadores
- ¿Qué es un transformador y cómo funciona?
- Componentes y características principales
- Incrustación y codificación posicional
- Atención multicabezal
- Red neuronal feed-forward
- Normalización y conexiones residuales
Modelos de transformadores
- Mecanismo de autoatención
- Arquitectura de codificador-decodificador
- Incrustaciones posicionales
- BERT (Representaciones de codificador bidireccional de transformadores)
- GPT (Transformador Preentrenado Generativo)
Optimización del rendimiento y dificultades
- Longitud del contexto
- Mamba y modelos de espacio de estados
- Atención rápida
- Transformadores dispersos
- Transformadores de visión
- Importancia de la cuantificación
Mejora de los transformadores
- Generación de texto aumentada de recuperación
- Mezcla de modelos
- Árbol de los pensamientos
Ajuste fino
- Teoría de la adaptación de bajo rango
- Ajuste fino con QLora
Leyes de escalado y optimización en LLM
- Importancia de las leyes de escalamiento para los LLM
- Escalado de tamaño de datos y modelos
- Escalado computacional
- Escalado de eficiencia de parámetros
Optimización
- Relación entre el tamaño del modelo, el tamaño de los datos, el presupuesto de proceso y los requisitos de inferencia
- Optimización del rendimiento y la eficiencia de los LLM
- Mejores prácticas y herramientas para la formación y el ajuste de los LLM
Formación y puesta a punto de los LLM
- Pasos y retos de la formación de LLMs desde cero
- Adquisición y mantenimiento de datos
- Requisitos de datos, CPU y memoria a gran escala
- Desafíos de optimización
- Panorama de los LLM de código abierto
Fundamentos de Reinforcement Learning (RL)
- Introducción a Reinforcement Learning
- Aprendizaje a través del refuerzo positivo
- Definición y conceptos básicos
- Proceso de decisión de Markov (MDP)
- Programación dinámica
- Métodos de Monte Carlo
- Aprendizaje de la diferencia temporal
Profundo Reinforcement Learning
- Redes Q profundas (DQN)
- Optimización de políticas proximales (PPO)
- Elements de Reinforcement Learning
Integración de LLMs y Reinforcement Learning
- Combinación de LLM con Reinforcement Learning
- Cómo se utiliza RL en los LLM
- Reinforcement Learning con retroalimentación humana (RLHF)
- Alternativas a RLHF
Casos de estudio y aplicaciones
- Aplicaciones en el mundo real
- Casos de éxito y retos
Temas Avanzados
- Técnicas avanzadas
- Métodos avanzados de optimización
- Investigación y desarrollos de vanguardia
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de Machine Learning
Audiencia
- Científicos de datos
- Ingenieros de software
21 Horas