Programa del Curso

Introducción

  • ¿Qué son Large Language Models (LLMs)?
  • LLMs vs modelos tradicionales de NLP
  • Descripción general de las características y la arquitectura de los LLM
  • Desafíos y limitaciones de los LLM

Comprensión de los LLM

  • El ciclo de vida de un LLM
  • Cómo funcionan los LLM
  • Los componentes principales de un LLM: codificador, decodificador, atención, incrustaciones, etcétera.

Empezar

  • Configuración del entorno de desarrollo
  • Instalar un LLM como herramienta de desarrollo, por ejemplo, Google Colab, Hugging Face

Trabajar con LLM

  • Explorando las opciones de LLM disponibles
  • Creación y uso de un LLM
  • Ajuste de un LLM en un conjunto de datos personalizado

Resumen de texto

  • Comprender la tarea del resumen de textos y sus aplicaciones
  • Uso de un LLM para el resumen de textos extractivos y abstractos
  • Evaluar la calidad de los resúmenes generados utilizando métricas como ROUGE, BLEU, etcétera.

Respuesta a preguntas

  • Comprender la tarea de responder preguntas y sus aplicaciones
  • Uso de un LLM para responder preguntas de dominio abierto y dominio cerrado
  • Evaluar la precisión de las respuestas generadas utilizando métricas como F1, EM, etcétera.

Generación de texto

  • Comprender la tarea de la generación de texto y sus aplicaciones
  • Uso de un LLM para la generación de texto condicional e incondicional
  • Controlar el estilo, el tono y el contenido de los textos generados mediante parámetros como temperatura, top-k, top-p, etcétera.

Integración de LLM con otros marcos y plataformas

  • Uso de LLM con PyTorch o TensorFlow
  • Uso de LLM con Flask o Streamlit
  • Uso de LLM con Google Cloud o AWS

Solución de problemas

  • Descripción de los errores y fallos comunes en los LLM
  • Uso de TensorBoard para monitorear y visualizar el proceso de capacitación
  • Uso de PyTorch Lightning para simplificar el código de entrenamiento y mejorar el rendimiento
  • Uso de Hugging Face conjuntos de datos para cargar y preprocesar los datos

Resumen y próximos pasos

Requerimientos

  • Comprensión del procesamiento del lenguaje natural y el aprendizaje profundo
  • Experiencia con Python y PyTorch o TensorFlow
  • Experiencia básica en programación

Audiencia

  • Desarrolladores
  • Entusiastas de la PNL
  • Científicos de datos
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas