Estrategias de segmentación en sistemas RAG

Autor
Allmi, Natalia ;
Durand, Victor
Fecha de emisión
Diciembre 2025
Tema
Inteligencia Artificial;
Operación de Préstamo;
Tecnología Exponencial;
Procesamiento del Lenguaje Natural;
Desarrollo de Infraestructura;
Fuerza Laboral
Código JEL
O32 - Management of Technological Innovation and R&D;
O36 - Open Innovation
Categoría
Notas Técnicas
Este documento evalúa cómo distintas estrategias de segmentación de texto (text splitters) afectan el rendimiento de sistemas RAG, usando preguntas de variada complejidad sobre documentos del sector Infraestructura y Energía del BID. Las respuestas se valoran en cinco métricas: accuracy, similarity, relevance, coherence y groundedness. Aunque hay diferencias entre las estrategias, la mayoría logra resultados similares y aceptables. Sin embargo, es fundamental considerar costos computacionales y casos de uso en el proceso de elección del splitter.
NO