1. Análisis de un bot existente impulsado por Gen AI

Metodologías de evaluación

En el siguiente board en Miró se muestran los siguientes criterios de evaluación y acá se puede revisar el test set base que se plantea como guía para evaluar un bot impulsado por GenAI:

Se llevaron a cabo pruebas a diferentes horarios y desde dos cuentas diferentes.


Pruebas

Prueba 1

Fecha: 03/09/2024

Hora: 1:07 am CT

Número telefónico: 5569854432

Notas: Conversación inicial

WhatsApp Image 2024-09-03 at 1.52.26 AM.jpeg

ANÁLISIS

Experiencia de usuario (UX):

Rendimiento del modelo de lenguaje:

⚠️ No se pudo probar porque aparentemente no hay un LLM

Manejo del contexto en las conversaciones:

⚠️ No se pudo probar porque aparentemente no hay un LLM

PROPUESTAS DE MEJORA

Experiencia de usuario (UX):


Prueba 2

Fecha: 03/09/2024

Hora: 08:26 am CT