Un Parcero - AI Voice Agent

Bienvenido a Un Parcero, un agente de voz interactivo impulsado por Inteligencia Artificial. Este proyecto combina un frontend moderno en React con un backend potente en Python utilizando LiveKit para la comunicación en tiempo real y OpenAI para el procesamiento de lenguaje natural.

📋 Tabla de Contenidos

Sobre el Proyecto
Arquitectura
Requisitos Previos
Instalación y Configuración
- Backend
- Frontend
Uso
Documentación Oficial

🚀 Sobre el Proyecto

Un Parcero es una aplicación diseñada para demostrar el poder de los agentes conversacionales multimodales. Permite a los usuarios interactuar con un asistente virtual a través de voz en tiempo real, con capacidades de:

Detección de voz (VAD): Identifica cuándo el usuario está hablando.
Transcripción (STT): Convierte voz a texto usando OpenAI Whisper.
Inteligencia (LLM): Genera respuestas inteligentes usando GPT-4o.
Síntesis de voz (TTS): Convierte las respuestas de texto a audio natural.

🏗 Arquitectura

El sistema sigue una arquitectura cliente-servidor desacoplada, mediada por LiveKit para la transmisión de audio/video de baja latencia.

graph TD
    User[Usuario] <-->|Audio/Video RTP| LiveKit[LiveKit Cloud]
    
    subgraph Frontend [Frontend (React + Vite)]
        UI[Interfaz de Usuario] -->|Solicita Token| API[Backend API /getToken]
        UI <-->|Señalización| LiveKit
    end
    
    subgraph Backend [Backend (Python Agent)]
        Agent[LiveKit Worker] <-->|Señalización & Media| LiveKit
        Agent -->|STT/LLM/TTS| OpenAI[OpenAI API]
    end

    User <--> UI

Frontend: Solicita un token de acceso al Backend y se conecta a una sala de LiveKit.
LiveKit Cloud: Actúa como el servidor SFU (Selective Forwarding Unit) para enrutar el audio entre el usuario y el agente.
Backend (Agent): Se conecta a la misma sala, escucha el audio del usuario, lo procesa y responde.

🛠 Requisitos Previos

Antes de comenzar, asegúrate de tener instalado:

Python 3.9 o superior.
Node.js 18 o superior.
Una cuenta en LiveKit Cloud (para obtener LIVEKIT_API_KEY, LIVEKIT_API_SECRET, LIVEKIT_URL).
Una clave de API de OpenAI (para OPENAI_API_KEY).

⚙️ Instalación y Configuración

Clona el repositorio:

git clone <url-del-repositorio>
cd un_agent

Backend

El backend maneja la lógica del agente y la autenticación.

Navega al directorio backend:
```
cd backend
```

Crea un entorno virtual:

python -m venv .venv
source .venv/bin/activate  # En Windows: .venv\Scripts\activate

Instala las dependencias:
```
pip install -r requirements.txt
```

Configura las variables de entorno. Crea un archivo .env en backend/ y agrega:

LIVEKIT_API_KEY=tu_api_key 
LIVEKIT_API_SECRET=tu_api_secret
LIVEKIT_URL=tu_livekit_url
OPENAI_API_KEY=tu_openai_key

Ejecuta el agente (modo desarrollo):
```
python agent.py dev
```

Frontend

El frontend es la interfaz visual para interactuar con el agente.

Navega al directorio frontend:
```
cd ../frontend
```
Instala las dependencias:
```
npm install
```
(Opcional) Si el frontend necesita credenciales directas (aunque usualmente las obtiene del backend), crea un archivo .env en frontend/.
Inicia el servidor de desarrollo:
```
npm run dev
```

🎮 Uso

Asegúrate de que tanto el Backend (agente) como el Frontend (servidor Vite) estén ejecutándose.
Abre tu navegador en la URL que muestra Vite (usualmente http://localhost:5173).
Navega a la página del agente de voz (ej. /voice-agent).
Haz clic en "Conectar" o el botón de inicio.
¡Empieza a hablar! El agente te escuchará y responderá.

📚 Documentación Oficial

Para profundizar en las tecnologías utilizadas:

LiveKit: Documentación Oficial
LiveKit Agents Framework: Guía de Agentes en Python
OpenAI API: Referencia de API
FastAPI: Documentación
React: Documentación
Vite: Guía

Hecho con ❤️ por el equipo de Un Parcero.

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
backend		backend
frontend		frontend
.dockerignore		.dockerignore
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Un Parcero - AI Voice Agent

📋 Tabla de Contenidos

🚀 Sobre el Proyecto

🏗 Arquitectura

🛠 Requisitos Previos

⚙️ Instalación y Configuración

Backend

Frontend

🎮 Uso

📚 Documentación Oficial

About

Uh oh!

Releases

Packages

Languages

robmdz/un_agent

Folders and files

Latest commit

History

Repository files navigation

Un Parcero - AI Voice Agent

📋 Tabla de Contenidos

🚀 Sobre el Proyecto

🏗 Arquitectura

🛠 Requisitos Previos

⚙️ Instalación y Configuración

Backend

Frontend

🎮 Uso

📚 Documentación Oficial

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages