Plantilla de implementación · VS03
Atiende reservas, FAQ y pre check-in en español, inglés, francés y alemán sin contratar recepción nocturna.
Esta plantilla está pensada para un perfil concreto, no para cualquier hotel. Si tu establecimiento no encaja, lo decimos antes y no te hacemos perder tiempo en un Discovery.
Encaja bien en hoteles boutique de 4 o 5 estrellas con entre 30 y 150 habitaciones, ADR entre 110 y 280 €, y un mix de huéspedes internacionales que llaman o escriben en varios idiomas a lo largo del día. Suele ser un hotel con director que conoce a sus repetidores por su nombre, recepción de día con dos o tres personas y un turno nocturno cubierto a medias o externalizado a un servicio de guardia que solo coge llamadas urgentes. Hay PMS moderno (Apaleo, Mews, Cloudbeds, Lean Beds) con API documentada, y existe ya cierta cultura de medir conversión por canal.
El objetivo no es sustituir a la recepción de día. Es cubrir la franja en que las reservas y consultas se pierden: desde las 21:00 hasta las 8:00, fines de semana completos, festivos locales y los picos de temporada en que el teléfono entra en cola. También cubre el canal escrito (WhatsApp Business, web chat) en cualquier franja horaria, con la misma lógica de idiomas.
Tres perfiles que NO encajan, y por qué:
Si tu hotel encaja en el primer grupo, agendamos una llamada de 30 minutos para revisar volumen real de llamadas perdidas, idiomas habituales y PMS. Si no encaja, lo decimos en esa misma llamada.
<h2 id="arquitectura">Arquitectura de referencia</h2>La arquitectura se apoya en cuatro componentes principales y dos auxiliares. Cada decisión está justificada por una restricción concreta del entorno hotelero, no por moda.
1. Retell AI como orquestador de voz. Retell gestiona el ciclo de la llamada (turn-taking, interrupciones, silencios largos), expone webhooks de eventos a N8N y permite configurar agentes multilingües con tools personalizadas. Es el componente que mantiene la latencia por debajo de 700 ms en condiciones normales, lo que en una llamada de hotel marca la diferencia entre sonar humano y sonar a IVR. La alternativa Vapi se usa solo cuando hace falta hyper-customización que Retell no permite, lo cual no es el caso aquí.
2. Deepgram Nova-3 multilingual para transcripción en tiempo real. Aquí va una nota técnica importante: usamos Nova-3, no Nova-2. La diferencia es relevante porque Nova-3 soporta detección automática de idioma dentro de un mismo audio y maneja code-switching (cambios de idioma a media frase) sin tener que reiniciar el reconocimiento. Para un huésped que empieza en inglés y suelta "¿tenéis spa?" a media frase, Nova-2 obligaría a un re-streaming completo y se notaría en la cadencia. Nova-3 lo absorbe.
3. ElevenLabs Multilingual v2 con voice cloning controlado para ES, EN, FR, DE. Cuatro voces, no una sola con acento neutro. La voz neutra suena artificial en un sector donde el huésped espera calidez. Las voces se eligen con criterios sobrios: timbre adulto, cadencia pausada, sin entonación de marketing. Los samples para clonar (cuando el hotel quiere voz propia, opcional) se graban con guion definido, se firma DPA con ElevenLabs y la huella vocal queda solo en el workspace del cliente.
4. GPT-4o como LLM conversacional. Maneja el razonamiento sobre disponibilidad, FAQ, upselling y deriva a humano cuando detecta intención fuera de catálogo. Las llamadas pasan por nuestro wrapper openai_budget_guard.py, que añade límite de tokens por sesión y corta automáticamente bucles. GPT-4o-mini se usa para tareas auxiliares (clasificación de intención inicial, resumen post-llamada).
Componentes auxiliares:
Code-switching natural ES↔EN. Es el detalle que más preguntan los hoteles tras escuchar el demo. Un huésped británico que reserva en Mallorca puede empezar pidiendo "a quiet room" y dos frases después soltar "vale, perfecto, ¿qué hay para desayunar?". Un agente mal configurado responde solo en inglés y descarta el español, o peor, cambia a un español de máquina con acento extraño. El nuestro detecta el cambio a nivel de palabra (no solo de frase), mantiene el idioma dominante de la conversación y absorbe las inserciones en el otro idioma sin reiniciar el flujo. Esto se logra con tres piezas: Nova-3 con detección de idioma a nivel token, prompt con instrucciones explícitas de continuidad y un post-procesado en el wrapper que pondera idioma según los últimos N turnos. No es magia: es configuración cuidada.
Hand-off a humano. El agente nunca se aferra a una llamada que no debería estar gestionando. Si detecta queja formal, problema médico, intención de cancelar reserva con disputa o cualquier patrón que el director del hotel marque como "transfer always", la llamada salta a número de guardia. La transferencia incluye resumen escrito de la conversación enviado por WhatsApp al director.
<h2 id="vector-de-valor">Vector de valor</h2>Cinco vectores. Para cada uno enumeramos qué hace, qué supone que hay detrás y qué no promete. Sin testimoniales inventados.
1. Recuperar reservas con menos abandono telefónico. El agente coge la llamada al primer tono, en cualquier franja, y mantiene la conversación hasta cerrar reserva o capturar lead con email + fecha aproximada. Supone que el PMS expone disponibilidad en tiempo real y que el hotel tiene tarifas no opacas. No promete convertir todas las llamadas no respondidas en reservas: convierte las que ya tenían intención clara y se perdían por falta de respuesta. Las llamadas frías o con expectativas fuera del posicionamiento del hotel no se fuerzan.
2. Confirmaciones automatizadas para reducir no-shows. Llama al huésped 48 h antes del check-in en su idioma de reserva, confirma hora estimada de llegada, ofrece pre check-in escrito y captura cualquier cambio. Reduce no-shows porque el huésped que ya no piensa venir tiende a decirlo cuando le llaman; los que sí vienen confirman y entran con menos fricción. No promete un porcentaje concreto de reducción: depende del tipo de cliente (corporate, OTA, directo) y de la antelación de la reserva. En Discovery acordamos un benchmark inicial con tus datos.
3. Pre check-in y captura de preferencias. Durante la confirmación o por WhatsApp posterior, el agente captura datos para acelerar el check-in físico (DNI/pasaporte, hora exacta, preferencias de habitación, alergias declaradas). El director recibe la ficha lista en el PMS y la recepción de día solo verifica documento. No promete sustituir el registro físico legal donde la normativa lo exige (Decreto 933/2021 en España): la captura es complementaria y queda firmada digitalmente vía Signaturit cuando el flujo lo requiere.
4. Upselling automático. Antes del check-in, el agente ofrece early check-in, late check-out, upgrade a categoría superior, reserva de restaurante interno y experiencias contratadas con partners (spa, traslado aeropuerto). Las ofertas son configurables por temporada, ocupación prevista y perfil del huésped. No promete ratio universal de aceptación: el upselling automático funciona bien cuando la oferta es coherente con el segmento (un huésped corporate de una noche no es candidato a paquete spa). El catálogo de ofertas se afina trimestralmente con el director.
5. Captura multilingüe de huéspedes internacionales. El agente entiende y responde en español, inglés, francés y alemán con voces dedicadas, no traducciones automáticas en tiempo real. Si llega un idioma fuera de los cuatro (italiano, holandés, portugués), el agente lo detecta, reconoce la limitación en inglés y deriva a humano o captura email para contactar al día siguiente. No promete cobertura universal: cubre los cuatro idiomas que en hoteles boutique españoles representan la mayoría del tráfico internacional. Italiano y portugués se añaden como opción en la fase de tuning si el volumen lo justifica.
<h2 id="calculadora">Calculadora ROI</h2>La estimación de retorno se calcula con tus propios datos, no con benchmarks genéricos. Pides reservas/mes, tasa actual de no-show, ADR medio y horas de check-in nocturno cubiertas, y la calculadora devuelve un rango razonable de recuperación mensual y anual. El rango se construye con dos escenarios (conservador y central), no con uno solo, para que veas la sensibilidad del modelo.
Si tras la simulación el resultado central queda por debajo de tres veces los honorarios anuales, te lo decimos por escrito y no avanzamos. No hay incentivo en cerrar un proyecto cuyo ROI no aguanta una hoja de cálculo.
<RoiCapture template="hospitality" /> <h2 id="benchmarks">Benchmarks sectoriales</h2>Los benchmarks que aparecen en esta página están sacados de fuentes públicas con autoría identificable: INE, Hostelería de España, Frontur, ITH y reportes sectoriales de Apaleo. Cuando una cifra es estimación nuestra a partir de varias fuentes, lo marcamos con [Estimación] y citamos la base.
No usamos cifras de "estudios internos" sin fuente verificable. Si una cifra no se puede atribuir, no entra. La razón es simple: en el sector hotelero hay datos abiertos suficientes para no necesitar inventarse nada, y un director de hotel detecta a la legua una estadística sospechosa.
Las cifras de no-show y mix de canales son rangos amplios porque la variabilidad real entre destinos y temporadas es alta. En el Discovery cruzamos estos benchmarks con los datos concretos de tu PMS (Apaleo Insights, Mews BI, Cloudbeds Reports) para tener una baseline propia antes del soft-launch.
<BenchmarkTable /> <h2 id="plan">Plan de implementación</h2>El plan se divide en cuatro fases con entregables observables. El cliente puede parar el proyecto al final de cualquier fase si no ve valor; en ese caso solo paga lo entregado hasta ese punto.
<ImplementationRoadmap />Los honorarios concretos se cierran tras el Discovery de 30 minutos, una vez verificadas tres variables: PMS exacto y nivel de acceso, volumen mensual de llamadas y mensajes, idiomas reales del tráfico. Sin esas tres no se puede dar cifra responsable. La estructura es honorarios de implementación (one-time) más honorarios mensuales fijos por mantenimiento, soporte y consumo de APIs. El consumo (Retell, Deepgram, ElevenLabs, OpenAI) se factura a coste con margen transparente, no oculto en una tarifa plana inflada.
El audio del demo y la voz del agente en producción son sintéticos. Por aplicación del Reglamento de Inteligencia Artificial (UE) 2024/1689, artículo 50.2, todo contenido de audio generado por sistema de IA debe ser identificable como tal, en formato legible por máquina y detectable por personas. La voz del agente se anuncia al inicio de cada llamada con una fórmula breve ("Le atiende el asistente virtual del hotel, conversación gestionada con IA") y el archivo de audio publicado en esta página incluye marcado SHA-256 más transcripción adjunta. No hay clonado de voz de persona real sin contrato firmado y consentimiento expreso de esa persona.
<AudioPlayerCompliant src="/audio/templates/hospitality-conserje-multilingue.mp3" transcriptPath="audio/transcripts/hospitality-conserje-multilingue.txt" />
Pon tus números reales abajo. La calculadora aplica factores conservadores observados en el sector para estimar valor mensual. No garantizamos resultados específicos.
4 de 4 vectores activos.
Estimación · no garantizada. El cálculo aplica factores conservadores observados en el sector. Tus números reales dependerán del volumen, conversión y procesos concretos. Para una estimación cerrada, agenda una consulta técnica.
| Métrica | Valor | Año | Fuente |
|---|---|---|---|
| Habitaciones hoteleras España (oferta total) | ~1,9 M plazas | 2023 | INE · Encuesta Ocupación Hotelera (EOH) |
| ADR medio hoteles 4* España | ~110-160 € (variabilidad alta por temporada y zona) | 2024 | Hostelería de España · Anuario sectorial |
| % turistas internacionales (cuota sobre llegadas) | 85,1 M turistas internacionales | 2023 | INE / Frontur |
Las cifras sectoriales no son proyecciones para Vexakon ni promesas para tu organización. Son referencias del sector. Tus números reales dependen de tu volumen, conversión y procesos.
Las duraciones son orientativas: dependen de la calidad de integración con tu software actual y de la disponibilidad de tu equipo para los gates de validación.
Voz sintetizada generada por inteligencia artificial. Vexakon, plantilla demostrativa. Transcripción pendiente · audio no generado todavía.
ElevenLabs/eleven_multilingual_v2. Metadata ID3v2 aplicada post-síntesis con disclosure v1.0. Conforme con EU AI Act art. 50.2 (vigente desde 2026-08-02). Capa de declaración oral embebida en los primeros 1.8 segundos.