¿Qué es Lexora Speech?

¿Qué es Lexora Speech?

Lexora Speech es la capa de generación encargada de convertir texto en audio natural utilizando modelos de voz neuronales avanzados.

Los usuarios simplemente escriben su texto, seleccionan un idioma y una voz, y generan el audio en cuestión de segundos.

  • Text to Speech con IA (TTS): convierte contenido escrito en audio natural y realista.
  • Soporte multilingüe: permite generar audio en múltiples idiomas.
  • Voces neuronales: elige entre una amplia variedad de voces con distintos tonos y estilos.
  • Modelo basado en créditos: el uso se calcula según la cantidad de audio generado.

Selección de idioma y voz

Antes de generar el audio, debes elegir el idioma y la voz que se utilizarán durante la síntesis.

Estas elecciones determinan cómo el motor de voz interpreta el texto, incluyendo reglas de pronunciación, modelado fonético y tono.

Cómo funciona

  1. Selecciona el idioma que corresponda a tu texto.
  2. Elige la voz que mejor se adapte a tu contenido.
  3. Haz clic en Generar para iniciar el proceso.

Este flujo te da control total sobre el estilo y el idioma en cada generación de audio.

Flujo de generación de audio

Una vez que haces clic en Generar, Lexora ejecuta un proceso optimizado para convertir el texto en audio.

  1. Validación del texto: verifica que el contenido sea válido y procesable.
  2. Estimación de créditos: calcula el coste antes de generar.
  3. Generación de voz: produce la forma de onda mediante modelos neuronales.
  4. Creación del recurso de audio: almacena el archivo generado.
  5. Asignación de ID de audio: permite reutilizarlo e integrarlo fácilmente.

Una vez generado, el audio puede reutilizarse múltiples veces sin necesidad de regenerarlo.

Selección de voz

Cada voz ofrece un tono, ritmo y personalidad diferentes. Elegir la adecuada te permite adaptar el resultado a tu contenido.

  • Voces narrativas: ideales para storytelling y artículos largos.
  • Voces neutras: adecuadas para documentación y contenido informativo.
  • Voces dinámicas: recomendadas para marketing y contenido promocional.

La combinación de voz e idioma garantiza una pronunciación precisa y una entonación natural.

Modelo de créditos

Lexora Speech funciona con un sistema transparente basado en créditos. Antes de generar audio, la plataforma calcula los créditos necesarios para que conozcas el coste de antemano.

  • No se inicia ninguna generación sin créditos suficientes.
  • Los créditos solo se deducen cuando la generación se completa correctamente.
  • El sistema es escalable, desde pequeños proyectos hasta grandes plataformas.

Para más detalles, consulta la documentación de créditos.

Casos de uso comunes

  • Convertir artículos de blog en audio.
  • Mejorar la accesibilidad para usuarios que prefieren escuchar.
  • Crear contenido de audio en múltiples idiomas.
  • Escalar la distribución de contenido con capas de audio.