Lexora Speech im Überblick

Was ist Lexora Speech?

Lexora Speech ist die Generierungsschicht von Lexora. Sie wandelt geschriebenen Text mit Hilfe moderner neuronaler Stimmmodelle in natürlich klingendes Audio um.

Der Ablauf ist bewusst einfach: Text eingeben, Sprache wählen, Stimme auswählen und die Generierung starten.

  • KI-Text-to-Speech: schriftliche Inhalte werden in realistisch klingende Sprache umgewandelt.
  • Mehrsprachig: du kannst Audio in mehreren Sprachen erzeugen.
  • Stimmenbibliothek: verschiedene Klangcharaktere für unterschiedliche Content-Typen.
  • Credit-basiert: die Nutzung orientiert sich an der Menge des erzeugten Inhalts.

Sprach- und Stimmwahl

Vor der Generierung wählst du die Sprache und die Stimme, die für dein Audio verwendet werden sollen.

Diese Auswahl bestimmt Aussprache, Tonalität und das gesamte Hörerlebnis.

  1. Wähle die Sprache, die zu deinem Text passt.
  2. Wähle die gewünschte Stimme.
  3. Klicke auf Generieren, um den Render-Prozess zu starten.

Wie die Generierung abläuft

  1. Textprüfung: Der Inhalt wird validiert.
  2. Credit-Schätzung: Der voraussichtliche Verbrauch wird berechnet.
  3. Voice Rendering: Das Audiosignal wird erzeugt.
  4. Asset-Erstellung: Das fertige Audio wird gespeichert.
  5. ID-Zuweisung: Das Audio bekommt eine eindeutige Kennung für Wiederverwendung und Embedding.

Ein einmal erzeugtes Audio kann später wiederverwendet werden, ohne es erneut zu generieren.

Stimmenwahl

Unterschiedliche Stimmen bringen unterschiedliche Tonlagen, Tempi und Charaktere mit. Die richtige Stimme hilft dabei, Inhalt und Wirkung besser aufeinander abzustimmen.

Credits und Nutzung

Lexora Speech arbeitet mit einem transparenten Credit-Modell. Vor der Generierung siehst du, wie viele Credits voraussichtlich benötigt werden.

  • Ohne ausreichende Credits startet keine Generierung.
  • Credits werden nur bei erfolgreicher Generierung verbraucht.
  • Das Modell ist sowohl für kleine Websites als auch für größere Plattformen geeignet.