Ein gutes Erklärvideo steht und fällt mit dem Voice-Over. Die Animationen können noch so aufwendig sein — wenn die Stimme nicht passt, verliert der Zuschauer den roten Faden. Andreas Brenner spricht seit über 20 Jahren Voice-Overs für Unternehmen wie Google, Amazon, SAP und TeamViewer. Das Ergebnis: ein Klang, der zur Marke passt, und eine Aussprache, bei der jedes Wort sitzt.
Von LG bis Targobank – so klingen Erklärvideos mit professionellem Voice-Over.
Stimme und Bild müssen eine Einheit bilden. Das gelingt nicht von selbst.
Ein Erklärvideo vermittelt komplexe Inhalte in kurzer Zeit. Das funktioniert nur, wenn Bild und Ton perfekt zusammenspielen. Die Animation zeigt, was passiert — die Stimme erklärt, warum es wichtig ist. Dieses Zusammenspiel ist kein Zufall, sondern das Ergebnis gezielter Entscheidungen: Welches Tempo passt zur Bildgeschwindigkeit? Welche Betonung lenkt die Aufmerksamkeit auf die richtigen Elemente? Wann macht eine kurze Pause mehr als der nächste Satz?
Sprecher Andreas Brenner hat in über 20 Jahren tausende solcher Entscheidungen getroffen. Er liest nicht einfach einen Text ab — er interpretiert ihn. Das macht den Unterschied zwischen einem Voice-Over, das der Zuschauer vergisst, und einem, das hängenbleibt. Kunden wie Google, Amazon, SAP und TeamViewer haben auf diese Qualität vertraut — und das aus gutem Grund.
Ein oft unterschätzter Faktor ist die Verständlichkeit. Erklärvideos richten sich häufig an Zuschauer, die das Thema nicht kennen. Gerade dann ist eine klare Artikulation entscheidend. Jedes Wort muss beim ersten Hören verstanden werden, weil es keinen Scrollbalken gibt wie beim Lesen. Schlechte Aussprache, zu schnelles Tempo oder undeutliche Konsonanten kosten Aufmerksamkeit — und damit den Lernerfolg oder den Kaufimpuls.
Ebenso wichtig ist die Tonalität. B2B-Erklärvideos für Unternehmenssoftware klingen anders als B2C-Videos für ein Konsumentenprodukt. Ein SaaS-Erklärvideo für Einkaufsleiter braucht einen sachlichen, kompetenten Ton, der Vertrauen signalisiert. Ein Tutorial für ein Kreativprodukt darf lockerer sein, mit mehr Energie und Begeisterung in der Stimme. Andreas Brenner beherrscht beide Register und viele Nuancen dazwischen — das Briefing bestimmt den Stil.
Schließlich ist da noch die Audioproduktion selbst. Ein Voice-Over, das mit Raumhall, Hintergrundgeräuschen oder inkonsistenter Lautstärke geliefert wird, macht selbst das beste Skript zunichte. Die Aufnahmen entstehen im professionellen, schallisolierten Tonstudio in Augsburg — mit dem Neumann U87, einem der renommiertesten Studio-Mikrofone der Welt. Das Ergebnis ist eine saubere, rauschfreie Sprachspur, die sich nahtlos in jeden Videoschnitt einfügt.
Von der Software-Demo bis zum Social-Media-Clip — für jedes Videoformat die passende Stimme.
Komplexe Software verständlich erklären — das ist die Königsdisziplin des Erklärvideos. Klare Sprache, passendes Tempo, kein Fachchinesisch ohne Erklärung. Referenzen: SAP, TeamViewer.
Ein Produkt in 60–90 Sekunden so erklären, dass der Zuschauer es sofort verstehen und kaufen möchte. Die Stimme muss den Nutzen kommunizieren, nicht nur die Features aufzählen.
Schritt-für-Schritt-Anleitungen brauchen ein besonders klares, ruhiges Voice-Over. Jeder Schritt muss verständlich sein, bevor der nächste kommt. Keine Hetze, keine Verwirrung.
Neue Mitarbeiter oder Kunden einführen — das Onboarding-Video soll willkommen heißen und informieren. Ein freundlicher, einladender Ton, der Orientierung gibt.
Wenn ein Imagefilm statt mit O-Ton mit einem durchgehenden Voice-Over arbeitet, braucht er eine Stimme mit Tiefe und Überzeugungskraft. Ideal für Unternehmensvorstellungen ohne Interviewstruktur.
Kurze, prägnante Voice-Overs für Instagram Reels, LinkedIn-Videos oder YouTube Shorts. Energie, Direktheit und ein klares Call-to-Action — alles in unter 60 Sekunden.
Einfacher Prozess, professionelles Ergebnis.
Das fertige Skript per E-Mail oder über das Kontaktformular einschicken. Timing-Angaben (z. B. „Szene 1: 0–15 Sek.") sind hilfreich, aber nicht zwingend. Kein fertiges Skript? Auf Anfrage helfen wir bei der Texterstellung.
Das Voice-Over wird im schallisolierten Tonstudio in Augsburg aufgenommen. Mikrofon: Neumann U87. Das Ergebnis ist eine saubere, professionell abgemischte Sprachspur — bereit für den Videoschnitt.
Die fertige Sprachspur wird zur Prüfung geschickt. Eine Korrekturschleife ist immer inklusive. Anpassungen an Betonung, Tempo oder einzelnen Sätzen werden zügig umgesetzt.
Lieferung als WAV (48 kHz, 24 Bit) und MP3 via E-Mail oder Download-Link. Auf Wunsch auch als einzelne Takes pro Szene, damit die Integration in den Schnitt so einfach wie möglich ist.
Der gesamte Prozess ist darauf ausgelegt, möglichst wenig Zeit in Anspruch zu nehmen — auf beiden Seiten. Standardlieferung innerhalb von 24 Stunden. Für längere Projekte (z. B. komplette Videokurse mit mehreren Modulen) wird ein realistischer Zeitplan vorab vereinbart. Wichtig: Das Voice-Over kann zu einem noch unfertigen Videoschnitt aufgenommen werden, wenn das Skript feststeht. Viele Animatoren und Videoproduktionen arbeiten so, da das Voice-Over als Timing-Grundlage für die Animation dient.
Tipp: Optimale Skriptlänge
125–150 Wörter entsprechen etwa einer Minute Sprechzeit bei entspanntem, gut verständlichem Tempo. Ein 90-Sekunden-Erklärvideo hat also ca. 190–225 Wörter. Kürzere Videos werden oft besser wahrgenommen — Zuschauer schauen ein 60-Sekunden-Video häufiger bis zum Ende als ein 3-Minuten-Video.
Sprechdauer-Rechner
KI-Generator testen
Antworten auf die wichtigsten Fragen zum Erklärvideo Voice-Over.
Als Faustregel gilt: 125–150 Wörter entsprechen etwa einer Minute Sprechzeit. Ein 2-minütiges Erklärvideo hat also ca. 250–300 Wörter Skript. Für Erklärvideos, die wirklich hängenbleiben sollen, empfiehlt sich eine Länge von 60–90 Sekunden — das hält die Aufmerksamkeit hoch. Den Sprechdauer-Rechner findest du auf der Preisliste-Seite.
Das Sprechtempo wird auf das Video abgestimmt und beim Briefing besprochen. Für Erklärvideos empfiehlt sich ein ruhiges, klares Tempo von ca. 120–140 Wörtern pro Minute. Bei Bedarf kann ein bestimmtes Timing vorgegeben werden, zum Beispiel „die ersten 15 Sekunden sollen für Szene 1 passen".
Standard ist WAV (48 kHz, 24 Bit) und MP3 (320 kbps). Diese Formate sind direkt kompatibel mit Adobe Premiere, Final Cut Pro, DaVinci Resolve und allen anderen gängigen Videoschnittprogrammen. Auf Wunsch auch als AIFF oder in anderen Spezifikationen.
Ja. Eine Korrekturschleife ist bei jeder Bestellung ohne Aufpreis enthalten. Anpassungen an Tempo, Betonung oder Einzelsätzen werden zügig umgesetzt. Für größere Skriptänderungen nach der Aufnahme kann ein kleiner Aufpreis anfallen.
Ja, das ist ein wichtiger Unterschied, der oft unterschätzt wird. B2B-Videos profitieren von einem sachlichen, kompetenten Ton, der Fachkenntnis und Verlässlichkeit vermittelt. B2C-Videos dürfen lockerer, emotionaler und direkter sein. Beim Briefing wird der gewünschte Stil konkret besprochen, um sicherzustellen, dass das Ergebnis zur Zielgruppe passt.
Das Voice-Over wird standardmäßig als saubere, rauschfreie Sprachspur ohne Musik geliefert. Das gibt dem Videoproducer maximale Flexibilität beim Mischen. Auf Wunsch kann auch eine fertig abgemischte Version mit GEMA-freier Hintergrundmusik produziert werden.
Der Preis richtet sich nach Textlänge und Nutzungsrechten (Online, Messe, TV). Details zur Kalkulation findest du auf der Preisseite.
Projektanfrage · Preisliste · Oder einfach anrufen.
Als Sprecher für Erklärvideos verbindet Andreas Brenner technisches Verständnis mit stimmlicher Präzision. Ob Voice-Over Erklärvideo für Software, ein Produktvideo Sprecher für E-Commerce oder ein Tutorial Vertonung für einen Online-Kurs — jede Produktion entsteht im eigenen Tonstudio in Augsburg und wird innerhalb von 24 Stunden geliefert. Kunden wie Google, Amazon, SAP und TeamViewer setzen auf diese Qualität. Den KI-Generator für schnelle Sprachproduktionen findest du hier.