SprachezuText

Sprachaufnahmen umwandeln in Dateien, Dokumente und Texte

Funktion

Tool

Anwendung

Bezahlmodell mit Preisen

Weiterführender Link

DSGVO konform

Meeting-Transkription / Notizen
Otter.ai
Live-Transkription, Sprechertrennung, Meeting-Zusammenfassungen und Export in Textnotizen/Dokumente.
Free; Pro $8.33/Nutzer/Monat jährlich bzw. $16.99 monatlich; Business $19.99/Nutzer/Monat jährlich. (Otter.ai)
nein - der Anbieter nennt Sicherheits- und GDPR-Standards, sitzt aber im US-Kontext; eine klar dokumentierte EU-Datenresidenz war in den geprüften Quellen nicht ersichtlich. (otter.ai)
Meeting-Transkription / Teams
Fireflies.ai
Meeting-Aufzeichnung, Transkription, Zusammenfassungen, Action Items und Dokumentation für Teams.
Free; Pro $10/Sitz/Monat jährlich bzw. $18 monatlich; Business $19/Sitz/Monat jährlich bzw. $29 monatlich; Enterprise $39/Sitz/Monat jährlich. (Fireflies.ai)
ja - öffentlich dokumentierte DPA-/Trust-Center-Unterlagen sowie GDPR- und SOC-2-Angaben sind vorhanden. (Fireflies.ai)
Meeting-Transkription / M365-Zoom-Umfeld
Zoom AI Companion
Meeting-Notizen, Zusammenfassungen, Aufgaben und Transkription im Zoom-Workplace-Kontext.
In berechtigten kostenpflichtigen Zoom-Workplace-Plänen ohne Aufpreis enthalten; weitere Enterprise-/Zusatzdienste separat. (Zoom)
ja - Zoom verweist auf DPA-Regelungen; zusätzlich sind EEA-/lokale Datenspeicherungsoptionen dokumentiert. (Zoom)
Audio-/Video-Transkription mit Schnitt
Descript
Transkription von Audio/Video, textbasiertes Bearbeiten, Untertitel und Dokumentausgabe.
Free; Hobbyist $16/Nutzer/Monat jährlich bzw. $24 monatlich; Business $50/Nutzer/Monat jährlich bzw. $65 monatlich. (Descript)
nein - öffentlich sichtbar waren Sicherheits-/GDPR-Hinweise, aber keine gleich stark dokumentierte DPA-/EU-Residency-Grundlage wie bei den DSGVO-Spitzenreitern. (Descript)
Meeting-Notetaker / Vertrieb & Teams
tl;dv
Meeting-Recording, Transkription, KI-Zusammenfassungen und Übergabe in CRM/Docs.
Free; Pro $18/Sitz/Monat; Business $29/Sitz/Monat jährlich; Enterprise auf Anfrage. (tldv.io)
ja - europäische Ausrichtung, dokumentierte DPA-/Trust-Center-Unterlagen und öffentlich genannte GDPR-/Security-Kontrollen. (tldv.io)
Meeting-Notetaker
Fathom
Automatische Meeting-Transkription, Highlights, Zusammenfassungen und Übergabe in Dokumente/CRM.
Free; Premium $16/Nutzer/Monat jährlich bzw. $20 monatlich; Team $15/Nutzer/Monat jährlich bzw. $19 monatlich; Business $25/Nutzer/Monat jährlich bzw. $34 monatlich. (fathom.ai)
ja - DPA ist öffentlich verfügbar; GDPR- und SOC-2-Type-II-Angaben sowie Governance-Funktionen sind dokumentiert. (fathom.ai)
Datei-Transkription / Untertitel
HappyScribe
Audio-/Video-Transkription, Untertitel, Export in Textdateien und Dokumentformate.
Free; Basic $8.50/Monat jährlich bzw. $17 monatlich; Pro $19/Monat jährlich bzw. $29 monatlich; Business $59/Monat jährlich bzw. $89 monatlich. (HappyScribe)
ja - öffentlich dokumentierte GDPR- und SOC-2-Type-II-Angaben; der Anbieter nennt zudem breite professionelle Nutzung. (HappyScribe)
Datei-Transkription / Human+AI
Rev
Transkription von Sprachaufnahmen, Meetings und Interviews; AI- sowie Human-Transkription.
Free; Essentials $25.49/Sitz/Monat jährlich bzw. $29.99 monatlich; Pro $47.99/Sitz/Monat jährlich bzw. $59.99 monatlich; Unlimited individuell. (rev.com)
nein - starke Sicherheitskommunikation ist vorhanden, aber für einen konservativen DSGVO-Einsatz fehlte mir eine gleichwertig klare EU-Residency-/DPA-Lage in den geprüften Quellen. (rev.com)
Datei-Transkription / Übersetzung
Sonix
Transkription, Sprechertrennung, Übersetzung und Export in Text-/Untertitelformate.
Standard $10/Stunde; Premium $22/Sitz/Monat bzw. $16.50/Sitz/Monat jährlich plus $5/Stunde; Enterprise individuell. (Sonix)
ja - der Anbieter nennt GDPR-Compliance; für Enterprise sind DPA/NDA/MSA und zusätzliche Kontrollfunktionen ausdrücklich aufgeführt. (Sonix)
Lokale Speech-to-Text-Verarbeitung
Whisper (lokal)
Lokale Umwandlung von Audiodateien in Text ohne Cloud-Zwang; gut für sensible Dateien und eigene Workflows.
Open Source / lokal kostenlos; Infrastrukturkosten separat. (GitHub)
ja - bei rein lokaler Ausführung verbleiben Audio und Transkript in der eigenen Infrastruktur. (GitHub)
Cloud-Speech-to-Text-API
Azure AI Speech
Entwickler- und Unternehmens-API für Transkription von Sprachaufnahmen, Live-Audio und Batch-Dateien.
Standard Real-time Transcription $1/Stunde; Fast Transcription $0.36/Stunde. (Microsoft Azure)
ja - Microsoft dokumentiert DPA-/Datenschutzregelungen und die EU Data Boundary für relevante Cloud-Dienste. (Microsoft Learn)
Cloud-Speech-to-Text-API
Google Cloud Speech-to-Text
API für Dateitranskription, Live-Transkription und Dokumentweiterverarbeitung.
V2 Dynamic Batch Recognition $0.003/Minute; V1 nach Freikontingent $0.016/Minute. (Google Cloud)
ja - Google stellt DPA-/Cloud-Privacy-Unterlagen bereit; für Speech-to-Text sind Logging-Opt-in und EU-/US-Endpunkte dokumentiert. (Google Cloud)
Cloud-Speech-to-Text-API
OpenAI Speech-to-Text API
API-Transkription für Audiodateien und Anwendungen mit Whisper bzw. GPT-4o-Transcribe-Modellen.
gpt-4o-mini-transcribe $0.003/Minute; gpt-4o-transcribe $0.006/Minute; Whisper $0.006/Minute. (OpenAI Entwickler)
ja - DPA ist verfügbar; für personenbezogene Audioinhalte ist dennoch eine saubere Transfer- und Risikoprüfung erforderlich. (OpenAI)
Cloud-Speech-to-Text-API
Amazon Transcribe
Batch- und Streaming-Transkription für Dateien, Callcenter, Meetings und Dokument-Workflows.
Standard Batch Transcription $0.075/Minute; Abrechnung sekundengenau mit Mindestdauer. (Amazon Web Services, Inc.)
ja - AWS verweist auf GDPR-/DPA-Regelungen; Region, Schlüssel und Löschkonzept müssen kundenseitig sauber konfiguriert werden. (AWS-Dokumentation)
Entwickler-API / Speech-to-Text
Deepgram
Echtzeit- und Batch-Transkription für Apps, Contact Center und Automatisierungen.
Nova-3 Monolingual $0.0077/Minute Pay-as-you-go; Nova-3 Multilingual $0.0092/Minute. (Deepgram)
ja - DPA/SCC und ein EU-spezifischer Endpunkt sind öffentlich dokumentiert. (Deepgram)
Entwickler-API / hohe STT-Qualität
Speechmatics
Mehrsprachige Speech-to-Text-API für Dateien, Streams und private/on-device Szenarien.
Free 480 Minuten/Monat; Pro ab $0.24/Stunde. (Speechmatics)
ja - GDPR-, ISO-27001- und SOC-2-Type-II-Angaben sind öffentlich dokumentiert; zudem sind private/on-device Szenarien möglich. (Speechmatics)
Entwickler-API / Enterprise-Deployments
AssemblyAI
Speech-to-Text-API mit Datei-Transkription, Analyse und Enterprise-/VPC-/On-Prem-Optionen.
Einstieg ab $0.15/Stunde; zusätzlich $50 Free Credits. (AssemblyAI)
ja - DPA ist verfügbar; EU-/VPC-/On-Prem-Optionen und EU-Data-Residency-Standards werden genannt. (AssemblyAI)
Entwickler-API / Echtzeit-Transkription
Gladia
Echtzeit- und Batch-Transkription für Dateien, Calls und produktive Datenpipelines.
Starter Async $0.61/Stunde, Real-time $0.75/Stunde; Growth ab $0.20/Stunde Async bzw. $0.25/Stunde Real-time. (gladia.io)
ja - Zero Data Retention, Datenhoheit und Compliance-/Opt-out-Funktionen auf bezahlten Plänen sind öffentlich dokumentiert. (gladia.io)