Verifizieren mit der Stimme: Eine Einführung in die Sprachbiometrie für PingOne Verify 

22.08.2023
-Minuten Lesezeit
A headshot of Diana Jouard
Integrations Product Manager

Was bedeutet Sprachbiometrie? 

In einer von digitalen Erfahrungen geprägten Welt hat man kaum Gewissheit darüber, wer die anonyme Person am anderen Ende des Telefons ist, oder ob es sich überhaupt um einen Menschen handelt (dazu später mehr). Bei der Stimmbiometrie, auch bekannt als Stimmauthentifizierung, werden die einzigartigen Merkmale der Stimme einer Person verwendet, um ihre Identität zu überprüfen. Es handelt sich hierbei um eine biometrische Authentifizierungsmethode, bei der verschiedene Stimmmerkmale wie Tonhöhe, Klang und Aussprache analysiert werden, um anhand dessen die Authentizität der sprechenden Person festzustellen. Als vollständig passive Form der Authentifizierung kann sie Reibung für den Benutzer komplett beseitigen.

Das funktioniert so

Die Stimme des Benutzers muss für die Authentifizierung per Sprache registriert sein. Dies kann erfolgen, indem der Nutzer im Rahmen einer Selfservice-Registrierung 3 bis 5 Stimmproben aufzeichnet. Die Sprachregistrierung kann auch passiv erfolgen, indem Audiodateien von einem Sprachdialogsystem eingelesen oder eine Stimmprobe während eines Gesprächs mit einem Callcenter-Agenten erfasst wird.

 

Bei der Verifizierung der Identität eines registrierten Benutzers erfasst das biometrische Stimmerkennungssystem eine neue Sprachprobe und verwendet dabei eine von drei Methoden:

 

  1. Die Stimme des Nutzers wird vor seiner Weiterleitung an einen Callcenter-Agenten durch das Sprachdialogsystem (IVR, Interactive Voice Response) erfasst. Dabei handelt es sich um eine textabhängige Sprachverifizierung, bei der eine Person eine bestimmte Passphrase spricht, die in der Regel aus einigen wenigen Wörtern besteht. Erinnern Sie sich an „Meine Stimme ist mein Pass; verifizieren Sie mich“? Die textabhängige Sprachverifizierung ist weniger sicher als andere Methoden, aber dazu später mehr.

     

     

     

     

  2. Weiterhin gibt es noch die textunabhängige Sprachverifizierung, bei der die Benutzer während eines Gesprächs mit einem Callcenter-Agenten passiv authentifiziert werden. Hierbei ist es unwichtig, was genau gesagt wird. Die Authentifizierung erfolgt schnell im Hintergrund während der normalen Interaktion des Nutzers mit einem Agenten, dem Sprachdialogsystem oder einer Anwendung. Diese Methode zur Implementierung der Stimmbiometrie bietet mehr Sicherheit, da sie den Angriffsvektor für das Spoofing mit einer synthetischen Stimme reduziert.

     

  3. Schließlich kann den Nutzern per E-Mail oder SMS ein Link zugesandt werden, über den sie die Verifizierung in einer webbasierten oder mobilen Anwendung durchführen können. Dies bietet ein zusätzliches Maß an Sicherheit, da es gleichzeitig den Besitz des Geräts nachweist. Auch hier werden Liveness-Kontrollen über diesen Kanal unterstützt.

 

Ein wichtiger Vorteil der digitalen Authentifizierung von Benutzern ist die Möglichkeit der Erfassung einer Stimmprobe mit überragender Audioqualität, die dann mehr Sicherheit bei der Überprüfung bietet. Mobilgeräte unterstützen eine Bandbreite von 16 kHz, während Festnetzanschlüsse nur 8 kHz bieten. PingOne Verify führt die passive Liveness-Erkennung ausschließlich über einen 16-kHz-Kanal durch, um aufgezeichnete Playback-Angriffe zu stoppen. Derzeit kann kein auf dem Markt verfügbarer Dienst für die Sprachbiometrie eine Liveness-Erkennung bei einer Frequenz von 8 kHz durchführen. Die Audioqualität ist einfach nicht ausreichend.
 

Wenn die Audioprobe erfasst wurde:

  • PingOne Verify verarbeitet die Datei und extrahiert ein Template. 

  • Dieses neue Template wird mit dem Registrierungs-Template abgeglichen.  

  • Eine hohe Übereinstimmung zwischen den Templates zeigt an, dass die gleiche Person beide Proben gesprochen hat, und bestätigt somit ihre Identität. 

  • PingOne Verify gibt mit seinem Ergebnis einen Wahrscheinlichkeits- und einen Sicherheitswert für den Abgleich aus.

  • Es ist möglich, das Master-Stimmprofil mit jeder erfolgreich verifizierten Stimmvorlage zu ergänzen, um es besser zu modellieren. 

Welchen Nutzen hat die Sprachbiometrie heute?  

Im Callcenter: Die Sprachbiometrie kann in Callcentern für jedes Unternehmen integriert werden, um die Authentifizierung von Nutzern oder die Autorisierung von Transaktionen zu ermöglichen. Die Nutzer können ihre Identität nachweisen, indem sie ganz natürlich mit einem Live-Agenten oder einem Sprachdialogsystem interagieren. Die Sprachbiometrie sollte als Teil eines mehrschichtigen Ansatzes zur Benutzerauthentifizierung eingesetzt werden. 

 

Telefon-Banking: Banken können Kunden per Telefon mittels Sprachbiometrie authentifizieren. Die Kunden können sicher auf ihre Konten zugreifen, Transaktionen durchführen und andere Bankgeschäfte erledigen, indem sie ihre Stimme als eindeutigen Identifikator verwenden.

 

Bedeutende Vorteile

  • Sprachbiometrie ist viel stärker als die wissensbasierte Authentifizierung, mit der Benutzer normalerweise über das Telefon verifiziert werden. Die Nutzer geben viel zu viele Informationen im Internet preis, so dass man leicht herausfinden kann, welche Schule eine Person besucht hat oder wie der Mädchenname der Mutter lautet.  

  • Zeitersparnis für Agenten, da das umständliche Stellen und Beantworten wissensbasierter Fragen bei der Authentifizierung wegfällt.

  • Sichere Kundenerlebnisse bei schneller, reibungsloser Authentifizierung. Die Sprachbiometrie ist in Kombination mit der Überprüfung des Gerätebesitzes oder der SIM-Karte eine äußerst sichere Methode zur Authentifizierung von Benutzern in einem Callcenter.

 

Ist das wirklich sicher?  

Die Stimmbiometrie ist sowohl sicher als auch sehr effizient. Wir Menschen verwenden mehr als 70 Muskeln, um Sprache zu erzeugen. Dies macht den sprachlichen Ausdruck jedes der 7,8 Milliarden Menschen auf diesem Planeten zu etwas Einzigartigem. Bei der Implementierung der Verifizierung über Sprache in PingOne Verify erkennt die KI nicht die verwendeten Worte, sondern die Stimmbiometrie erkennt die unverwechselbaren Merkmale der Sprache des Benutzers. 

 

Funktioniert die Sprachbiometrie auch, wenn die Person einen Schnupfen hat?

Auf jeden Fall! Ein leistungsfähiger biometrischer Algorithmus für die Sprachbiometrie funktioniert auch dann erwartungsgemäß und mit hoher Genauigkeit, wenn der Benutzer erkältet ist. Sollte die Stimme jedoch völlig anders klingen, wird die Person nicht als der registrierte Nutzer erkannt und bestätigt. In Extremfällen wie diesem sollte man den Benutzer darum bitten, eine andere Form der Authentifizierung zu wählen.

 

Es wird bei jeder Form der biografischen Überprüfung Grenzfälle geben. Wie wir es bereits schon vom Fingerabdruck kennen, können auch Benutzer mit Hornhautbildung, z. B. durch manuelle Arbeit, diese Funktion nicht verwenden. 

 

Unsere Lösung in Aktion

Exceptional experiences start with secure identity.
Diesen Artikel teilen:
Verwandte Ressourcen

Starten Sie jetzt

Kontaktieren Sie uns

sales@pingidentity.com

Erfahren Sie, wie Ping Ihnen helfen kann, sichere Erlebnisse für Mitarbeiter, Partner und Kunden in einer sich schnell wandelnden digitalen Welt zu bieten.