Deep Learning generiert vokale Biomarker | Neuro-Depesche 7-8/2020

Depressions-Screening anhand von Stimmproben?

Reduzierter Bewegungsumfang, Mikrographie und eine leise Stimme deuten bei Älteren klassischerweise auf einen Morbus Parkinson hin, können aber auch Zeichen einer Depression sein. Jetzt wurde mit modernen sprachtechnologischen Methoden versucht, Parkinson-Patienten mit der automatisierten Analyse von Stimmproben auf eine Depression zu screenen. Es wurde eine ordentliche Genauigkeit erreicht.
In einer Datenbank lagen von 921 Patienten mit Parkinson-Syndrom neben Krankheitsmerkmalen (z. B. Parkinson-Schwerenach UPDRS) auch die Selbsteinschätzung vor, ob sie sich depressiv fühlten oder nicht (Frage 8 im Parkinson’s Disease Questionnaire, PDQ-8). Aus jeweils einer zehnsekündigen, mittels iPhone erfassten Sprachaufzeichnung wurden paralinguistische Merkmale extrahiert und mittels maschinellem Lernen und Deep-Learning- Techniken ausgewertet, um eine akute Depressivität zu identifizieren.
Angewendet wurden die beiden Sprachmerkmale-Sets AVEC 2013 und GeMAPS, in denen u. a. energie- und spektralbezogene Parameter wie Lautstärke, Harmonizität, Verzerrungen etc. sowie vokalakustische Merkmale wie Frequenzstabilität in Hz (Jitter) und Lautstärkenstabilität in dB (Shimmer) erfasst werden. Verarbeitet wurden diese Daten mit mehreren Lernklassifizierungsmethoden einschließlich Support Vector Machine (SVM), Random Forest (RF) und Feedforward-Deep-Neural-Network (DNN)-Modell. Nach dieser komplexen Analyse wurden 318 Patienten als depressiv und 603 als nicht-depressiv eingeschätzt.
Es zeigte sich der Trend, dass die Anzahl Nicht-Depressiver mit zunehmender Parkinson- Schwere (nach UPDRS-Teil I und II) stark abnahm, während die Anzahl Depressiver zunächst anstieg und dann bei höheren Schweregraden wieder sank. Zwischen Depression und Parkinson-Schweregrad ergab sich ein Korrelationskoeffizient von 0,3936. Der mittlere Schweregrad von Probanden mit versus ohne Depression betrug 15,43 vs. 6,25.
In der Unterscheidung depressiver und nicht-depressiver Patienten ergaben sich im AVEC-2013-Funktionsset F-Scores von 0, 66 bzw. 0,83 und eine maximale Gesamtgenauigkeit von 0,77 (nach SVM + Schweregrad und RF + Schweregrad). Im GeMAPSSet resultierten F-Scores von 0,62 bzw. 0,83, in einer Gesamtgenauigkeit von 0,76 (nach RF + Schweregrad, DNN + Schweregrad bzw. nach Schweregrad allein). HL

Kommentar

Vokale Biomarker sind eine potenziell sehr nützliche Methode zur Erkennung von Depressionen im Behandlungsalltag. Die Diagnosegenauigkeit könnte, so die Autoren, bei Einschluss linguistischer Merkmale noch erhöht werden.
Quelle: Ozkanca Y et al.: Depression screening from voice samples of patients affected by Parkinson’s disease. Digit Biomark 2019; 3(2): 72-82

Alle im Rahmen dieses Internet-Angebots veröffentlichten Artikel sind urheberrechtlich geschützt. Alle Rechte, auch Übersetzungen und Zweitveröffentlichungen, vorbehalten. Jegliche Vervielfältigung, Verlinkung oder Weiterverbreitung in jedem Medium als Ganzes oder in Teilen bedarf der schriftlichen Zustimmung des Verlags.

Ihr Zugang zu exklusiven Inhalten für Fachkreise

Login für Fachkreise

Neu registrieren

Passwort vergessen?