Sprechstimmprofil depressiver Störungen im Kindesalter: Aktuelle explorative Befunde einer empirischen Studie
von Philipp Stang, Sandra Reimann & Karin Schleider
1 Einführung und Fragestellung
Der Sprechstimmanalyse depressiver Störungen[1] gebührt seit geraumer Zeit das internationale Forschungsinteresse (vgl. u.a. Aderhold, 2005; Garcia-Toro, Talavera, Saiz-Ruiz & Gonzales., 2000; Strassen, 1995). Vielfältige Studien zeigen unterschiedliche, zum Teil divergente, Ergebnisse für die Sprechweise von Menschen mit depressiven Störungen. Bisher konnte keine empirische Studie identifiziert werden, die die stimmlichen Merkmale des Sprechens von Kindern mit einer depressiven Störung näher beleuchtete. Theoretisch-empirische Grundlagen zur Sprechstimmanalyse und den sprechstimmlichen Merkmalen depressiver Störungen wurden
bereits von Stang & Schleider (2018) ausführlich dargestellt. Dieser Beitrag ist eine empirische Fortführung des genannten Artikels. Der vorliegende Beitrag stellt dabei eine aktuelle empirische Studie vor, die erstmals Sprechstimmprofile von Kindern mit einer depressiven Störung im Vergleich zu Kindern ohne depressive Störungen erstellt und diese miteinander vergleicht. Es werden erste deskriptive, explorative Ergebnisse mit qualitativem Charakter vorgestellt.
Aus den theoretischen Grundlagen ergibt sich die Fragestellung, ob es Unterschiede von sprechstimmlichen Merkmalen von Kindern mit depressiven Störungen gibt gegenüber
· Kindern ohne depressive Störung
· Erwachsenen mit depressiver Störung
und ob sich aus den Unterschieden gruppenspezifische Sprechstimmprofile bilden lassen. Außerdem soll der Zusammenhang untersucht werden zwischen sprechstimmlichen Merkmalen und der Depressivität.
[1] Für den vorliegenden Artikel wurde entsprechend der ICD-10 (Internationale statistische Klassifikation der Krankheiten) eine Reihe von Diagnosen im Sinne depressiver Störungen verwendet (vgl. Dilling, Mombour & Schmidt, 2015; Mehler-Wex, 2008; Remschmidt, Schmidt & Poustka, 2011). Hierzu zählen die depressive Episode (F32.x), differenziert nach Schweregrad in leichte (F32.0), mittelgradige (F32.1) und schwere depressive Episode ohne bzw. mit psychotische Symptome (F32.2 bzw. F32.3) sowie die rezidivierende depressive Störung (F33.x), ebenfalls differenziert nach Schweregrad der gegenwärtigen Episode (F33.0 bis F33.3) bzw. gegenwärtig remittiert (F33.4). Daneben sind zu erwähnen die Zyklothymia (F34.0), die Dysthymia (F34.1) sowie Angst und depressive Störung gemischt (F41.2), akute Belastungsreaktion (F43.0) und die Anpassungsstörungen mit kurzer bzw. längerer depressiver Reaktion (F43.20 bzw. F43.21). Schließlich zu erwähnen sei noch die Störung des Sozialverhaltens mit depressiver Störung (F92.0).
2 Empirischer Zugang
Aus dem aktuellen Forschungsstand konnte bislang kein Sprechstimmprofil für Sprecher mit einer depressiven Störung abgeleitet werden, welches für den Altersbereich von Kindern Gültigkeit hat. Da vor allem in diesem Altersbereich depressive Störungen häufig unerkannt bleiben und somit auch nicht therapiert werden, ist gerade dort eine Erhöhung der Güte im Sinne einer Optimierung der Sensitivität und Spezifität der Depressionsdiagnostik erstrebenswert. Daraus ergibt sich für die weitere Forschung eine Lücke, die mit der im Folgenden vorgestellten empirischen Studie in Ansätzen geschlossen werden soll.
3 Methodik
Bei der 2018 von Stang, Reimann und Schleider durchgeführten Studie handelt es sich um eine quasiexperimentelle quantitative Feldstudie im Querschnittdesign im Zwei-Stichproben-Vergleich, n≥30 (N=66). Pro Probanden wurde eine Testbatterie bestehend aus 6 Audioaufnahmen erhoben. Speziell wurden dabei stimmliche Merkmal des Sprechens beleuchtet. Das Ziel der Untersuchung war es, Aufschluss über den Sprechprozess zu erhalten.
Die Datengewinnung erfolgte dabei durch Beobachtung des Untersuchungsobjekts zu jeweils einem Messzeitpunkt und durch Aufzeichnung mittels Audioaufnahmegerät. Um die Ausprägungen von akustischen Merkmalen zu beschreiben, wurden die Daten „sprachstatistisch“ (Hoffmann & Piotrowski, 1979) bearbeitet.
3.1 Forschungsstrategie/Datenerhebungsmethode
Vor der Durchführung wurden die Eltern der Probanden über das Forschungsvorhaben mündlich sowie schriftlich aufgeklärt.
Bei der Datengewinnung entsprach das abstrakte, klassifizierte und relativierte Material der Vorstellung, das zu beobachtende Geschehen sei im Prinzip bekannt und lasse sich in einzelne Elemente oder Segmente zerlegen (vgl. Bortz, 2005). Die Versuchsdurchführung fand für die Experimentalgruppe (EG) in den kooperierenden Praxen und Kliniken statt. Die Daten der Kontrollgruppe (KG) wurden nicht in klinischen Einrichtungen, jedoch in exakt der gleichen Art und Weise unter vergleichbaren Bedingungen erhoben.
Die Wahrscheinlichkeit, eine reliable und gültige quantitative Untersuchung zu erhalten, konnte zum einen durch die Standardisierung der Untersuchungssituation, zum anderen auch den Einsatz der Testbatterie und mittels apparativen Einsatzes des Audioaufnahmegeräts bei der Datengewinnung erhöht werden. Die Objektivität wurde bei der Durchführung der Untersuchung durch die Testbatterie, inklusive der beiden Fragebögen, besonders beachtet. Da für die Stichproben das zentrale Grenzwerttheorem der klassischen Testtheorie angenommen wird, kann eine Normalverteilung vorausgesetzt werden, was als ein Faktor für Repräsentativität gesehen werden kann. Unter den genannten Kriterien konnte aufgezeigt werden, dass zum einen die Untersuchung unter Berücksichtigung grundlegender Maßstäbe der Sozialforschung durchgeführt wurde und zum anderen die Gütekriterien der klassischen Testtheorie eingehalten werden konnten.
Die apparative Beobachtung verlief bei allen Probanden in gleicher Art und Weise. Bei den Beobachtungen wurden ausschließlich das akustische Material und psychopathologische Konstrukte beachtet. Durch den Einsatz eines Audioaufnahmegeräts während des quantitativen Tests wurde ausschließlich eine Datenaufzeichnung angefertigt. Die Audioaufnahmen erfolgten anonymisiert mit dem Field recorder R-09HR (Kondensatormikrophon). Es handelt sich um eine statische Aufnahme, eine fest installierte Aufnahmeapparatur vor den sitzenden Probanden mit standardisiertem Abstand des Aufnahmegeräts von 45 cm zum Probanden (vgl. Brinker & Sager, 2006; Strassen, 1995). Das spontane Sprechen wurde bei der Datenerhebung mit folgender Aufforderung und Frage initiiert: „Erzähle mir bitte, wie du heute zu mir gekommen bist!“.
Zum Vorlesen wurde der standardisierte Text „Der Fuchs und die Trauben“ verwendet. Anschließend bat der Versuchsleiter die Probanden, den Langvokal /a:/, den Kurzvokal /a/, den Nasal /m/ lang zu sprechen sowie hörbar von 21 bis 30 zu zählen. Ebenfalls in anonymisierter Form wurden die Depressionsfragebögen DIKJ (Depressionsinventar für Kinder und Jugendliche) und DTK-II (Depressionstest für Kinder-II) von allen Probanden ausgefüllt. Die Fragebögen dienten innerhalb dieser Studie nicht zur Bestätigung der vordiagnostizierten depressiven Störung, sondern für die Erhebung von Vergleichsdaten für EG und KG. Die Depressionsdiagnostik der EG wurde für die Probanden dieser Stichprobe vorausgesetzt. Es handelte sich bei allen Probanden der EG um pseudonymisierte psychiatrische und psychotherapeutische Patienten. Die gesicherte Diagnose wurde von den Ärzten oder approbierten Psychotherapeuten der kooperierenden klinischen Institutionen gestellt. Die Reihenfolge der Testdurchführung wurde durch den Gedanken geleitet, mögliche Probandeneffekte auszuschließen bzw. zu verringern. Mit der Vergabe einer Chiffrierung wurde die Anonymität der Probanden gewährleistet.
Eine Einführung in das Thema der Untersuchung wurde den Probanden nicht vor der Untersuchungsdurchführung gegeben, um eine Beeinflussung der Probanden durch den Versuchsleiter und damit einen eventuell auftretenden Probandeneffekt zu verringern. Es erfolgte eine Aufklärung über die Erhebungsmethoden und ein Einholen der Einverständniserklärungen der Sorgeberechtigten sowie der Probanden. Es lag ein positives Votum der Ethikkommission der Universität Regensburg der Studie vor. Die Datenschutzbestimmungen wurden eingehalten.
3.2 Stichprobe
Allgemein lässt sich sagen, dass die Entscheidung für den „besten“ Stichprobenumfang eine diffizile Herausforderung an einen Untersuchungsleiter stellt. In der einschlägigen Fachliteratur finden sich hierzu vielfältige Meinungen (vgl. Bortz & Döring, 2006; Fahrmeir, Künstler, Pigeot & Tutz, 2016; Lippe & Kladroba, 2002). In diesem Zusammenhang bezweifeln Lippe & Kladroba (2002) beispielweise, dass Repräsentativität „überhaupt ein sinnvolles Kriterium für die Güte einer Auswahl ist“ (S.144). Die Autoren „halten […] `Repräsentativität´ nicht für ein brauchbares Konzept“ (ebd.). Auch in der klassischen Testtheorie ist die a priori Auswahl des Stichprobenumfangs nicht unumstritten. Die Wahl des „optimalen“ Stichprobenumfangs wird laut Bortz & Döring (2006) durch die Berechnung eines Anteils der Gesamtpopulation bestimmt. Die hier zutreffende Population sind die Kinder, die in der BRD wohnhaft waren/sind und die 2018 zwischen neun und 12 Jahre alt waren. Konkret ergibt sich zu diesen Überlegungen folgende Berechnung: Zum Stichtag 31.12.2016 lebten in der Bundesrepublik Deutschland 2911782 Kinder im Alter von neun bis 12 Jahren (vgl. Statistisches Bundesamt, 2018). Bei der Annahme von Steinmann, Watzke, Lehmann & Härter (2013) sowie Blanz et al. (2006), dass bei ca. 2 % der Kinder in diesem Alter eine depressive Störung vorliegt, ergibt sich eine Gruppengröße von 58236 Kindern. Werden gemäß Mehler-Wex & Kölch (2008) aus dieser Gruppe 50% der Kinder berücksichtigt, bei denen komorbid eine Störung des Sozialverhaltens im Sinne einer externalisierenden Störung als Ausschlusskriterium der vorliegenden Studie vorliegt, ergibt sich eine Gruppengröße gleich 29118 (vgl. ebenso Essau, Karpinski, Petermann & Conradt, 1998; Groen & Petermann 2002, Deutsche Gesellschaft für Kinder- und Jugendpsychiatrie und Psychotherapie, 2003; Fröhlich-Gildhoff, 2004). Gemäß Cohen (1988) sowie Bortz und Döring (2006) würde sich auf Grundlage von diesem ermittelten Populationswert ein Stichprobenumfang gleich 380 bei einem Konfidenzintervall von 95% und einer Fehlermarge von 5 Prozent ergeben. Des Weiteren dürften zusätzlich die Stichprobe um die Raten der komorbiden Störungen Hyperkinetische Störungen und Leserechtschreibstörung (LRS) im Sinne der Ausschlusskriterien bereinigt werden. Zudem gilt eine unterdurchschnittliche Intelligenz als Ausschlusskriterium für die vorliegende Studie. Da genaue Angaben zur Überschneidung der genannten komorbiden Störungsbilder aus der Fachliteratur bislang fehlen, kann eine genaue Berechnung nicht vorgenommen werden.
Bei der Berechnung der Stichprobengröße kommt auch zu kurz, dass der Anteil der Kinder, die Probleme mit der Lesekompetenz und ganz allgemein mit der Sprachfertigkeit in der deutschen Sprache haben, keine Berücksichtigung findet. Zum einen betrifft dies einen Anteil aufgrund von Analphabetismus und zum anderen einen Anteil aufgrund von geringer sprachlicher Deutschkenntnisse vor dem Hintergrund von Migration. Ein Aufwachsen mit einer Fremdsprache galt als Ausschlusskriterium, um die Prominenz anderer Akzente als den melodischen auszuschließen (Kaunzner, 2018). Auch sollte sich die Auswahl und Größe der Stichprobe nach den verfügbaren Kindern richten, also derer, die im deutschen Gesundheitssystem erfasst sind; hier: in psychotherapeutischen und psychiatrischen Praxen sowie Kliniken. Kinder mit einer nicht diagnostizierten depressiven Störung stellen keine potentiellen Probanden für die Studie dar, da sie nicht zu akquirieren sind. Laut Informationssystem der Gesundheitsberichterstattung (2018) des Bundes waren 2016 mindestens 9700 Kinder und Jugendliche unter 15 Jahren in einem Krankenhaus in der BRD aufgrund einer depressiven Störung. Eine genauere Angabe ist aufgrund der lediglich dreistelligen Angabe der Diagnosen gemäß F-Schlüssel der ICD-10 durch das Informationssystem der Gesundheitsberichterstattung nicht möglich. Wegen der vielfältigen oben genannten und weiterer Überlegungen (z.B. zu geringe Deutschkenntnisse aufgrund von Migration etc.) und der vielzähligen nicht quantifizierbaren Faktoren wurde daher nicht der Stichprobenumfang errechnet, sondern dieser richtete sich nach der erwarteten Effektstärke gemäß Bortz und Döring (2006). Laut Bortz & Döring (2006) ist für die Untersuchung von Gruppenunterschieden hinsichtlich der Mittelwertsdifferenzen bei einem großen Effekt (δ=.8) ein N gleich 20 und bei der Untersuchung von Korrelationen ein N gleich 22 ausreichend (S.628; Tab. 9.7).
Vom 01.06.2016 bis 30.06.2018 wurden kontinuierlich Probanden akquiriert. Dies geschah über ein Anschreiben an die Schulrektoren, Lehrkräfte sowie den Elternbeirat diverser Schulen ebenso wie Ärzten und Psychotherapeuten kinder- und jugendpsychiatrischer/-psychotherapeutischer Kliniken und Praxen sowie Selbsthilfegruppen, Organisationen, Berufsverbände (DPtV, 2018), die Kassenärztliche Vereinigung, Fachzeitschriften und die Psychotherapeutenkammer (PTK Bayern, 2018). Zusätzlich wurden Internetplattformen wie Deutsches Bündnis gegen Depression e.V. (DepressionsLiga e.V., 2018), Kiss Mittelfranken (2018) und Seelenkummer (2018) angeschrieben. Die Anschreiben mit den Informationen und Einverständniserklärungen zur Studie wurden per E-Mail oder per Post zugestellt. Anschließend nahmen sowohl die Erziehungsberechtigten, Ärzte und Therapeuten mit dem Untersuchungsleiter per Email, Post, Telefon oder Fax Kontakt auf, um Termine für die Untersuchungsdurchführung zu vereinbaren. Es fand ein Telefonat zur Aufklärung und Besprechung der Untersuchungsmodalitäten statt. Zudem ermöglichte ein Online-Portal der Studie eine Kontaktaufnahme über die Homepage http://praxis-stang.de/forschung/, welche die aktuellen Datenschutzbestimmungen beachtete. Infolge der jeweils aktuellen Übersicht zur Stichprobenzusammensetzung wurde stets versucht, diejenigen Probanden zu akquirieren, die noch unterrepräsentiert waren. Aus dem Rücklauf entstand die Zufallsstichprobe.
Die Behandler wurden darauf hingewiesen, dass als Voraussetzung für die Teilnahme an der Untersuchung bei den Probanden der klinischen Stichprobe eine aktuell bestehende depressive Störung mit gesicherter Diagnosestellung vorliegen müsse. Externalisierte Störungen sowie die Diagnose des selektiven Mutismus galten für die vorliegende Studie als Ausschlusskriterien, weil vermutet wurde, dass die Symptome dieser Störungsbilder die untersuchte depressive Symptomatik und deren Auswirkung auf das vermutete depressive Sprechstimmprofil überlagern und somit verändern könnten. Zudem galten als Ausschlusskriterium, wenn das Alter des Kindes nicht zwischen neun und zwölf Jahren lag, Deutsch nicht die Muttersprache war, eine mangelnde Kooperationsbereitschaft oder Motivation vorlag. Auch eine mangelnde Lesekompetenz bzw. eine nach klinischem Eindruck umschriebene Entwicklungsstörung oder unterdurchschnittliche Intelligenz führte zum Ausschluss. Vor allem hinsichtlich der Lesekompetenz wurde für die Testung eine altersadäquate Kompetenzentwicklung von den Probanden abverlangt. Aufgrund der vielzähligen Ausschlusskriterien und der Suche nach Patienten mit einer depressiven Störung ohne Komorbiditäten im genannten Altersbereich stellte sich die Probandenakquise als besonders komplex heraus.
Unter dem Gesichtspunkt ethischer Kriterien war bei der Art und Weise der Probandenakquise gewährleistet, dass die Probanden völlig freiwillig an der Untersuchung teilnehmen konnten. Die Anonymität der gewonnenen Daten wurde durch eine Chiffrierung gewährleistet.
Bei der Planung des Untersuchungsinstruments und der Probandenakquise wurde aufbauend auf dem bisherigen Forschungsstand davon ausgegangen, dass grundsätzlich neun- bis zwölfjährige Kinder lesen können und sich noch nicht in einem hörbaren Stimmbruch befanden. Um dies sicher zu stellen wurde vor der Untersuchung augenscheinlich auf die Deutschkenntnisse und die Lesekompetenz der Probanden geachtet.
Insgesamt wurde eine Stichprobe mit N=87 erhoben. Von diesen wurden 21 Probanden von der Untersuchung ausgeschlossen. Dies lag an fehlenden Daten, Bestätigungen von Ausschlusskriterien, Testabbrüchen oder starken Artefakten in den Audioaufnahmen. Somit liegt der Gesamtstichprobenumfang bei 66 Probanden. Die Stichprobe ist damit größer im Vergleich zu Studien des aktuellen Forschungsstandes (Garcia-Toro et al., 2000). In der EG befinden sich 47 Prozent (n=31) und in der KG 53 Prozent (n=35) der Probanden. Dies entspricht einer effektiven Rücklaufquote gleich 5.25 Prozent von 590 kontaktierten Kliniken, Fachärzten, Therapeuten, Institutsambulanzen, Sozialpsychiatrischen Zentren und Beratungsstellen.
56.1 Prozent der Versuchsteilnehmer sind weiblich (n= 37) und 43.9 Prozent männlich (n= 29). Die Probanden sind zwischen 9 Jahre und 12 Jahre alt (M= 10.37, SD= 1.114). Während 6.1 Prozent (n= 4) in einem Förderzentrum beschult werden, besuchen 45.5 Prozent (n= 30) der Probanden die Grundschule, 6.1 Prozent (n= 4) die Mitteschule, 7.6 Prozent (n= 5) die Realschule, 21.2 Prozent (n= 14) das Gymnasium, 4.5 Prozent (n= 3) die Montessori-Schule und 9.1 Prozent (n= 6) eine Gesamtschule.
Im arithmetischen Mittel wohnen die Probanden der KG in Orten mit 26650 Einwohnern (SD= 45753) und die Probanden der EG in Orten mit 115659 Einwohnern (SD= 181494). Das Alter der Probandenmütter lag im Mittel in der KG bei 42.74 Jahren (SD= 5.94) und in der EG bei 39.19 Jahren (SD= 4.49). Im Diagnosespektrum der EG fanden sich gemäß ICD-10 Anpassungsstörungen mit depressiver Reaktion als F43.20 (n= 11; 35.5% der EG) und F43.21 (n= 8; 25.8% der EG) sowie depressive Episoden als F32.0 (n= 3; 9.7% der EG) und F32.1 (n=9; 29.0% der EG).
3.3 Durchführung
Die Empfehlungen für den in der Studie verwendeten Vorlesetext gab Kranich (2016a). Für den Altersbereich der Probanden wurde seinerseits die folgende Fabel empfohlen: „Der Fuchs und die Trauben“. Diese wird dem griechischen Dichter Äsop zugeschrieben. Für die vorliegende Studie wurde gemäß der Empfehlung von Kranich (2016b) eine Fassung frei nach Äsop verwendet (vgl. Äsop, 2018).
Durch die Beratung von Reimann (2016) wurde der Originaltext in mehreren Fällen ersetzt, um eine zeitgemäße und altersadäquate Textrezeption für die Kinder im Alter von neun bis zwölf Jahren zu gewährleisten (mündliche Mitteilung Reimann, 2016).
In dem genannten Text wurden zum Zweck der Optimierung der Textverständlichkeit einige Worte ersetzt. So wurde aus „empor“ „hoch“, aus „verächtlich“ „ablehnend“ und aus „hochmütiges“ „stolzes“. Als explorative Vorstudie wurden in Einzelfällen einige Kinder gebeten, den Originaltext und den abgeänderten Text zu lesen. Vor allem die Kinder im Alter von neun Jahren meldeten zurück, dass ihnen sowohl das Vorlesen des Textes wie auch das Textverständnis bei dem modifizierten Text leichter gelänge als bei der ursprünglichen Textfassung.
Um Artefakte bei der Aufnahme zu vermeiden, wurde das Instruktionsblatt mit dem Vorlesetext laminiert und bei jeder Untersuchungsdurchführung vor den Probanden auf den Tisch gelegt sowie dort fixiert.
Die Entscheidung für den Einsatz von Selbstbeurteilungsfragebögen ergab sich nicht zuletzt durch das Phänomen des „underreporting“ von Bezugspersonen bei der Fremdbeurteilung (vgl. Rossmann, 2014, S.49). Daher kamen als Selbstbeurteilungsfragebögen das DIKJ und der DTK-II zum Einsatz.
3.4 Auswertungsmethoden
Die unterstützende Beratung bei der phonetischen Auswertung erfolgte durch Mayer (2018) sowie die statistische Beratung durch Mentorium (2018) sowie Smigierski (2018).
Die phonetische Auswertung der Audiodaten im WAV-Format wurde mit dem Programm Praat® durchgeführt. Hierbei wurde ein spezielles Skript für diese Studie zur Erstellung eines Sprechstimmprofils erstellt und bei der Auswertung verwendet. Die abhängigen Variablen wurden entsprechend dem aktuellen Forschungsstand in das Skript aufgenommen (vgl. Stang & Schleider, 2018). In Anlehnung an Strassen (1995), Garcia-Toro et al. (2000), Aderhold (2005) und Nilsonne (1998) sowie Mayer (2017a, 2017b) zeigten sich die in dem Skript aufgenommenen Variablen für die Studie als zielführend sowie für die Auswertung als technisch möglich.
Zugehörig zu den sprechstimmlichen Merkmalen wurden folgende Kategorien/Akzente der gesprochenen Sprache untersucht:
1. das Tempo u.a. über die Wort- und Silbengeschwindigkeit und die Tonhaltedauer,
2. die Melodie über beispielsweise den Tonhöhenmittelwert und
3. die Dynamik/Intensität u.a. über die mittlere Lautstärke.
Alle Variablen sind intervall- oder verhältnisskaliert. Denn das Tempo wurde aus der Dauer abgeleitet u.a. beispielsweise in Sekunden (s), die Frequenz in Hertz (Hz) und die Dynamik/Intensität in Dezibel (dB) gemessen. Im Folgenden findet sich eine Auflistung der abhängigen Variablen.
Tab. 1.: Variablen der sprechstimmlichen Merkmale
Das Trimming bei der Variable Dauer nach Trimming (DTr) erfolgte gemäß Empfehlungen von Alghowinem et al. (2013) zur Verwendung schmaler Ausschnitte aus Audiodateien.
Die Depressivität wurde durch die Variablen
1. dysphorische Stimmung und Selbstwertprobleme,
2. agitiertes Verhalten,
3. Müdigkeit und autonome Reaktionen sowie
4. Schwere der depressiven Symptomatik erhoben.
Die ersten drei genannten Variablen wurden nominalskaliert erfasst und entsprechen den gleichnamigen Skalen des DTK-II. Die letztgenannte Variable ist ordinalskaliert und wird durch den Gesamtwert des DIKJ erhoben. Die psychometrischen Skalen der zwei verwendeten Depressionsfragebögen kamen aufgrund der hinreichenden gut erfüllten Gütekriterien der klassischen Testtheorie in Frage.
Als Kontrollvariablen wurden die soziodemografischen Daten Alter, Geschlecht, Schultyp, Jahrgangsstufe, Alter der Mutter, Größe des Wohnortes und fünfstelliger F-Schlüssel der Diagnose gemäß ICD-10 (Internationale statistische Klassifikation der Krankheiten) erhoben. Zudem hat die Erhebung der unten genannten vier Variablen der Depressivität (unabhängige Variablen) ebenfalls Kontrollcharakter bei der KG.
Nach der phonetischen Auswertung fand eine Plausibilitätsprüfung statt, indem einzelne randomisiert ausgewählte Datensätze händisch erneut ausgewertet wurden. Bei der Auswertung wurde der Pitch Range automatisch bestimmt.
Die Datensätze zu den pseudonymisierten soziodemografischen Angaben, Fragebogenergebnissen und den Audioaufnahmen wurden gespeichert und in die Statistikprogramme IBM SPSS Statistics 24 und Jasp exportiert. Anschließend wurden die Datensätze bereinigt sowie sämtliche Skalensummenwerte berechnet. Bei der Bereinigung wurden alle nicht auszuwertenden Datensätze extrahiert. Bei der Auswertung des DIKJ und des DTK-II wurden die Durchführungs-, Auswerte- und Interpretationshinweise der jeweiligen Manuale beachtet. Nachdem alle Variablen berechnet waren, erfolgte die Erstellung der deskriptiven Statistik. Explizit wird darauf hingewiesen, dass die hier präsentierten Ergebnisse deskriptiv-explorativen Charakter aufweisen. Die inferenzstatistische Auswertung ist in Planung.
4 Erste Ergebnisse
Einleitend können die Ergebnisse der vorliegenden Studie mit den sprach-, sprech- und kommunikationswissenschaftlichen sowie psychologischen Grundlagen erörtert werden.
Bußmann (2008) erörtert als Funktion der nonverbalen Kommunikation unter anderem auch die Substitution und die Amplifikation. Für die performative Sprechweise von Menschen mit einer depressiven Störung können diese beiden Funktionen insbesondere in der Form betrachtet werden, dass durch die Sprechstimme der Bedeutungsinhalt der Selbstoffenbarung (Schulz von Thun, 2008) z.B. die Emotionsexpression, transportiert wird und der Empfänger einen Eindruck zur emotionalen Befindlichkeit des Senders bekommt. In diesem Zusammenhang kann die langsamere Sprechgeschwindigkeit inklusive der Pausendauer von Kindern mit einer depressiven Störung in Beziehung mit dem ersten Axiom Watzlawicks, Beavin & Jackson (2011) gebracht werden. Mit den Mitteln des zögernden Sprechtempos, der Pausenzeiten und der Stille wird somit kommuniziert. Was kommuniziert wird, kann als Symbol-, Symptom- oder Signalcharakter interpretiert werden (vgl. Bender, 2014; Bühler, 1969).
Vor allem im spontanen Sprechen der Probanden zeigt sich, dass die Kriterien für gesprochene Sprache laut Kessel & Reimann (2017) erfüllt werden. Beim Vorlesen, Zählen sowie den Reproduktionen der Einzellaute kam es beispielweise zu Abbrüchen oder Wiederholungen. Der Phonations- und Artikulationsprozess weist gemäß Lemke (2006) sowie Fiukowski (2004) einen Komplex sprecherischer Gestaltungsmittel auf. Dabei ist nicht trennscharf zu beurteilen, welche dieser Gestaltungsmittel in den melodischen, temporalen oder dynamischen Akzent fallen (Allhoff & Allhoff, 2016; Nawka & Wirth, 2008). Es ergeben sich fließende Übergänge zwischen den Akzenten sowie der Zuordnung einzelner Parameter zu mehreren Akzenten, z.B. Amplitudendifferenz zwischen den ersten beiden Harmonischen des Sprachsignals (H1-H2), Shimmer, Smoothed cepstral peak prominence (cpps), Tilt (t) und Harmonics-to-Noise-Ratio (hnr). In allen Fällen beziehen sich die erhobenen Parameter des Sprechens auf stimmliche Merkmale.
Ziel der Untersuchung war es, stimmliche Merkmale von Sprechern mit einer depressiven Störung zu identifizieren. Eine grundlegende Überlegung war es in diesem Zusammenhang durch eine Optimierung der Depressionsdiagnostik mittels ergänzender Sprechstimmanalyse Patienten frühzeitig den Zugang zu einer Therapie zu ermöglichen. Die phonetische Analyse mit dem Programm Praat stellte sich dabei allgemein als gültig, zuverlässig, objektiv und ökonomisch heraus. Diesbezüglich können die Erfahrungen mit dem Programm in der bisherigen Forschung bestätigt werden (Tóth et al., 2018). Bei der Auswertung der Parameter zur Dauer kann auf Folgendes hingewiesen werden. Die Dauer der gesamten Audiodatei (durationTotal) beinhaltet auch die Stillephasen am Anfang und am Ende. Durch ein Trimming entsprechend dem Intensitätsverlauf wurden die genannten Stillephasen ausgeschlossen. Somit wird die reine Äußerungsdauer analysiert. Für das Vorlesen, Zählen und freie Sprechen ist diese Dauer die Basis für die Sprechgeschwindigkeitsmessung. In diese sind die Pausen innerhalb der Äußerung inbegriffen. Bei den gehaltenen Lauten entspricht die Trimmdauer der Haltedauer. Die Analysedauer gibt schließlich die Dauer des Signalabschnitts an, der tatsächlich in die Stimm- und Intensitätsanalyse eingeht. Bei den gehaltenen Lauten wurden am Anfang und am Ende je 10% bezogen auf die Trimmdauer abgeschnitten, um die Ein- und Ausschwingphase zu eliminieren.
4.1 Sprechstimmliche Unterschiede zwischen Kindern mit und ohne depressive Störung
Die Ergebnisse der vorliegenden Studie zeigen Unterschiede zwischen Kindern mit und ohne depressive Störung. Beispielsweise zeigen sich in der Gruppe der Kinder mit einer depressiven Störung Unterschiede in der Dauer, die Sprechgeschwindigkeit, die Amplitudendifferenz, der niedrigste Ton, Jitter und Shimmer, Harmonics-to-Noise Ratio, die spektrale Neigung, der Intensitätsmittelwert sowie die Stimmqualität. Dadurch kann festgehalten werden, dass die Gruppe der Kinder mit einer depressiven Störung insgesamt langsamer, mit mehr Pausen, leiser, tendenziell behauchter sowie einer geringeren Stimmqualität als die gesunde KG spricht. Kinder mit einer depressiven Störung besitzen ein tendenziell stärker geneigtes Spektrum (Slope) als Kinder ohne eine depressive Störung. Zudem ergaben sich interindividuelle Unterschiede sowie Unterschiede hinsichtlich der einzelnen Sprechmodalitäten, also es gab Unterschiede zwischen dem Vorlesen, dem Sprechen von Lauten, dem Zählen und dem spontanen Sprechen (s.u.).
4.2 Sprechstimmliche Unterschiede zwischen Erwachsenen und Kindern mit depressiver Störung
Werden die Ergebnisse des aktuellen Forschungsstandes mit denen der vorliegenden Studie verglichen, fällt auf, dass sich in der hier vorliegenden Studie auch andere Parameter zwischen der EG und KG unterscheiden als im bisherigen Forschungsstand. Das bedeutet, dass sich für Kinder mit einer depressiven Störung auch Unterschiede in anderen Parametern ergeben als bei erwachsenen Sprechern mit einer depressiven Störung, z.B. hinsichtlich der spektralen Parameter der Stimmqualität und der Harmonizität. Parallelen zum bisherigen Forschungsstand ergeben sich jedoch auch, z. B. hinsichtlich der Parameter der Temporalität (Alghowinem et al., 2013; Bitouk, Nenkova & Verma, 2010; Krajewski, 2008; Rathert, 2006; Redecker, 2008). Sowohl die Analyse der Melodik, der Lautheit, des Tempos sowie der Stimmqualität stellten sich als zielführend heraus. Auch für Jitter und Shimmer ergaben sich differenzierte Ergebnisse. In der bisherigen Forschung ergaben sich insgesamt jedoch auch wiederholt differenzierte Sprechstimmprofile von Menschen mit depressiven Störungen. Bei Strassen (1995) konnten beispielsweise, anders als teilweise bei Garcia-Toro et al. (2000) oder Aderhold (2005), keine signifikanten Unterschiede für die mittlere Pausendauer, Pausen pro Sekunde, mittlere Sprechabschnittlänge und die mittlere F0-Kontur erzielt werden. Die bisherige Forschung konnte für Erwachsene mit einer depressiven Störung folgende Charakteristika sprechstimmlicher Merkmale finden:
- Verringerung der Tonhöhenvariabilität, der Intensität und der Dauer,
- Erhöhung der Pausen- und der Reaktionszeiten,
- Änderung der Energieverteilung
(Hoffmann, Gonze & Mendlewicz, 1985; Nilsonne, 1998; Strassen, 1988). „Üblicherweise wird bei Patienten mit einer Depression in der Stimme eine Verringerung der Tonhöhenvariabilität, der Intensität und der Dauer gefunden (vgl. Nilsonne, 1998; Strassen, 1988). Daneben zeigt sich häufig eine Erhöhung der Pausen- und der Reaktionszeiten, eine Verringerung der Stimmintensität, eine Änderung der Energieverteilung über verschiedene Frequenzbänder hinweg sowie eine Erhöhung der stimmlosen Pausendauer“ (Hoffmann et al., 1985).
Zusammengefasst konnte in der bisherigen Forschung vielseitig eine insgesamt geringere Ausprägung prosodischer Merkmale bei Erwachsenen mit einer depressiven Störung festgestellt werden. Hinsichtlich der unterschiedlichen Ergebnisse von Erwachsenen und Kindern mit einer depressiven Störung wird diesbezüglich ein Interaktionseffekt hinsichtlich der Variable Alter bzw. Entwicklung vermutet.
4.3 Sprechstimmprofile der Kinder mit einer depressiven Störung im Vergleich zu Kindern ohne depressive Störung
Die einzelnen Sprechstimmprofile der Kinder mit einer depressiven Störung können folgendermaßen beschrieben werden. Diese Befunde sollten vorsichtig als Tendenzen auf rein deskriptiver Basis interpretiert werden (M= Mittelwert, MD= Mittelwertdifferenz zwischen EG und KG).
Beim Vorlesen weisen Kinder mit einer depressiven Störung eine niedrigere Sprechgeschwindigkeit im Sinne von Silben pro Sekunde sowie Wörter pro Minute auf (SPS: M=2.77 Silben pro Sekunde, MD=-0.48 Silben pro Sekunde; WPM: M=110.42 Wörter pro Minute, MD=-18.94 Wörter pro Minute). Sowohl die Dauer der gesamten Audioaufnahme (DT) als auch die Dauer nach Trimming (DTr) ist bei der EG länger (DTr: M=52.83 s, MD=9.14 s). In der EG gibt es größere interindividuelle Unterschiede in der Gruppe als in der KG bezogen auf die Parameter der Dauer. Im Mittel ist die Audioaufnahme von Kindern mit einer depressiven Störung beim Vorlesen länger trotz einer niedrigeren Sprechgeschwindigkeit als bei der KG. Dies spricht für eine zögerlichere Sprechweise mit größeren Pausendauern und/oder häufigeren Pausen. Auch zeigt sich eine größere Amplitudendifferenz (hh: M=1.08 dB, MD=1.9 dB), also das Verhältnis von offenen und geschlossenen Phonationsphasen, sowie eine geringere spektrale Neigung (Slope) (s: M=-23.51 dB, MD=-0.65 dB). Nach Mayer (2017b) kann daher die Stimme tendenziell als weniger tragfähig beurteilt werden. Die Amplitudendifferenz der Kinder mit einer depressiven Störung kann im Verhältnis zur KG als eine Tendenz zu einer behauchten Stimme interpretiert werden. Es ergab sich ein kleinerer Pitchmittelwert (MP: M=243.20 Hz, MD=-5.82 Hz), -standardabweichung (SP: M=28.270 Hz, MD=-3.5 Hz), -minimum (MinP: M=167.02 Hz, MD=-4.08 Hz) und -maximum (MaxP: M=460.2 Hz, MD=-41.74 Hz). D.h. es finden sich insgesamt geringere Werte der Tonhöhenparameter. Auch zeigt sich beim Vorlesen der EG ein geringer Stimmumfang (rH: M= 293.18 Hz; MD=-37.66 Hz; rS: M= 17.11 Halbtöne, MD=-1.08 Halbtöne). Die objektive Stimmqualität kann gemäß Smoothed cepstral peak prominence (cpps) um 0.97 dB als schlechter interpretiert werden (cpps: M=9.88 dB, MD=-0.97 dB). Dies kann auch im Zusammenhang mit der Behauchungsdimension verstanden werden. Gemäß Mayer (2017b) besteht eine Korrelation zwischen cpps und Behauchung. Im Bereich der Perturbation kann ein geringeres Verhältnis von harmonischen zu Geräuschanteilen (Harmonics-to-noise Ratio) (hnr: M=15.00 dB, MD=-0.35 dB) sowie ein erhöhter Jitter (JL: M= 1.66 %, MD=0.04 %) und Shimmer (SL: M=10.56 %, MD=0.35 %) bei den Kindern mit einer depressiven Störung festgestellt werden. Bei extremen Werten würde dbzgl. der Höreindruck der Heiserkeit entstehen. Die Intensität ist im Mittel um 2.77 dB geringer bei Kindern mit einer depressiven Störung (meanI: M=57.42 dB, MD=-2.77 dB). Es zeigt sich zudem ein geringeres Intensitätsminimum (minI: M=40.02 dB, MD=-1.78 dB) und ein niedrigeres Intensitätsmaximum (maxI: M=67.49 dB, MD=-2.85 dB).
Das Sprechen des Langvokals /a:/ ist bei den Kindern mit einer depressiven Störung durch folgende Merkmale gekennzeichnet: längere Haltedauer (DTr: M=4.03 s, MD=1.52 s), einer größeren Amplitudendifferenz (hh: M=4.33 dB, MD=2.59 dB), geringerem Pitchmittelwert (MP: M=225.72 Hz, MD=0.31 Hz) bei gleichzeitig größerer Standardabweichung (SP: M=5.45 Hz, MD=0.11 Hz), kleinerem Pitchminimum (MinP: M=213.03 Hz, MD=-1.93 Hz), größerem Pitchmaximum (MaxP: M=246.09 Hz, MD=3.05 Hz), größerem Stimmumfang (rh: M=33.06 Hz, MD=4.98 Hz; rS: M=2.54 Halbtöne, MD=0.23 Halbtöne), geringerem Jitter (JL: M=0.69 %, MD=-0.02 %) und größerem Shimmer (SL: M=7.4 %, MD=1.14 %), geringere spektrale Neigung (Slope) (s: M=-16.71 dB, MD=-1.42 dB), geringere Smoothed cepstral peak prominence (cpps: M=10.91 dB, MD=-1.19 dB), geringere Harmonics-to-noise Ratio (hnr: M=16.11 dB, MD=-0.73 dB) geringerer Intensitätsmittelwert (meanI: M=47.04 dB, MD=-7.24 dB) und größere -standardabweichung (sdI: M=7.51 dB, MD=4.37 dB), größerem Intensitätsminimum (minI: M=44.77 dB, MD=0.23 dB), kleineren Intensitätsmaximum (maxI: M= 56.69 dB, MD=-1.47 dB) und größerem Acoustic Voice Quality Index (avqi: M=5.13 Punkte; MD=0.44 Punkte). Es zeigt sich somit zusammenfassend ein längeres Phonieren, eine geringere Tonhöhe mit interindividuell größeren Unterschieden, ein geringerer Stimmumfang und eine geringere Lautstärke mit einer Tendenz zur Mitte hinsichtlich des Minimums und des Maximums sowie eine geringere Stimmqualität (vgl. Mayer, 2017b).
Die Stimme der Kinder mit einer depressiven Störung ist beim Sprechen des Kurzvokals /a/ charakterisiert durch eine geringere Haltedauer (DTr: M=0.45 s, MD=-0.34 s) und größeren Amplitudendifferenz (hh: M=4.9 dB, MD=3.51 dB) als die KG, also kürzeres Lauten des Vokals mit längeren offenen als geschlossenen Phonationsphasen. Der Tonhöhenmittelwert zeigt sich höher (MP: M=224.94 Hz, MD=1.04 Hz) bei gleichzeitig höherer Standardabweichung (SP: M=9.97 Hz, MD=1.27 Hz), höherem Tonhöhenminimum (MinP: M=205.16 Hz, MD=1.44 Hz) und -maximum (MaxP: M=250.70 Hz, MD=3.1 Hz). Der Stimmumfang (rH: M=45.54 Hz, MD=1.66 Hz; rS: M=3.45 Halbtöne, MD=0.1 Halbton), Jitter (JL: M=1.59 %, MD=0.13 %) und Shimmer (SL: M=12.36 ‚%, MD=1.57 %) sind deskriptiv größer als in der KG. Sowohl die cpps (M=9.26 dB, MD=-0.46 dB) als auch die spektrale Neigung (Slope) (s: M=-15.92 dB, MD=-1.67 dB) sowie das hnr (M=11.12 dB, MD=0.54 dB) zeigt geringere Werte auf. Die Intensität weist einen höheren Mittelwert (meanI: M=52.32 dB, MD=0.21 dB) mit einer geringeren Standardabweichung (sdI: M=5.72 dB, MD=-1.38 dB), größerem Minimal- (minI: M=37.59 dB, MD=2.98 dB) und geringerem Maximalwert (maxI: M=56.21 dB, MD=-0.76 dB) auf. Beim Kurzvokal /a/ kann daher insgesamt eine schlechtere Stimmqualität sowie Tendenz zur Behauchung interpretiert werden. Es ergeben sich interindividuelle Unterschiede.
Beim Zählen von 21 bis 30 ergibt sich für die EG eine längere Dauer (DTr: M=11.75 s, MD=1.89 s) und eine geringere Sprechgeschwindigkeit (SPS: M=3.46 Silben pro Sekunde, MD=-1.7 Silben pro Sekunde; WPM: M=53.15 Wörter pro Minute, MD=-26.19 Wörter pro Minute). Kinder mit einer depressiven Störung zählen also langsamer als die Kinder ohne depressive Störungen. Es zeigt sich eine höhere Amplitudendifferenz (hh: M=3.24 dB, MD=1.38 dB), geringere mittlere Tonhöhe (MP: M=229.13 Hz, MD=9.01 Hz) mit höheren Standardabweichung (SP: M=18.95 Hz, MD=3.56 Hz), geringerem Pitchminimum (MinP: M=167.02 Hz, MD= -15.11 Hz) und -maximum (MaxP: M=318.8 Hz, MD=-10.57 Hz), höherem Stimmumfang (rH: M= 151.78 Hz, MD=4.54 Hz; rS: M=11.36 Halbtöne, MD=1.14 Halbtöne), höhere Jitter- (JL: M=1.85 %, MD=0.24 %) und Shimmerwerte (SL: M=10.81 %, MD=1.34 %), einer geringeren cpps (cpps: M=8.89 dB, MD=-1.17 dB) und spektrale Neigung (Slope) (s: M=-23.98 dB, MD=-0.49 dB), höheren hnr (hnr: M=14.22 dB, MD= -1.55 dB) sowie geringerem Intensitätsmittelwert (meanI: M=51.94 dB, MD=-1.68 dB), -minimum (minI: M=37.27 dB, MD= -0.6 dB) und -maximum (maxI: M=59.91 dB, MD=-1.22 dB). Die Stimmqualität kann beim Zählen als schlechter befundet werden. Somit lassen sich in den Stimmen der Kinder mit einer depressiven Störung mehr Unregelmäßigkeiten wiederfinden.
Die Haltedauer (DTr: M=3.73 s, MD=-0.16 s) ist bei der EG beim gesprochenen Nasal /m/ geringer als bei der KG. Es findet sich eine größere Amplitudendifferenz (hh: M=13.82 dB, MD=1.44 dB), ein geringeren Pitchmittelwert (MP: M=233.46 Hz, MD=-4.4 Hz), größere Pitchstandardabweichung (SP: M=17.89 Hz, MD=-3.53 Hz), größeres Pitchminimum (MinP: M=203.35 Hz, MD=9.59 Hz) und kleineres Pitchmaximum (MaxP: M=265.72 Hz, MD=-11.25 Hz). Der Stimmumfang (rH: M=62.37 Hz, MD=-20.84 Hz; rS: M=4.61 Halbtöne, MD=-1.6 Halbtöne), Jitter (JL: M=0.62 %, MD=-0.48 %) und Shimmer (SL: M=4.93 %, MD=-1.66 %) sind geringer. Die cpps (cpps: M=10.99 dB, MD=0.02 dB) sowie hnr (hnr: M=24.04 dB, MD=2.36 dB) fallen größer aus. Das heißt, es finden sich entgegen der Erwartung verhältnismäßig weniger Geräuschanteile, mehr harmonische Anteile, und es kann von einer insgesamt besseren Sprechstimmqualität beim Sprechen des Nasals /m/ ausgegangen werden.
Das spontane Sprechen der Kinder mit einer depressiven Störung fällt entgegen der Erwartung durch eine längere Sprechdauer (DTr: M=9.64 s, MD= 7.34 s) auf. Es ergibt sich eine höhere Amplitudendifferenz (hh: M=1.81 dB, MD=0.65 dB). Der Tonhöhenmittelwert (MP: M=228.8 Hz, MD=-9.65 Hz) fällt bei einer größeren Standardabweichung (SP: M=26.32 Hz, MD=1.73 Hz) geringer aus. Das Tonhöhenminimum (MinP: M=175.26 Hz, MD=-11.37 Hz) ist niedriger und das -maximum (MaxP: M=321.92 Hz, MD=9.38 Hz) größer. Der Stimmumfang fällt größer aus (rH: M=146.66 Hz, MD=20.75 Hz; rS: M=10.44 Halbtöne, MD=1.56 Halbtöne). Es findet sich ein gleich großer Jitter (JL: M=1.95 %) und ein größerer Shimmer (SL: M=12.13 %, MD=1.02 %). Der cpps fällt geringer aus (cpps: M=8.57 dB, MD=-1.26 dB). Die Intensitätsparameter sind allesamt geringer (meanI: M=53.06 dB, MD=-3.06 dB; minI: M=41.56 dB, MD=-2.26 dB; maxI: M=59.37 dB, MD=-2.91 dB). Die Sprechstimmqualität sowie die Harmonizität wird bei dem vorliegenden Befund bei der EG als geringer im Vergleich zur KG interpretiert (hnr: M=13.64 dB, MD=-0.51 dB).
4.4 Sprechstimmprofile der Erwachsenen mit einer depressiven Störung im Vergleich zu Kindern mit einer depressiven Störung
Aufgrund der Methodendiversität der Studien können keine Sprechstimmprofile von Erwachsenen mit einer depressiven Störung und Kindern mit einer depressiven Störung erstellt werden. Das Verwenden unterschiedlicher Mikrofone bei der Untersuchungsdurchführung bei den verschiedenen Studien führt zu Verzerrungen und ermöglicht dadurch keinen direkten Vergleich der spezifischen Ergebnisse.
Festgehalten werden kann auch, dass sich für Kinder bei den unterschiedlichen Sprechmodalitäten differenzierte Befunde finden lassen. Vor allem ergeben sich z. B. unterschiedliche Befunde hinsichtlich der (Halte-)Dauer, dem verwendeten Tonhöhenumfang, Jitter und Shimmer oder den Intensitätsparametern zwischen dem Vorlesen, dem Sprechen einzelner Laute, dem Zählen oder dem freien Sprechen.
4.5 Depressivität und sprechstimmliche Merkmale
Der Zusammenhang zwischen der Depressivität und den sprechstimmlichen Merkmalen ist noch nicht abschließend untersucht. Daher folgt im nächsten Abschnitt eine Abhandlung zu den vermuteten Zusammenhängen.
4.6 Aprosodisches Syndrom
In Verbindung mit den vermuteten Korrelationen der sprechstimmlichen Merkmale mit der Symptomatik und Schwere der Depressivität wird das folgende Konzept im Sinne einer „depressiven Stimme“ (Strassen, 1995) oder der „Aprosodie“ (Garcia-Toro et al., 2000) vorgestellt.
Aufgrund der komplexen Zusammensetzung des „depressiven“ Sprechstimmprofils aus mehreren phonetischen Parametern im Sinne verschiedener (Symptom-)Kriterien wird der Begriff eines „aprosodischen Syndroms“ vorgeschlagen. Dies ließe sich durch die Kriterien der Parameter kennzeichnen, bei denen Unterschiede zwischen der EG und KG bestünden. Das aprosodische Syndrom könnte in dem Sinne verstanden werden als das Zusammentreffen mehrerer Ausprägungen der Sprechstimme entsprechend dem depressiven Sprechstimmprofil. Damit entspräche das genannte Syndrom der Logik der ICD-10 hinsichtlich eines somatischen Syndroms. Die spezielle Bedeutung liegt in der Clusterung der Depressionsmarker bezogen auf Merkmale der Sprechstimme. Angelehnt an Merkel & Voigt-Zimmermann (2011) könnte durch die Diagnostik eines aprosodischen Syndroms die Indikation zu einem Stimmtraining gestellt werden, welches eine Psychotherapie begleitet, ergänzt und unterstützt. Merkel & Voigt-Zimmermann (2011) stellten auch einen positiven Einfluss von (Sprech-) Stimmübungen auf die Psyche fest. Die Bestimmung der Anzahl der Symptome, bzw. hier sprechstimmlichen Merkmale mit depressiver Profilentsprechung, zum Vorliegen des Syndroms gemäß ICD-10 könnte ein Anliegen der zukünftigen Forschung sein. Hingewiesen wird darauf, dass bei dem aprosodischen Syndrom von keinem psychosomatischen Charakter a priori ausgegangen werden kann, da keine körperliche Krankheit (z. B. Dysphonie) ohne organisches Korrelat per se vorliegt.
4.7 Sprechstimmanalysen und neue Medien im Rahmen der Psychotherapie
Mit der hier aufgezeigten Untersuchung kann festgestellt werden, dass Sprechstimmanalysen nicht nur eine zurückreichende Tradition besitzen, sondern dass auch vielfältige Einsatzmöglichkeiten in der Gegenwart bestehen sowie die zukünftige Forschung vielfältige Anknüpfungspunkte findet, um die Sprechstimmanalyse für neue Anwendungsfelder und neue Technologien voranzutreiben. Die Aussage, dass bisher objektive, systematische effiziente Methoden zur Diagnostik einer depressiven Störung fehlen, die Verhaltensbeobachtungen einbeziehen sowie Indikatoren für das Bestehen einer depressiven Störung sowie der Schwere einer depressiven Störung beinhalten, sollte zukünftig obsolet sein. Nun gilt es, neue Psychodiagnostika zu entwickeln, die die bisherigen Instrumente ergänzen.
Die vorliegende Untersuchung konnte hierzu einen Beitrag leisten. Im Sinne eines Profils konnte die Sprechstimme von Kindern mit einer depressiven Störung näher beleuchtet und beschrieben werden. Es kann u. a. Liu, Li, Gao, Wang & Yang (2017) sowie Dibeklioğlu, Hammal & Cohn (2018) zugestimmt werden, dass grundsätzlich das Erkennen einer depressiven Störung über Verhaltensindikatoren, wie hier über Indikatoren der Sprechstimme, möglich ist.
Grundsätzlich ist es denkbar, eine standardisierte Erfassung von Merkmalen der Sprechstimme hinsichtlich psychischer und psychopathologischer Konstrukte zu realisieren. Zur Ermittlung eines Sprechstimmprofils sind ähnliche Voraussetzungskriterien zu stellen wie bei anderen psychodiagnostischen Instrumenten. Neben der konzentrativen Leistungsfähigkeit, der Auffassungsgabe und ausreichenden Kompetenzen im Vorlesen kann das Leseverständnis sowie ein Mindestmaß an intellektueller Leistungsfähigkeit als Voraussetzung proklamiert werden (Böhme & Stuchlik, 1995). Zur Gewinnung des Datenmaterials werden entsprechend Mendiratta et al. (2018) das reproduzierte Sprechen von Texten (Vorlesen) und spontane Sprechen empfohlen. Aus der hier vorliegenden Studie kann zudem das Zählen von 21 bis 30 sowie grundsätzlich das Sprechen von Einzellauten angeraten werden. Entsprechend Alghowinem et al. (2013) wird die Verwendung eher schmaler Ausschnitte der Audioaufnahmen nahegelegt. Hierzu kann ein Trimming vorgenommen werden.
Aufgrund der Methodendiversität in der bisherigen Forschung sei auf eine Vereinheitlichung des Erhebungssettings von phonetischen Untersuchungen sowie Untersuchungen zur Psychoakustik hingewiesen. Einen Ansatz zur Vereinheitlichung verfolgt beispielsweise AVEC (vgl. Ringeval et al., 2017; SSPNET, 2018).
Gemäß einer Mitteilung der Psychotherapeutenkammer Nordrhein-Westfalen im Psychotherapeuten-Journal im März 2018 über das „Internet in der Psychotherapie“ kann die „Integration von neuen Medien in den psychotherapeutischen Alltag“ auf vielfältigen Ebenen geschehen[2]. Bis zu 81 Prozent der Einwohner der BRD würden den Einsatz neuer Medien und künstlicher Intelligenz in der Medizin begrüßen (vgl. Gießelmann, 2018a). Mittlerweile gibt es eine Reihe von Studienvorhaben, die sich mit künstlicher Intelligenz im Bereich der Medizin beschäftigen (vgl. Just et. al, 2017). Auch können bereits mannigfache Produkte auf dem Markt gesichtet werden (Beerheide, 2018; Gertz & Schneider, 2018). U.a. gibt es eine Smartphone Applikation für Jugendliche mit einem erhöhten Psychoserisiko (vgl. Traber-Walker, Walitza & Franscini, 2018).
[2] In diesem Zusammenhang sei auf eine Publikation zum Thema Selbsthilfeplattform im Internet für Menschen mit Essstörungen und deren Angehörigen verwiesen (Reimann, 2018).
4.8 Limitationen
Im Sinne von Limitationen kann angemerkt werden, dass die Artikulationspräzision in der vorliegenden Untersuchung nicht beachtet wurde. Diese kann jedoch laut Kranich (2018) eine erfolgsversprechende Variable bei der Untersuchung von Gruppenunterschieden zwischen Kindern mit und ohne eine depressive Störung sein. Es kann darauf hingewiesen werden, dass die Artikulationspräzision aus Gründen des quantitativen Forschungsdesigns in Verbindung mit der Einhaltung der Gütekriterien der Repräsentativität und der Testökonomie keine Beachtung geschenkt wurde. Zum einen könnte sich die zukünftige Forschung der Artikulationspräzision mit einer explorativen Untersuchung über ein qualitativ-auditives Forschungsdesign annehmen. Dabei wäre eine Beschreibung des Höreindrucks von klinisch geschulten Phonetikern und Sprechwissenschaftlern denkbar. Zum anderen wäre eine Quantifizierung der Artikulationspräzision für die zukünftige Forschung über beispielsweise das Spektrogramm oder die Formanten möglich. In allen Fällen wäre ein anderes Forschungsdesign als das hier vorliegende notwendig. Zielführend erscheint die Verwendung eines Vorlesetextes, der phonostilistische Differenzierungsmöglichkeiten bietet (vgl. Krech, Stock, Hirschfeld & Anders, 2009).
5 Ausblick
Die Arbeit befasste sich mit dem Versuch, die Sprechstimme und Sprechweise von Kindern mit psychiatrischer Störung zu charakterisieren. Nachdem im theoretischen Rahmen versucht wurde, einen Einblick in die bisherige Forschung zu geben, die für diese Untersuchung relevant zu sein versprach, wurden in einem empirischen Teil auf dieser Grundlage Forschungsfragen gebildet. Zu deren Beantwortung wurden sprechstimmliche Unterschiede zwischen Kindern mit und Kinder ohne eine depressive Störung im Sinne eines Profils charakterisiert. Damit beschäftigte sich die Untersuchung mit Phänomenen der Sprechstimme. Eine Korrelationsanalyse sowie eine Faktorenanalyse mit anschließender Signifikanzprüfung der Gruppenunterschiede (t-Test) stehen ggw. noch aus.
Möglicherweise könnte schlussendlich aus den Ergebnissen ein elektronisches Diagnostikinstrument entwickelt werden. Wilkes schlug diesbezüglich bereits die Entwicklung eines elektronischen Diagnosegeräts vor (vgl. Sample, 2000, S.17). Im Anschluss daran sollte der Versuch unternommen werden, die Spezifität und die Sensitivität eines solchen Instruments zu bestimmen. Die zukünftige Forschung sollte zeigen, welche technischen Möglichkeiten es für ein elektronisches Diagnoseinstrument auf Basis einer Sprechstimmanalyse gibt und wie dies in der Entwicklung umzusetzen ist. Hierbei gilt es auch die Herausforderung zu bewältigen, dass in der Praxis unterschiedlicher Mikrofone verwendet werden. Rechtliche sowie ethische Aspekte sollten bei der Entwicklung eines elektronischen Diagnoseinstruments beachtet werden.
Praat bietet bereits die Möglichkeit für eine vollautomatische Sprechstimmanalyse. Darauf aufbauend wäre der Transfer zur Diskrimination zweier Sprechstimmprofile – gesund vs. depressiv – nötig, um ein Programm oder eine Applikation zu entwickeln, welches vollautomatisch Sprechstimmleistungen in gesund versus depressiv kategorisieren könnte. Der vorliegende Beitrag zeigte die Sinnhaftigkeit und Zweckmäßigkeit einer solchen Applikation bzw. eines solchen Programmes auf. Grundsätzlich sei wiederholt darauf aufmerksam gemacht, dass eine solche Möglichkeit nicht die bisherige klassische Diagnostik ersetzen, sondern ergänzen soll (Kahl & Krüger-Brand, 2018). Auch die berechtigte ethische Kritik, einen Patienten gegen seinen Willen zu durchleuchten, stellt keinen intentionalen Gedanken der Grundidee einer solchen Applikation dar. Vielmehr erscheint es sinnhaft, eine Optimierung der Sensitivität und Spezifität in der Diagnostik von psychiatrischen Störungen zu erlangen und zuverlässige und genaue Diagnostika für „maskierte“ psychiatrische Störungsbilder zu entwickeln. Ein Grundproblem der Diagnostik im Kindesalter stellt häufig die noch nicht ausreichend entwickelte Kommunikationsfähigkeit von Kindern dar, wodurch sie häufig eigenes Erleben (noch) nicht (für Erwachsene verständlich) verbalisieren können. Aus diesen Überlegungen ergeben sich Anknüpfungspunkte zu einer Analyseapplikation, die im Bereich der Psychoakustik diagnostische Unterstützung bieten könnte. Dabei sollte stets das Persönlichkeitsrecht der Menschen gewahrt werden (vgl. Nagy, 2010). Der Einsatz obliegt dabei Fachpersonen mit entsprechender Expertise, die über die Erlaubnis und Kompetenz für die Diagnostik verfügen.
Vielfach wird über aktuelle Entwicklungen im Bereich der Telemedizin und computergestützten Verfahren wie Applikationen zu Spracherkennung etc. berichtet (Przybilla, 2017; Kahl & Krüger-Brand, 2018; Kuhn, Jungmann & Jungmann, 2018).
Explizit wird darauf hingewiesen, dass der Höreindruck der Audioaufnahmen täuschen kann. Daher ist der Einsatz apparativer Verfahren zur Sprechstimmanalyse empfehlenswert. Diese Empfehlung gilt nicht nur für die Erhebung eines sprechtherapeutischen Befundes, zur Evaluation eines Sprech- bzw. Stimmtrainings, sondern auch als ergänzendes Instrument für approbierte Psychotherapeuten und Ärzte im Rahmen der Depressionsdiagnostik. Letzteres darf verstanden werden als Ergänzung zur klassischen Psychodiagnostik, u.a. bestehend aus Anamnese, Exploration, Verhaltensbeobachtung und Testpsychologie. Durch den Einsatz apparativer Verfahren im Bereich der Psychoakustik wird ein Diagnostiker nicht abgelöst. Nach wie vor braucht es den Menschen und seine Expertise, um die analysierten Profile im komplexen Zusammenhang der Gesamtschau aller Befunde zu interpretieren. Schlussendlich werden die Entscheidungen, verbunden mit allen Konsequenzen, wie z.B. eine Diagnosestellung, von einem Menschen getroffen. Gemäß der „Empfehlung für den verantwortlichen Einsatz von KI (künstlicher Intelligenz) und automatisierten Entscheidungen“ des Bitkom (Bundesverband Informationswirtschaft, Telekommunikation und neue Medien e.V., 2018) sollte bei Entscheidungen immer die letzte Urteilsgewalt bei Ärzten und approbierten Psychotherapeuten bleiben (vgl. Gießelmann, 2018a, S.117).
Die zukünftige Forschung könnte an die hier vorliegende Studie anknüpfen und deren Design in modifizierter Form replizieren, um deren Ergebnisse zu überprüfen. Gemäß Kaunzner (2018) wäre hinsichtlich der zukünftigen Forschung ergänzend zu der vorliegenden Studie ein Forschungsdesing erfolgsversprechend, welches unterschiedliche dialektale und regiolektale Einflüsse berücksichtigt. Zudem kann die Beachtung eines Fremdspracheneinflusses sowie der Schulleistung, vor allem im Fach Deutsch, und eine Teilnahme am Chor bei der Stichprobenauswahl zu weiterführenden differenzierten Ergebnissen führen. Des Weiteren könnte die zukünftige Forschung Differenzierungen in der Untersuchungsdurchführung vornehmen, indem unterschiedliche Formen des Zählens sowie der Artikulation von Einzellauten Beachtung finden. Hinsichtlich des Zählens empfiehlt hierzu Kaunzner (2018) die Kadenzen zwischen den Zahlen zu kontrollieren. Eine getrennte Auswertung von terminal intonierten Zahlen und nicht terminal intonierten Zahlen wird zudem von Kaunzner (2018) angeraten. Auch kann durch die differenzierte Betrachtung der Artikulation der Einzellaut gewinnbringende Ergebnisse erzielen.
In der vorliegenden Studie wurden depressive Störungen als Oberbegriff diverser Diagnosen aus dem depressiven Formenkreis verstanden. Trotz teilweiser gemeinsamer Symptome ergeben sich syndromal große Unterschiede sowie Unterschiede im Schweregrad. Die zukünftige Forschung könnte an dieser Tatsache anknüpfen und Clusteranalysen zu Sprechstimmprofilen für einzelne Diagnosen vornehmen. Mittlerweile bieten digitale elektroakustische Verfahren vielfältige Anwendungsmöglichkeiten. Ein ethisch und datenschutzrechtlich adäquater Einsatz ist dabei als Mindestvoraussetzung an autorisierte Diagnostiker zu stellen.
Gemäß Puffer (2010) kann abschließend festgehalten werden, dass die Stimme unsere Stimmung offenbaren kann. Die Studie hat gezeigt, dass eine Analyse der Stimme auch zum Zwecke der Psychodiagnostik bei depressiven Störungen zielführend eingesetzt werden kann.
6 Literaturverzeichnis
Aderhold, M. (2005): Sprache und Depression – Sechs Parameter zur Untersuchung depressiver Stimmungen in der Sprache. Dissertation. Frankfurt am Main: Johann Wolfgang-Goethe-Universität.
Alghowinem, S., Goecke, R., Wagner, M., Epps, J., Breakspear, M. & Parker, G. (2013): Detecting depression: A comparison between spontaneous and read speech. IEEE International Conference on Acoustics, Speech and Signal Processing, S. 7547-7551.
Allhoff, D.-W. & Allhoff, W. (2016): Rhetorik & Kommunikation: Ein Lehr- und Übungsbuch (17. Aufl.). München: Reinhardt.
Äsop (2018): Der Fuchs und die Trauben. Verfügbar unter: http://www.sos-halberstadt.bildung-lsa.de/fabeln/pdf/DerFuchsunddieTrauben.pdf Stand: 20.07.2018.
Beerheide, R. (2018): Die App als digitale Begleiterin. In Deutsches Ärzteblatt, PP, 2018 (7). S.304-305.
Bender, S. (2014): Die Axiome von Paul Watzlawick. Verfügbar unter: http://www.paulwatzlawick.de/axiome.html [Stand: April 2018]
Bitkom (2018): Empfehlungen für den verantwortlichen Einsatz von KI und automatisierten Entscheidungen. Verfügbar unter: https://www.bitkom.org/noindex/Publikationen/2018/Leitfaeden/180202-Empfehlungskatalog-online-2.pdf Stand: 20.07.2018
Bitouk, D., Nenkova, A. & Verma, R. (2010): Class-level spectral features for emotion recognition. Speech communication, S. 613–625.
Blanz, B.; Remschmidt, H.; Schmidt, M.H. & Warnke, A. (2006): Psychische Störungen im Kindes- und Jugendalter. Stuttgart: Schattauer Verlag.
Böhme, G. & Stuchlik, G. (1995): Voice profiles and standard voice profile of the untrained children. Journal of Voice, 9, 3, S.304-307.
Bortz, J. & Döring, N. (2006): Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. Berlin, Heidelberg: Springer-Verlag.
Bortz, J. (2005): Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Heidelberg: Springer Medizin Verlag.
Brinker, K. & Sager, S.F. (2006): Linguistische Gesprächsanalyse. Eine Einführung. 4. Aufl. Berlin: Erich Schmidt.
Bühler, K. (1969): Die Axiomatik der Sprachwissenschaften. Quellen der Philosophie. Band 10. Frankfurt am Main: Klostermann.
Bußmann, H. (Hrsg.) (2008): Lexikon der Sprachwissenschaft. 4. aktualisierte und erweiterte Auflage. Stuttgart. Kröner Verlag.
Cohen, J. (1988): Statistical power analysis for the behavioral sciences. Hillsdale, New Jersey: Lawrence Erlbaum Associates.
DepressionsLiga e.V. (2018): Teilnehmer gesucht – aktuelle Studien und Umfragen. Verfügbar unter: http://www.depressionsliga.de/studien_umfragen.html Stand: 01.07.2018
Deutsche Gesellschaft für Kinder- und Jugendpsychiatrie und Psychotherapie, Bundesarbeitsgemeinschaft Leitender Klinikärzte für Kinder- und Jugendpsychiatrie und Psychotherapie& Berufsverband der Ärzte für Kinder- und Jugendpsychiatrie und Psychotherapie (DGKJP, BAG & BKJPP), (Hrsg.). (2003): Leitlinien zu Diagnostik und Therapie von psychischen Störungen im Säuglings-, Kindes- und Jugendalter (2. Aufl.). Köln: Deutscher Ärzte-Verlag.
Dibeklioğlu, H.; Hammal, Z. & Cohn, J.F. (2018): Dynamic Multimodal Measurement of Depression Severity Using Deep Autoencoding. IEEE Journal of Biomedical and Health Informatics, 22 (2), S. 525-536.
Dilling, H., Mombour, W. & Schmidt, M.H. (2015): Internationale Klassifikation psychischer Störungen: ICD-10 Kapitel V(F). Klinisch-diagnostische Leitlinien. (10. Aufl.). Bern: Hans Huber.
DPtV (2018): Optimierung der Depressionsdiagnostik - Kinder zwischen 9 und 12 Jahren zur Teilnahme gesucht. Verfügbar unter: https://www.deutschepsychotherapeutenvereinigung.de/gesundheitspolitik/forschungsprojekte/externe-projekte-zur-psychotherapieforschung/#c6831 Stand: 06.08.2018
Essau, C.A.; Karpinski, N.A.; Petermann, F. & Conradt, J. (1998): Häufigkeit und Komorbidität psychischer Störungen bi Jugendlichen: Ergebnisse der Bremer Jugendstudie. Zeitschrift für klinische Psychologie Psychiatrie und Psychotherapie, 46, S. 105-124.
Fahrmeir, L.; Heumann, C.; Künstler, R.; Pigeot, I. & Tutz, G. (2016): Statistik. Der Weg zur Datenanalyse. 8., überarbeitete und ergänzte Auflage. Berlin, Heidelberg: Springer.
Fiukowski, H. (2004): Sprecherzieherisches Elementarbuch. 7., neu bearbeitete Auflage. Tübingen: Niemeyer Verlag.
Fröhlich-Gildhoff, K. (2004): Depression bei Kindern und Jugendlichen. In Gesprächspsychotherapie und Personzentrierte Beratung, 35. Jg., H. 2/2004, S. 101–110. Verfügbar unter: https://www.gwg-ev.org/sites/default/files/GPB-2004-2-Fr%C3%B6hlich-Gildhoff.pdf Stand: 20.08.2018
Garcia-Toro, M., Talavera, J. A., Saiz-Ruiz, J. & Gonzales, A. (2000): Prosody Impairment in Depression Measured through Acoustic Analysis [Elektronische Version]. In The Journal of Nervous and Mental Disease, 188(12), 824-829.
Gertz, C. & Schneider, A. (2018): Gesundheits-Apps: Was kommt auf die Praxis zu? In KVB Forum, 2018 (7-8), S.30-31.
Gießelmann, K. (2018a): Chatbots und Maschinen willkommen. In Deutsches Ärzteblatt, PP, 2018 (3), S.117.
Groen, G. & Petermann, F. (2002): Depressive Kinder und Jugendliche. 2., überarbeitete Auflage. Göttingen: Hogrefe Verlag.
Hargreaves, W.A. & Starkweather, J.A. (1964): Voice quality changes in depression. In Language Speech, 7, p.84-88.
Hoffmann, G.M.; Gonze, J.C. & Mendlewicz, J. (1985): Speech pause time as a method for the evaluation of psychomotor retardation in depressive illness. The British Journal of Psychiatry, 146. S. 535-538.
Hoffmann, L. & Piotrowski, R. G. (1979): Beiträge zur Sprachstatistik. Leipzig: VEB Verlag Enzyklopädie.
Informationssystem der Gesundheitsberichterstattung (2018): Diagnosedaten der Krankenhäuser ab 2000. Verfügbar unter: http://www.gbe-bund.de/oowa921-install/servlet/oowa/aw92/WS0100/_XWD_FORMPROC?TARGET=&PAGE=_XWD_458&OPINDEX=14&HANDLER=XS_ROTATE_ADVANCED&DATACUBE=_XWD_486&D.000=ACROSS&D.001=PAGE&D.002=PAGE&D.003=PAGE&D.972=PAGE&D.946=DOWN&D.100=PAGE Stand: 20.07.2018
Just, M.A.; Pan, L.; Cherkassky, V.L.; McMakin, D.L.; Cha, C.; Nock, M.K. & Brent, D. (2017): Machine learning of neural representations of suicide and emotion concepts identifies suicidal youth. In Nature Human Behaviour 2017, (1). 911-919.
Kahl, K. & Krüger-Brand, H. E. (2018): Unterstützung, aber kein Ersatz. In Deutsches Ärzteblatt, PP, 2018 (7). S.317-319.
Kaunzner, U. (2018): Schriftliche Mitteilung am 25.07.2018. Regensburg.
Kessel, K. & Reimann, S. (2017): Basiswissen Deutsche Gegenwartssprache. 5., überarbeitete und erweiterte Auflage. Tübingen: Narr Francke Attempto Verlag.
Kiss Mittelfranken (2018): Verfügbar unter: http://kiss-mfr.de/ Stand: 06.08.2018
Krajewski, J. (2008): Stimmbasierte akustische Schläfrigkeitsdetektion. Eine signalverarbeitungsbasierte und mustererkennungsalgorithmengestützte Verfahrensentwicklung. Dissertation; Universität Wuppertal, Fachbereich G - Bildungs- und Sozialwissenschaften. Elektronische Publikation im Internet: http://elpub.bib.uni-wuppertal.de/servlets/DerivateServlet/Derivate-1153/dg0706.pdf [Stand: Mai 2013]
Kranich, W. (2016a): Sprechwissenschaftliche Grundlagen der Prosodieperzeption. Schriften zur Sprechwissenschaft und Phonetik. Bd. 4. Berlin: Frank & Timme Verlag.
Kranich, W. (2016b): Mündliche Mitteilung am 11.04.2016. Zirndorf.
Kranich, W. (2018): Mündliche Mitteilung am 14.07.2018. Zirndorf.
Krech, E.-M.; Stock, E.; Hirschfeld, U. & Anders, L. C. (2009): Deutsches Aussprachewörterbuch. Berlin, New York: De Gruyter Verlag.
Kuhn, S.; Jungmann, S.M. & Jungmann, F. (2018): Künstliche Intelligenz für Ärzte und Patienten. „Googeln“ war gestern. In Deutsches Ärzteblatt, PP, 2018 (7). S.320-323.
Lemke, S. (Hrsg.) (2006): Sprechwissenschaft/ Sprecherziehung. Ein Lehr- und Übungsbuch. Leipziger Skripten. Band 4. Frankfurt am Main: Peter Lang.
Lippe, P. v.d. & Kladroba‚ A. (2002): Repräsentativität von Stichproben. In Marketing, ZFP 24 (2002), S. 139 - 145.
Liu, Z., Li, C., Gao, X., Wang, G. & Yang, J. (2017): Ensemble-based depression detection in speech. IEEE International Conference on Bioinformatics and Biomedicine (BIBM), S. 975-980.
Mayer, J. (2017a): Phonetische Analyse mit Praat. Ein Handbuch für Ein- und Umsteiger. Verfügbar unter: http://praatpfanne.lingphon.net/downloads/praat_manual.pdf Stand: 07.08.2018
Mayer, J. (2017b): Praat-Stimmprofil. Verfügbar unter: http://praatpfanne.lingphon.net/downloads/Praat-Stimmprofil.pdf Stand: 07.08.2018
Mayer, J. (2018): Mündliche Mitteilung am 05.04.2018. Zirndorf.
Mehler-Wex, C. & Kölch, M. (2008): Depressive Störungen im Kindes- und Jugendalter. Deutsches Ärzteblatt, 105 (9), 149-155.Verfügbar unter: https://www.aerzteblatt.de/archiv/59092/Depressive-Stoerungen-im-Kindes-und-Jugendalter#literatur Stand: 20.07.2018
Mehler-Wex, C. (2008): Depressive Störungen. Heidelberg: Springer Medizin Verlag.
Mendiratta, A., Scibelli, F., Esposito, A. M., Capuano, V., Likforman-Sulem, L., Maldonato, M. N., Vinciarelli, A. & Esposito, A. (2018): Automatic detection of depressive states from speech. In: A. Esposito, M. Faudez-Zanuy, F. Carlo Morabito & E. Pasero (eds.) Multidisciplinary Approaches to Neural Computing, S. 301-314. Springer.
Mentorium (2018): Mündliche Mitteilung am 04.07.2018. Zirndorf.
Merkel, A. & Voigt-Zimmermann, S. (2011): Potential von Stimmübung zur Aktivierung von psychischen Ressourcen – eine qualitativ-empirische Studie. In: I. Bose & B. Neuber (Hrsg.). Interpersonelle Kommunikation: Analyse und Optimierung. Hallesche Schriften zur Sprechwissenschaft und Phonetik, Band 39. Frankfurt a. M.: Peter Lang. S. 261-268.
Nagy, T. F. (2010): Essential ethics for psychologists: A primer for understanding and mastering core issues. Washington: Am. Psychological Association.
Nawka, T. & Wirth, G. (2008): Stimmstörungen (5. Aufl.). Köln: Deutscher Ärzte.
Nilsonne, A. (1998): Acoustic analysis of speech variables during depression and after improvement. Acta Psychiatrica Scandinavica 76 (3), S. 235-245.
Praat (2003): Voice 3. Simmer. Verfügbar unter: http://www.fon.hum.uva.nl/praat/manual/Voice_3__Shimmer.html Stand: 06.08.2018
Praat (2011): Voice 2. Jitter. Verfügbar unter: http://www.fon.hum.uva.nl/praat/manual/Voice_2__Jitter.html Stand: 06.08.2018
Przybilla, S. (2017): Sprich, und ich sag dir, wer du bist. In Neue Zürcher Zeitung, 11.1.2017. Verfügbar unter: https://www.nzz.ch/nzzas/nzz-am-sonntag/spracherkennung-sprich-und-ich-sag-dir-wer-du-bist-ld.139110 Stand: 20.07.2018.
Psychotherapeutenkammer Nordrhein-Westfalen (2018): Internet in der Psychotherapie – Großer Ratschlag am 24.01.2018. In Psychotherapeuten journal, 1/2018, S.79-80.
PTK Bayern (2018): Studie „Sprechstimmprofil von Kindern mit depressiven Störungen“. Verfügbar unter: https://www.ptk-bayern.de/ptk/web.nsf/id/pa_studien.html Stand: 06.08.2018
Puffer, H. (2010): ABC des Sprechens: Grundlagen, Methoden, Übungen. Leipzig: Henschel.
Rathert, M. (2006): Sprache und Recht. Kurze Einführung in die Germanistische Linguistik. Heidelberg.
Redecker, B. (2008): Persuasion und Prosodie: Eine empirische Untersuchung zur Perzeption prosodischer Stimuli in der Werbung. Frankfurt am Main: Peter Lang.
Reimann, S. (2016): Mündliche Mitteilung am 23.06.2016. Regensburg.
Reimann, S. (2018): Sprache des Hungerns. Selbstreflexion, Diagnostik und sprachwissenschaftliche Untersuchungen der Internetplattform www.hungrig-online.de. Tübingen: Gunter Narr.
Remschmidt, H.; Schmidt, M. & Poustka, F. (Hrsg.) (2011): Multiaxiales Klassifikationsschema für psychische Störungen des Kindes- und Jugendalters nach ICD-10 der WHO. 5., 1., unveränderter Nachdruck der 5., vollst. überarb. und erw. Auflage. Bern: Hans Huber.
Ringeval, F., Schuller, B., Valstar, M., Gratch, J., Cowie, R., & Pantic, M. (2017): Summary for AVEC 2017 - Real-life depression and affect challenge and workshop. Proceedings of the 2017 ACM Multimedia Conference, S. 1963-1964.
Rossmann, P. (2014): DTK-II. Depressionstest für Kinder-II. Berching in der Oberpfalz. Huber
Rossmann, P. (2014): Depressionstest für Kinder – II. (DTK-II). Bern: Hans Huber.
Sample, I. (2000): Voice from the grave. In New Scientist, 167, p.19.
Schulz von Thun, F. (2008): Miteinander reden. Band 1. Störungen und Klärungen. Allgemeine Psychologie der Kommunikation. 2. Auflage. Reinbek: Rowohlt Taschenbuch Verlag.
Seelenkummer (2018): Depressionen. Verfügbar unter: http://www.seelenkummer.de/viewforum.php?f=36 Stand: 06.08.2018
Smigierski, J. (2018): Schriftliche Mitteilung am 08.08.2018. Stuttgart.
SSPNET (2018): AVEC 2017. Verfügbar unter: http://sspnet.eu/avec2017/ [Stand: April 2018]
Stang, P. & Schleider, K. (2018): Stimmliche Merkmale depressiver Störungen. Aktueller Forschungsstand. DGSS @ktuell, (2018). Verfügbar unter: https://www.dgss.de/fileadmin/user_upload/Aktuelles/DGSS-Aktuell/2018/dgssaktuell_2018-3.pdf Stand: 14.08.2018.
Stang, P. (2018): Forschung. Verfügbar unter: http://praxis-stang.de/forschung/ Stand: 06.08.2018
Statistisches Bundesamt (2018): Verfügbar unter: https://www-genesis.destatis.de/genesis/online;jsessionid=07B342ED97BBEFC7B8BCCF4A6B0D1CD3.tomcat_GO_1_1?operation=previous&levelindex=3&levelid=1530539505025&step=3 Stand: 02.07.2018.
Steinmann, M.; Watzke, B.; Lehmann, C. & Härter, M. (2013): Epidemiologie depressiver Störungen. In C. M. Freitag, A. Barocka, C. Fehler, M. Grube & H. Hampel (Hrsg.) (2013). Depressive Störungen über die Lebensspanne. Ätiologie, Diagnostik und Therapie. Stuttgart: Kohlhammer. S.17-28.
Stiensmeier-Pelster, J.; Braune-Krickau, M.; Schürmann, M. & Duda, K. (2014): DIKJ – Depressions-Inventar für Kinder und Jugendliche. Manual. 3., überarbeitete und neu normierte Auflage. Göttingen: Hogrefe.
Strassen, H.H. (1988): Modelling affect in terms of speech parameters. Psychopathology 21, S.83-88.
Strassen, H.H. (1995): Affekt und Sprache. Stimm- und Sprachanalysen bei Gesunden, depressiven und schizophrenen Patienten. Berlin, Heidelberg, New York: Springer Verlag.
Tóth, L., Hoffmann, I., Gosztolya, G., Vincze, V., Szatlóczki, G., Bánréti, Z. & Kálmán, J. (2018): A Speech Recognition-based Solution for the Automatic Detection of Mild Cognitive Impairment from Spontaneous Speech. Current Alzheimer Research, 15 (2), S. 130-138.
Traber-Walker, N.; Walitza, S. & Franscini, M. (2018): Robin Smartphone App für Jugendliche mit einem erhöhten Psychoserisiko. Psychotherapie Aktuell, 10. Jahrgang, Heft 1.2018, S.26-30.
Watzlawick, P.; Beavin, J. H. & Jackson, D.D. (2011): Menschliche Kommunikation. Formen Störungen Paradoxien. 12. Aufl. Bern: Hans Huber Verlag.
Philipp Stang (M.A.)
… ist approbierter Psychotherapeut, studierte u.a. neben dem Magister-Studium Sprechwissenschaft und Sprecherziehung an der Universität Regensburg; Sprecherzieher (univ./DGSS) und Master of Speech Communication and Rhetoric (M.A.). Aktuell arbeitet er als Dozent, Supervisor und Co-Leiter für Selbsterfahrungsgruppen an staatlich anerkannten Ausbildungsinstituten nach dem Psychotherapeutengesetz sowie in Curricula der Facharztweiterbildung des Bayerischen Bezirkstags. Beteiligung an diversen Forschungsprojekten; Zusatzausbildungen: u.a. Sexualtherapie, Fachkraft für Trans*-Gesundheit, zertifizierter Präventionsmanager - Sexuelle Übergriffe gegen Kinder & Jugendliche, zertifiziert für das BMJS 12/21 (Therapie mit Sexualtätern) und Gruppenpsychotherapie. Als Psychotherapeut ist er in eigener psychotherapeutischer und sexualtherapeutischer Lehrpraxis mit Kassenzulassung in Zirndorf tätig.
Kontakt:
Kontakt: Philipp Stang (M.A.); Praxis für Psychotherapie & Sexualtherapie, Karlstr. 1, D-90513 Zirndorf, Telefon: +49 911 133 860 79, Telefax: +49 911 923 893 67, email: info@praxis-stang.de, http://www.praxis-stang.de; Institut für Verhaltenstherapie, Verhaltensmedizin und Sexuologie, Nürnberger Str. 22, 90762 Fürth, Telefon: +49 911 787 272 7.
PD Dr. Sandra Reimann
… studierte Germanistik, Politik, Soziologie und Journalismus in Regensburg und Eichstätt. Seit 2006 ist sie am Lehrstuhl für Deutsche Sprachwissenschaft an der Universität Regensburg tätig und zwar momentan als Akademische Oberrätin; zwischendurch vertrat sie Professuren in Paderborn, Bonn und Regensburg und war als Gastprofessorin an der Karl-Franzens-Universität in Graz. Seit 1992 ist sie Hörfunkjournalistin. Sandra Reimann ist Sprecherin des Regensburger Verbunds für Werbeforschung (RVW) und hat die wissenschaftliche Betreuung des Regensburger Archivs für Werbeforschung (RAW) inne. Sie hat zahlreiche Kontakte zu Universitäten im Ausland. Als Gastdozentin ist sie seit Jahren u.a. in Finnland und Italien tätig; ferner unterrichtet sie in Griechenland, den Niederlanden, Norwegen, Polen, Tschechien und Ungarn.
Kontakt: PD. Dr. Sandra Reimann; Fakultät für Sprach-, Literatur- und Kulturwissenschaften, Institut für Germanistik, Lehrstuhl für Deutsche Sprachwissenschaft; Universität Regensburg
Telefon +49 941 943-3484, Telefax +49 941 943-2927, email: Sandra.Reimann@sprachlit.uni-regensburg.de, https://www.uni-regensburg.de/sprache-literatur-kultur/germanistik-sw-1/mitarbeitende/reimann/index.html.
Prof. Dr. Karin Schleider (Dipl. Psych. Sonderpäd.)
… wurde in Bingen am Rhein geboren. Sie studierte Psychologie und Sonderpädagogik sowie Kinder- und Jugendpsychiatrie an der Universität in Würzburg und der State Universität of New York. Sie arbeitete als Psychologin und wissenschaftliche Mitarbeiterin am Institut für Psychologie und an der Universitätsklinik für Kinder und Jugendlichen Psychiatrie und -psychotherapie in Würzburg. Sie ist staatlich approbierte Psychotherapeutin für Kinder, Jugendliche und Erwachsene. Nach Ihrer Tätigkeit als Professorin an der Katholischen Hochschule NRW in Köln, lehrt und forscht sie als Professorin an der Pädagogischen Hochschule Freiburg und leitet dort die Abteilung für Beratung, Klinische und Gesundheitspsychologie.
Kontakt:
Prof. Dr. Karin Schleider (Dipl. Psych., Sonderpäd. M.A.); Abteilung für Beratung, Klinische und Gesundheitspsychologie, Institut für Psychologie (Department of Psychology); Pädagogische Hochschule Freiburg (University of Education), Kunzenweg 21, D-79117 Freiburg, Germany; Telefon: +49 761 682-523, Telefax: +49 761 682-480, email: k.schleider@ph-freiburg.de; http://www.ph-freiburg.de/psychologie/schleider.html.