Geschlechtsunterschiede in der Intelligenzentwicklung

Geschlechtsunterschiede in der Intelligenz:
Entwicklungsbedingter Ursprung ja, Jensen-Effekt nein

Gerhard Meisenberg, Medizinische Fakultät der Ross-Universität, Dominica
Diskussionen, Statistiken und Autorenprofile zu dieser Publikation finden Sie unter:
https://www.researchgate.net/publication/319711784

Richard Lynns Entwicklungstheorie der Geschlechtsunterschiede in der Intelligenz wird anhand der Durchführung der Armed Services Vocational Aptitude Battery in der NLSY79 evaluiert. Es zeigt sich, dass der Anstieg der Punktzahl zwischen dem 15. und 23. Lebensjahr bei Männern größer ist als bei Frauen, was ein wesentliches Element der Theorie unterstützt.
Andererseits stehen weder die Geschlechtsunterschiede selbst noch ihre Entwicklungsveränderungen in einem konsistenten Zusammenhang mit den g-Ladungen der Untertests. Daher sollten Geschlechtsunterschiede nicht als Unterschiede in der „allgemeinen“ Intelligenz (g) konzeptualisiert werden.
Schlüsselwörter: ASVAB, NLSY, Intelligenz, Geschlechtsunterschiede, g-Ladungen, Entwicklung

Die von Richard Lynn in seinem Zielartikel skizzierte Theorie macht zwei wichtige überprüfbare Annahmen. Erstens geht sie davon aus, dass es kognitive Geschlechtsunterschiede gibt, die sinnvollerweise als Unterschiede in der allgemeinen Intelligenz konzeptualisiert werden können. Das Konzept wird entweder als ein IQ operationalisiert, der als Durchschnitt (oder, bombastischer ausgedrückt, als „unit-weighted factor score“) von Untertest-Ergebnissen einer komplexen Testbatterie wie den Wechsler-Tests berechnet wird, oder als der unrotierte erste Faktor oder die erste Hauptkomponente aus einer Faktorenanalyse oder Hauptkomponentenanalyse der Untertest-Ergebnisse. Die zweite Behauptung ist, dass Geschlechtsunterschiede altersabhängig sind, mit minimalen und inkonsistenten Unterschieden in der Kindheit und einem sich allmählich entwickelnden männlichen Vorteil ab einem Alter von etwa 15 oder 16 Jahren. Es wird angenommen, dass dieser Entwicklungstrend mit dem späteren Zeitpunkt der Pubertät bei Männern im Vergleich zu Frauen zusammenhängt, der mit einer späteren und längeren Reifung des männlichen Gehirns sowie der körperlichen Reifung verbunden ist. Im Folgenden werde ich diese Behauptungen anhand der 1980 durchgeführten Verwaltung der Armed Services Vocational Aptitude Battery (ASVAB) im National Longitudinal Survey of Youth 1979 (NLSY79) untersuchen

Materialien

1. Die NLSY79-Stichprobe
Der National Longitudinal Survey of Youth wurde 1979 als prospektive Längsschnittstudie vom US-Arbeitsministerium ins Leben gerufen. Eingeschlossen wurden Probanden im Alter von 14-22 Jahren. Die Stichprobe ist nicht vollständig repräsentativ für die US-Bevölkerung, da Personen aus niedrigeren sozioökonomischen Verhältnissen und einige ethnische/rassische Minderheiten überrepräsentiert waren. Männer und Frauen wurden jedoch proportional zu jeder Gruppe in die Stichprobe aufgenommen. Die Armed Services Vocational Aptitude Battery (ASVAB) wurde 1980 der gesamten Kohorte verabreicht. Es liegen vollständige Testergebnisse für 5975 Männer und 5939 Frauen vor.

2. Eigenschaften des ASVAB
Der ASVAB ist ein beruflicher Eignungstest, der für das Screening angehender Rekruten und für die Zuweisung zu verschiedenen militärischen Aufgaben und Ausbildungsprogrammen in den US-Streitkräften verwendet wird. Er besteht aus 10 Untertests:

  1. Allgemeine Wissenschaft: Kenntnisse der physikalischen und biologischen Wissenschaften.
  2. Arithmetic Reasoning: Wortprobleme, die eher das logische Denken als das mathematische Wissen betonen.
  3. Wortwissen: Verstehen der Bedeutung von Wörtern.
  4. Absatz-Verständnis: Verstehen der Bedeutung von Absätzen.
  5. Numerische Operationen: Ein Geschwindigkeitstest der mentalen Addition, Subtraktion, Multiplikation und Division.
  6. Codiergeschwindigkeit: Ein Geschwindigkeitstest zum Zuordnen von Wörtern und Zahlen.
  7. Auto- und Werkstattinformationen: Kenntnisse über Automobile, Werkstattpraktiken und die Verwendung von Werkzeugen.
  8. Mathematische Kenntnisse: Kenntnisse und Fähigkeiten in Algebra, Geometrie und Bruchrechnung.
  9. Mechanisches Verständnis: Verständnis für mechanische Prinzipien wie Zahnräder, Riemenscheiben und Hydraulik.
  10. Elektronisches Verständnis: Kenntnisse über Elektrizität, Funkprinzipien und Elektronik.
    Diese Beschreibungen der Untertests sind aus Maier & Grafton (1981). Psychometrisch gesehen ist der ASVAB ein Test der kristallisierten Intelligenz: erworbenes Wissen und Fähigkeiten und nicht die Fähigkeit zum kontextfreien Denken. Als solcher ist er eng mit Tests zur Lese- und Schreibfähigkeit verwandt (Marks, 2010).

3. Skalierung der Punktwerte
Da die Punktwerte aller Untertests mit dem Alter annähernd linear ansteigen, wurden die Rohwerte der Untertests altersresidualisiert und auf die IQ-Metrik skaliert, mit einem Mittelwert von 100 und einer Standardabweichung von 15. Die Hauptkomponentenanalyse dieser altersresidualisierten skalierten Werte ergab eine nicht rotierte erste Hauptkomponente (g-Faktor), die 66,1 % der Gesamtvarianz ausmachte. Dieser g-Faktor, skaliert auf die IQ-Metrik, wurde als Maß für die allgemeine Intelligenz verwendet.

Ergebnisse

1. Die (Un-)Wichtigkeit von g

Tabelle 1 zeigt die g-Ladungen (Korrelationen mit g) der skalierten Subtest-Scores sowie die männlichen und weiblichen Mittelwerte und Standardabweichungen für jeden Subtest und den Faktor g. Die Skalierung impliziert, dass aufgrund der nahezu gleichen Anzahl von Männern und Frauen die männlichen und weiblichen Scores im Durchschnitt 100 ergeben. Aufgrund des großen Stichprobenumfangs sind fast alle Geschlechtsunterschiede (d) statistisch signifikant. Daher sollte die Interpretation der Ergebnisse eher auf der Größe der Unterschiede als auf ihrer statistischen Signifikanz beruhen.

Tabelle 1. g-Ladungen der ASVAB-Subtests und Geschlechtsunterschiede. N = 5.975 Männer und 5.939 Frauen. d = standardisierter Geschlechtsunterschied: (S Mittelwert – 9 Mittelwert) I gemittelte Standardabweichung; ** p<.01; *** p<.001, two-tailed. Ein Alterstrend ist das Ausmaß, in dem Männer pro Jahr mehr gewinnen als Frauen, ausgedrückt auf der IQ-Skala.

. g loading ♂ mean ± SD ♀ mean ± SD d Δ age trend
1. Science 0.887 102.0±15.9  98.0±13.8  0.27*** 0.229
2. Arithmetic 0.872 101.5±15.5  98.5±14.3  0.20*** 0.354
3. Words 0.891  99.8±15.4 100.2±14.6 -0.03 0.112
4. Comprehension 0.839  98.6±15.4 101.4±14.5 -0.19*** 0.294
5. Numerical Ops. 0.737  98.3±14.9 101.7±14.9  0.23*** 0.587
6. Coding 0.673  96.9±14.3 103.1 ±15.0 -0.42*** 0.286
7. Auto & Shop 0.732 106.7±15.6  93.3±10.7  1.02*** 1.029
8. Math knowledge 0.833 100.4±15.4  99.6±14.6  0.05** 0.458
9. Mechanical Compr. 0.806 104.7±15.9  95.3±12.3  0.67*** 0.707
10. Electronics Info 0.830 104.5±15.7  95.5±12.7  0.63*** 0.518
g   101.7±16.0  98.3±13.8  0 23*** 0.549

Die Ergebnisse bestätigen, dass Männer tatsächlich ein höheres g haben als Frauen. Wir sehen aber auch, dass die Geschlechtsunterschiede in 5 der 10 Untertests größer sind, und in einigen Fällen weit größer als die Unterschiede in g.

Die durchschnittlichen absoluten Geschlechtsunterschiede sind 0,37d (5,6 IQ-Punkte) in den Untertests, im Gegensatz zu 0,23d (3,5 IQ-Punkte) auf dem allgemeinen Faktor. Dies ist nicht zu erwarten, wenn die Geschlechtsunterschiede nur oder sogar hauptsächlich auf g liegen.

Eine weitere Vorhersage der Hypothese, dass die Geschlechtsunterschiede hauptsächlich auf die allgemeine Intelligenz zurückzuführen sind, ist, dass die Geschlechtsunterschiede zugunsten der Männer bei den Tests größer sind, die den allgemeinen Faktor am besten messen, d.h. bei denen, die am besten mit g korrelieren. Die Inspektion der ASVAB-Subtests zeigt die Art der Geschlechtsunterschiede. Es gibt fünf Tests mit primär akademischem Inhalt: Naturwissenschaften, Arithmetik, Wortschatz, Textverständnis und mathematisches Wissen; zwei Tests zur psychomotorischen Geschwindigkeit: Numerische Operationen und Codierung; und drei Tests zu beruflichen Kenntnissen und Fähigkeiten: Auto & Shop Info, Mechanisches Verständnis und Elektronik Info. Geschlechtsunterschiede begünstigen Männer bei den beruflichen Tests, Frauen bei den Geschwindigkeitstests, und bei den akademischen Tests sind die Geschlechtsunterschiede gering.

Da man argumentieren kann, dass die beruflichen Untertests sich auf spezifische Erfahrungen und Kenntnisse beziehen, denen Männer mehr ausgesetzt sind als Frauen, wollen wir sehen, was mit den Geschlechtsunterschieden passiert, wenn diese drei Tests weggelassen werden. In diesem Fall ergeben die verbleibenden 7 Untertests einen g-Faktor, bei dem die Frauen um 0,8 IQ-Punkte besser abschneiden als die Männer. Diesmal beträgt die Korrelation zwischen den g-Ladungen und den Geschlechtsunterschieden jedoch +.693, was der konventionellen statistischen Signifikanz nahe kommt (p=.084). Dies deutet darauf hin, dass Männer bei Tests mit hoher g-Belastung tendenziell besser abschneiden und Frauen bei Tests mit niedriger g-Belastung besser.

Wir können jedoch auch argumentieren, dass die psychomotorische Geschwindigkeit konzeptionell von der Intelligenz verschieden ist. In Dual-Processing-Theorien der Kognition erfordern schnelle Antworten eine automatische Verarbeitung, während Intelligenz eine Eigenschaft eines langsamen Verarbeitungssystems ist (Evans, 2008). Was passiert mit den Geschlechtsunterschieden, wenn die beiden Geschwindigkeitstests entfernt werden, aber alle anderen beibehalten werden? Wie erwartet, vergrößert sich der männliche Vorteil auf dem g-Faktor, der aus den verbleibenden acht Untertests extrahiert wird: von 3,4 Punkten im kompletten ASVAB auf 5,2 Punkte, wenn die Geschwindigkeitstests entfernt werden. Darüber hinaus kehrt sich das Vorzeichen der Korrelation zwischen den g-Ladungen und den Geschlechtsunterschieden um, auf -.447. Die Antwort auf die Frage, ob Tests mit höheren g-Belastungen Männer oder Frauen bevorzugen, hängt also sehr stark von der Zusammensetzung der Testbatterie ab.

2. Veränderungen mit dem Alter

Untersuchen wir nun den Entwicklungsverlauf, der von Lynns Theorie vorgeschlagen wird. Tabelle 2 zeigt, wie sich die Geschlechtsunterschiede auf dem allgemeinen Faktor, extrahiert aus allen 10 Untertests, mit dem Alter verändern. Im Alter von 15 Jahren gibt es keinen Geschlechtsunterschied, aber mit zunehmendem Alter haben Männer einen Vorsprung vor Frauen. Im Alter von 20 Jahren und darüber hinaus übertreffen sie die Frauen um fast ein Drittel einer Standardabweichung oder 5 IQ-Punkte.

Tabelle 2. Geschlechtsunterschiede auf dem allgemeinen Faktor, der aus den ASVAB-Subtests extrahiert wurde, nach Alter. d=standardisierter Geschlechtsunterschied: (S Mittelwert – 9 Mittelwert) / gemittelte Standardabweichung.

Age ♂ mean ± SD ♂ N ♀ mean ± SD ♀ N d
15 99.7±14.6 488 100.3±12.7 431 -0.04
16 101.6±15.2 784 98.5±12.6 725 0.22
17 102.0±16.1 750 98.8±13.0 752 0.22
18 100.8±16.0 705 99.0±13.3 721 0.12
19 100.4±16.7 761 97.5±14.0 757 0.19
20 102.4±16.3 741 97.5±14.4 813 0.32
21 103.4±16.1 751 99.0±14.2 774 0.29
22 102.0±16.2 765 97.2±14.9 798 0.31
23 102.9±15.2 230 96.7±14.2 168 0.42

Wir haben zuvor gesehen, dass, wenn man das Alter ignoriert, das Muster der Geschlechtsunterschiede in den Untertests keine konsistente Beziehung zu den g-Ladungen der Untertests zeigt. Es ist dennoch möglich, dass z.B. die pränatale Androgenwirkung die Stärken und Schwächen der Geschlechter in spezifischen Untertests erzeugt, während die fortgesetzte Gehirnentwicklung nach dem Alter von 15 Jahren einen allgemeinen männlichen Vorteil erzeugt, der bei Tests mit höheren g-Belastungen am stärksten ist. Um zu testen, ob die größere Verbesserung der männlichen als der weiblichen Testleistung nach dem 15. Lebensjahr mit den g-Belastungen der Untertests zusammenhängt, wurden einfache Regressionen zur Vorhersage der Untertestergebnisse mit dem Alter durchgeführt, getrennt für Männer und Frauen. Die unstandardisierten B-Koeffizienten wurden für jede Regression aufgezeichnet und der weibliche B-Koeffizient vom männlichen B-Koeffizienten subtrahiert. Dieser Differenzwert wird als die Differenz der Punktegewinne zwischen Männern und Frauen, ausgedrückt als gewonnene oder verlorene IQ-Punkte pro Jahr, genommen.

Die letzte Spalte in Tabelle 1 zeigt die Ergebnisse. Bei jedem Untertest und dem gemeinsamen Faktor sind die Vorzeichen positiv, was darauf hinweist, dass die Leistungssteigerung mit steigendem Alter bei Männern größer ist als bei Frauen. Das Ausmaß dieses Geschlechtsunterschieds ist am geringsten bei Wortwissen, wo er 0,112 IQ-Punkte pro Jahr beträgt. Das bedeutet, dass Männer zwischen dem Alter von 15 und 23 Jahren 0,112 * 8 = 0,896 Punkte relativ zu den Frauen gewinnen. Im anderen Extrem übersteigen die männlichen Zugewinne bei Auto & Shop Info die weiblichen Zugewinne sogar um 8,232 Punkte. Mit anderen Worten, zwischen diesen Altersgruppen erwerben Männer und Frauen neues Wortwissen mit ähnlichen Raten, aber Männer erwerben Auto- und Werkstattwissen mit viel höheren Raten als Frauen. Die Zuwächse in den anderen Untertests liegen dazwischen, und zwischen dem Alter von 15 und 23 Jahren gewinnen Männer im Vergleich zu Frauen 4,39 IQ-Punkte auf dem gemeinsamen Faktor.

Wenn der Geschlechtsunterschied in den Punktwertgewinnen in der letzten Spalte von Tabelle 1 mit den g-Ladungen der Untertests korreliert wird, erhalten wir ein Pearson’s r von -.492, das nicht signifikant ist. Wie zuvor können wir die Berufstests und die Geschwindigkeitstests aus der Analyse ausschließen. Ohne die drei Berufstests erhalten wir r = -.357, und ohne die beiden Geschwindigkeitstests erhalten wir r = -.785. Die letzte dieser Korrelationen ist statistisch signifikant mit p = .021 bei einer Stichprobengröße von 8 Tests. Die negativen Vorzeichen dieser Korrelationen zeigen, dass, wenn überhaupt, das Ausmaß, in dem die Punktezuwächse der Männer die der Frauen zwischen dem Alter von 15 und 23 Jahren übertreffen, tendenziell größer bei Tests mit geringerer g-Belastung ist. Dies widerspricht der Ansicht, dass Männer in der späten Adoleszenz in der allgemeinen Intelligenz gegenüber Frauen aufholen.

Ein Blick auf die erste und letzte Datenspalte in Tabelle 1 zeigt die Gründe für die negativen Vorzeichen, die in dieser Übung erhalten wurden. Wir sehen, dass die beruflichen Tests diejenigen sind, bei denen Männer in der späten Adoleszenz viel schneller gewinnen als Frauen. Diese Tests haben g-Ladungen, die eher niedrig (Auto & Shop Info) oder mittel (Mechanical Comprehension, Electronics Info) sind. Nach Ausschluss der berufsbezogenen Tests zeigen die Tests mit niedriger g-Belastung etwas größere Zuwächse zwischen Männern und Frauen als die akademischen Tests; und wenn die Tests mit niedriger g-Belastung ausgeschlossen werden, aber die berufsbezogenen Tests beibehalten werden, gibt es ein ziemlich konsistentes Muster von berufsbezogenen Tests mit größeren Zuwächsen zwischen Männern und Frauen mit dem Alter, während sie auch etwas niedrigere g-Belastungen haben.

Schlussfolgerungen

Die in diesem Kommentar vorgestellten Ergebnisse veranschaulichen zwei Aspekte von Richard Lynns Entwicklungstheorie der Geschlechtsunterschiede in der Intelligenz. Der erste ist, dass die Geschlechtsunterschiede bis zum Alter von etwa 15 Jahren gering und/oder variabel sind, dass aber die Männer nach diesem Alter tendenziell vor den Frauen liegen. Dieser Teil der Theorie wird unterstützt, wie die d-Werte in Tabelle 2 zeigen. Sogar die endgültige Größe des Geschlechtsunterschieds von fast 5 IQ-Punkten stimmt gut mit den Ergebnissen vieler anderer von Lynn zusammengestellter Studien überein. Darüber hinaus gibt es eine gewisse Allgemeingültigkeit der größeren männlichen als weiblichen Zuwächse zwischen dem Alter von 15 und 23 Jahren, in dem Sinne, dass diese bei allen Untertests beobachtet werden (letzte Spalte der Tabelle 1).

Auf den ersten Blick bestätigen die Ergebnisse die Schlussfolgerung von Lynn, dass Männer im Erwachsenenalter in der allgemeinen Intelligenz um 4 bis 5 Punkte besser abschneiden als Frauen. Eine genauere Betrachtung der Ergebnisse zeigt jedoch, dass der männliche Vorteil im ASVAB auf das Vorhandensein von drei Untertests zurückzuführen ist, die berufliche Fähigkeiten und Kenntnisse betreffen. Ohne diese drei Tests ist der Geschlechtsunterschied praktisch gleich Null. Selbst in der Altersgruppe der 20- bis 23-Jährigen, in der die Männer im gesamten Test 4,8 Punkte besser abschneiden als die Frauen, erzielen sie nur einen vernachlässigbaren Unterschied von 0,3 Punkten, wenn die beruflichen Tests weggelassen werden. Außerdem gibt es keinen konsistenten Zusammenhang zwischen den g-Ladungen der Untertests und ihren Geschlechtsunterschieden. Die Geschlechtsunterschiede zeigen keinen Jensen-Effekt. Die Spearman-Hypothese, die besagt, dass die Leistungsunterschiede zwischen rassischen und ethnischen Gruppen bei den am stärksten g-geladenen Tests am größten sind (Jensen, 1985), gilt nicht für Geschlechtsunterschiede. Daher können Geschlechtsunterschiede nicht als Unterschiede in einem allgemeinen Fähigkeitsfaktor erklärt werden, sondern nur als Unterschiede in spezialisierten Fähigkeiten, zumindest für den Bereich der Fähigkeiten, die mit dem ASVAB getestet werden.

Auch die Geschlechtsunterschiede in den Subtestwertzuwächsen, die in der letzten Spalte von T able 1 dargestellt sind, zeigen keinen Jensen-Effekt. Dieser Geschlechtsunterschied ist nur in dem Sinne allgemein, dass Männer in allen Untertests schneller zulegen als Frauen, aber er kann nicht als g konzeptualisiert werden. Insbesondere beobachten wir, dass das Ausmaß, in dem die jährlichen Zuwächse bei Männern größer sind als bei Frauen, bei den drei Berufstests und bei numerischen Operationen (Kopfrechnen) am stärksten ausgeprägt ist. Dies deutet darauf hin, dass die beschleunigte männliche Entwicklung in diesen Bereichen nicht nur das Ergebnis einer schnelleren Gesamtreifung des Gehirns ist, die sich vermutlich auf alle Fähigkeiten im Verhältnis zu ihren g-Belastungen auswirken würde. Sie lässt sich besser durch inhaltsspezifische Faktoren erklären, wie z.B. eine größere männliche als weibliche Exposition gegenüber oder ein größeres Interesse an Werkzeugen, Motoren, Getrieben, Hydraulik und Zahlen.

Andererseits beobachten wir, dass die männlichen Zuwächse mit dem Alter die der Frauen auch in den anderen ASVAB-Subtests übertreffen. Dies deutet darauf hin, dass es eine allgemeine Komponente für den Geschlechtsunterschied in den kognitiven Verläufen während der späten Adoleszenz gibt, obwohl diese allgemeine Komponente nicht als g konzeptualisiert werden kann. Wir haben gesehen, dass auf dem g-Faktor, der aus allen 10 Untertests extrahiert wurde, dieser Unterschied im Entwicklungsverlauf 4,39 IQ-Punkte zwischen dem Alter von 15 und 23 Jahren ausmacht. Wenn der g-Faktor nur aus den sieben nicht-beruflichen Untertests extrahiert wird, reduziert sich dieser Entwicklungsunterschied auf 3,13 Punkte. Diese Ergebnisse deuten darauf hin, dass die wahre Entwicklungskomponente in Lynns Entwicklungstheorie ungefähr 3 IQ-Punkte beträgt, die Männer gegenüber Frauen zwischen dem Alter von 15 und 23 Jahren gewinnen, zumindest bei einem Kompositum der Fähigkeiten, die mit dem ASVAB getestet werden.

References

Evans, J.S.B.T. (2008). Dual-processing accounts of reasoning, judgment, and social cognition. Annual Review of Psychology 59: 255-278.

Jensen, A.J. (1985). The nature of the black-white difference on various psychometric tests: Spearman’s hypothesis. Behavioral and Brain Sciences 8: 193-263.

Maier, M.H. & Grafton, F.C. (1981). Aptitude Composites for ASVAB 8, 9, and 10 (No. ARI-RR-1308). Army Research Institute for the Behavioral and Social Sciences, Alexandria VA.

Marks, D.F. (2010). IQ variations across time, race, and nationality: An artifact of differences in literacy skills. Psychological Reports 106: 643-664.

* * *