Intelligenztraining - N-Back-Arbeitsgedächtnistraining
(Jaeggi, Buschkuehl, Jonides, Perrig & Shah, 2008; 2010; 2011)

 Intelligenz_N-Back_intelligence_working memory

Wenngleich kein Zweifel besteht, dass ein großer Teil der Varianz in Gf durch den Einfluss der Gene zu erklären ist (Baltes, Staudinger & Lindenberger, 1999; Cattell, 1963; Gray & Thompson, 2004), konnte doch gezeigt werden, dass bspw. die soziale Klasse und auch das Lebensalter auf die Vererblichkeit von Gf moderierend einwirken (Haworth et al., 2009; Turkheimer, Haley, Waldron, D'Onofrio, & Gottesman, 2003). Wenn also Gf zu einem gewissen Maße unter dem Einfluss von Umweltfaktoren steht (Nisbett, 2009), dann könnten gezielte Interventionen zu einer Verbesserung in Gf führen.

Vor dem Hintergrund der engen Beziehung zwischen Gf und AG erfreuten sich in den letzten Jahren vor allem Interventionen zur Verbesserung des AG zunehmender Beliebtheit (Jaeggi et al., 2008; Jaeggi, Buschkuehl, et al., 2011; Jaeggi, Studer-Luethi et al., 2010; Klingberg et al. 2005). Im Folgenden wird das zum heutigen Zeitpunkt vergleichsweise gut erforschte N-Back-Training vorgestellt.

 

 

Das N-Back-Arbeitsgedächtnistraining
(Jaeggi, Buschkuehl, Jonides, Perrig & Shah, 2008; 2010; 2011)

N-Back_Intelligenztraining_Arbeitsgedächtnis

Die N-Back-Aufgabe wurde ursprünglich von Kirchner (1958) als visuell-räumliche Aufgabe mit drei Ladungen (0-back bis 3-back) eingeführt. In der visuell-räumlichen Variante werden nacheinander visuelle Stimuli (z.B. Quadrate) präsentiert. Die Aufgabe besteht darin, immer dann zu reagieren, wenn ein Stimulus n-Stufen zuvor an der gleichen Stelle aufgetaucht war.

Die einfache Veränderbarkeit des Schwierigkeitsgrads durch eine Erhöhung der Arbeitsgedächtnis-Ladung (z.B. von 2-back auf 3-back) machte die N-Back-Aufgabe bei Studien mit bildgebenden Verfahren zu einer der am häufigsten verwendeten Arbeitsgedächtnis-Aufgaben (Conway et al., 2005; Kane & Engle, 2002).

Neuerdings konzentriert sich eine wachsende Anzahl von Forschungsarbeiten auf den Einsatz der N-Back-Aufgabe im Bereich des kognitiven Trainings (Jaeggi, Buschkuehl, Jonides & Perrig, 2008; Jaeggi, Buschkuehl, Jonides & Shah, 2011; Jaeggi, Studer-Luethi et al., 2010; Jausovec & Jausovec, 2012; Redick et al., 2012; Salminen, Strobach & Schubert, 2012; Schmiedek, Lövden & Lindenberger, 2010; Seidler et al., 2010). Ausgangspunkt dieser Forschungen waren die häufig zitierten und kontrovers diskutierten Experimente von Jaeggi et al. (2008), in denen ein positiver Trainingseffekt eines Dual-N-Back-Trainings auf die Leistungen in einem Intelligenztest (Bochumer Matrizentest; BOMAT; Hossiep, Turck & Hasella, 2001) nachgewiesen werden konnte. Das Dual-N-Back-Training verlangte von den 34 Versuchspersonen (Studenten) der 4 Experimentalgruppen neben dem Bearbeiten der visuell-räumlichen N-Back-Aufgabe (Quadrate) gleichzeitig die Verarbeitung einer auditiven N-Back-Aufgabe (Buchstaben). Während also Quadrate eingeblendet wurden, war gleichzeitig eine Stimme zu hören, die nacheinander Buchstaben nannte. Die Versuchspersonen mussten immer dann eine Taste drücken, wenn der eben genannte Buchstabe, auch N Stufen zuvor genannt wurde.  

Durch die Konzipierung des Trainings als Doppelaufgabe (Dual-N-Back) sollte der Verwendung von Strategien ein Riegel vorgeschoben werden. Schließlich sollten keine Memo-Strategien eingeübt werden, sondern das Arbeitsgedächtnis an seiner Kapazitätsgrenze trainiert werden. Wie schon beim COGMED-Arbeitsgedächtnistraining wurde dafür ein adaptives Training entwickelt. Bei guten Leistungen wurde der Schwierigkeitsgrad automatisch um eine Stufe erhöht, während nach schwächeren Durchgängen die Schwierigkeit um eine Stufe zurückging.

Die Ergebnisse der Trainingsstudien erscheinen auf den ersten Blick sehr überzeugend (siehe Abbildung 1). Insbesondere die Tatsache, dass Verbesserungen im Intelligenztest gegenüber den Kontrollgruppen umso größer ausfielen, desto mehr trainiert worden war, beeindruckt. Allerdings stieß nicht zuletzt die Zusammenfassung der Ergebnisse der 4 Experimentalstudien zu einer einzigen Abbildung auf Kritik. Redick et al. (2012) geben zu bedenken, dass sich die vier Studien, in denen die Versuchspersonen an 8, 12, 17 und 19 Tagen jeweils für ca. 25 Min. trainierten, in zu vielen Faktoren unterschieden, als dass eine Zusammenfassung der Ergebnisse, wie sie in Abbildung 1B von Jaeggi et al. (2008) vorgenommen wurde, vertretbar sei. So seien z.B. in der 8-Trainingstage-Stichprobe zur Messung des Transfers auf die Intelligenz Raven’s Advanced Progressive Matrices (RAPM; Raven, 1990) eingesetzt worden, während in den übrigen Experimenten auf die BOMAT-Matrizen zurückgegriffen wurde. Zudem hatten die VPn der 19-Tage-Gruppe zur Bearbeitung des BOMAT wesentlich länger Zeit, die Aufgaben zu bearbeiten (20 min) als die Pobanden der 12- und 17-Tage-Gruppen (10 min).

 

         N-Back_Intelligenz_Arbeitsgedächtnis_Jaeggi_Perrig

Abbildung 1. Leistungen in den Matrizentests als eine Funktion von Gruppe und Testzeitpunkt (A) und Verbesserungen in den Raven-Matrizen oder den BOMAT-Matrizen als eine Funktion der Anzahl der  Trainingstage (B). Aus “Improving Fluid Intelligence With Training on Working Memory,” von S. M. Jaeggi, M. Buschkuehl, J. Jonides, & W. J. Perrig, 2008, Proceedings of the National Academy of Sciences of the United States of America, 105, p. 6831. Copyright 2008 by the National Academy of Sciences of the United States of America. 

 

Redick et al. (2012) geben ebenfalls zu bedenken, dass auch die Zusammenfassung der Ergebnisse in Abbildung 1A verwirre, da der Eindruck erweckt werde, Experimentalgruppe und Kontrollgruppe seien hinsichtlich ihrer Pre-Test-Leistungen in den Matrizen-Aufgaben gematcht worden. Tatsächlich fand ein Matching der VPn auf Basis der Intelligenztestleistungen im Pre-Test jedoch nur in der Stichprobe statt, die an 17 Tagen trainiert hatte. Zielscheibe heftiger Kritik wurde neben dem Einsatz nur eines Intelligenzmaßes (Matrizen-Aufgaben) auch die Verwendung passiver Kontrollgruppen, da somit eine Verfälschung der Ergebnisse durch das Auftreten von Placebo- oder Hawthorne-Effekten nicht ausgeschlossen werden kann. Jaeggi, Studer-Luethi et al. (2010) halten dem entgegen, dass sich unter dem Einfluss derartiger Artefakte Verbesserungen in allen gemessenen Transfer-Aufgaben (Matrizen-Aufgaben, Digit Span, Reading Span) hätten einstellen müssen. Während jedoch nach dem Training positive Effekte auf das Lösen der Matrizen und auf die Digit Span nachgewiesen werden konnten, blieb der Effekt auf die Reading Span Task (RST) aus. Nichtsdestotrotz haben Redick et al. (2012) angesichts der genannten methodischen Mängel nicht unrecht, wenn sie die Euphorie eines Robert Sternberg (2008) dämpfen. Dieser hatte nämlich als Reaktion auf die Studien von Jaeggi et al. (2008) verlauten lassen: „Fluid intelligence is trainable to a significant and meaningful degree” (S.6791). Sternbergs Aussage mag ein wenig voreilig erscheinen, nicht zuletzt, wenn man sich vor Augen führt, dass in immerhin zwei (8- und 12-Trainingstage) der vier Experimente der Trainingseffekt kein Signifikanzniveau erreichte. Auch wenn in der 12-Trainingstage-Gruppe immerhin eine positive Tendenz zu beobachten war (p = 0,09), so bleiben letztlich nur zwei Studien mit relativ kleinen Stichproben, wovon in wiederum einer Studie aufgrund der nicht gematchten Intelligenztestwerte eine Regression zur Mitte aufgetreten sein könnte, in denen ein signifikanter Trainingseffekt nachgewiesen werden konnte. Sternberg (2008) forderte vor diesem Hintergrund zu Recht, dass die Ergebnisse unbedingt an weiteren Stichproben und von unterschiedlichen Forschergruppen repliziert werden müssten.

In einer ersten eigenen Replikationsstudie gelang es Jaeggi, Studer-Luethi et al. (2010) einige methodische Schwächen der früheren Experimente auszuräumen und gleichzeitig die Ergebnisse aus 2008 weitgehend zu bestätigen. Insgesamt 46 Studenten der National Normal University Taipeh trainierten an 20 Tagen zu jeweils ca. 17 - 20 Min. entweder eine Single-N-Back-Aufgabe (visuell-räumlich) oder dieselbe Dual-N-Back-Aufgabe (visuell-räumlich + auditiv) wie in der Originalstudie. Sowohl die Single- als auch die Dual-N-Back-Gruppe wiesen nach dem Training gegenüber den 43 Versuchspersonen der passiven Experimentalgruppe verbesserte Trainingsleistungen auf. Der größte Transfereffekt konnte bei der Dual-N-Back-Gruppe für das Lösen der RAPM beobachtet werden (Dual-N-Back: d = 0.98; Kontrollgruppe: d = 0.10). Während für die gleiche Gruppe im BOMAT zwar eine signifikante Verbesserung im Vergleich zum Pre-Test festgestellt werden konnte, wie sie in der Kontrollgruppe nicht zu beobachten war, erreichte die Analyse der Veränderung gegenüber der Kontrollgruppe jedoch nicht das Signifikanzniveau (Dual-N-Back: d = 0.49; Kontrollgruppe: d = 0.29). Interessanterweise ließen sich auch für die Single-N-Back-Trainingsgruppe positive Effekte nachweisen (RAPM: d = .65; BOMAT: d = .70), die im Vergleich zur Kontrollgruppe signifikant höher ausfielen. Jaeggi, Studer-Luethi et al. resümieren, dass diese Ergebnisse nicht nur die Originalstudie bestätigen würden, sondern weitere Perspektiven für zukünftige Trainingsinterventionen eröffneten, da Single-N-Back-Aufgaben im Vergleich zu Dual-N-Back-Aufgaben wesentlich leichter zu verstehen seien und somit auch für den Einsatz mit Kindern geeignet seien. Tatsächlich wirken die Ergebnisse gegenüber der Studie aus 2008 wesentlich überzeugender, da einige methodische Mängel behoben wurden, indem a) eine größere Stichprobe verwendet wurde, b) Experimentalgruppe und Kontrollgruppe hinsichtlich ihrer Pre-Test-Ergebnisse in den Matrizen-Tests gematcht wurden und c) alle Versuchspersonen sowohl die Raven-Matrizen als auch den BOMAT bearbeiten mussten. Dennoch ließ insbesondere der erneute Einsatz einer passiven Kontrollgruppe nicht alle Kritiker verstummen (Shipstead, Redick & Engle, 2012). Zudem birgt die Fokussierung auf Matrizen-Aufgaben als alleiniges Maß der fluiden Intelligenz die Gefahr, dass ein beobachteter Transfereffekt als Indiz für eine umfassende Veränderung der fluiden Intelligenz interpretiert wird, obwohl in Wirklichkeit aufgabenspezifische Verbesserungen (z.B. Verbesserungen in der visuellen Verarbeitung) für diesen Effekt verantwortlich sein könnten (Moody, 2009).

In der Folge wurden N-Back-Aufgaben immer häufiger zum Zwecke des kognitiven Trainings eingesetzt. In zwei Studien (Jausovec & Jausovec, 2012; Schmiedek et al., 2010) mit vergleichsweise langen Trainingszeiten (ca. 30 Stunden und ca. 100 Stunden) wurde eine N-Back-Aufgabe in ein umfangreiches Trainingsprogramm eingebettet. In beiden Fällen konnten positive Transfereffekte auf mehrere Maße der fluiden Intelligenz nachgewiesen werden. Studien mit geringerem Trainingspensum, in denen ausschließlich N-Back-Aufgaben trainiert wurden, brachten bislang widersprüchliche Ergebnisse zutage. Während Jaeggi et al. (2011) nach einem 4 - 6-wöchigen Single-N-Back-Training für Kinder Transfereffekte auf die RSPM (Raven, 1988) und den Test For Nonverbal Intelligence (TONI; Brown, L., Sherbenou, R. J. & Johnsen, 1997) berichten, die auch noch 3 Monate nach dem Training gegenüber einer aktiven Kontrollgruppe zu beobachten waren, taten sich andere Forschergruppen schwer, ähnliche Ergebnisse zu finden. So berichten z.B. Salminen et al. (2012) von verbesserten Exekutiven Funktionen und Seidler et al. (2010) von einer Verbesserung in einer komplexen Arbeitsgedächtnis-Aufgabe (Operation Span Task). Der Transfer auf die ebenfalls erhobenen Raven-Matrizen blieb jedoch in beiden Fällen aus. Unter den Studien, in denen keine Effekte auf Intelligenztests nachgewiesen werden konnten, verdient vor allem die erst kürzlich publizierte Untersuchung von Redick et al. (2012) besonderes Augenmerk. Viele methodische Mängel vorausgegangener Studien wurden von den Autoren vollständig beseitigt. Anstatt nur einer aktiven oder passiven Kontrollgruppe ließ man zwei Kontrollgruppen mitlaufen. Neben den 24 Versuchspersonen, die eine adaptive Dual-N-Back-Aufgabe trainierten (siehe Jaeggi, 2008), mussten 29 VPn eine adaptive visuelle Suchaufgabe (aktive Kontrollgruppe) bearbeiten, während 20 VPn kein Training erhielten (passive Kontrollgruppe). Es gab keinen signifikanten Unterschied zwischen den drei Gruppen hinsichtlich ihrer Pre-Test-Leistungen. Um mögliche Verbesserungen nicht nur in einzelnen Aufgaben zu detektieren, sondern auch auf der Ebene latenter Fähigkeiten, wurden 17 unterschiedliche Transfer-Maße erhoben. Aber obwohl das Trainingspensum mit 20 Sessions verteilt auf durchschnittlich 46 Tage (SD = 13,7), an denen ca. 30 - 40 Min. trainiert wurde, im Umfang dem aus den Studien von Jaeggi in nichts nachstand, konnte weder in den Tests zur fluiden Intelligenz noch in Tests zur Arbeitsgedächtnis-Kapazität noch in Multitasking-Tests eine signifikante Verbesserung nachgewiesen werden. Wie lässt sich dieser auf ganzer Linie gescheiterte Replikationsversuch erklären? Redick et al. vermuten, dass methodische Mängel einige der positiven Befunde vorausgegangener Studien verursacht haben könnten. Unterstützung für ihre These sehen die Autoren in den subjektiven Auskünften ihrer Versuchspersonen. So gaben die Probanden der beiden Experimentalgruppen wesentlich häufiger an, ihr Gedächtnis und ihre Intelligenz habe sich verbessert, obwohl auf objektiver Ebene keine Verbesserungen feststellbar waren. Entweder hatten sich die Versuchspersonen tatsächlich in einigen kognitiven Fähigkeiten verbessert und es war einfach nicht gelungen, dies mit den Leistungstests zu erfassen, oder sie hatten sich diese Verbesserungen nur eingebildet. In Anbetracht der Vielzahl kognitiver Tests spricht allerdings einiges für einen Placebo-Effekt. Redick et al. weisen darauf hin, dass insbesondere in Experimenten mit passiven Kontrollgruppen mit solchen Placebo-Effekten zu rechnen sei. Der Glaube, durch ein Arbeitsgedächtnis-Training intelligenter geworden zu sein, könnte dazu geführt haben, dass Versuchspersonen ausdauernder mit anspruchsvollen Problemstellungen umgegangen seien. Allerdings stellt sich dann die Frage: Weshalb haben dann nicht auch die Versuchspersonen aus der Studie von Redick et al. von derartigen Placebo-Effekten profitiert? Eine Erklärung könnte lauten: Der Placebo-Effekt war zu schwach. Denn anders als in allen anderen N-Back-Trainingsstudien wurde den Probanden im Vorfeld nicht mitgeteilt, dass sie ihre kognitiven Leistungen durch die Teilnahme an der Studie verbessern könnten. Die Teilnehmer wurden also bezüglich des Ziels der Studie weitgehend im Dunkeln gelassen. Diese aus forschungsmethodischer Sicht lobenswerte Vorgehensweise ist allerdings auch der Schwachpunkt der Studie von Redick et al. Eines der größten Probleme eines N-Back-Traininigs ist nämlich der Faktor Motivation. Adaptive (Dual-)N-Back-Aufgaben sind i. d. R. ungemein anstrengend und gleichzeitig sehr monoton. Soll erreicht werden, dass Probanden über einen Zeitraum von 20 Tagen mit maximaler Konzentration trainieren, bedarf es großer Anreize. Während in anderen Studien neben einer finanziellen Aufwandsentschädigung auch eine Verbesserung der kognitiven Leistungsfähigkeit in Aussicht gestellt wurde, entfiel dieser wichtige Anreiz in der Studie von Redick et al. vollständig. Immerhin wurden auch die Versuchspersonen von Redick et al. mit 10$ für jede absolvierte Trainingsession entlohnt. Trotzdem stellt sich die Frage, ob alle Versuchspersonen ohne Hoffnung auf Verbesserungen in den kognitiven Leistungen bis zum Ende der 20 Tage mit der nötigen Konzentration ans Werk gingen. Einen wichtigen Hinweis liefern die Leistungssteigerungen in der Dual-N-Back-Aufgabe. Verglichen mit den Trainingsverbesserungen in anderen Dual-N-Back-Trainingsstudien (Jaeggi, Buschkuehl, Jonides & Perrig, 2008; Jaeggi, Studer-Luethi et al., 2010; Salminen, Strobach & Schubert, 2012) fallen die Leistungssteigerungen vom ersten bis zum letzten Trainingstag auffallend gering aus. Zwei der 24 Versuchspersonen schnitten in der Trainingsession von Tag 20 sogar schlechter ab als in der Trainingsession von Tag 1. Wenngleich auch der Dual-N-Back-Trainingsfortschritt mit den Pre-/Post-Veränderungen der Transferaufgaben nicht korrelierte, so bleiben doch Zweifel, ob sich die VPn von Redick et al. überhaupt ausreichend angestrengt haben, um etwaige Transfer-Effekte sichtbar werden zu lassen.

Damit ist die Forschungslage zum (Dual-)N-Back-Training insgesamt eher unbefriedigend. Während Studien, in denen Transfereffekte gefunden werden konnten, teilweise methodische Schwächen aufweisen, so leidet die aus forschungsmethodischer Sicht anspruchsvollste Studie, in welcher überhaupt keine Transfer-Effekte gefunden werden konnten, womöglich unter Motivationsproblemen ihrer Teilnehmer.

Konkurrierende Validität der N-Back-Aufgabe

Trotz der häufigen Verwendung des N-Back-Paradigmas als Arbeitsgedächtnis-Aufgabe liegt nur eine relativ geringe Anzahl an Studien zur konkurrierenden Validität vor. Die Datenlage zum Dual-N-Back-Paradigma ist aufgrund seines noch jungen Alters sogar noch spärlicher. Die wenigen bisher vorliegenden Studien liefern ein noch unvollkommenes Bild, welche kognitiven Leistungen beim Lösen von (Dual-)N-Back-Aufgaben involviert sind. Obwohl das Aufrechterhalten und Updaten eines dynamischen Rehearsal-Sets der N-Back-Aufgabe eine Augenscheinvalidität als Arbeitsgedächtnis-Aufgabe verleiht (Kane, Conway, Miura & Colflesh, 2007), fielen die Korrelationen mit manchen Arbeitsgedächtnis-Aufgaben zunächst eher gering aus. Insbesondere wenn nur einzelne AG-Maße eingesetzt wurden, wie etwa die RST oder die Operation Span Task (OST), wurden nur sehr geringe Korrelationen von r = .10 bis r = .24 berichtet (Colom et al., 2008; Jaeggi, Buschkuehl et al., 2010; Kane et al., 2007; Oberauer, 2005; Roberts & Gibson, 2002). Dem stehen zwei Studien gegenüber (Shelton, Elliot, Hill, Calamia & Gouvier, 2009; Shelton, Metzger, Elliot, 2007), in denen über drei Stichproben hinweg eine Korrelation zwischen den Leistungen in der OST und einem aus 0-, 1-, 2-, und 3-Back zusammengesetzten Wert von r ≈ .46 gefunden werden konnten. Darüber hinaus konnten Shamosh et al. (2008) eine Korrelation von r = .55 zwischen einer 3-Back-Aufgabe und einem aus vier komplexen Arbeitsgedächtnis-Maßen zusammengesetzten Wert (Operation Span, Reading Span, Symmetry Span, Rotation Span) nachweisen. Angesichts dieser Datenlage mag man geneigt sein, die geringen Korrelationen aus früheren Studien auf eine zu große Fehlervarianz zurückzuführen, die sich durch die Beschränkung auf nur eine Arbeitsgedächtnis-Aufgabe ergeben haben könnte. Ein weiterer Grund für schwache Korrelationen zwischen N-Back-Aufgaben und komplexen Arbeitsgedächtnis-Aufgaben könnte in unterschiedlichen Erinnerungsprozessen liegen. Während bei N-Back-Aufgaben vor allem Vertrautheits- und Wiedererkennungsprozesse gefordert sind, verlangen komplexe Arbeitsgedächtnis-Aufgaben vor allem das aktive Abrufen von Gedächtnisinhalten (Kane et al., 2007). Tatsächlich konnten Oberauer et al. (2005) zeigen, dass die Korrelation zwischen einer verbalen N-Back-Aufgabe und einigen Wiedererkennungsaufgaben deutlich höher ausfiel als der durchschnittliche Zusammenhang von komplexen Arbeitsgedächtnis-Aufgaben untereinander. Darüber hinaus erzielten Shelton und Kollegen (2007, 2009) durch den Einsatz einer modifizierten N-Back-Aufgabe, die einen aktiven Erinnerungsabruf erforderte, eine größere Korrelation zur OST als andere Forschergruppen. Die Schnittmenge zwischen N-Back-Aufgaben und komplexen Arbeitsgedächtnis-Aufgaben scheint also größer auszufallen, wenn gleiche Erinnerungsprozesse involviert sind. Für einen größeren Zusammenhang sprechen schließlich auch die Ergebnisse der Studie von Schmiedek, Hildebrandt, Lövden, Wilhelm und Lindenberger (2009). Mithilfe einer Analyse latenter Variablen konnte eine latente Korrelation (r = .96) zwischen einem aus drei komplexen Arbeitsgedächtnis-Aufgaben (Reading Span, Counting Span, Rotation Span) gebildeten Faktor und einem aus drei Updating-Aufgaben (visuell-räumliche 3-Back-Aufgabe, Memory Updating, Alpha Span) gebildeten Faktor gefunden werden. Zwischen den beiden latenten Faktoren bestand kein signifikanter Unterschied.

Erstaunlicherweise scheint die N-Back-Aufgabe mindestens genauso eng mit einfachen Arbeitsgedächtnis-Aufgaben (Simple Span Tasks) zusammenzuhängen (Korrelationen zwischen r = .12 und r = .53; Colom et al., 2008; Dobbs & Rule, 1989; Gevins & Smith, 2000; Jaeggi, Buschkuehl et al., 2010; Oberauer, 2005; Roberts & Gibson, 2002; Shelton et al., 2007; Shelton et al., 2009). Als wesentlich direkterer Beziehungsnachweis könnten auch die Ergebnisse aus den Trainingsstudien von Jaeggi et al. (2008) und Jaeggi, Studer-Luethi et al. (2010) herangezogen werden, in denen nach (Dual-)N-Back-Trainings zwar signifikante Verbesserungen in einer Simple Span Task (Digit Span Task) beobachtet werden konnten, der Transfer auf die komplexeren AG-Aufgaben (RST, OST) jedoch ausblieb. 

Da beim Lösen der N-Back-Aufgabe augenscheinlich Entscheidungs- und Inhibitionsprozesse als auch die Auflösung von Interferenzen gefordert sind, kann ein moderater bis enger Zusammenhang zu Maßen der Exekutiven Funktionen vermutet werden. Tatsächlich zeigte sich in einer Studie mit Kindern (Ciesielsky, Lesnik, Savoy, Grant & Ahlfors, 2006) eine substanzielle Korrelation zwischen den 2-Back-Leistungen und den Ergebnissen im Stroop-Test (r = .55) im Wisconsin Card Sorting Test (r = .56) und im Verbal Fluency Test (r = .59). In Studien mit erwachsenen VPn zeigten sich jedoch nur sehr schwache Korrelationen (r = .10 bzw. r = .12) zwischen einer 2-Back-Aufgabe und der Stroop-Aufgabe (Friedman et al., 2006; Friedman et al., 2008). Auch Jaeggi, Buschkuehl et al. (2010) fanden nur eine geringe Korrelation (r = .26) zwischen einer auditiven 3-Back-Aufgabe und der Self Ordered Pointing Task. Dagegen konnten in einer erst kürzlich erschienenen Studie von Salminen et al. (2012) nach einem 14-tägigen Dual-N-Back-Training Transfereffekte auf eine Task Switching Aufgabe (reduzierte Mixing Cost) und auf eine Attentional Blink Aufgabe nachgewiesen werden.

Schließlich scheinen sich N-Back-Aufgaben ein erhebliches Maß an Varianz mit Maßen der fluiden Intelligenz (Gf) zu teilen. Die gefundenen Korrelationen sind zum Teil vergleichsweise hoch und reichen von r = .19 bis r = .66 (Friedman et al., 2006, 2008; Gevins & Smith, 2000; Jaeggi, Buschkuehl et al., 2010; Salthouse, Pink & Tucker-Drob, 2008; Shelton et al., 2009; Van-Leeuwen et al., 2007; Waiter et al., 2009). Zudem untersuchten Hockey und Geffen (2004) als auch Gevins und Smith (2000), ob sich mit interindividuellen Unterschieden in der Intelligenz (gemessen mit der Multidimensional Aptitude Battery bzw. der Wechsler Adult Intelligence Scale) Leistungen in der N-Back-Aufgabe vorhersagen lassen. Tatsächlich konnte beobachtet werden, dass VPn mit hohen Intelligenztestwerten schneller in der N-Back-Aufgabe agierten als VPn mit niedrigeren Werten, vor allem bei höheren N-Back-Stufen. Auch in der Studie von Schmiedek et al. (2009) zeigte sich eine hohe Korrelation (r = .84) zwischen einem aus drei Updating-Aufgaben (visuell-räumliche 3-Back-Aufgabe, Memory Updating, Alpha Span) erzeugten Faktor und einem Gf-Faktor, gebildet aus den Werten der RAPM und neun Reasoning-Aufgaben des Berliner Intelligenzstrukturtest (BIS; Jäger, Süß, Beauducel, 1997). 

In Hinsicht auf die Relation von Dual-N-Back-Aufgaben zu Gf-Aufgaben liefern insbesondere die Studien von Jaeggi, Buschkuehl et al. (2010) und Jaeggi, Studer-Luethi et al. (2010) wichtige Hinweise. Während Jaeggi, Buschkuehl et al. (2010) eine Korrelation von r = .48 zwischen den RAPM und einer Dual-3-Back- Aufgabe feststellen konnten, gelang Jaeggi, Studer-Luethi et al. (2010) der Nachweis einer Korrelation zwischen zwei Gf-Maßen (RAPM, BOMAT) und einem aus 2-, 3- und 4-Back gemittelten Wert (r = .41 bzw. r = .40). Als einen wiederum direkteren Beziehungsnachweis zwischen (Dual-)N-Back und Gf sehen Jaeggi, Buschkuehl et al. (2010) die verbesserten Intelligenztestwerte infolge von (Dual-)N-Back-Trainings an (Jaeggi et al., 2008; Jaeggi, Buschkuehl, et al., 2011; Jaeggi, Studer-Luethi et al., 2010).

 




Literatur:

Baltes, P. B., Staudinger, U. M. & Lindenberger, U. (1999). Lifespan psychology: theory and application to intellectual functioning. Annual Review of Psychology, 50, 471−507.

Brown, L., Sherbenou, R. J. & Johnsen, S. K. (1997). TONI-3: Test of Nonverbal Intelligence (3rd ed.). Circle Pines, MN: American Guidance Service.

Psychologie_Link_pdf Buschkuehl, M. Jaeggi, S.M. (2010). Improving intelligence a literature review. Swiss medical weekly. 140(19-20):266-72.

Cattell, R. B. (1963). Theory of fluid and crystallized intelligence: a critical experiment. Journal of Educational Psychology, 54 (1), 1−22.

Psychologie_Link_pdf Chooi, W. T.; Thompson, L. A. (2012). "Working memory training does not improve intelligence in healthy young adults". Intelligence 40 (6): 531. doi:10.1016/j.intell.2012.07.004

Ciesielski, K. T., Lesnik, P. G., Savoy, R. L., Grant, E. P. & Ahlfors, S. P. (2006). Developmental neural networks in children performing a categorical N-back task. Neuroimage, 33 (3), 980-990.

Colom, R., Abad, F. J., Quiroga, M. A., Shih, P. C. & Flores-Mendoza, C. (2008). Working memory and intelligence are highly related constructs, but why? Intelligence, 36, 584-606.

Conway, A. R., Kane, M. J., Bunting, M. F., Hambrick, D. Z., Wilhelm, O. & Engle, R. W. (2005). Working memory span tasks: A methodological review and user’s guide. Psychonomic Bulletin & Review, 12, 769-786.

Friedman, N. P. & Miyake, A. (2005). Comparison of four scoring methods for the reading span test. Behavior Research Methods, 37 (4), 581-590.

Friedman, N. P., Miyake, A., Corley, R. P., Young, S. E., Defries, J. C. & Hewitt, J. K. (2006). Not all executive functions are related to intelligence. Psychological Science, 17 (2), 172-179.

Dobbs, A. R. & Rule, B. G. (1989). Adult age differences in working memory. Psychology and Aging, 4, 500–503.

Gevins, A. & Smith, M. E. (2000). Neurophysiological measures of working memory and individual differences in cognitive ability and cognitive style. Cerebral Cortex, 10, 829-839.

Gray, J. R. & Thompson, P. M. (2004). Neurobiology of intelligence: science and ethics. Nature Reviews. Neuroscience, 5 (6), 471−482.

Haworth, C. M. A., Wright, M. J., Luciano, M., Martin, N. G., de Geus, E. J. C., van Beijsterveldt, C. E. M., Bartels, M., Posthuma, D., Boomsma, D. I., Davis, O. S. P., Kovas, Y., Corley, R. P., DeFries, J. C., Hewitt, J. K., Olson, R. K., Rhea, S. A, Wadsworth, S. J., Iacono, W. G., McGue, M., Thompson, L. A., Hart, S. A., Petrill, S. A., Lubinski, D & Plomin, R. (2009). The heritability of general cognitive ability increases linearly from childhood to young adulthood. Molecular Psychiatry, 15, 1112-1120.

Hockey, A. & Geffen, G. (2004). The concurrent validity and test-retest reliability of a visuospatial working memory task. Intelligence, 32, 591-605.

Hossiep, R., Hasella, M. & Turck, D. (2001). BOMAT - advanced - short version - Bochumer Matrizentest. Göttingen: Hogrefe.

Psychologie_Link_pdf Jaeggi, S.M., Buschkuehl M., Jonides, J., Perrig, W.J. (2008). Improving fluid intelligence with training on working memory. Proc Natl Acad Sci USA 105:68296833.

Psychologie_Link_pdf Jaeggi, S. M., Buschkuehl, M., Jonides, J., & Shah, P. (2011). Short- and long-term benefits of cognitive training. PNAS, 108(25), 10081-10086. doi:10.1073/pnas.1103228108

Psychologie_Link_pdf Jaeggi, S. M., Buschkuehl, M., Perrig, W. J., & Meier, B. (2010). The concurrent validity of the N-back task as a working memory measure. Memory, 18, 394-412. doi: 10.1080/09658211003702171.

Psychologie_Link_pdf Jaeggi, S.M., Studer-Luethi, B., Buschkuehl, M., Su, Y.F., Jonides, J., & Perrig, W.J. (2010). The relationship between n-back performance and matrix reasoning - implications for training and transfer. Intelligence, 6, 625-635.

Jausovec, N. & Jausovec, K. (2012). Working memory training: improving intelligence - changing brain activity. Brain and Cognition. 79, 96-106.

Psychologie_Link_pdf Kane, M. J., Conway, A. R. A., Miura, T. K., & Colflesh, G. J. H. (2007). Working memory, attention control, and the N-back task: A cautionary tale of construct validity. Journal of Experimental Psychology: Learning, Memory, and Cognition, 33, 615-622.

Kane, M. J. & Engle, R. W. (2002). The role of prefrontal cortex in working-memory capacity, executive attention, and general fluid intelligence: An individual differences perspective. Psychonomic Bulletin & Review. 9, 637-671.

Psychologie_Link_pdf Klingberg T (2010). Training and plasticity of working memory. Trends in Cognitive Science,14(7): 317-324.

Psychologie_Link_pdf Loosli, S.V., Buschkuehl, M., Perrig, W.J., & Jaeggi, S.M. (in press). Working memory training improves reading processes in typically developing children. Child Neuropsychology.

Psychologie_Link_pdf Moody, D. E. (2009), Can intelligence be increased by training on a task of working memory? Intelligence, Volume 37, Issue 4, July–August 2009, Pages 327-328, DOI: 10.1016/j.intell.2009.04.005

Neubauer, A. & Stern, E. (2007). Lernen macht intelligent. Warum Begabung gefördert werden muss. München: DVA.

Nisbett, R. E. (2009). Intelligence and how to get it: Why schools and cultures count. New York: W.W. Norton.

Oberauer, K. (2005). Binding and inhibition in working memory: Individual and age differences in shortterm recognition. Journal of Experimental Psychology, 134 (3), 368-387.

Psychologie_Link_pdf Owen, A.M., Hampshire, A., Grahn, J.A., Stenton, R., Dajani, S. Burns, A. S., Howard and Ballard, C.G (2010). Putting brain training to the test, Nature, 465, 775-779.

Psychologie_Link_pdf Qiu Feiyue; Wei Qinqin (2010). "Study on Improving Fluid Intelligence through Cognitive Training System Based on Gabor Stimulus" Information Science and Engineering. 

Raven, J., Raven, J. C. & Court, J. H. (1998). Manual for Raven's progressive matrices and vocabulary scales. Oxford: Oxford Psychologists Press

Psychologie_Link_pdf Redick. T. S., Shipstead, Z., Harrison T., L., Hicks, K. L., Fried, D. E., Hambrick, D. Z., Kane, M. J., Engle, R. W. (in press). No evidence of intelligence improvement after working memory training: A randomized, placebo-controlled study. Journal of Experimental Psychology, General.

Roberts, R. & Gibson, E. (2002). Individual differences in sentence memory. Journal of Psycholinguistic Research, 31 (6), 573-598.

Rost, D. H. (2009). Intelligenz: Mythen und Fakten. Weinheim: Beltz.

Psychologie_Link_pdf Salminen, T., Strobach, T., & Schubert, T. (2012). On the impacts of working memory training on executive functioning. Frontiers in Human Neuroscience, 6: 166.

Psychologie_Link_pdf Schmiedek, F. Lövdén, M. Lindenberger, U. (2010) Hundred Days of Cognitive Training Enhance Broad Cognitive Abilities in Adulthood: Findings from the COGITO Study. Front Aging Neurosci. 13;2. pii: 27.

Schmiedek, F., Hildebrandt, A., Lövden, M., Wilhelm, O. & Lindenberger, U. (2009). Complex span versus updating tasks of working memory: The gap is not that deep. Journal of Experimental Psychology: Learning, Memory, and Cognition, 35, 1089-1096.

Psychologie_Link_pdf Seidler, R. (2010). Cognitive Training as an intervention to improve driving ability in the older adult.(Technical Report No. M-CASTL 2010–01). Ann Arbor: University of Michigan.

Shamosh, N. A., Deyoung, C. G., Green, A. E., Reis, D.L., Johnson, M. R., Conway, A. R., Engle, R. W., Braver, T. S. & Gray, J. R. (2008). Individual differences in delay discounting: Relation to intelligence, working memory, and anterior prefrontal cortex. Psychological Science, 19 (9), 904-911.

Shelton, J. T., Elliott, E. M., Hill, B. D., Calamia, M. R. & Gouvier, W. D. (2009). A comparison of laboratory and clinical working memory tests and their prediction of fluid intelligence. Intelligence, 37, 283-293.

Shelton, J. T., Metzger, R. L. & Elliott, E. M. (2007). A group-administered lag task as a measure of working memory. Behavior Research Methods, 39 (3), 482-493.

Psychologie_Link_pdf Smith, G.E., Housen, P., Yaffe, K., Ruff, R., Kennison, R.F., Mahncke, H.W. and Zelinski, E.M. (2009). A cognitive training program based on principles of brain plasticity: Results from the improvement in memory with Plasticity-based adaptive cognitive training (IMPACT) Study. The American Geriatrics Society.

Psychologie_Link_pdf Sternberg, R.J. (2008). Increasing fluid intelligence is possible after all.Proc. Natl. Acad. Sci. U. S. A.105, 67916792.

Psychologie_Link_pdf Studer-Luethi, B., Jaeggi, S.M., Buschkuehl, M., Perrig, W.J. (2012). Influence of neuroticism and conscientiousness on working memory training outcome. Personality and Individual Differences, 53, 44-49. doi:10.1016/j.paid.2012.02.012.

Turkheimer, E., Haley, A., Waldron, M., D’Onofrio, B.M. & Gottesman, I.I. (2003) Socioeconomic status modifies heritability of IQ in young children. Psychological Science 14, 623-628.

Van Leeuwen, M., Van den Berg, S. M., Hoekstra, R. A. & Boomsma, D. I. (2007). Endophenotypes for intelligence in children and adolescents. Intelligence, 35, 369-380.

Waiter, G. D., Deary, I. J., Staff, R. T., Murray, A. D., Fox, H. C., Starr, J. M., et al. (2009). Exploring possible neural mechanisms of intelligence differences using processing speed and working memory tasks: An fMRI study. Intelligence, 37, 199-206.

Psychologie_Link_pdf Willis, S.L., Tennstedt, S.L., Marsiske, M. Ball, K., Elias, F., Koepke, K.M., Morris, J.N., Rebok, G.W., Unverzagt, F.W., Stoddard, A.M., and Wright, W. (2006). Long-term effects of cognitive training on everyday functional outcomes in older adults. Journal of the American Medical Association, 296 (23).

 [COMMENT0000000052]