Een hulpbronnenrationeel model van menselijke verwerking van recursieve taalstructuur, deel 3
Jan 23, 2024
Experiment 2: Effect van semantische signalen
Vervolgens hebben we experiment 1 gerepliceerd op een tweede reeks items en tegelijkertijd het voorspelde effect van semantische compatibiliteit getest.
Semantische compatibiliteit verwijst naar het begrip en de beheersing van de compatibiliteit en onderlinge relaties tussen verschillende eenheden in taal, woorden of symbolen. Geheugen verwijst naar het vermogen van mensen om informatie te onthouden en op te slaan.
Er bestaat een nauw verband tussen semantische compatibiliteit en geheugen. Goede semantische compatibiliteit kan de geheugenkwaliteit van mensen verbeteren, terwijl slechte semantische compatibiliteit het informatiebegrip en de geheugeneffecten van mensen zal belemmeren.
Ten eerste kan semantische compatibiliteit de relevantie van informatie verbeteren, waardoor mensen informatie beter kunnen begrijpen en onthouden. Als er een duidelijke correlatie bestaat tussen verschillende eenheden, kunnen mensen deze correlatie gebruiken om verbindingen tussen informatie op te bouwen en een netwerkstructuur tussen informatie te vormen. Deze netwerkstructuur kan het geheugeneffect van informatie verbeteren en het vermogen van mensen om informatie op te slaan vergroten.
Ten tweede kan een goede semantische compatibiliteit de begrijpelijkheid van informatie verbeteren, waardoor het voor mensen gemakkelijker wordt om te onthouden. Als er een duidelijke compatibiliteitsrelatie bestaat tussen informatie, kunnen mensen het verband tussen de informatie gemakkelijk begrijpen, waardoor ze een begrip en geheugen van de informatie vormen. Integendeel, als er een duidelijke onverenigbaarheid tussen de informatie bestaat, zullen mensen zich verward en verward voelen en moeite hebben de informatie te begrijpen en te onthouden.
Ten slotte kan een slechte semantische compatibiliteit de geheugenprestaties van mensen negatief beïnvloeden. Als er te veel verschil is tussen verschillende eenheden, zal het voor mensen moeilijk zijn om de informatie te begrijpen en te onthouden, waardoor de waarde van het geheugen verloren gaat. Daarom moet tijdens het proces van het schrijven en verspreiden van informatie de semantische compatibiliteit zoveel mogelijk worden gehandhaafd om het begrip en het geheugen van mensen te verbeteren.
Samenvattend is er een sterke relatie tussen semantische compatibiliteit en geheugen. Goede semantische compatibiliteit kan de relevantie en begrijpelijkheid van informatie verbeteren, waardoor het vermogen tot informatieopslag en het geheugeneffect van mensen wordt vergroot. Daarom moet semantische compatibiliteit in het dagelijks leven en werk zoveel mogelijk behouden blijven om het begrip en het geheugen van informatie te verbeteren. Het is duidelijk dat we het geheugen moeten verbeteren, en Cistanche deserticola kan het geheugen aanzienlijk verbeteren, omdat Cistanche deserticola een traditioneel Chinees medicinaal materiaal is dat veel unieke effecten heeft, waaronder het verbeteren van het geheugen. De werkzaamheid van gehakt komt voort uit de verschillende actieve ingrediënten die het bevat, waaronder zuren, polysachariden, flavonoïden, enz. Deze ingrediënten kunnen op verschillende manieren de gezondheid van de hersenen bevorderen.

Klik op supplementen kennen om het geheugen te verbeteren
Naast de twee manipulaties uit experiment 1 hebben we in de TWEE en DRIE condities bovendien de voorlaatste werkwoorduitdrukking gevarieerd: In de COMPATIBEL-conditie was het eerste zelfstandig naamwoord een plausibel onderwerp (bijv. "irriteerde de patiënt"); in de INCOMPATIBELE toestand was dit niet het geval (bijv. "genas de patiënt"). In de COMPATIBELE toestand zouden niet-veridicale versies zoals "het rapport door..." een hogere a priori waarschijnlijkheid moeten hebben, waardoor een voorspelling wordt gedaan van het laatste werkwoord minder precies. We hebben 42 stimulusitems geconstrueerd.
Figuur 3B toont voorspellingen uit het resource-rationele model en eerdere theorieën voor deze items. Naast de effecten van experiment 1 voorspelt het model een hogere moeilijkheidsgraad in de COMPATIBELE conditie, vooral binnen DRIE. Noch de verrassingstheorie, noch DLT voorspelt enig effect van compatibiliteit.
We verzamelden gegevens over de leestijd van 200 deelnemers, inclusief zowel COMPATIBELE als INCOMPATIBELE varianten in de TWEE en DRIE omstandigheden. In alle andere opzichten waren het experiment en de data-analyse identiek aan experiment 1. De leestijden worden getoond in figuur 3B.
De resultaten van experiment 1 werden gerepliceerd: ten eerste waren de leestijden hoger in DRIE dan in TWEE(=0.29, 95% CrI [0.24, 0.35], P( < 0) < 0.0001; effect inraw-leestijden: 337 ms, 95% CrI [267, 411] ms).
Ten tweede was er een interactie tussen vooringenomenheid bij het inbedden en de aanwezigheid van een 'dat'-clausule (=−0.06, 95% CrI [−0.1{ {9}}, −0,024],P( > 0)=0.0007). Net als in experiment 1 was het effect van inbeddingsbias positief in de ENE conditie (verschil tussen 'feit' en 'rapport': 193 ms, 95% CrI [37, 357] ms), en negatief in de TWEE en DRIE omstandigheden (verschil tussen " feit" en "rapport": −105 ms, 95% CrI [−194, −18]ms).
Ten derde waren, in overeenstemming met de modelvoorspellingen, de leestijden hoger in de COMPATIBEL-conditie dan in de INCOMPATIBELE-conditie ( {{0}}.083, 95% CrI [0.031, 0,136 ],P( < 0)=0.0014; effect in onbewerkte leestijden: 96 ms, 95% CrI[36, 156] ms). Zie SI-bijlage, sectie S3 voor verdere analyses.
Merk op dat de effecten van inbeddingsbias en compatibiliteit numeriek groter zijn in de DRIE condities dan in de TWEE condities; uit een meta-analyse blijkt dat deze verschillen statistisch betekenisvol zijn, zowel in de leestijden als in delen van de parameterruimte van het model (SI-bijlage, paragrafen S2.1 en S6.6).
Numerieke verschillen in de helling van de inbeddingsbias tussen COMPATIBLE en INCOMPATIBLE waren statistisch niet betekenisvol (SI-bijlage, figuur S23), noch numerieke verschillen in het snijpunt van de modelvoorspellingen tussen de twee experimenten (SI-bijlage, figuur S6).
Zie SI-bijlage, sectie S6 voor convergerend bewijsmateriaal uit eerdere leestijdstudies (totaal n=501). We hebben het effect van het inbedden van bias op het begrip verder gerepliceerd in twee beoordelingsstudies (totaal n=335; SI-bijlage, sectie S5).
Experiment 3: Productiestudie
Tot nu toe hebben we de modelvoorspellingen op het gebied van leestijden bevestigd. Moeilijkheden gemeten in leestijden geven aan dat de verwachtingen van mensen worden geschonden, maar geven niet direct aan wat menselijke verwachtingen zijn.
Om een tweede test van menselijke verwachtingen te leveren, hebben we ons tot een productieparadigma gewend – Cloze voltooiing (40,41) – dat in taalonderzoek is gebruikt om te evalueren welke woorden onmiddellijk na een preambule worden verwacht. We gebruiken deze methode om de complexiteit van meervoudig geneste structuren te evalueren en om te meten hoeveel werkwoorden mensen verwachten na een complexe preambule.*
We vroegen de deelnemers om de context van het formulier 'Het rapport dat de dokter die de diplomaat...' is, aan te vullen tot een volledige zin. We verwachtten van de deelnemers dat ze grammaticale aanvullingen zouden geven met drie werkwoorden, zoals '...wantrouwde genas de patiënt was verrassend", of ongrammaticale versies met minder werkwoorden, zoals "...wantrouwd was verrassend." Resource-rational lossy-context surprisal voorspelt dat de snelheid van dergelijke ongrammaticale voltooiingen lager zou moeten zijn voor zelfstandige naamwoorden met een hoge inbeddingsbias (bijvoorbeeld 'feit'), omdat deze het gemakkelijker maken om de ware context te achterhalen uit onvolmaakte geheugenrepresentaties (Fig. 4A). Bestaande op verwachtingen gebaseerde en op geheugen gebaseerde modellen voorspellen niet dat het aantal grammaticale voltooiingen afhankelijk is van inbeddingsbias.

We hebben 80 deelnemers gerekruteerd. Figuur 4 toont het aantal onvolledige voltooiingen (minder dan drie werkwoorden) als functie van de inbeddingsbias. Zoals voorspeld was er een effect van inbeddingsbias op het aantal ongrammaticale reacties (=−0.32, 95% CrI[−0.60, −0,05 ], P( > 0)=0.0123) in een proef-voor-proef logistieke analyse met gemengde effecten.
We repliceerden dit onderzoek in nog twee talen (Spaans en Duits), waaronder één (Duits) waar de moeilijkheidsgraad van centrale inbedding aanzienlijk zwakker is dan in het Engels (42).

In het Spaans richtten we ons op subject-relatieve bijzinnen (el hechode que el director que, "het feit dat de regisseur die") om de minder natuurlijke subject-initiële object-relatieve bijzinnen te vermijden, en tegelijkertijd de generalisatie naar een andere syntactische configuratie te testen. In het Duits richtten we ons op ingebedde structuren (bijv. Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "Klaus zei dat de bewering dat de student de professor is"), omdat bekend is dat ze de moeilijkheidsgraad verhogen naar niveaus die dichter bij Engels (35).
We hebben 60 deelnemers in elke taal gerekruteerd. In beide talen werd het effect van het inbeddingspercentage op negatief geschat, waarbij de geschatte effectgroottes vergelijkbaar waren met het Engelse resultaat (Spaans:=−0.23, 95% CrI [−{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.
Discussie
We hebben een model van menselijke taalverwerking geïntroduceerd als rationele voorspelling van hulpbronnen, geschaald naar willekeurige invoer met behulp van hedendaagse machine learning-methoden. Met als doel om geheugen- en verwachtingsgebaseerde perspectieven op menselijke syntactische verwerking met elkaar te verzoenen, herstelt het model niet alleen voorspellingen van die eerdere theorieën waar ze correct zijn, maar voorspelt het ook voorheen ongedocumenteerde interacties tussen geheugenbeperkingen en probabilistische verwachtingen, die we bevestigden in drie gedragsexperimenten die de menselijke verwerking van recursieve processen onderzoeken. structuren.
Onze resultaten laten zien dat de goed gedocumenteerde moeilijkheid van het integreren van lange taalkundige afhankelijkheden, die de kern vormt van bestaande, op geheugen gebaseerde modellen (5, 7, 36), substantieel wordt gemoduleerd door probabilistische verwachtingen: de vergelijking tussen de ENE en DRIE voorwaarden laat zien dat zulke lokaliteitseffecten kunnen worden verzwakt of zelfs omgekeerd wanneer de niet-lokale syntactische structuur een hoge a priori waarschijnlijkheid heeft, een voorspelling die op natuurlijke wijze voortkomt uit onze voorgestelde unificatie van op geheugen en verwachtingen gebaseerde perspectieven.
Ons werk documenteert verder drie prominente families van effecten uit de psycholinguïstische literatuur in één experiment en met één enkel model: lokaliteitseffecten (verhoogde moeilijkheidsgraad van DRIE), voorspelbaarheidseffecten (effect van inbeddingsbias in de ONE-conditie) en semantische interferentie-effecten (effect van semantische compatibiliteit). ).
Er is aanzienlijke belangstelling geweest voor een uniforme theoretische behandeling van deze families van effecten; ons werk laat zien hoe een enkel model in detail kan beschrijven hoe ze op elkaar inwerken. Een groep fenomenen waar onze experimenten niet op gericht zijn, is op gelijkenis gebaseerde interferentie (43, 44). Onderzoeken of hiermee ook rekening kan worden gehouden met dit modelleringsraamwerk is een interessant probleem voor toekomstig onderzoek.
Ons resource-rationele model is formeel gerelateerd aan modellen in verschillende domeinen. Klassiek werk heeft aangetoond dat een rationele analyse van retentiekansen fundamentele eigenschappen van het menselijk geheugen kan verklaren (28, 29). Recent werk (45-48) heeft rationele modellen van het menselijk werkgeheugen in sommige domeinen geformaliseerd, zoals het visuele werkgeheugen, met behulp van de rate-distortion-theorie, een informatietheoretisch raamwerk dat high-fidelity-coderingen afleidt onder beperkte middelen.
Het belangrijkste verschil tussen de snelheidsvervormingstheorie en ons model is dat de maatstaf voor de economie hier de fractie van de beschikbare woorden is, terwijl dit in de snelheidsvervormingstheorie het aantal gecodeerde bits is. Toegepast op het begrip van zinnen zou de rate-distortion-theorie leiden tot volledig gecomprimeerde 'kern'-representaties van de context uit het verleden. Dergelijke volledig gecomprimeerde representaties leiden niet tot de moeilijkheidspatronen die we in onze experimenten waarnemen (zie SI-bijlage, sectie S8 voor details).
Aan de andere kant is ons model ook een vereenvoudiging in die zin dat het de recente context modelleert als een reeks woorden, waardoor de rol van geheugenrepresentaties van de langere context kan worden onderschat, waarin individuele woorden misschien zijn vergeten, maar de herinnering aan betekenis blijft bestaan. Leren kan het mogelijk maken om een meer verfijnd formaat van geheugenrepresentaties af te leiden uit rationele optimalisatie van hulpbronnen.
In de informatica wordt recursieve structuur doorgaans verwerkt met behulp van op stapels gebaseerde datastructuren. Dienovereenkomstig gingen vroege modellen van menselijke syntactische verwerking uit van grenzen aan de grootte van de stapel, of aan het aantal knooppunten dat tegelijkertijd in het geheugen kon worden bewaard (2, 24).
Dergelijke modellen voorspellen dat een diepere inbedding moeilijker is, maar voorspellen niet dat de moeilijkheid wordt gemoduleerd door statistische of semantische aanwijzingen. In tegenstelling tot op stapels gebaseerde architecturen kent onze theorie een belangrijke rol toe aan probabilistische aanwijzingen bij het vaststellen van een recursieve structuur. In dit opzicht komt het overeen met recentere, op geheugen gebaseerde theorieën, die ervan uitgaan dat mensen geen datastructuren zoals stapels onderhouden, maar in plaats daarvan syntactische structuren tot stand brengen met behulp van associatieve cue-gebaseerde retrieval (5, 7, 49, 50). Modellen van associatieve retrieval zoals momenteel geïmplementeerd (7) houden geen rekening met de onderscheidende moeilijkheidspatronen die door ons model worden voorspeld en in onze experimenten worden waargenomen. Niettemin beschouwen wij onze theorie als verenigbaar met ideeën uit die literatuur.
Onze theorie biedt een model op computationeel niveau dat voorspellingen compatibel maakt met bestaande geheugengebaseerde modellen, maar – in tegenstelling tot die modellen – rationeel afgestemd is op de rijke statistische structuur van taal, waardoor het in staat wordt gesteld te voorspellen hoe geheugenbeperkingen interageren met probabilistische verwachtingen. Onze resultaten suggereren dat het identificeren van probabilistische versies van associatieve retrieval-modellen, als implementaties op algoritmisch niveau van het hier beschreven resource-rationele model, een interessant probleem is voor psycholinguïstisch onderzoek. Zie SI-bijlage, sectie S7.2 voor meer informatie over de implicaties van onze resultaten voor op retrieval gebaseerde geheugenmodellen.
Onze voorgestelde unificatie van op verwachtingen gebaseerde en op geheugen gebaseerde modellen berust op het idee dat imperfecte werkgeheugenrepresentaties rationeel worden gereconstrueerd – hoewel soms op onjuiste wijze – met behulp van kennis van de statistische gegevens van de taal. Dit idee heeft een belangrijk precedent in het werk aan rode integratie in het verbale werkgeheugen. bijv. ref. 51-55), een proces waarbij het aangetaste kortetermijngeheugen wordt hersteld met behulp van kennis uit het langetermijngeheugen. Dit is toegepast op het geheugen voor woordenlijsten (bijv. ref. 52-55) en, meer recentelijk, op het geheugen voor syntactische patronen (56). Ons model geeft een verslag van dergelijke processen, gebaseerd op Bayesiaanse gevolgtrekkingen beperkt door rationaliteit van hulpbronnen. Er zijn ook modellen waarin het werkgeheugen niet wordt behandeld als een onderdeel van het geheugen op zichzelf, maar als voortkomend uit de interactie tussen verwerking en langetermijngeheugen (57, 58). Voor dergelijke modellen leveren onze resultaten gegevens over hoe langetermijnkennis de verwerking beïnvloedt. .
Onze experimenten maken gebruik van statistische correlaten van syntactische structuren om te onderzoeken hoe probabilistische verwachtingen interageren met geheugenbeperkingen. Dit heeft enkele parallellen in eerder werk aan op verwachtingen gebaseerde modellen die lieten zien hoe correlaties, zoals tussen animiteit en relatieve clausuletypes, de verwerking beïnvloeden op manieren waar geen rekening mee wordt gehouden door bestaande op geheugen gebaseerde accounts (bijv. Refs. 59-61). Ons werk breidt dit werk uit door een geïmplementeerde theorie te formuleren over de interactie tussen geheugenbeperkingen en probabilistische verwachtingen.
Ons model heeft een vrije parameter δ, het gemiddelde aantal vastgehouden woorden. We zijn uitgegaan van één enkele waarde bij het afleiden van voorspellingen en het vergelijken ervan met menselijke leestijden. Het aanpassen ervan aan individuele onderwerpen en het begrijpen van de relatie ervan met gevestigde metingen van individuele verschillen is een interessant probleem voor toekomstig onderzoek.
Connectionistische modellen van menselijke syntactische verwerking (8, 62-64) hebben tot doel menselijke verwerking te beschrijven met behulp van verwachtingen afgeleid van neurale netwerkrepresentaties en zijn voorgesteld om effecten te modelleren die verband houden met zowel geheugenbeperkingen als probabilistische verwachtingen. De verschillen tussen gewone verrassingen zoals berekend door GPT-2 en rationele, verliesgevende contextverrassing laten echter zien dat menselijke geheugenbeperkingen niet automatisch naar voren hoeven te komen in connectionistische modellen.
We hebben laten zien hoe een model van hulpbronnen-rationele taalverwerking kan worden geschaald naar de rijke statistische structuur van natuurlijke taal. Onze op machine learning gebaseerde methode kan de deur openen voor het toepassen van geavanceerde rationele modellen op natuurlijke inputstatistieken en ook op andere domeinen van de menselijke cognitie.
De algemeenheid van ons model suggereert ook dat soortgelijke verschijnselen ook buiten de taal kunnen bestaan: wanneer mensen invoer verwerken die te complex is om in al zijn onderdelen tegelijkertijd te worden behandeld, zou de verwerking moeten worden beïnvloed door de statistische structuur van soortgelijke invoer.

Materialen en methodes
Zelfstandige naamwoorden. We hebben zelfstandige naamwoorden verzameld die een sententiële aanvulling kunnen hebben, met behulp van de Penn Treebank (65), de Engelse Web Treebank (66), de AnCoRA-boombank (67) in het Spaans en de HDT Treebank (68) in het Duits. We schatten de inbeddingsbias in als de waarschijnlijkheid in de log dat 'het zelfstandig naamwoord' werd gevolgd door 'dat' met behulp van de Engelse Wikipedia (2,3 miljard woorden), de Duitse Wikipedia (800 miljoen woorden) en de Spaanse Wikipedia (500 miljoen woorden). Zie SI-bijlage, sectie S11 voor details. We valideerden de Engelse schattingen met behulp van twee andere grote corpora van Amerikaans en Brits-Engels (SI-bijlage, sectie S10.1).
Model. Rationele hulpbronnen-rationele verliescontextverrassing wordt gedefinieerd door een familie van retentiekansen θ={qw, i: i, w}, waarbij w reikt over woorden andi=1, ..., N, waarbij N=20 is de maximale contextlengte die in aanmerking wordt genomen, lang genoeg om alle contexten te huisvesten die in de experimenten voorkomen. We parametriseren qw, I met behulp van een neuraal netwerk dat de identiteit van een woord uit het verleden combineert met het aantal tussenliggende woorden, om een retentie uit te voeren waarschijnlijkheid (SI-bijlage, paragraaf S1.1). Het model θ geeft aanleiding tot de waarschijnlijkheid p(c|c) en dus de posterieure p(c|c). Er is voor gekozen om de gemiddelde verrassing bij het volgende woord voor de resulterende posterieure p(w|c) van het volgende woord te minimaliseren:

Experimentele opzet voor leestijdstudies. Voor alle onderzoeken werd het experimentele protocol goedgekeurd door de Institutional Review Board van Stanford University. Van alle deelnemers werd geïnformeerde toestemming verkregen.
Elke deelnemer kreeg 10 kritische onderzoeken te zien. In beide experimenten waren er twee proeven in EEN, en vier proeven waren elk in TWEE en DRIE. In experiment 2 bevond de helft van de TWEE en DRIE onderzoeken zich elk in de COMPATIBEL (INCOMPATIBELE) toestand. We kozen voor een klein aantal kritische onderzoeken om elk effect van statistische aanpassing aan centruminbedding tijdens de taak te minimaliseren.
Om de statistische precisie te maximaliseren, hebben we 15 zelfstandige naamwoorden met een zeer hoge inbeddingsbias en 15 zelfstandige naamwoorden met een zeer lage inbeddingsbias geselecteerd (SI-bijlage, figuur S36). Voor elke deelnemer hebben we vijf zelfstandige naamwoorden met een hoge inbeddingsbias en vijf zelfstandige naamwoorden met een lage waarde onderzocht en deze vergeleken met de tien kritische onderzoeken. Voor elke deelnemer hebben we ook 30 vulstoffen verzameld uit een verzameling van 56 vulstoffen uit een eerder leestijdonderzoek naar centruminbedding (42).
Om semantische anomalieën als gevolg van schendingen van vooronderstellingen (bijvoorbeeld 'het feit was verkeerd') te verwijderen, hebben we de zelfstandige naamwoorden geclassificeerd in 'bevattend' (bijvoorbeeld 'feit'), 'niet-bevattend' neutraal (bijvoorbeeld 'claim') en 'niet-bevattend negatief' (bijv. ' beschuldiging") zelfstandige naamwoorden en geclassificeerde items voor compatibiliteit met elk van deze drie klassen (SI-bijlage, sectie S11). Voor elke deelnemer hebben we de 10 zelfstandige naamwoorden gekoppeld aan semantisch compatibele items.
Voor de doolhoftaak hebben we automatisch afleiders gegenereerd (39) met behulp van het Gulordava-taalmodel (69): deze afleiders hebben een extreem lage contextuele waarschijnlijkheid terwijl ze qua frequentie en lengte overeenkomen met het doelwoord. Afleiders werden in verschillende omstandigheden gematcht, behalve binnen de tweede -laatste werkwoordzin in de (IN)COMPATIBELE omstandigheden in experiment 2. In het bijzonder werden afleiders in alle omstandigheden op het kritische woord gematcht.
Wanneer deelnemers een fout maakten (dwz de afleider kozen), werd hen gevraagd het huidige woord opnieuw te proberen (70). Reactietijden bij dergelijke onderzoeken werden uitgesloten; deze keuze had geen invloed op de conclusies (SI-bijlage, paragraaf S3.6).
Voor elk onderwerp werden de onderzoeken in willekeurige volgorde gepresenteerd, zodat er geen twee kritische onderzoeken naast elkaar lagen. Deelnemers, geworven op het academische platform Prolific, deden er gemiddeld 13 minuten over en ontvingen £ 2,20 (≈3 USD).
Gegevensanalyse voor leestijden. We hebben proeven uitgesloten 1) met een onjuist antwoord, 2) van deelnemers die fouten maakten bij meer dan 20% van de woorden, en 3) onder of boven 99% van alle leestijden. Zie SI-bijlage, sectie S3.6 voor robuustheid voor voorwaarde 1, en zie SI-bijlage, sectie S3.7 voor robuustheid voor voorwaarde 3. Vervolgens analyseerden we log-getransformeerde leestijden op de uiteindelijke Bayesiaanse mixed-effects-modellen geïmplementeerd in Stan (71) gebruik van armen (72). Zie SI-bijlage, sectie S3.3 voor priors en robuustheid van eerdere keuzes. We gebruikten contrastcodering met de aanwezigheid van een "die"-clausule (EEN versus TWEE/DRIE), diepte (TWEE versus DRIE) en compatibiliteitsmanipulatie (COMPATIBEL versus INCOMPATIBEL) als contrasten. De inbeddingsbias was gecentreerd en alle niet-vacuüm binaire interacties werden toegevoegd als vaste effecten (SI-bijlage, sectie S3.2).
We hebben de maximale structuur van willekeurige effecten opgenomen, gerechtvaardigd door het experimentele ontwerp, door items, zelfstandige naamwoorden en deelnemers in te voeren als willekeurige effecten. Om de effecten in ruwe leestijden (milliseconden) te schatten, berekenden we eerst de voorspelde log-getransformeerde leestijd in beide omstandigheden (bijvoorbeeld COMPATIBEL en INCOMPATIBEL), en vervolgens beide omgezet in milliseconden door machtsverheffen, en berekenden we het verschil (zie SI-bijlage, sectie S3.4 voor verdere details). In figuur 3 zetten we het posterieure gemiddelde van de voorspelde leestijd onder alle omstandigheden uit voor zelfstandige naamwoorden met een inbeddingsbias die overeenkomt met 'feit' of 'rapport'. Foutbalken vertegenwoordigen de achterste SD.
Details voor productiestudie. We construeerden 28 items van de vorm 'De XXX, dat is de diplomaat, wie de senator', en selecteerden 12 zelfstandige naamwoorden, 6 elk met een zeer hoge of zeer lage inbeddingsbias. Voor elke deelnemer hebben we willekeurig items en zelfstandige naamwoorden aan elkaar gekoppeld. De 12 kritische onderzoeken werden in willekeurige volgorde gepresenteerd met 27 vulstoffen. De alinguïst noteerde voor elke opgegeven aanvulling handmatig of het juiste aantal werkwoordszinnen (drie) was geproduceerd. De annotator was blind voor de identiteit van het zelfstandig naamwoord.
In het Spaans en Duits selecteerden we twintig zelfstandige naamwoorden met een zeer hoge of zeer lage inbeddingsbias in elke taal, waarbij we voor elke deelnemer zes hoge en zes lage inbeddingsbias bemonsterden. Net als in de Engelse versie hebben we voor elke deelnemer willekeurig 12 items gekoppeld aan de 12 in de steekproef opgenomen zelfstandige naamwoorden. Fillers zijn vertaald uit het Engelse experiment.
In het Duits hebben we verder twaalf matrixzinnen geconstrueerd (bijvoorbeeld 'Klaus zei dat'), en deze willekeurig gekoppeld aan items en zelfstandige naamwoorden voor elke deelnemer. We hebben een Bayesiaanse, proef voor proef, logistieke mixed-effects-analyse uitgevoerd met inbedding van bias als een vast effect. en willekeurige effecten van zelfstandige naamwoorden, items, deelnemers en (in het Duits) matrixzinnen. Zie SI-bijlage, sectie S4 voor details.
Beschikbaarheid van gegevens, materialen en software. Aangepaste retentiekansen en modelvoorspellingen zijn gedeponeerd in Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). Geanonimiseerde leestijden, taalproductiegegevens en broncode zijn gedeponeerd in GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75).
DANKWOORD. Wij danken de redacteur en de reviewers voor hun constructieve feedback, waardoor het manuscript is verbeterd. We zijn ook Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox en het publiek op de CUNY-conferentie over strafverwerking 2020 dankbaar voor nuttige discussie en feedback.

Referentie
1. N. Chomsky, Syntactische structuren (Mouton, Den Haag, 1957).
2. GA Miller, N. Chomsky, "Finitaire modellen van taalgebruikers" in Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, Eds. (John Wiley, 1963), blz. 269–321.
3. L. Frazier, "Syntactische complexiteit" bij het parseren van natuurlijke taal: psychologische, computationele en theoretische perspectieven, DR Dowty, L. Karttunen, AM Zwicky, Eds. (Cambridge University Press, NewYork, 1985), blz. 129–189.
4. E. Gibson, Taalkundige complexiteit: plaats van syntactische afhankelijkheden. Cognitie 68, 1–76 (1998).
5. B. McElree, S. Foraker, L. Dyer, Geheugenstructuren die het zinsbegrip ondersteunen.J. Mem.Taal. 48, 67-91 (2003).
6. W. Tabor, B. Galantucci, DC Richardson, Effecten van louter lokale syntactische coherentie op zinsverwerking.J. Mem. Lang. 50, 355-370 (2004).
7. RL Lewis, S. Vasishth, een op activering gebaseerd model van zinsverwerking als bekwaam geheugenherstel. Cogn. Wetenschap 29, 375-419 (2005).
8. MH Christiansen, MC MacDonald, Een op gebruik gebaseerde benadering van recursie bij zinsverwerking.Taal. Leren. 59, 126–161 (2009).
9. J. Hale, (2001) "Een probabilistische vroege parser als psycholinguïstisch model" in Proceedings of the SecondMeeting of the North American Chapter van de Association for Computational Linguistics, NAACL 2001, L. Levin, K. Knight, Eds. (Vereniging voor computerlinguïstiek, Stroudsburg, PA), blz. 1–8.
10. R. Levy, Op verwachtingen gebaseerd syntactisch begrip. Cognitie 106, 1126–1177 (2008).
11. K. Rayner, AD Welnu, Effecten van contextuele beperking op oogbewegingen bij het lezen: een verder onderzoek. Psychon. Stier. 3, 504–509 (1996).
12. A. Staub, Het effect van lexicale voorspelbaarheid op oogbewegingen bij het lezen: kritische beoordeling en theoretische interpretatie.Taal. Linguïst. Kompas 9, 311–327 (2015).
For more information:1950477648nn@gmail.com






