Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation

Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funkt...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Manner, Anita
Muut tekijät: Humanistis-yhteiskuntatieteellinen tiedekunta, Faculty of Humanities and Social Sciences, Kieli- ja viestintätieteiden laitos, Department of Language and Communication Studies, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Pro gradu
Kieli:eng
Julkaistu: 2025
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/101918
Kuvaus
Yhteenveto:Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funktionaaliset piirteet. Tutkielmassa teknisten viestijöiden kirjoittama aineisto koostui www-sisällönhallintaohjelmistojen käyttäjädokumentaatiosta. Tekoälyn tuottama aineisto koostui puolestaan OpenAI:n kehittämän suuren kielimallin GPT 4-o mini generoimista teksteistä. Tekstien tuottamisessa hyödynnettiin Ranade ym. (2024) kehotesuunnittelun metodia. Sananippujen rakenteellisia ja funktionaalisia piirteitä lähestyttiin Biber ym. (1999) ja Hylandin (2008b) viitekehysten kautta. Korpusten välisten erojen tilastollista merkitsevyyttä mitattiin log-uskottavuusfunktiolla. Tutkimustulokset osoittivat, että tekoälyn tuottamassa käyttäjädokumentaatiossa on enemmän sananippuja ja kaavamaista kieltä. Nippujen rakenteellisen analyysin perusteella ihmisten ja tekoälyn tuottamien tekstien merkittävimmät erot olivat nomini- ja verbilausekkeissa. Funktionaalinen analyysi puolestaan viittasi siihen, että tekniset viestijät käyttävät enemmän kuvailevia nippuja teksteissään kuin tekoäly. Eri korpuksista poimittujen nippujen rakenteellisissa ja funktionaalisissa piirteissä oli myös paljon samankaltaisuuksia, mikä voi johtua kielimallin koulutusdatan kattavuudesta. Tutkielma tarjoaa uutta tietoa leksikaalisista nipuista teknisessä viestinnässä sekä tekoälyn tuottamissa teksteissä. Analyysin perusteella tekoälyn hyödyntäminen kirjoitustyössä sekä tiedonhaussa edellyttää erityistä tietoisuutta syötteiden vaikutuksesta mallien tuottamaan tekstiin.