Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation

Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funkt...

Full description

Bibliographic Details
Main Author: Manner, Anita
Other Authors: Humanistis-yhteiskuntatieteellinen tiedekunta, Faculty of Humanities and Social Sciences, Kieli- ja viestintätieteiden laitos, Department of Language and Communication Studies, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:eng
Published: 2025
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/101918
Description
Summary:Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funktionaaliset piirteet. Tutkielmassa teknisten viestijöiden kirjoittama aineisto koostui www-sisällönhallintaohjelmistojen käyttäjädokumentaatiosta. Tekoälyn tuottama aineisto koostui puolestaan OpenAI:n kehittämän suuren kielimallin GPT 4-o mini generoimista teksteistä. Tekstien tuottamisessa hyödynnettiin Ranade ym. (2024) kehotesuunnittelun metodia. Sananippujen rakenteellisia ja funktionaalisia piirteitä lähestyttiin Biber ym. (1999) ja Hylandin (2008b) viitekehysten kautta. Korpusten välisten erojen tilastollista merkitsevyyttä mitattiin log-uskottavuusfunktiolla. Tutkimustulokset osoittivat, että tekoälyn tuottamassa käyttäjädokumentaatiossa on enemmän sananippuja ja kaavamaista kieltä. Nippujen rakenteellisen analyysin perusteella ihmisten ja tekoälyn tuottamien tekstien merkittävimmät erot olivat nomini- ja verbilausekkeissa. Funktionaalinen analyysi puolestaan viittasi siihen, että tekniset viestijät käyttävät enemmän kuvailevia nippuja teksteissään kuin tekoäly. Eri korpuksista poimittujen nippujen rakenteellisissa ja funktionaalisissa piirteissä oli myös paljon samankaltaisuuksia, mikä voi johtua kielimallin koulutusdatan kattavuudesta. Tutkielma tarjoaa uutta tietoa leksikaalisista nipuista teknisessä viestinnässä sekä tekoälyn tuottamissa teksteissä. Analyysin perusteella tekoälyn hyödyntäminen kirjoitustyössä sekä tiedonhaussa edellyttää erityistä tietoisuutta syötteiden vaikutuksesta mallien tuottamaan tekstiin.