Summary: | Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funktionaaliset piirteet. Tutkielmassa teknisten viestijöiden kirjoittama aineisto koostui www-sisällönhallintaohjelmistojen käyttäjädokumentaatiosta. Tekoälyn tuottama aineisto koostui puolestaan OpenAI:n kehittämän suuren kielimallin GPT 4-o mini generoimista teksteistä. Tekstien tuottamisessa hyödynnettiin Ranade ym. (2024) kehotesuunnittelun metodia. Sananippujen rakenteellisia ja funktionaalisia piirteitä lähestyttiin Biber ym. (1999) ja Hylandin (2008b) viitekehysten kautta. Korpusten välisten erojen tilastollista merkitsevyyttä mitattiin log-uskottavuusfunktiolla. Tutkimustulokset osoittivat, että tekoälyn tuottamassa käyttäjädokumentaatiossa on enemmän sananippuja ja kaavamaista kieltä. Nippujen rakenteellisen analyysin perusteella ihmisten ja tekoälyn tuottamien tekstien merkittävimmät erot olivat nomini- ja verbilausekkeissa. Funktionaalinen analyysi puolestaan viittasi siihen, että tekniset viestijät käyttävät enemmän kuvailevia nippuja teksteissään kuin tekoäly. Eri korpuksista poimittujen nippujen rakenteellisissa ja funktionaalisissa piirteissä oli myös paljon samankaltaisuuksia, mikä voi johtua kielimallin koulutusdatan kattavuudesta. Tutkielma tarjoaa uutta tietoa leksikaalisista nipuista teknisessä viestinnässä sekä tekoälyn tuottamissa teksteissä. Analyysin perusteella tekoälyn hyödyntäminen kirjoitustyössä sekä tiedonhaussa edellyttää erityistä tietoisuutta syötteiden vaikutuksesta mallien tuottamaan tekstiin.
|