Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation

Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funkt...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Manner, Anita
Muut tekijät: Humanistis-yhteiskuntatieteellinen tiedekunta, Faculty of Humanities and Social Sciences, Kieli- ja viestintätieteiden laitos, Department of Language and Communication Studies, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Pro gradu
Kieli:eng
Julkaistu: 2025
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/101918
_version_ 1833407614467178496
author Manner, Anita
author2 Humanistis-yhteiskuntatieteellinen tiedekunta Faculty of Humanities and Social Sciences Kieli- ja viestintätieteiden laitos Department of Language and Communication Studies Jyväskylän yliopisto University of Jyväskylä
author_facet Manner, Anita Humanistis-yhteiskuntatieteellinen tiedekunta Faculty of Humanities and Social Sciences Kieli- ja viestintätieteiden laitos Department of Language and Communication Studies Jyväskylän yliopisto University of Jyväskylä Manner, Anita Humanistis-yhteiskuntatieteellinen tiedekunta Faculty of Humanities and Social Sciences Kieli- ja viestintätieteiden laitos Department of Language and Communication Studies Jyväskylän yliopisto University of Jyväskylä
author_sort Manner, Anita
datasource_str_mv jyx
description Tämän tutkielman tavoitteena oli selvittää generatiivisen tekoälyn tuottaman ja teknisten viestijöiden kirjoittaman käyttäjädokumentaation kielellisiä eroja korpusanalyysin avulla. Analyysin keskiössä olivat kolmen ja neljän sanan pituisten sananippujen toistuvuus sekä niiden rakenteelliset ja funktionaaliset piirteet. Tutkielmassa teknisten viestijöiden kirjoittama aineisto koostui www-sisällönhallintaohjelmistojen käyttäjädokumentaatiosta. Tekoälyn tuottama aineisto koostui puolestaan OpenAI:n kehittämän suuren kielimallin GPT 4-o mini generoimista teksteistä. Tekstien tuottamisessa hyödynnettiin Ranade ym. (2024) kehotesuunnittelun metodia. Sananippujen rakenteellisia ja funktionaalisia piirteitä lähestyttiin Biber ym. (1999) ja Hylandin (2008b) viitekehysten kautta. Korpusten välisten erojen tilastollista merkitsevyyttä mitattiin log-uskottavuusfunktiolla. Tutkimustulokset osoittivat, että tekoälyn tuottamassa käyttäjädokumentaatiossa on enemmän sananippuja ja kaavamaista kieltä. Nippujen rakenteellisen analyysin perusteella ihmisten ja tekoälyn tuottamien tekstien merkittävimmät erot olivat nomini- ja verbilausekkeissa. Funktionaalinen analyysi puolestaan viittasi siihen, että tekniset viestijät käyttävät enemmän kuvailevia nippuja teksteissään kuin tekoäly. Eri korpuksista poimittujen nippujen rakenteellisissa ja funktionaalisissa piirteissä oli myös paljon samankaltaisuuksia, mikä voi johtua kielimallin koulutusdatan kattavuudesta. Tutkielma tarjoaa uutta tietoa leksikaalisista nipuista teknisessä viestinnässä sekä tekoälyn tuottamissa teksteissä. Analyysin perusteella tekoälyn hyödyntäminen kirjoitustyössä sekä tiedonhaussa edellyttää erityistä tietoisuutta syötteiden vaikutuksesta mallien tuottamaan tekstiin.
first_indexed 2025-05-12T20:00:40Z
format Pro gradu
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "Hahn, Judit", "language": null, "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Manner, Anita", "language": null, "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2025-05-12T05:54:40Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2025-05-12T05:54:40Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2025", "language": null, "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/101918", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "T\u00e4m\u00e4n tutkielman tavoitteena oli selvitt\u00e4\u00e4 generatiivisen teko\u00e4lyn tuottaman ja teknisten viestij\u00f6iden kirjoittaman k\u00e4ytt\u00e4j\u00e4dokumentaation kielellisi\u00e4 eroja korpusanalyysin avulla. Analyysin keski\u00f6ss\u00e4 olivat kolmen ja nelj\u00e4n sanan pituisten sananippujen toistuvuus sek\u00e4 niiden rakenteelliset ja funktionaaliset piirteet. Tutkielmassa teknisten viestij\u00f6iden kirjoittama aineisto koostui www-sis\u00e4ll\u00f6nhallintaohjelmistojen k\u00e4ytt\u00e4j\u00e4dokumentaatiosta. Teko\u00e4lyn tuottama aineisto koostui puolestaan OpenAI:n kehitt\u00e4m\u00e4n suuren kielimallin GPT 4-o mini generoimista teksteist\u00e4. Tekstien tuottamisessa hy\u00f6dynnettiin Ranade ym. (2024) kehotesuunnittelun metodia. Sananippujen rakenteellisia ja funktionaalisia piirteit\u00e4 l\u00e4hestyttiin Biber ym. (1999) ja Hylandin (2008b) viitekehysten kautta. Korpusten v\u00e4listen erojen tilastollista merkitsevyytt\u00e4 mitattiin log-uskottavuusfunktiolla. Tutkimustulokset osoittivat, ett\u00e4 teko\u00e4lyn tuottamassa k\u00e4ytt\u00e4j\u00e4dokumentaatiossa on enemm\u00e4n sananippuja ja kaavamaista kielt\u00e4. Nippujen rakenteellisen analyysin perusteella ihmisten ja teko\u00e4lyn tuottamien tekstien merkitt\u00e4vimm\u00e4t erot olivat nomini- ja verbilausekkeissa. Funktionaalinen analyysi puolestaan viittasi siihen, ett\u00e4 tekniset viestij\u00e4t k\u00e4ytt\u00e4v\u00e4t enemm\u00e4n kuvailevia nippuja teksteiss\u00e4\u00e4n kuin teko\u00e4ly. Eri korpuksista poimittujen nippujen rakenteellisissa ja funktionaalisissa piirteiss\u00e4 oli my\u00f6s paljon samankaltaisuuksia, mik\u00e4 voi johtua kielimallin koulutusdatan kattavuudesta. Tutkielma tarjoaa uutta tietoa leksikaalisista nipuista teknisess\u00e4 viestinn\u00e4ss\u00e4 sek\u00e4 teko\u00e4lyn tuottamissa teksteiss\u00e4. Analyysin perusteella teko\u00e4lyn hy\u00f6dynt\u00e4minen kirjoitusty\u00f6ss\u00e4 sek\u00e4 tiedonhaussa edellytt\u00e4\u00e4 erityist\u00e4 tietoisuutta sy\u00f6tteiden vaikutuksesta mallien tuottamaan tekstiin.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.abstract", "value": "", "language": "en", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2025-05-12T05:54:40Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2025-05-12T05:54:40Z (GMT). No. of bitstreams: 0\n Previous issue date: 2025", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "98", "language": null, "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.language.iso", "value": "eng", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": null, "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "technical writing", "language": null, "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "software documentation", "language": null, "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "lexical bundle", "language": null, "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "user guide", "language": null, "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "corpus analysis", "language": null, "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation", "language": null, "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "master thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-202505124159", "language": null, "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Humanistis-yhteiskuntatieteellinen tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Humanities and Social Sciences", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Kieli- ja viestint\u00e4tieteiden laitos", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Department of Language and Communication Studies", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": null, "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": null, "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Englannin kieli", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "English", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_bdcc", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.copyright", "value": "\u00a9 The Author(s)", "language": "fi", "element": "rights", "qualifier": "copyright", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "masterThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tekninen viestint\u00e4", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "korpuslingvistiikka", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}, {"key": "dc.description.accessibilityfeature", "value": "unknown accessibility", "language": "en", "element": "description", "qualifier": "accessibilityfeature", "schema": "dc"}, {"key": "dc.description.accessibilityfeature", "value": "ei tietoa saavutettavuudesta", "language": "fi", "element": "description", "qualifier": "accessibilityfeature", "schema": "dc"}]
id jyx.123456789_101918
language eng
last_indexed 2025-05-21T20:06:14Z
main_date 2025-01-01T00:00:00Z
main_date_str 2025
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/a1b9aa42-50fe-4630-912b-e81a7d67a446\/download","text":"URN:NBN:fi:jyu-202505124159.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2025
record_format qdc
source_str_mv jyx
spellingShingle Manner, Anita Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation technical writing software documentation lexical bundle user guide corpus analysis Englannin kieli English tekninen viestintä korpuslingvistiikka
title Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
title_full Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
title_fullStr Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
title_full_unstemmed Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
title_short Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
title_sort comparative analysis of lexical bundles in ai generated vs human written external software documentation
title_txtP Comparative analysis of lexical bundles in AI-generated vs. human-written external software documentation
topic technical writing software documentation lexical bundle user guide corpus analysis Englannin kieli English tekninen viestintä korpuslingvistiikka
topic_facet Englannin kieli English corpus analysis korpuslingvistiikka lexical bundle software documentation technical writing tekninen viestintä user guide
url https://jyx.jyu.fi/handle/123456789/101918 http://www.urn.fi/URN:NBN:fi:jyu-202505124159
work_keys_str_mv AT manneranita comparativeanalysisoflexicalbundlesinaigeneratedvshumanwrittenexternalsoftwaredocume