Lidovky.cz

Vědecký trapas: Konferenční bláboly generoval počítač

  22:38

Cyril Labbé ukazuje, jak snadné je ošálit vydavatele publikací. Springer a IEEE musely stáhnout desítky nesmyslných textů.

Seznamte se: Ike Antkare, supervědec s h-indexem 94! Jako člověk ale neexistuje... foto: © archiv, repro Česká poziceČeská pozice

Opisování vědeckých textů už je passé, nově se ujímá jejich náhodné tvoření! Tak by se daly v nadsázce popsat okolnosti vpravdě bizarní ostudy. Na jejím konci je stažení více než stovky „odborných článků“ z databáze vydavatele Springer a Institute of Electrical and Electronic Engineers (IEEE). Jejich autory totiž nebyli výzkumníci, nýbrž – software. Ač se to týká především oboru IT, někdy se zdá, že takový generátor náhodných shluků slov už zasáhl i postmoderní společenské vědy...

Ale popořádku. Francouzský informatik Cyril Labbé z univerzity v Grenoblu katalogizoval konferenční příspěvky, které se objevovaly v letech 2008 až 2013. A zjistil, že 16 z těch, které publikoval Springer, a více než sto otištěných v IEEE, bylo jen počítačově generovanými nesmysly. Jednou z vygenerovaných kravin byl například text o budoucnosti a rizicích inženýrství, který se objevil loni v Číně. Redaktoři časopisu Nature se pokoušeli kontaktovat „autory“ i zástupce konferencí, ale až na výjimky nebyli úspěšní...

Labbé se zaměřil na texty, jež byly sestaveny softwarovým nástrojem SCIgen, který náhodně kombinuje shluky slov, aby vytvořil falešné články o IT. Kouzlem osudu byl SCIgen před lety vyvinut „ajťáky“ z MIT, kteří tím chtěli ukázat, že vědecké konference klidně přijmou i nesmyslné články. Jeden satirický web zase náhodně generuje názvy fyzikálních článků a nechává návštěvníky hádat, který z nich je „fake“ a který naopak „pravý“.

SCIgen je zdarma k využití, a jak je vidět, někdo se s jeho výtvorem skutečně občas pokusí proniknout na vědecká sympozia. Labbé prokázal, že v desítkách výskytů dokonce i úspěšně. Většina konferencí se uskutečnila v Číně, autory zfalšovaných příspěvků byli vesměs ti s čínskou afiliací. Oslovení pořadatelé odmítali uznat svou chybu, mlžili a bagatelizovali vlastní odpovědnost.

Spamovací válka vědeckých srdcí

„Věděl jsem, že se to (náhodné generování článků) určitě děje, ale netušil jsem, v jakém rozsahu,“ řekl magazínu Nature programátor Jeremy Stribling, jenž byl spoluautorem softwaru SCIgen. Podle Labbého je ovšem docela snadné uměle poskládané elaboráty odhalit. Vytvořil též stránku pro „SCIgen detekci paperů“, kam je možné nahrát zazipované soubory s PDF podklady a aplikace prověří, zda jsou texty cinknuté, nebo ne.

Je ovšem velmi pozoruhodné, že vygenerované příspěvky údajně prošly i recenzním řízením, peer-review... Četli je lidé?Příspěvky, které neprošly Labbého detekcí, pak sám oznámil vydavatelství Springer a IEEE. Obě instituce zareagovaly shodně: bláboly vyřadily ze svých elektronických databází a zavádějí postupy, aby již nikdy nepronikly mezi skutečnou vědu, skutečné myšlení. Je ovšem pozoruhodné, jak říká Ruth Francisová, tisková mluvčí Springeru, že vygenerované konferenční příspěvky údajně prošly recenzním řízením... Četli je opravdu lidé?

Labbé je zaníceným bojovníkem proti podvodům vědy. Už v roce 2010 si proto vytvořil fiktivního autora jménem Ike Antkare, který „sepsal“ 102 článků pomocí nástroje SCIgen. Nesmysly pak nahrál do databáze Google Scholar, čímž vyšrouboval Ikeho pomyslný Hirschův index na astronomickou cifru 94, kterou se pyšní vůbec nejcitovanější vědci. V tabulkách pak vybájeného profesora Antkareho vystřelil jakoby na 21. světovou příčku! Nyní Labbé tvrdí, že jeho nejnovější objevy jsou jen příznakem „spamovací války v srdci vědy“.

zpět na článek


© 2024 MAFRA, a.s., ISSN 1213-1385 © Copyright ČTK, Reuters, AFP. Publikování nebo šíření obsahu je zakázáno bez předchozího souhlasu.