Microsofts Excel soll etliche wissenschaftliche Arbeiten zum Thema Genetik verfälscht haben.

Foto: Screenshot/WebStandard

Etliche wissenschaftliche Arbeiten zum Thema Genetik sollen schwerwiegende Excel-Fehler aufweisen. Dies geht aus einer Analyse von fast 3.600 Arbeiten aus den unterschiedlichsten Bereichen hervor. Aufgedeckt wurden die vielen Fehler mit dem Microsoft-Programm von australischen Forschern und das Ergebnis in der Fachzeitschrift "Genome Biology" publiziert.

Liste von Genen

Bei den Arbeiten zum Überthema Genetik muss eine Liste mit den Genen angegeben werden, die bei der Recherche miteinbezogen wurden. Laut den Forschern soll circa eine von fünf Arbeiten Fehler in der Gen-Liste aufweisen. Die Schuld ist allerdings nicht bei schusseligen Akademikern, sondern dem Microsoft-Programm zu suchen.

Das Gen "Septin 2" wird mit "SEPT2" abgekürzt, was in weiterer Folge dazu führt, dass Excel daraus den zweiten September macht.
Foto: Washington Post

Automatische Formatierung

Dieses soll nämlich Gene zu Kalenderdaten oder zufälligen Nummern konvertiert haben. Typischerweise wird etwa das Gen "Septin 2" mit "SEPT2" abgekürzt, was dazu führte, dass dadurch einfach der 2. September wurde. Problematisch daran ist zudem, dass die Konvertierung nicht einfach zurückgenommen werden kann, da Excel das Wort nach der Änderung anders speichert. Somit kann das Feld nur mehr gelöscht werden.

Keine Lösung

Die australischen Forscher verweisen zudem darauf, dass die automatische Formatierung nicht permanent deaktiviert werden kann. Bei jedem Eintrag, wo die Konvertierung eventuell auftreten könnte, muss also angegeben werden, dass es sich dabei um einen Text und kein Datum handelt. Somit ist es kein Wunder, dass etwa 20 Prozent der untersuchten Arbeiten Fehler in der Liste aufweisen.

Umstieg auf R oder Python

Neu ist das Problem übrigens nicht. Ein Paper aus dem vergangenen Jahrzehnt hat bereits auf die fehlerhafte Formatierung hingewiesen. Da auch Konkurrenzprodukte wie Apache OpenOffice Calc oder LibreOffice Calc ähnlich vorgehen, war bisher kein Umstieg auf Alternativen möglich. Somit bleibt den Forschern nur mehr übrig, ganz genau beim Umgang mit Excel zu sein oder auf freie Programmiersprachen für statistische Berechnungen wie R oder Python umzusteigen. (red, 27.08.2016)