Bester Plagiate-Erkennungsalgorithmus kommt aus Deutschland

22.06.2009 | Kurzmeldung

Die Fakultät Medien der Bauhaus-Universität Weimar hat zusammen mit der Universidad Politécnica de Valencia in Spanien einen internationalen Wettbewerb zur automatischen Erkennung von digitalen Plagiaten durchgeführt. Jetzt stehen die Sieger fest. Mit dem Wettbewerb wollten die Initiatoren - selbst Forscher im Bereich digitale Plagiate - herausfinden, wie gut aktuelle automatische Plagiat-Erkennungsalgorithmen arbeiten.


13 Plagiat-Experten aus Deutschland, Österreich, Spanien, Italien, Tschechien, den USA, Großbritannien, Nigeria, Südkorea, Israel, Griechenland, Brasilien, Kanada und der Ukraine hatten sich am Wettbewerb beteiligt.
Den Experten wurden zwei Aufgaben gestellt: Erstens musste eine Anzahl an verdächtigen Dokumenten mit potentiellen Quelldokumenten verglichen und die plagiierten Stellen aufgefunden werden. Zweitens mussten in einer Anzahl an verdächtigen Dokumenten plagiierte Textstellen auf Grund von textlichen Auffälligkeiten wie Stilbrüchen gefunden werden. Die zur Verfügung gestellte Textkollektion bestand aus mehr als 20.000 verdächtigen Dokumenten und weiteren 20.000 Quelldokumenten. Per Zufall wurden die künstlichen Plagiate erzeugt, die dann mit Hilfe der Erkennungsalgorithmen aufgespürt werden mussten.

Die Teilnehmer erzielten zum Teil sehr gute Ergebnisse: Der beste Algorithmus in der externen Analyse findet 66 Prozent aller Plagiate, 74 Prozent der gefundenen Plagiate sind richtig. Bei der sehr viel schwierigeren intrinsischen Analyse spürte der Sieger-Algorithmus fast die Hälfte (46 Prozent) aller Plagiate auf.

Der 1. Preis ging an Cristian Grozea (Fraunhofer FIRST - Fraunhofer Institut für Rechnerarchitektur und Softwaretechnik, Berlin), der auch den ersten Platz in der Externen Plagiat-Analyse belegte. Der zweite Preis in der Kategorie Intrinsische Plagiat-Analyse wurde an Efstathios Stamatatos (University of the Aegan, Griechenland) verliehen.

Die Ergebnisse des Wettbewerbs können auf der Wettbewerbsseite abgerufen werden:
http://www.webis.de/pan-09/competition.php

Quelle:heise.de, 20.06.2009


Gepostet von: mschmidt
Kategorie: Kurzmeldung