Docol©c
Anleitung    Login erstellen

Docol©c - Fragen und Antworten

Prüfauftrag

Welche Dokumentenformate werden unterstützt?

Momentan werden die Dokumentenformate PDF, DOC, DOCX, RTF, HTML, PPT (PowerPoint®), XLS (Excel®) und Textdateien unterstützt.

Wie müssen Internet-Quellen angegeben werden; welche Protokolle werden unterstützt?

Prüfdokumente, die nicht von lokaler Festplatte hochgeladen werden, sondern aus dem Internet geladen werden (z.B. beim Prüfen einer bestimmten Webseite) können über die Protokolle http://, https://, ftp:// oder ftps:// direkt angesprochen werden.

Kann man den Service auch per SOAP-Webservice nutzen?

Ja. Eine vollständige SOAP Schnittstelle existiert, um Docol©c automatisch aus E-Learning-Plattformen oder Konferenz-Management-Software heraus aufzurufen. Die WSDL-Datei sowie weitere Informationen erhalten Sie gerne auf Anfrage.

Gibt es weitere Unterstützung bei der Verarbeitung großer Dokumentmengen?

Ja. Aufgrund unterschiedlicher Anwendungsfälle bieten wir individuelle Lösungen. Bitte nehmen Sie Kontakt mit uns auf.

Kann Docol©c auch Dokumente aus einem privaten Intranet bei der Suche berücksichtigen?

Nach Indizierung der Daten: Ja. Entweder wir übernehmen die Indizierung für Sie oder unterstützen Sie bei einer eigenen Lösung. Bitte nehmen Sie Kontakt mit uns auf.

Benötigt man zur Prüfung im Demo-Modus eine Lizenz?

Nein. Der Demo-Modus ist öffentlich nutzbar. Sie müssen lediglich angemeldet sein.

Was ist der Unterschied zwischen "demo" und "professionell"?

Ein Prüfauftrag im Demomodus ist kostenlos und in seiner Suchgenauigkeit sehr stark eingeschränkt. Es werden lediglich einige zufällige Stellen exemplarisch durchsucht. Im Modus "professionell" wird das zu prüfende Dokument optimal untersucht und die Ergebnisse detailliert aufgelistet.

Kann man mehrere Dateien auf einmal hochladen?

Ja, Sie müssen dazu angemeldet sein und einen anderen Browser als den Internet Explorer verwenden. Mit Firefox, Safari oder Chrome können Sie mehrere Dateien auswählen und mit einem Klick hochladen.

Weshalb erscheint die gleiche Seite wieder, nachdem ich auf "Plagiatprüfung starten" geklickt habe?

Nach dem Hochladen des zu prüfenden Dokuments wird der Prüfauftrag in Ihrem Konto abgelegt und wenn alle Rechte vorhanden sind, direkt gestartet. Es erscheint die gleiche Seite wieder, um mit der Eingabe von Prüfaufträgen fortzufahren.

Was passiert wenn man sich den Report "nur per Email" zusenden lässt?

In diesem Fall wird das Dokument und der Report nicht im Konto gespeichert, sondern nach der Plagiatprüfung per Email versendet und der Vorgang gelöscht.

Weshalb erscheinen die Felder ID und Passwort rosa, nachdem ein Prüfauftrag gestartet wurde?

Sie können Prüfaufträge anlegen, auch wenn Sie noch nicht angemeldet sind. Um Prüfungen jedoch anzustoßen, müssen Sie angemeldet sein. Die rosa Felder zeigen an, dass Sie noch nicht angemeldet sind. (Es existiert eine Sitzung mit Daten, die noch keiner Person zugeordnet ist.)

Kann dasselbe Dokument mit geänderten Einstellungen erneut geprüft werden?

Ja. Das bereits geprüfte Dokument muss jedoch zuvor aus Ihrem Konto gelöscht werden.

Können beliebig große Dateien hochgeladen werden?

Nein, die maximale Dateigröße liegt bei zirka 40 MB. Falls Ihre Datei größer ist, löschen Sie Grafiken und Bilder aus der Datei und versuchen Sie es erneut. Da Docol©c ausschließlich Textinhalte zur Prüfung verwendet, haben Grafiken und Bilder keine Einfluss auf das Ergebnis.

Ihr Konto

Wenn ich nicht angemeldet bin, sind dann hochgeladene Prüfaufträge öffentlich zugänglich?

Nein, auf keinen Fall. Es existiert bereits eine private Sitzung. Wenn Sie sich anmelden, werden alle Sitzungsdaten in Ihr Konto übernommen.

Wann werden Prüfungen zurückgehalten und nicht gleich gestartet?

Immer dann, wenn Sie zum Zeitpunkt des Prüfauftrags noch nicht genügend Rechte besaßen, um die Prüfung zu starten. Das ist der Fall...
...wenn Sie zum Zeitpunkt des Prüfauftrags noch nicht angemeldet waren oder
...wenn Sie den Prüfmodus "professionelle" auswählten, aber Ihr Konto noch nicht lizenziert ist.

Werden Dokumente nach der Prüfung von Docol©c gespeichert?

Dokumente, die zur Überprüfung bei Docol©c eingereicht werden bleiben ebenso wie die erzeugten Reports unter vollständiger Kontrolle durch den Benutzer. Sobald dieser ein Dokument aus seinem Account entfernt, wird dieses vollständig von den Servern von Docol©c entfernt. Für eine Überwachung des Systems sowie zu Zwecken der statistischen Auswertung werden anonymisierte Daten über die geprüften Dokumente sowie die gefundenen Textstellen gespeichert. Ein Rückschluss auf die, diesen Daten zugrunde liegende, Arbeit ist jedoch nicht möglich, da Name und Inhalt der Dokumente weder vollständig noch teilweise gespeichert werden.

Werden Dokumente die sich in meinem Account befinden bei der Plagiatsuche ebenfalls durchsucht?

Nein, Dokumente die sich in den Nutzeraccounts befinden werden von Docol©c nicht durchsucht.

Herkunftsreport

Was bedeutet der Prozentsatz, wie wurde er berechnet?

Zu Anfang eines jeden Reports ist zu lesen: “Es wurden insgesamt 50 Textstellen überprüft. Davon wurden 21 Textstellen (42,0%) in anderen Dokumenten gefunden.” Wobei sich die Zahlen selbstverständlich von Report zu Report unterscheiden. Der Prozentsatz gibt also das Verhältnis gefundener Textstellen zu überprüften Textstellen an (21/50 = 42,0%).

Wenn ich auf die gelb markierten Stellen klicke passiert nichts?

Da der Herkunftsreport interaktive Funktionen enthält, müssen Sie im Browser Javascript aktiviert haben, um die volle Funktionalität zu erhalten. Außerdem sollten Sie einen aktuellen Browser verwenden, wie beispielsweise Mozilla Firefox ab Version 1.0 oder MS Internet Explorer ab Version 6. Empfohlen wird Mozilla Firefox Version 3.

Der Internet Explorer zeigt am oberen Rand des Herkunftsreports einen Sicherheitshinweis.

Microsoft hat in deren Webbrowsern eine Sicherheitsfunktion eingebaut, so dass nach Herunterladen von HTML-Dokumenten darin enthaltene Programme erstmal geblockt sind. Sie sollten "geblockte Inhalte" im Herkunftsreport zulassen, um alle im Herkunftsreport enthaltenen Informationen nutzen zu können.

Mein E-Mail Programm stürzt ab, wenn ich den Report öffne!

Ein Herkunftsreport beinhaltet in der Regel so viele Seiten, wie das Originaldokument. Zwar werden Grafiken herausgefiltert, bei sehr umfangreichen Dokumenten kann es jedoch vorkommen, dass Ihr E-Mail Programm mit diesen Größen nicht umgehen kann. Bitte laden Sie in diesem Fall den Report mit dem Browser aus Ihrem Konto.

Was bedeutet "Mischsuche" bei der Trefferanzeige?

Bei den Treffern der Mischsuche wurde ein Suchalgorithmus verwendet, der auch weitläufigere Textübereinstimmungen im Text an und vor der markierten Stelle berücksichtigt.

Was ist die Docol©c Digitale Signatur (DDS)?

Der von Docol©c erstellte Herkunftsreport spiegelt die Situation zum Zeitpunkt der Recherche wieder. Mit der Digitalen Signatur kann nachgewiesen werden, dass der Herkunftsreport zum angezeigten Datum von Docol©c erstellt und zwischenzeitlich nicht verändert wurde. Die Signatur ist als Quelltext- Kommentar an das HTML-Dokument angehängt.

Es wurden gar keine oder nur sehr wenige Textstellen geprüft und keine Textstellen gefunden.

Dieser Fall tritt immer dann auf, wenn das zu prüfende Dokument keinen extrahierbaren Text enthält. Ursachen hierfür liegen darin, dass das Dokument den Text nur in Form von Grafiken oder in einer anderen nicht lesbaren Form enthält (siehe auch die folgende Frage).

Der Report enthält nicht das geprüfte Dokument sondern nur leere Seiten oder ausschließlich merkwürdige Zeichen.

Offensichtlich war es nicht möglich den Text des Dokumentes zu extrahieren, da das Dokument diesen nicht in lesbarer Form enthält. Dies tritt beispielsweise dann auf, wenn das Dokument den Text nur als Grafiken enthält (1 Grafik pro Seite), so dass ein direktes Extrahieren des Textes nicht möglich ist.

Handelt es sich bei dem zu prüfenden Dokument um ein PDF-Dokument und enthält der Report nur unleserliche Zeichen, so wurde der Text bei der Erstellung des Dokumentes in einer vom Standard abweichenden Kodierung abgelegt. Der Hintergrund hierfür ist, dass Texte, die in PDF-Dokumente enthalten sind, nicht zwangsläufig in einer Standardkodierung wie z.B. UTF-8 oder ISO-8859-1 enthalten sein müssen. In solchen Fällen enthält das Dokument lediglich die Information welches Fontzeichen an einer bestimmten Stelle einer Seite erscheinen soll, nicht aber um welches Zeichen es sich dabei handelt. Ein "B" kann beispielsweise mit dem Byte 0x0B kodiert und ein "e" als 0x0C kodiert sein und das Dokument enthält eine Zuordnung des Bytes 0x0B zu der dargestellten Form, die ein Mensch als "B" erkennen kann und des Bytes 0x0C zu der Form eines "e". Die Information dass es sich bei dem Zeichen mit der Bytekodierung 0x0B um das Zeichen "B" (0x42 in UTF-8-, ASCII- bzw. ISO-8859-1-Kodierung) fehlt jedoch.

Wenn Sie solch ein Dokument mit dem Acrobat-Reader öffnen und versuchen Teile des Textes zu kopieren, werden Sie feststellen, dass sich der Text entweder gar nicht zum Kopieren markieren lässt oder aber dass beim anschließenden Einfügen in einem beliebigen Textverarbeitungsprogramm Sie die gleichen (unleserlichen) Zeichen erhalten, die im Report vorhanden sind. Ebenso ist ein Durchsuchen des Dokuments im Acrobat Reader nicht möglich.

Wenn Sie das zu Grunde liegende Ursprungsdokument aus dem das PDF-Dokument erzeugt wurde vorliegen haben, sollte eine Überprüfung dieses Dokuments jedoch kein Problem sein. Alternativ können Sie das PDF-Dokument mit einem anderen Programm erzeugen lassen.

Login erstellen / Login ändern

Benötige ich ein Login für Docol©c?

Ja, nur so können Sie den Dienst Nutzen. Einige Funktionen können Sie kennen lernen, ohne sich anzumelden. Um jedoch Demo- oder professionelle Prüfungen durchzuführen müssen Sie am System angemeldet sein.

Wie kann ich mich anmelden?

Rufen Sie die Seite "Login erstellen" auf und füllen Sie die Registrierungsfelder korrekt aus. ID und Passwort können Sie selber frei wählen. Merken Sie sich bitte auf jeden Fall die ID.

Was ist der Unterschied zwischen ID und Lizenzschlüssel?

ID steht für Identifikation und bezeichnet die eindeutige Kennung Ihres Kontos. Zusammen mit dem geheimen Passwort benötigen Sie die ID für den Zugang zu Ihren privaten Daten.
Mit einem Lizenzschlüssel kann Ihr und noch weitere Benutzerkonten freigeschaltet werden.

Wo trage ich den Lizenzschlüssel ein?

Nachdem Sie angemeldet sind, erscheint auf der "Login ändern"-Seite ein Feld zur Eingabe des Lizenzschlüssels.

Einstellungen

Können Plagiate exakt bestimmt werden?

Ab wann es sich bei einer Textstelle um ein Plagiat handelt, ist häufig nicht exakt zu bestimmen. Werden die Muster zu weit gefasst, erhält man zu viele nicht plagiierte Stellen und aufwendige manuelle Überprüfungen werden notwendig. Werden die Muster zu eng gelegt, werden viele Stellen "übersehen".

Welchen Einfluss haben die Suchoptionen?

Je mehr Worte geprüft werden, desto geringer ist die Fehlerrate der Treffer. Wird das Erstellungsdatum berücksichtigt, werden nur Dokumente durchsucht, die älter sind, als das Prüfdokument oder deren Erstellungsdatum nicht bekannt ist.

Welchen Einfluss hat die Fragmentlänge?

Wird die Fragmentlänge kürzer gewählt, steigt in der Regel die Anzahl der Treffer, allerdings nimmt die Anzahl der falschen Treffer zu. Dies führt dazu, dass eine hohe Übereinstimmung angezeigt wird, obwohl gar nicht plagiiert wurde. Fragmente mit 9 Wörtern ergeben eine sehr konservative Suche, was die Übereinstimmung angeht und sehr wenig falsche Treffer. Das kann aber dazu führen, dass zu wenig markiert/gefunden wird und dann auch wieder eine Nachprüfung stattfinden muss.

Was verbirgt sich hinter "hoher Relevanz"?

Hohe Relevanz ist sinnvoll und entfernt solche Fundstellen, die zwar in mehreren Quellen im Internet gefunden wurden, es jedoch keine weiteren Textstellen gibt, die ebenfalls in diesen Quellen gefunden wurden. Dies tritt bspw. bei Literaturverweisen oder rein zufällig auf.

Welchen Einfluss haben die Einstellungen zur Textanalyse?

Die Textanalyse-Einstellungen sagen aus, wie genau ein Dokument untersucht wird. Es werden mehr Stellen überprüft bei geringerer Wörtergüte und kurzen Sätzen. Allerdings eventuell auch unrelevante. Wird bei der Absatzlänge etwas verändert, werden insgesamt nur noch Absätze betrachtet, die aus mehr als einem Satz bestehen, was die Analyse vergröbert.

Was versteht man unter "Wörtergüte"?

Es gibt Wörter innerhalb eines Satzes, die einen geringen Identifikationswert für den Satz besitzen. Hier kann eingestellt werden, wie hoch die Qualität des Satzes ist, ausgedrückt in Prozent qualitativ guter Wörter eines Satzes.

Wieso lässt man sich nicht immer die maximale Anzahl Vergleichsdokumente anzeigen?

Häufig sind hochwertige Quellen mehrfach vorhanden. Werden viele dieser Dokumente im Herkunftsreport aufgelistet, erhält man zwar einen guten Überblick über vorhandene Quellen, allerdings reicht theoretisch ein Vergleichsdokument zum Nachweis einer plagiierten Stelle.

Welches sind die optimalen Einstellungen?

Grundsätzlich lässt sich sagen, dass die Standardeinstellung in der Regel die besten Einstellungen sind. Diese wurden in umfangreichen Tests für deutsch- und englischsprachige Dokumente ermittelt.

Weitere Informationen

Was bedeutet der Name Docoloc?

Docol©c setzt sich zusammen aus "document", "co-location", also dem Auffinden eines Dokuments an einem anderen Ort und "collocation" also dem zusammenhängenden Gebrauch mehrere Wörter.

Wo finde ich weitere Informationen zum Thema Plagiate?

Folgend externen Webseiten liefern hilfreiche Informationen:
Weber-Wulff, D.: Plagiat & Fremde Federn
Resolution des Deutschen Hochschulverbandes
Plagiarism @ University of Sussex
University of Leeds Plagiarism Guide
IEEE Plagiarism Guidelines
ACM Policy and Procedures on Plagiarism
teachers.tv: Secondary ICT - Plagiarism - A Cut and Paste Generation

Kontakt


Docoloc UG (haftungsbeschränkt) & Co. KG
Methfesselstraße 2
38106 Braunschweig
Germany
E-Mail: info@docoloc.de
Telefon +49-531-3495570
Telefax +49-531-3495571
Amtsgericht Braunschweig HRA 200859
USt-ID-Nr.: DE269775384

Persönlich haftende Gesellschafterin:
Ifalt UG (haftungsbeschränkt)
Sitz Braunschweig, Germany
Amtsgericht Braunschweig HRB 201951
Geschäftsführer: Dr.-Ing. Jens Brandt, Dr.-Ing. Martin Gutbrod



Kontakt - Preise und AGBs - Grundsätze - Referenzen - Hilfe

©2010 Docoloc KG - IBR/ITM Forschungspartner - Plagiatsuche in Milliarden Dokumenten
 deutsch english