|
Docol©c
| Anleitung Login erstellen |
Momentan werden die Dokumentenformate PDF, DOC, DOCX, RTF, HTML, PPT (PowerPoint®), XLS (Excel®) und Textdateien unterstützt.
Prüfdokumente, die nicht von lokaler Festplatte hochgeladen werden, sondern aus dem Internet geladen werden (z.B. beim Prüfen einer bestimmten Webseite) können über die Protokolle http://, https://, ftp:// oder ftps:// direkt angesprochen werden.
Ja. Eine vollständige SOAP Schnittstelle existiert, um Docol©c automatisch aus E-Learning-Plattformen oder Konferenz-Management-Software heraus aufzurufen. Die WSDL-Datei sowie weitere Informationen erhalten Sie gerne auf Anfrage.
Ja. Aufgrund unterschiedlicher Anwendungsfälle bieten wir individuelle Lösungen. Bitte nehmen Sie Kontakt mit uns auf.
Nach Indizierung der Daten: Ja. Entweder wir übernehmen die Indizierung für Sie oder unterstützen Sie bei einer eigenen Lösung. Bitte nehmen Sie Kontakt mit uns auf.
Nein. Der Demo-Modus ist öffentlich nutzbar. Sie müssen lediglich angemeldet sein.
Ein Prüfauftrag im Demomodus ist kostenlos und in seiner Suchgenauigkeit sehr stark eingeschränkt. Es werden lediglich einige zufällige Stellen exemplarisch durchsucht. Im Modus "professionell" wird das zu prüfende Dokument optimal untersucht und die Ergebnisse detailliert aufgelistet.
Ja, Sie müssen dazu angemeldet sein und einen anderen Browser als den Internet Explorer verwenden. Mit Firefox, Safari oder Chrome können Sie mehrere Dateien auswählen und mit einem Klick hochladen.
Nach dem Hochladen des zu prüfenden Dokuments wird der Prüfauftrag in Ihrem Konto abgelegt und wenn alle Rechte vorhanden sind, direkt gestartet. Es erscheint die gleiche Seite wieder, um mit der Eingabe von Prüfaufträgen fortzufahren.
In diesem Fall wird das Dokument und der Report nicht im Konto gespeichert, sondern nach der Plagiatprüfung per Email versendet und der Vorgang gelöscht.
Sie können Prüfaufträge anlegen, auch wenn Sie noch nicht angemeldet sind. Um Prüfungen jedoch anzustoßen, müssen Sie angemeldet sein. Die rosa Felder zeigen an, dass Sie noch nicht angemeldet sind. (Es existiert eine Sitzung mit Daten, die noch keiner Person zugeordnet ist.)
Ja. Das bereits geprüfte Dokument muss jedoch zuvor aus Ihrem Konto gelöscht werden.
Nein, die maximale Dateigröße liegt bei zirka 40 MB. Falls Ihre Datei größer ist, löschen Sie Grafiken und Bilder aus der Datei und versuchen Sie es erneut. Da Docol©c ausschließlich Textinhalte zur Prüfung verwendet, haben Grafiken und Bilder keine Einfluss auf das Ergebnis.
Nein, auf keinen Fall. Es existiert bereits eine private Sitzung. Wenn Sie sich anmelden, werden alle Sitzungsdaten in Ihr Konto übernommen.
Immer dann, wenn Sie zum Zeitpunkt des Prüfauftrags noch nicht genügend Rechte besaßen, um die Prüfung zu starten. Das ist der Fall...
...wenn Sie zum Zeitpunkt des Prüfauftrags noch nicht angemeldet waren oder
...wenn Sie den Prüfmodus "professionelle" auswählten, aber Ihr Konto noch nicht lizenziert ist.
Dokumente, die zur Überprüfung bei Docol©c eingereicht werden bleiben ebenso wie die erzeugten Reports unter vollständiger Kontrolle durch den Benutzer. Sobald dieser ein Dokument aus seinem Account entfernt, wird dieses vollständig von den Servern von Docol©c entfernt. Für eine Überwachung des Systems sowie zu Zwecken der statistischen Auswertung werden anonymisierte Daten über die geprüften Dokumente sowie die gefundenen Textstellen gespeichert. Ein Rückschluss auf die, diesen Daten zugrunde liegende, Arbeit ist jedoch nicht möglich, da Name und Inhalt der Dokumente weder vollständig noch teilweise gespeichert werden.
Nein, Dokumente die sich in den Nutzeraccounts befinden werden von Docol©c nicht durchsucht.
Zu Anfang eines jeden Reports ist zu lesen: “Es wurden insgesamt 50 Textstellen überprüft. Davon wurden 21 Textstellen (42,0%) in anderen Dokumenten gefunden.” Wobei sich die Zahlen selbstverständlich von Report zu Report unterscheiden. Der Prozentsatz gibt also das Verhältnis gefundener Textstellen zu überprüften Textstellen an (21/50 = 42,0%).
Da der Herkunftsreport interaktive Funktionen enthält, müssen Sie im Browser Javascript aktiviert haben, um die volle Funktionalität zu erhalten. Außerdem sollten Sie einen aktuellen Browser verwenden, wie beispielsweise Mozilla Firefox ab Version 1.0 oder MS Internet Explorer ab Version 6. Empfohlen wird Mozilla Firefox Version 3.
Microsoft hat in deren Webbrowsern eine Sicherheitsfunktion eingebaut, so dass nach Herunterladen von HTML-Dokumenten darin enthaltene Programme erstmal geblockt sind. Sie sollten "geblockte Inhalte" im Herkunftsreport zulassen, um alle im Herkunftsreport enthaltenen Informationen nutzen zu können.
Ein Herkunftsreport beinhaltet in der Regel so viele Seiten, wie das Originaldokument. Zwar werden Grafiken herausgefiltert, bei sehr umfangreichen Dokumenten kann es jedoch vorkommen, dass Ihr E-Mail Programm mit diesen Größen nicht umgehen kann. Bitte laden Sie in diesem Fall den Report mit dem Browser aus Ihrem Konto.
Bei den Treffern der Mischsuche wurde ein Suchalgorithmus verwendet, der auch weitläufigere Textübereinstimmungen im Text an und vor der markierten Stelle berücksichtigt.
Der von Docol©c erstellte Herkunftsreport spiegelt die Situation zum Zeitpunkt der Recherche wieder. Mit der Digitalen Signatur kann nachgewiesen werden, dass der Herkunftsreport zum angezeigten Datum von Docol©c erstellt und zwischenzeitlich nicht verändert wurde. Die Signatur ist als Quelltext- Kommentar an das HTML-Dokument angehängt.
Dieser Fall tritt immer dann auf, wenn das zu prüfende Dokument keinen extrahierbaren Text enthält. Ursachen hierfür liegen darin, dass das Dokument den Text nur in Form von Grafiken oder in einer anderen nicht lesbaren Form enthält (siehe auch die folgende Frage).
Offensichtlich war es nicht möglich den Text des Dokumentes zu extrahieren, da das Dokument diesen nicht in lesbarer Form enthält. Dies tritt beispielsweise dann auf, wenn das Dokument den Text nur als Grafiken enthält (1 Grafik pro Seite), so dass ein direktes Extrahieren des Textes nicht möglich ist.
Handelt es sich bei dem zu prüfenden Dokument um ein PDF-Dokument und enthält der Report nur unleserliche Zeichen, so wurde der Text bei der Erstellung des Dokumentes in einer vom Standard abweichenden Kodierung abgelegt. Der Hintergrund hierfür ist, dass Texte, die in PDF-Dokumente enthalten sind, nicht zwangsläufig in einer Standardkodierung wie z.B. UTF-8 oder ISO-8859-1 enthalten sein müssen. In solchen Fällen enthält das Dokument lediglich die Information welches Fontzeichen an einer bestimmten Stelle einer Seite erscheinen soll, nicht aber um welches Zeichen es sich dabei handelt. Ein "B" kann beispielsweise mit dem Byte 0x0B kodiert und ein "e" als 0x0C kodiert sein und das Dokument enthält eine Zuordnung des Bytes 0x0B zu der dargestellten Form, die ein Mensch als "B" erkennen kann und des Bytes 0x0C zu der Form eines "e". Die Information dass es sich bei dem Zeichen mit der Bytekodierung 0x0B um das Zeichen "B" (0x42 in UTF-8-, ASCII- bzw. ISO-8859-1-Kodierung) fehlt jedoch.
Wenn Sie solch ein Dokument mit dem Acrobat-Reader öffnen und versuchen Teile des Textes zu kopieren, werden Sie feststellen, dass sich der Text entweder gar nicht zum Kopieren markieren lässt oder aber dass beim anschließenden Einfügen in einem beliebigen Textverarbeitungsprogramm Sie die gleichen (unleserlichen) Zeichen erhalten, die im Report vorhanden sind. Ebenso ist ein Durchsuchen des Dokuments im Acrobat Reader nicht möglich.
Wenn Sie das zu Grunde liegende Ursprungsdokument aus dem das PDF-Dokument erzeugt wurde vorliegen haben, sollte eine Überprüfung dieses Dokuments jedoch kein Problem sein. Alternativ können Sie das PDF-Dokument mit einem anderen Programm erzeugen lassen.
Ja, nur so können Sie den Dienst Nutzen. Einige Funktionen können Sie kennen lernen, ohne sich anzumelden. Um jedoch Demo- oder professionelle Prüfungen durchzuführen müssen Sie am System angemeldet sein.
Rufen Sie die Seite "Login erstellen" auf und füllen Sie die Registrierungsfelder korrekt aus. ID und Passwort können Sie selber frei wählen. Merken Sie sich bitte auf jeden Fall die ID.
ID steht für Identifikation und bezeichnet die eindeutige Kennung Ihres Kontos. Zusammen mit dem geheimen Passwort benötigen Sie die ID für den Zugang zu Ihren privaten Daten.
Mit einem Lizenzschlüssel kann Ihr und noch weitere Benutzerkonten freigeschaltet werden.
Nachdem Sie angemeldet sind, erscheint auf der "Login ändern"-Seite ein Feld zur Eingabe des Lizenzschlüssels.
Ab wann es sich bei einer Textstelle um ein Plagiat handelt, ist häufig nicht exakt zu bestimmen. Werden die Muster zu weit gefasst, erhält man zu viele nicht plagiierte Stellen und aufwendige manuelle Überprüfungen werden notwendig. Werden die Muster zu eng gelegt, werden viele Stellen "übersehen".
Je mehr Worte geprüft werden, desto geringer ist die Fehlerrate der Treffer. Wird das Erstellungsdatum berücksichtigt, werden nur Dokumente durchsucht, die älter sind, als das Prüfdokument oder deren Erstellungsdatum nicht bekannt ist.
Wird die Fragmentlänge kürzer gewählt, steigt in der Regel die Anzahl der Treffer, allerdings nimmt die Anzahl der falschen Treffer zu. Dies führt dazu, dass eine hohe Übereinstimmung angezeigt wird, obwohl gar nicht plagiiert wurde. Fragmente mit 9 Wörtern ergeben eine sehr konservative Suche, was die Übereinstimmung angeht und sehr wenig falsche Treffer. Das kann aber dazu führen, dass zu wenig markiert/gefunden wird und dann auch wieder eine Nachprüfung stattfinden muss.
Hohe Relevanz ist sinnvoll und entfernt solche Fundstellen, die zwar in mehreren Quellen im Internet gefunden wurden, es jedoch keine weiteren Textstellen gibt, die ebenfalls in diesen Quellen gefunden wurden. Dies tritt bspw. bei Literaturverweisen oder rein zufällig auf.
Die Textanalyse-Einstellungen sagen aus, wie genau ein Dokument untersucht wird. Es werden mehr Stellen überprüft bei geringerer Wörtergüte und kurzen Sätzen. Allerdings eventuell auch unrelevante. Wird bei der Absatzlänge etwas verändert, werden insgesamt nur noch Absätze betrachtet, die aus mehr als einem Satz bestehen, was die Analyse vergröbert.
Es gibt Wörter innerhalb eines Satzes, die einen geringen Identifikationswert für den Satz besitzen. Hier kann eingestellt werden, wie hoch die Qualität des Satzes ist, ausgedrückt in Prozent qualitativ guter Wörter eines Satzes.
Häufig sind hochwertige Quellen mehrfach vorhanden. Werden viele dieser Dokumente im Herkunftsreport aufgelistet, erhält man zwar einen guten Überblick über vorhandene Quellen, allerdings reicht theoretisch ein Vergleichsdokument zum Nachweis einer plagiierten Stelle.
Grundsätzlich lässt sich sagen, dass die Standardeinstellung in der Regel die besten Einstellungen sind. Diese wurden in umfangreichen Tests für deutsch- und englischsprachige Dokumente ermittelt.
Docol©c setzt sich zusammen aus "document", "co-location", also dem Auffinden eines Dokuments an einem anderen Ort und "collocation" also dem zusammenhängenden Gebrauch mehrere Wörter.
Folgend externen Webseiten liefern hilfreiche Informationen:
Weber-Wulff, D.: Plagiat & Fremde Federn
Resolution des Deutschen Hochschulverbandes
Plagiarism @ University of Sussex
University of Leeds Plagiarism Guide
IEEE Plagiarism Guidelines
ACM Policy and Procedures on Plagiarism
teachers.tv: Secondary ICT - Plagiarism - A Cut and Paste Generation
Docoloc UG (haftungsbeschränkt) & Co. KG Methfesselstraße 2 38106 Braunschweig Germany E-Mail: info@docoloc.de Telefon +49-531-3495570 Telefax +49-531-3495571 Amtsgericht Braunschweig HRA 200859 USt-ID-Nr.: DE269775384 Persönlich haftende Gesellschafterin: Ifalt UG (haftungsbeschränkt) Sitz Braunschweig, Germany Amtsgericht Braunschweig HRB 201951 Geschäftsführer: Dr.-Ing. Jens Brandt, Dr.-Ing. Martin Gutbrod
Kontakt - Preise und AGBs - Grundsätze - Referenzen - Hilfe
©2010 Docoloc KG - IBR/ITM Forschungspartner - Plagiatsuche in Milliarden Dokumenten
deutsch english