Instrukcja interpretacji
Interaktywnego Raportu

Interaktywny Raport obejmuje Raport Podobieństwa - wynik analizy antyplagiatowej oraz Raport wykrywania treści AI - wynik wykrywania użycia AI.

SPIS ZAGADNIEŃ

Funkcjonalności Raportu Podobieństwa

Dane dokumentu

Współczynniki podobieństwa

Aktywne listy podobieństw

Nawigacja po fragmentach

Treść Raportu Podobieństwa

Baza Aktów Prawnych

Refbooks

Zaznaczanie fragmentów podobnych - parafrazy

Interpretacja Raportu podobieństwa

Funkcjonalności Raportu wykrywania treści AI

Szczegóły Raportu wykrywania treści AI

Interpretacja Raportu wykrywania treści AI

Udostępnianie Raportu

Raport DEMO

❗Czas oczekiwania na Raport Podobieństwa to zwykle do 24 godzin od momentu zaksięgowania (a nie dokonania) płatności. W wielu przypadkach czas sprawdzenia jest krótszy, nie ma jednak możliwości jego oszacowania.

Funkcjonalności Raportu Podobieństwa

Raport Podobieństwa (wynik analizy antyplagiatowej):

📉 generuje Współczynniki Podobieństwa (WP), które procentowo określają ilość odnalezionych w analizowanym dokumencie zapożyczeń;

📑 zaznacza fragmenty pracy identyczne z tekstami odnalezionymi w bazach porównawczych,

🧾 przedstawia najdłuższe wykryte w pracy zapożyczenia w postaci listy 10 najdłuższych fragmentów,

🗃️ segreguje wykryte w pracy zapożyczenia według źródeł podobieństwa oraz baz porównawczych, w których zostały one odnalezione (BAP - Baza Aktów Prawnych, zasoby światowego Internetu, Refbooks – baza publikacji naukowych [opcja dodatkowa]),

🎨 umożliwia wyróżnianie (poprzez zaznaczenie kolorem niebieskim) zapożyczeń pochodzących z wybranego źródła podobieństwa,

💻 umożliwia podgląd stron internetowych, z którymi wykryto podobieństwo, z zaznaczonymi fragmentami identycznymi również na stronie WWW czy pliku PDF z Internetu.

📝 określa stopień podobieństwa do konkretnego odnalezionego źródła podobieństwa wyrażony w:

- liczbie wyrazów wspólnych dla obu tekstów,

- liczbie fragmentów, w jakiej go wykorzystano,

- procentowego współczynnika wykorzystania tego źródła w tekście analizowanego dokumentu,

🧭 umożliwia nawigację po dokumencie ułatwiając jego analizę.

Widok Raportu Podobieństwa

Dane dokumentu

Dane dotyczące dokumentu oraz raportu umieszczone są w oknie Metadane. Okno otwierane jest poprzez kliknięcie w obszar tytułu i danych autora⬇️

W oknie matadanych dostępna jest opcja Kopiuj, za pomocą której możliwe jest skopiowanie wszystkich danych dokumentu jednym kliknięciem.

Współczynniki podobieństwa

określają, w jakim procencie praca składa się z fragmentów identycznych z wykrytymi w innych tekstach,
są stosunkiem liczby wyrazów odnalezionych w innych tekstach do całkowitej liczby wyrazów w badanym dokumencie.

Wyniki analizy w Raporcie Podobieństwa

Współczynnik podobieństwa 1 (WP1) - określa, jaką część badanej pracy stanowią frazy o długości 5 wyrazów lub dłuższe, odnalezione w zasobach Internetu oraz bazie Refbooks (z wyłączeniem fragmentów aktów prawnych odnalezionych w Bazie Aktów Prawnych - BAP). Współczynnik podobieństwa 1 służy przede wszystkim do badania samodzielności językowej autora pracy.

Współczynnik podobieństwa 2 (WP2) - określa, jaka część badanej pracy składa się z fraz odnalezionych w zasobach Internetu oraz bazie Refbooks (z wyłączeniem BAP) o długości 25 wyrazów lub dłuższej. Ze względu na długość wykrywanych fraz Współczynnik podobieństwa 2 jest lepszym narzędziem do wykrywania nieuprawnionych zapożyczeń.

Współczynnik podobieństwa BAP (WP BAP) - oznacza, jaka część badanej pracy składa się wyłącznie z fraz aktów prawnych odnalezionych w Bazie Aktów Prawnych o długości co najmniej 8 wyrazów.

Aktywne listy podobieństw

Listy podobieństw umożliwiają szybką analizę głównych źródeł zapożyczeń w tekście oraz łatwą nawigację po odnalezionych oznaczonych fragmentach.

Pierwsza lista podobieństw zawiera zawsze 10 najdłuższych fragmentów z badanej pracy odnalezionych w innych źródłach. Na tej liście może znajdować się kilka fragmentów pochodzących z jednego źródła. Po kliknięciu w ikonę lupy przy wybranym źródle (Pokaż w tekście) nastąpi przeniesienie do wybranego fragmentu w tekście. Wybrany fragment zostanie zaznaczony poprzez żółte podświetlenie tekstu.

Pozostałe listy podobieństw pogrupowane są względem źródeł podobieństwa, a przy nich znajdują się sumaryczne statystyki podobieństwa względem całego źródła, niezależnie od liczby fragmentów, w których zostało przedstawione. Wartości obok każdego źródła reprezentują procentowy udział danego fragmentu w całości tekstu, liczbę identycznych słów oraz liczbę fragmentów, w których wystąpiły. Po kliknięciu w ikonę lupy przy wybranym źródle (Pokaż w tekście) nastąpi przeniesienie do wybranego fragmentu w tekście. Wybrany fragment zostanie zaznaczony poprzez żółte podświetlenie tekstu, a podstawowe zaznaczanie kolorami odpowiadającymi bazom porównawczym zostanie wyszarzone.

🔔Na listach podobieństwa mogą znajdować się rekordy wyróżnione pogrubioną czcionką. Oznacza to, że przynajmniej jeden z ich fragmentów osiągnął minimalną długość frazy dla Współczynnika podobieństwa 2 (tj. domyślnie 25 wyrazów).

Każde źródło ma przypisany numer w kolejności zgodnej z kolejnością baz. Po najechaniu na dany fragment podświetli się numer źródła, co ułatwia odnalezienie go na liście.

Nawigacja po fragmentach

Dostępne jest przechodzenie pomiędzy kolejnymi fragmentami z wybranego źródła za pomocą przycisków następny/poprzedni z prawej strony ekranu, które pojawią się w momencie kliknięcia w dowolny fragment. Okno nawigacji po fragmentach jest interaktywne, można je przenieść w dowolne dogodne dla użytkownika miejsce ekranu.

W przypadku listy źródeł internetowych po kliknięciu w link do strony otworzy się podgląd strony www lub pliku PDF z zaznaczonymi fragmentami identycznymi. Za pomocą paska nawigacji źródło można otworzyć w oddzielnej karcie lub zamknąć podgląd. Jeśli w danym źródle znaleziono więcej niż jeden podobny fragment, kliknięcie w inny żółty fragment na podglądzie strony internetowej, przeniesie do pasującego fragmentu w badanym tekście.

Alerty

Występowanie w tekście niektórych zabiegów edytorskich może mieć na celu zaburzenie wyników analizy. Zmiany niewidoczne dla osoby zapoznającej się z treścią pracy na wydruku lub w pliku wpływają na frazy porównywane podczas analizy tekstu (poprzez celowe błędy pisowni) w celu ukrycia zapożyczeń lub obniżenia wyników w Raporcie Podobieństwa.

Statystyki dotyczące wystąpień alertu są wyświetlane w Raporcie podobieństwa w sekcji Alerty. Poniżej prezentujemy widoki poszczególnych zabiegów edytorskich w raportach.

Należy ocenić, czy zaznaczone wystąpienia wynikają z uzasadnionego formatowania tekstu lub użycia symboli we wzorach (chemicznych, matematycznych) - jest to możliwa nadwrażliwość systemu, czy też są celową manipulacją.

Parafrazy - fragmenty, w których dokonano nieznacznych modyfikacji (zmiana kolejności wyrazów, użycie synonimu itp.) względem odnalezionego w źródłach podobieństwa fragmentu - nadmierne użycie mogło mieć na celu ukrycie nieuprawnionych zapożyczeń.

Znaki pochodzące z alfabetu innego niż łaciński - znaki z innych alfabetów mogą imitować litery z alfabetu właściwego dla języka pracy powodując błędy pisowni wyrazów w tekście.

Rozstrzelenia - zwiększenie odległości pomiędzy literami może imitować spacje powodując złączenie wyrazów.

Mikrospacje - spacje o zerowej długości pomiędzy literami wyrazów mogą powodować nieprawidłowy podział wyrazów w tekście.

Ukryte znaki - znaki o białym kolorze czcionki mogą zastępować spacje powodując złączenie sąsiednich wyrazów.

Należy ocenić, czy zaznaczone wystąpienia wynikają z uzasadnionego formatowania tekstu (nadwrażliwość systemu), czy są celową manipulacją.

Dokumenty, w których zidentyfikowano Alert, są wyróżnione czerwonym wykrzyknikiem na liście dokumentów. Statystyki dotyczące wystąpień alertu zawarto w Raporcie podobieństwa w sekcji Alerty.

Treść Raportu Podobieństwa

Fragmenty zidentyfikowane jako podobne zostały oznaczone w treści raportu kolorami zgodnie z legendą oznaczeń baz pochodzenia zapożyczeń. Przy fragmentach zamieszczone są numery, pod którymi znajdują się źródła na listach podobieństwa.

Kolory występujące w treści Raportu podobieństwa oznaczają odpowiednio:

Internet

zielony — fragmenty pochodzące z zasobów Internetu,

Dwa odcienie zielonego służą do rozróżnienia następujących bezpośrednio po sobie fragmentów odnalezionych w różnych źródłach bądź w tym samym źródle, ale w innych jego miejscach.

Baza Aktów Prawnych

niebieski kolor tła — fragmenty odnalezione w dokumentach pochodzących z Bazy Aktów Prawnych (BAP),

Analizowane teksty są również porównywane z Bazą Aktów Prawnych firmy Wolters Kluwer SA, co pozwala odróżnić je od innego rodzaju zapożyczeń, ponieważ jako akty normatywne nie są chronione prawem autorskim.

Refbooks

fioletowy— fragmenty pochodzące z zasobów bazy RefBooks [opcja dodatkowa]; to wielomilionowa baza publikacji i tekstów ze wszystkich dziedzin nauki i kultury, głównie w języku polskim i angielskim, stanowiąca podstawę dla sprawdzeń dokonywanych przez system Antyplagiat. Dzięki współpracy z wydawnictwami Wolters Kluwer SA, Termedia i serwisem Paperity.org obejmuje m.in. najnowsze książki, komentarze oraz artykuły naukowe udostępniane zarówno w modelu tradycyjnym, jak i na podstawie otwartych licencji (tzw. Open Access) oraz bazę arxiv.org.

Zaznaczanie fragmentów podobnych - parafrazy

System zaznacza także frazy podobne (ale nie identyczne) do fragmentów ze znalezionych źródeł. Frazy, które zostały poddane drobnym modyfikacjom, takim jak: zmiana kolejności słów, dodawanie lub usuwanie słów, zastępowanie pojedynczych słów synonimami, są w Raporcie podkreślane i wyświetlane w jaśniejszym odcieniu koloru czcionki.

Oryginalna fraza jest wyświetlana po najechaniu kursorem myszy na zmodyfikowany fragment.

Interpretacja Raportu podobieństwa

Aby dokonać właściwej interpretacji Raportu Podobieństwa, należy wykonać następujące czynności:

Sprawdzić wartości Współczynników podobieństwa (wątpliwości powinno budzić w szczególności przekroczenie progu 50% dla Współczynnika podobieństwa 1 i 5% dla Współczynnika podobieństwa 2).
Jeżeli w badanej pracy pojawi się Alert oznaczający wykorzystanie liter z innych alfabetów niż łaciński, należy zwrócić na to szczególną uwagę poprzez przeanalizowanie akapitów zawierających litery oznaczone kolorem żółtym.
Przeanalizować listę „10 najdłuższych fragmentów” (wątpliwości powinny budzić fragmenty o liczbie wyrazów przekraczającej 50; jeżeli takie występują, należy je odnaleźć, używając linku „Pokaż w tekście” i sprawdzić, czy są cytatami).
Przeanalizować pozostałe listy, zwracając szczególną uwagę na dokumenty zawierające fragmenty o długości przekraczającej limit ustalony dla Współczynnika podobieństwa 2 (są one oznaczone pogrubioną czcionką). W przypadku takich dokumentów, zwłaszcza znajdujących się na początku listy, należy użyć linku „Pokaż w tekście” i sprawdzić, czy są one raczej krótkimi frazami rozproszonymi po całym dokumencie (w takiej sytuacji można je uznać za przypadkowe zapożyczenia), czy też długimi fragmentami tekstu sąsiadującymi ze sobą i rozdzielonymi tylko krótkimi frazami (taka sytuacja powinna budzić podejrzenia).
W przypadku pojawienia się jakichkolwiek podejrzeń, należy poddać Raport Podobieństwa szczegółowej analizie, polegającej, poza użyciem funkcji Raportu Podobieństwa wymienionych w pkt. 1-4, także na dokładnym sprawdzeniu treści dokumentu, z uwzględnieniem prawidłowego oznaczenia cytowanych fragmentów użytych w badanej pracy wykrytych przez System jako podobne do tekstów odnalezionych w bazach Systemu.

Dodatkowe informacje dotyczące interpretacji Raportu podobieństwa:

System Antyplagiat jest narzędziem umożliwiającym kontrolę oryginalności badanych dokumentów. Jego zadaniem jest dokładne określenie zakresu ewentualnych podobieństw w sprawdzanym tekście w porównaniu do treści znajdujących się w bazach Systemu.
System udostępnia Użytkownikowi powyższe informacje pozwalając na dokonanie samodzielnej oceny, czy zapożyczenia odnalezione w treści analizowanego dokumentu są uprawnione. Zadaniem systemu nie jest wykonanie samoistnej oceny, czy badany dokument został napisany samodzielnie, a jedynie dostarczenie materiału do jej dokonania. Z tego względu Raport Podobieństwa powinien być zawsze poddany analizie przez kompetentną osobę. W szczególności nie należy oceniać pracy opierając się wyłącznie na wskaźnikach (wartościach procentowych) Współczynników Podobieństwa. Konieczne jest sprawdzenie w treści dokumentu, czy cytacje są poprawnie oznaczone i czy pochodzą z dokumentów, które zostały wymienione w bibliografii.
System nie analizuje, która praca powstała wcześniej - zgłoszona do analizy, czy odnaleziona przez system i potraktowana jako źródło. W związku z tym na podstawie samego Raportu Podobieństwa nie można określić, która praca jest oryginałem, a która kopią. Do takich wniosków można dojść jedynie w drodze analizy obydwu dokumentów.
Ze względu na przyjęte metody analizowania podobieństw, system wykrywa także wyrażenia (związki frazeologiczne), które są powszechnie wykorzystywane w języku polskim, np.: „z tego też powodu można”, „można odnieść takie wrażenie, że”, „warto pamiętać o tym, że”. Zaliczenie tego typu wyrażeń do ogólnej puli zapożyczeń, i ich wpływ na wartość procentowego wskaźnika podobieństwa Raportu, dla tekstów w języku polskim nie powinien jednak przekroczyć 5%. Z analizy przeprowadzonej przez system Antyplagiat wynika, że w przypadku tekstów zawierających dużo fraz zaczerpniętych z języka fachowego, Współczynnik podobieństwa znacząco wzrasta. Powoduje to, że część prac uzyskuje stosunkowo wysoki współczynnik, a szczegółowa analiza Raportów podobieństwa wykazuje, że nie zawierają one niedopuszczalnych zapożyczeń. Współczynnik podobieństwa 2 znacznie dokładniej określa zapożyczenia odnalezione w analizowanym dokumencie. Jego wartość jest wyliczana w analogiczny sposób jak Współczynnika podobieństwa 1, jednak identyfikuje on frazy złożone z minimum 25 wyrazów.

Funkcjonalności Raportu wykrywania treści AI

Wykrywanie treści AI, inaczej określane detekcją AI, jest modułem (inaczej detektorem) dostarczającym informację o prawdopodobieństwie, z jakim wgrany do sprawdzenia tekst został utworzony przy użyciu narzędzi sztucznej inteligencji opartych na GPT tj. GPT-2, GPT-J, GPT-NEO, GPT-3 lub GPT-4. Przykładowe narzędzia to ChatGPT, Bing, Gemini, Jasper. Detektor jest trenowany do tego, aby odróżnić teksty pisane przez człowieka od tekstów generowanych przez sztuczną inteligencję, a jednym z elementów oceny prawdopodobieństwa jest określenie przewidywalności lub przypadkowości słów w tekście. Detektor analizuje teksty, aby zidentyfikować charakterystyczne cechy modeli językowych. Wykorzystuje do tego techniki uczenia maszynowego. Na podstawie dużej ilości danych treningowych rozpoznaje cechy charakterystyczne dla tekstów tworzonych przez AI. Podobnie jak w przypadku Raportu Podobieństwa, zadaniem systemu nie jest wykonanie samoistnej oceny, czy badany dokument został napisany samodzielnie, a jedynie dostarczenie materiału do jej dokonania. Z tego względu Raport Wykrywania treści AI powinien być zawsze poddany analizie przez kompetentną osobę.

Szczegóły Raportu wykrywania treści AI

Aby zapoznać się z wynikami raportu wykrywania treści AI należy przejść na zakładkę „Detekcja AI” w menu po lewej stronie ekranu.

Dla ułatwienia szybkiej oceny poszczególnych fragmentów pracy wprowadzono legendę oznaczania fragmentów według 5 zakresów procentowych, z których każdy oznaczony jest innym kolorem. Treść badanego dokumentu jest wyświetlana po prawej stronie ekranu i jest ona oznaczona kolorem przypisanym do odpowiedniego zakresu. Po najechaniu kursorem myszy na konkretny fragment wyświetli się informacja o dokładnym prawdopodobieństwie użycia AI dla danego fragmentu.

I. Zawartość treści AI w tekście

Sekcja prezentuje wskaźnik określający jaka część tekstu została uznana za prawdopodobnie wygenerowaną przy użyciu narzędzi AI. Wynik przedstawiony procentowo, od 0 do 100%, informuje o udziale treści zidentyfikowanych w tekście analizowanego dokumentu jako stworzone z wykorzystaniem sztucznej inteligencji. Wskaźnik informuje, jaka część tekstu mogła zostać wytworzona z wykorzystaniem sztucznej inteligencji, czyli dla których fragmentów prawdopodobieństwo jej użycia przekracza ustawiony próg. Domyślnie wartość progu ustawiona jest na 80% (0,8 w skali o wartościach od 0 do 1). W tej sekcji udostępniona została również - zaznaczona domyślnie - funkcja „Wyświetl tylko fragmenty o silnych cechach AI” prezentująca w tekście jedynie fragmenty o wysokim prawdopodobieństwie AI, czyli wliczające się do wyniku „Zawartość treści AI w tekście”.

Wyłączenie opcji „Wyświetl tylko fragmenty o silnych cechach AI” podświetli wszystkie fragmenty zgodnie z legendą kolorów.

II. Zaawansowana analiza rozkładu prawdopodobieństwa

Za pomocą suwaka umieszczonego w drugiej sekcji osoba analizująca raport może zmienić wartość progową a system automatycznie przeliczy wynik. Umożliwia to sprawdzenie, jak zmienia się ocena tekstu przy różnych ustawieniach czułości. Suwaka warto użyć, gdy wynik jest niejednoznaczny - jeśli wskaźnik treści AI jest bliski 50%, można sprawdzić jak podniesienie lub obniżenie progu zmieni ocenę tekstu. Samodzielne dostosowanie poziomu analizy do konkretnego przypadku pozwala lepiej zrozumieć, które fragmenty tekstu budzą największe wątpliwości – i z jaką pewnością zostały ocenione przez system.

III. Szczegóły Raportu Wykrywania treści AI

W trzeciej sekcji dostępna jest lista fragmentów tekstu uszeregowana od fragmentów z najwyższym wynikiem prawdopodobieństwa do fragmentów z najniższym. Opcja lupki („Pokaż w tekście”) umożliwia osobie oceniającej tekst szybkie przeniesienie się do konkretnego fragmentu w celu szczegółowej analizy. Dla optycznego wyróżnienia czcionka wyszukanego fragmentu zostaje pogrubiona.

Ważne! Aby pobrać raport wykrywania treści AI należy skorzystać z opcji zapisu do PDF dostępnego w przyborniku po prawej stronie ekranu.

Interpretacja Raportu wykrywania treści AI

Fragmenty oznaczone kolorem zielonym, obejmujące zakres od 0% do 40% należy interpretować jako napisane z dużym prawdopodobieństwem przez człowieka. Fragmenty oznaczone kolorem żółtym, obejmujące zakres od 41% do 60% ukazują, że nie można jednoznacznie określić czy zostały napisane przez człowieka czy przy użyciu narzędzi opartych na AI. Fragmenty oznaczone kolorem czerwonym, obejmujące zakres od 61% do 100% należy interpretować jako napisane z dużym prawdopodobieństwem przy użyciu sztucznej inteligencji.

Detektor jest narzędziem wspierającym weryfikację oryginalności tekstów. Jego skuteczność wynosi 95%. W związku z tym, że detekcja AI jest nadal w fazie rozwoju mogą zdarzyć się fałszywe pozytywne (tekst napisany przez AI oznaczony jako napisany przez człowieka) i fałszywie negatywne (tekst napisany przez człowieka oznaczony jako napisany przez AI) wyniki. Ich poziom nie przekracza 5%.

Aby dokonać właściwej interpretacji Raportu wykrywania treści AI, należy zwrócić uwagę na następujące kwestie dodatkowe:

1. Styl pisania powinien odpowiadać poziomowi stylu studenta, jaki prezentował w dotychczas przygotowywanych formach pisemnych.

2. Poprawność gramatyczna: powtarzające się frazy, wiele numerowanych i wypunktowanych list, literówki, nieprzetłumaczone słowa. Tego typu błędy są charakterystyczne dla narzędzi opartych o AI.

3. Sposób zwracania się autora tekstu do czytelnika. Sztuczna inteligencja zwraca się do pytającego z użyciem formy „Ty”.

4. Opisy bez rozwinięć, uzasadnień, “suche” sformułowania, encyklopedyczne zdania. 5. Nieprawdziwe informacje, dane, wyniki badań, bibliografia, błędy merytoryczne.

⚠️ W każdym przypadku rekomendujemy, aby w pierwszej kolejności zapoznać się z wytycznymi uczelni lub instytucji, dotyczącymi dopuszczalności stosowania narzędzi opartych o AI. Jeśli takich wytycznych nie ma najlepiej uzgodnić z promotorem lub opiekunem pracy możliwy cel i zakres użycia narzędzi AI w Twojej pracy.

Udostępnianie Raportu

W menu po prawej stronie ekranu znajduje się przycisk udostępniania Raportu. Dzięki tej funkcji Użytkownik może wysyłać link do Raportu zapewniający dostęp i podgląd osobie nieposiadającej konta w systemie. Raport można udostępnić tylko do wglądu wpisując e-mail osoby lub kopiując link do raportu.

Raport DEMO

Page updated

Report abuse