Jedna na cztery osoby kopiuje coś w ciągu pierwszych pięciu minut odwiedzin.
Badania StackOverflow
Autorom witryny udało się skatalogować każde polecenie kopiowania wykonane w StackOverflow w ciągu dwóch tygodni i podzielili się publicznie tym, czego się dowiedzieli. Dzięki tym badaniom byli w stanie uchwycić wiele różnych atrybutów kopiowania, znaczniki, to czy kopiowany był blok kodu czy zwykły tekst, jak był oceniony kopiowany post albo z jakiego regionu pochodziła dana osoba.
StackOverflow gromadziło od 26 marca do 9 kwietnia 2021 roku.
Kopiujemy na potęgę w pracy
Jeden na czterech użytkowników, którzy odwiedzili pytanie dotyczące przepełnienia stosu, kopiuje coś w ciągu pięciu minut od odwiedzenia strony. Ludzie kopiują odpowiedzi około dziesięć razy częściej niż z pytań i około 35 razy częściej niż z komentarzy. Kopiowanie z bloków kodu to zjawisko występujące ponad dziesięć razy częściej niż kopiowanie z otaczającego go tekstu. Większość kopii miała miejsce w ciągu tygodnia pracy oraz w godzinach pracy. Główne obszary geograficzne to Azja (33%), Europa (30%) i Ameryka Północna (26%).
Zaakceptowane czy nie?
Ciekawostka – częściej kopiowane są pytania bez zaakceptowanych odpowiedzi niż pytania, które zostały zaakceptowane. Kiedy myślimy o zaakceptowanej odpowiedzi, możemy pomyśleć, że jest ona najlepsza i wywnioskować, że jest ona kopiowana znacznie częściej niż odpowiedzi niezaakceptowane. Jednak patrząc na dane, okazuje się, że 52,4% przypadków kopiowania pochodzi z odpowiedzi, które nie zostały zaakceptowane.
Więc jeśli zaakceptowane odpowiedzi nie są częściej kopiowane, to zapewne odpowiedzi z wyższym wynikiem muszą być kopiowane częściej? W przypadku odpowiedzi wydaje się, że jest to dość równomiernie występujące zjawisko. Jeśli zaś chodzi o pytania, większość kopii pochodzi z postów z 1-5 punktami. Możliwe, że dzieje się tak dlatego, iż użytkownicy kopiują pytanie, aby je odtworzyć i ostatecznie zamieścić na portalu odpowiedź.
Kopia a reputacja
86% wszystkich kopii dokonywali anonimowi użytkownicy czyli użytkownicy o reputacji 0 (od razu otrzymujesz 1 repa tworząc konto). Możliwe też jednak, że niektóre z tych kopii pochodzą od użytkowników, którzy mają konto, ale nie są zalogowani.
Wraz ze wzrostem reputacji zmniejsza się liczba kopii na użytkownika. Zatem im wyższa reputacja użytkownika, tym rzadziej on kopiuje. Zapewne deweloperzy, którzy się uczą, często mają gorszą reputację i szukają rzeczy, które mogą przyspieszyć ich naukę i szybko zacząć. Gdy programiści zdobywają wiedzę, budują również swoją reputację i koncentrują się na bardziej precyzyjnych wyzwaniach, rzeczach, których po prostu nie da się skopiować ze Stack Overflow.
Kody na licencji i tagi
StackOverflow zachęca do kopiowania kodu i wykorzystywania go w swoich aplikacjach. Doceniają walory edukacyjne takiego postępowania i unikanie zbędnej pracy, którą ktoś już wykonał. Jednocześnie jednak przytomnie zaznaczają, że użycie niektórych kodów źródłowych wymaga określonej licencji.
Tagi, pod którymi występowały najczęściej przypadki kopiowania kodu, to jedne z najpopularniejszych i najbardziej aktywnych tagów w Stack Overflow. Python pojawia się aż w czterech najpopularniejszych grupach tagów. Trzy z nich to grupy tagów specyficzne dla analizy danych: „python,pandas”, „python,pandas,dataframe” oraz „python,matplotlib”.
Z 11829 przypadkami skopiowania post How to iterate over rows in a DataFrame in Pandas był najczęściej kopiowanym postem w badanym okresie - odpowiedź udzielona w 2013 roku wciąż pomaga tysiącom programistów każdego tygodnia.