Odkąd świat dowiedział się o sponsorowanych przez państwo kampaniach mających na celu rozpowszechnianie dezinformacji w mediach społecznościowych, Twitter starał się powstrzymać boty i trolle znajdujące się na jego platformie.

Sieć społecznościowa ma jednak większy problem dotyczący zautomatyzowanych kont, które mają na celu rozprzestrzenianie spamu i oszustw oraz zwiększanie liczby obserwujących. Nowe badanie pokazuje, że firma wciąż nie nadąża za zalewem tego rodzaju nadużyć.

Dwóch badaczy twierdzi, że dzięki opracowanemu przez siebie procesowi uczenia się, mogą identyfikować nadużycia na kontach znacznie szybciej niż robi to Twitter – często wykrywając je na wiele miesięcy przed zauważeniem ich przez Twittera.

Zubair Shafiq, profesor informatyki na Uniwersytecie w Iowa, oraz jego absolwent, Shehroze Farooqi, podczas swojego 16-miesięcznego badania przeanalizowali 1,5 miliarda tweetów, z których zidentyfikowali ponad 167 000 aplikacji wykorzystujących API Twittera do automatyzacji kont rozprzestrzeniających dziesiątki milionów tweetów, które rozpowszechniają spam i linki do złośliwego oprogramowania. Szacuje się, że opóźnienia w wykryciu takich aplikacji pozwalają im na skumulowanie dziesiątek milionów tweetów miesięcznie, zanim zostaną one zbanowane.

„Pokazujemy, że wiele z tych szkodliwych aplikacji używanych do wszelkiego rodzaju negatywnej działalności pozostaje niewykrytych przez algorytmy Twittera czasem przez wiele miesięcy i wyrządzają one wiele szkód zanim platforma w końcu wykryje je i usunie” – powiedział Shafiq.

Naukowcy twierdzą, że dzielili się swoimi wynikami z Twitterem przez ponad rok, ale firma nie poprosiła o dalsze szczegóły dotyczące ich metody lub danych. Platforma wyraziła uznanie dla celów badania, ale sprzeciwiła się jego wynikom twierdząc, że naukowcom z Iowa brakowało pełnego obrazu tego, jak walczą z nadużyciami.

W opublikowanym raporcie Twitter stwierdził, że usunął ponad 4000 dezinformacyjnych kont zmotywowanych politycznie pochodzących z Rosji, kolejnych 3300 z Iranu i ponad 750 z Wenezueli. Oświadczył również, działa też na rzecz ograniczenia nadużyć w aplikacjach wprowadzając nowe ograniczenia dotyczące dostępu do interfejsu API Twittera. Firma twierdzi, że w ciągu ostatnich sześciu miesięcy 2018 roku zbanowała 162 000 przypadków nadużyć. Jednak badacze z Iowa twierdzą, że ich badania pokazują, iż nadużywanie aplikacji Twittera wciąż jest nierozwiązanym problemem.

Shafiq i Farooqi podczas 16 miesięcy obserwacji Twittera i skuteczności jego działań wykryli, z których kont każda aplikacja została wysłana, wraz z czynnikami obejmującymi wiek kont, czas tweetów, liczbę nazw użytkowników, hashtagów, linki zawarte w tweetach oraz stosunek retweetów do oryginalnych tweetów. Co najważniejsze, zaobserwowali, które konta zostały ostatecznie zablokowane przez Twittera i posłużyli się tymi danymi do oznaczenia tych kont jako śmieciowe.

Twitter oświadczył, że nie zgadza się z metodologią badań dwóch naukowców z Iowa.

„Uważamy, że metody stosowane w tych badaniach nie odzwierciedlają dokładnie stanu naszej platformy głównie dlatego, że czynniki w nim wykorzystywane nie są dość mocno skorelowane z tym, czy dana aplikacja faktycznie narusza nasze zasady”.

Naukowcy z Iowa zauważają jednak, że oznaczyli tylko te aplikacje zbanowane przez Twittera, z których zostało usuniętych 90 proc. lub więcej wpisów.

Jedną z wad metody badaczy była liczba fałszywych oznaczeń. Shafiq i Farooqi przyznali, że około 6 proc. aplikacji, które dzięki ich metodzie zostały zidentyfikowane jako złośliwe, były w rzeczywistości łagodne. Twierdzą jednak, że współczynnik fałszywych oznaczeń jest bardzo niski.

Naukowcy zgadzają się z Twitterem, że firma zmierza we właściwym kierunku, zaostrzając kontrole śmieciowych kont oraz nadużyć. Zauważyli, że około czerwca 2017 r. firma zaczęła efektywniej blokować złe aplikacje, ale twierdzą, że Twitter wciąż nie wykorzystuje potencjału uczenia maszynowego, aby jak najszybciej wykrywać nadużycia w aplikacjach.