Wykrywanie fałszywych wiadomości ogranicza się zatem do oceny wiarygodności, która nie zawsze jest obiektywna. Prawdziwe źródła czasami przekazują bowiem nieprawdziwe historie, a fałszywe źródła informacji czasem publikują prawdę. Rozróżnienie między prawdziwymi i fałszywymi wiadomościami nie dotyczy wiarygodnych i niewiarygodnych źródeł ani nawet prawdziwych i fałszywych informacji, dotyczy uczciwości i oszustwa. To, co sprawia, że wiadomości są fałszywe jest intencją autora – jeśli zawierają coś, co według niego jest prawdą lub coś, co jego zdaniem jest fałszywe.

Czy można zmierzyć intencje milionów anonimowych autorów online?

Na podstawie analizy języka naturalnego eksperci od lingwistyki udowodnili, że struktura języka zmienia się w zależności od celu komunikacyjnego. Kiedy opowiadamy historię używamy więcej czasu przeszłego i zaimków w trzeciej osobie. Podczas udzielania wyjaśnień używamy większej liczby rzeczowników i przyimków. Kiedy wchodzimy w interakcje korzystamy z większej ilości pytań i wykrzykników. Gramatyka tekstu odzwierciedla więc jego cel.

Właśnie dlatego język fałszywych wiadomości – jego struktura w przeciwieństwie do jego treści – może być kluczem do wykrycia tego celu. Autor próbujący poinformować opinię publiczną ma inną motywację niż autor, który próbuje kogoś oszukać. Ta różnica pod względem celu komunikacyjnego będzie miała konsekwencje językowe. Sztuką jest dowiedzieć się, jakie to będą konsekwencje – opisać styl fałszywych wiadomości.

Rozpoczęcie prac na Uniwersytecie w Birmingham

Chociaż fałszywe wiadomości są wszędzie, nie jest do końca jasne jak je rozpoznać, zwłaszcza gdy ludzie tak gwałtownie nie zgadzają się co do tego, które informacje są prawdą, a które fałszem. Wiele organizacji buduje bazy danych fałszywych wiadomości głównie poprzez sprawdzanie faktów. Najważniejszym problemem nie jest jednak tworzenie zbilansowanych zbiorów do analizy lingwistycznej, ale fakt, iż te zbiory zawsze odzwierciedlają polityczne uprzedzenia. Nie jest również oczywiste, jak zebrać porównywalną próbkę prawdziwych wiadomości.

Pytania takie jak te są kluczem do zrozumienia cech charakteryzujących fałszywe wiadomości. Wyobraźmy sobie badanie, w którym fałszywe wiadomości składają się z sensacyjnych artykułów rozpowszechnianych za pośrednictwem mediów społecznościowych, podczas gdy prawdziwa wiadomość składa się z bardziej poważnych artykułów opublikowanych w tradycyjnych serwisach informacyjnych. Lingwistyczne porównanie tych dwóch zestawów danych niewątpliwie formalnie się zbiegnie, ale byłoby błędem zakładać, że jest to podstawowa różnica między prawdziwymi i fałszywymi wiadomościami.

Wstępne badania prowadzone na Uniwersytecie w Birmingham sugerują, że rozwiązaniem tego problemu jest stworzenie zbiorów reprezentujących nie tylko fałszywe wiadomości, ale cały internetowy serwis informacyjny. Jedynie porównując publikacje różnych autorów, wiadomości z różnych źródeł, różne tematy i punkty widzenia, a następnie poddając te dane starannej analizie lingwistycznej, można naprawdę zrozumieć, czym różni się język fałszywych i wiarygodnych wiadomości.

Źródło: birmingham.ac.uk