Rafał Prabucki, 07.05.2018

 

Parę tygodni temu definitywnie zamknięto portal Backpage.com – stronę WWW na anonse publikowane w postaci postów przez użytkowników. Prokurator generalny stanu Teksas, Ken Paxton uznał, że posiada dość dowodów, aby zablokować stronę związaną ze wspieraniem handlu żywym towarem (zob. rys. 1)[1]. Z kolei prokurator generalny stanu Kalifornia, Xavier Bercerra oskarżył Carla Ferrera, głównego twórcę Backpage.com o między innymi pranie brudnych pieniędzy[2]. W tle sprawy pojawiły się kwestie związane z bitcoinami i sztuczną inteligencją (w skrócie SI). Przy tej okazji warto przypomnieć ciekawy epizod i zadać pytanie, czego szukał na portalu system uczący się, stworzony przez między innymi Rebeccę Portnoff?

Rysunek 1. Zrzut ekranu zablokowanej strony.

Ale po kolei…

Problematyka SI i nauk prawnych nieustannie próbuje się ze sobą wiązać za sprawą ruchu Artificial Intelligence in Law (akronim: AIL). Na tym tle postrzegana jest przez pryzmat automatyzacji pewnych procesów, przy czym tok myślenia jak prawnik, a przede wszystkim sztuka argumentacji nie są temu ruchowi obce. Wszystko zależy od tego, co rozumiemy pod pojęciem SI. Najłatwiej można ją określić mianem oprogramowania, które szuka teorii i metodologii związanych z poznawaniem świata oraz konstruowaniem odpowiednich reakcji w związku z pojawianiem się pewnych charakterystycznych sytuacji. Tak zdefiniowane pojęcie SI pozwala nam na objęcie tym terminem projektów autonomicznych pojazdów (Google, Uber, Tesla), czy też sprawnie poruszającymi swoimi mechanicznymi kończynami robotów opracowanych przez BostonDynamics. Chociaż nie będą one przygotowywały skomplikowanych dokumentów, to ich algorytmy odwzorowują pracę ludzkiego śródmózgowia (motoryka).

Nasza inteligencja istnieje, a SI próbuje ją naśladować. „Algorytm”, z którego korzystamy jest w naszym mózgu. Proces powstawania inteligencji da się przedstawić wedle schematu: mamy dane, które przetwarzamy na informacje. Informacje składają się z kolei na wiedzę. Musi jednak zajść proces poznania tych informacji. Jeżeli potrafimy zrozumieć zgromadzoną wiedzę, to wyciągniemy odpowiednie wnioski, które są ostatnim procesem powstawania inteligencji[3].

Proces wiedzotwórczy jest bardzo znaczący w kryminalistyce. Prokurator wiedząc, że na miejscu oględzin znaleziono proszek, oddaje go do laboratorium, w którym specjaliści na podstawie zebranych danych na temat danej substancji, sporządzają ekspertyzę zawierającą informacje, która odpowiada na pytanie co to jest. Prokurator zapoznaje się z informacjami zawartymi w ekspertyzie o substancji i w ten sposób uzyskuje wiedzę[4]. Jeżeli rozumie tę wiedzę i jest w stanie wyciągnąć odpowiednie wnioski, to będzie to świadczyło o jego inteligencji. W rezultacie inteligencja przełoży się na sporządzenie poprawnego aktu oskarżenia aż po mowę końcową. Zanim prokurator wystąpi ze swoją mową końcową na sali sądowej, to śledczy muszą zgromadzić ślady. Tyle tylko, że problem współczesnej kryminalistyki to ogromne ilości danych z różnych źródeł i to przeważnie danych chaotycznych bez żadnej uporządkowanej struktury. Szczególnie, że znaczna część przestępstw dokonywana jest za pomocą sieci Internet.

Weźmy dla przykładu rejestr transakcji dla kryptowaluty Bitcoin. Blockchain (łańcuch bloków) posiada zapisane wszystkie transakcje zrealizowane tokenami, które w przypadku Bitcoina są nośnikiem wartości. Blockchain to swoista księga rachunkowa. Jest to nieocenione źródło informacji, które posiada jednak znaczne ilości danych. Jeżeli połączymy je z jakimś portalem, gdzie np. wystawiane są oferty usług seksualnych płatnych w bitcoinach, to mamy już dwa źródła informacji. Wiążąc te informacje mamy szansę pozyskać cenną wiedzę na temat np. stręczycieli lub handlu żywym towarem. Trudno jednak mówić tu o jakimś porządku, chociaż dla samej technologii stojącej za tą kryptowalutą można mówić o pewnej strukturze, ponieważ wszystko zapisywane jest w blokach. Przeciętny przestępca korzystający z bitcoinów będzie korzystał z wielu portfeli, a adresy tych portfeli (powstające na bazie kluczy publicznych), przypominające ze względu na swoje funkcje numery kont bankowych nic śledczym nie mówią. Publiczny rejestr w postaci bloków nie zapisuje danych właściciela tzn. imienia, nazwiska itd.

Rebecca Portnoff z University of California wpadła na pomysł, jak wykorzystać właściwości Blockchaina i zaradzić problemowi handlu żywym towarem. Wystarczy nauczyć SI wyszukiwania podejrzanych ofert na danej stronie (np. zamknięta niedawno Backpage.com). Do tej pory robili to policjanci, którzy nie radzili sobie z przeglądaniem przeogromnej liczby ofert seksualnych i rozszyfrowywaniem nomenklatury przestępców. SI nie tylko robi to szybciej, ale i sprawniej. Od razu łączy ofertę stręczyciela z transakcjami wykonanymi bitcoinami na jego rzecz. W ten sposób prokurator otrzymuje konkretną wiedzę, a z całego procesu wyeliminowany zostaje śledczy przeglądający tysiące postów oraz specjalista łączący je potem z transakcjami zapisanymi w blokach składającymi się na Bitcoina[5].

Jak działa SI szukająca stręczycieli? Generalnie wyróżniamy modele typu analytical (analityczny) i learned (uczony) SI. Model zaproponowany w projekcie prowadzonym przez uczonych z University of California posiada to, co określa się mianem „machine learning” (uczenie maszynowe) i jest cechą charakterystyczną dla modelu uczonego. To znaczy, że w przeciwieństwie do modelu analitycznego nie jest tu wymagane tworzenie skomplikowanego algorytmu opartego na matematycznych wzorach. Tworzymy listę wejść (inputs) i odpowiadające im wyjścia (outputs). Model uczony to relacje pomiędzy oznaczonymi wejściami i pożądanymi wyjściami. To tak w dużym skrócie[6].

W przypadku SI poszukującej stręczycieli i handlarzy żywym towarem główny nacisk położono na stylometrii. W tym przypadku jest to metoda analizy ofert seksualnych dla ustalenia statystycznej charakterystyki stylu tworzenia tego typu postów (tekstów) przez autora[7]. Drugi etap pracy SI to łączenie ofert z transakcjami realizowanymi bitcoinami. Jak już wspominałem, przestępca może mieć wiele portfeli na bitcoiny, a połączenie ich z jedną osobą nie jest możliwe bez wsparcia się informacjami z innego źródła. Dzięki zautomatyzowaniu przeszukiwania ofert oraz SI, która wykorzystała stylometrię w celu łączenia postów pochodzących od jednej i tej samej osoby, udało się pozyskać wiedzę na temat działania stręczyciela i portfeli na bitcoiny do niego należących (zob. rys. 2)[8].

Rysunek 2. Próba ustalenia schematu powstawania wiedzy na bazie danych z portalu Backpage.com i blockchaina Bitcoina. Opracowanie własne.

Wydaje się, że pomysł ten jest uniwersalny[9] – można wykorzystać go do każdego forum, na którym przeprowadzane są transakcje handlowe zabronionymi towarami lub substancjami, jak i także do każdej kryptowaluty, która nie jest zero-proof technology[10], czyli posiada publiczny (otwarty) i czytelny blockchain.

Przyszłość pokaże, czy SI będzie po śladach cyfrowych pozostawionych w sieci poszukiwać przestępców i ich ofiar. Według niektórych błyskawiczne zamknięcie Backpage.com to – z punktu widzenia wiktymologii – porażka, ze względu na powrót do tradycyjnych metod sprzedaży ludzi… [11].

————————————————————————————————————————–

[1] https://www.texasattorneygeneral.gov/news/releases/investigation-by-ag-paxtons-office-helps-shut-down-backpage.com [dostęp 02.05.2018].

[2] Astor M., Backpage Chief Pleads Guilty to Conspiracy and Money Laundering, “New York Times”, 04.12.2018.

[3] Prateek J., Artificial Intelligence with Python, Wydawnictwo Packt, Birmingham 2017.

[4] Zainspirowałem się pozycją: Konieczny J., Identyfikacja kryminalistyczna, Instytut Wydawniczy EuroPrawo, Warszawa 2017.

[5] Revell T., AI uses bitcoin trail to find and help sex-trafficking victims, “New Scientist”, 02.09.2017.

[6] Prateek J., dz. cyt.

[7] Istnieją darmowe oprogramowania do tego typu analiz, jak STYLO – można więc samemu spróbować, jak działa stylometria  https://sites.google.com/site/computationalstylistics/home [dostęp 02.05.2018].

[8] Portnoff R., Haung D., Doerfler P., Afroz S., McCoy D., Backpage and Bitcoin: Uncovering Human Traffickers, “KDD 2017 Applied Data Science Paper”, 17.08.2017.

[9] Zob. Portnoff R., Afroz S., Durrett G., Kummerfeld J., Berg-Kirkpatrick T., McCoy D., Levchenko K., Paxson V., Tools for Automated Analysis of Cybercriminal Markets, https://www.researchgate.net/publication/315874214_Tools_for_Automated_Analysis_of_Cybercriminal_Markets [dostęp 02.05.2018].

[10] Dla przykładu: kryptowaluta Dash zapisuje dane dotyczące transakcji w taki sposób, że niemożliwa jest obserwacja drogi, jaką pokonują między kolejnymi użytkownikami jej tokeny.

[11] Astor M., dz. cyt.

0 komentarzy