Start - Jak komputer czyta w myślach, czyli o interfejsach mózg-komputer
Jak komputer czyta w myślach, czyli o interfejsach mózg-komputer

Przeciwieństwa się przyciągają – większość z nas spotkała się kiedyś z tym terminem, jednak w przypadku jednych z najbardziej rozpowszechnionych urządzeń świata jest on wyjątkowo mylący.
Gdyby zapytać ludzi o najpopularniejsze ich zdaniem urządzenia, zapewne najczęściej powtarzającymi się odpowiedziami byłyby: komputer, telefon oraz telewizor (choć ten ostatni pojawiałby się głównie w odpowiedziach osób starszych). Z tego powodu trudno nie odnieść wrażenia, że mało kto na co dzień myśli o maszynie, dzięki której zawdzięczamy właśnie samą umiejętność myślenia. Ludzkie ciało jest za bardzo „nasze”, aby w pełni móc rozpatrywać je jako maszynę, mimo że w przypadku mózgu jest to nawiązanie wręcz idealne. Porównując mózg do komputera, łatwo dostrzec sporą liczbę podobieństw, która sprawia, że z dwóch na pierwszy rzut oka niepowiązanych ze sobą rzeczy powstaje obraz bliźniąt, może nie jednojajowych, jednak nadal podobnych do siebie i mocno ze sobą związanych.
Za jedno z najbardziej trafnych porównań w neuroinformatyce uznaje się stwierdzenie Alana Turinga, który uznał komputer za odzwierciedlenie ludzkiego mózgu. Sama postać Turinga, zapewne dobrze znana osobom mniej lub bardziej zainteresowanym informatyką, zasłużyła sobie na miano swego rodzaju prekursora sztucznej inteligencji poprzez stworzenie tzw. testu Turinga. Jego głównym celem było przedstawienie, czy maszyna jest w stanie myśleć w typowo ludzki sposób. Jaki sposób myślenia jest więc uznawany za ludzki? Pytanie, pomimo sporej dozy specyficzności, posiada dość prostą do zrozumienia odpowiedź. Ludzki sposób myślenia to taki, który spowoduje, że podczas rozmowy druga strona nie zda sobie sprawy z tego, że tak naprawdę rozmawia z urządzeniem. Z tego powodu sam test ma postać dialogu z wykorzystaniem języka naturalnego, czyli takiego, który jest stosowany w zwykłej komunikacji interpersonalnej. Sędziowie poprzez przeprowadzanie dialogu z niewidzialną jednostką wydają opinię, czy ich rozmówca jest człowiekiem, czy jednak maszyną. Czy bycie istotą ludzką wystarczy do przejścia testu? Niestety w niektórych przypadkach nawet człowiek nie wydawał się sędziom wystarczająco ludzki, aby móc zdać i nie zostać przez niektórych z nich uznanym za maszynę.

Jak już wcześniej zostało wspomniane, ludzki mózg i komputer mają wiele wspólnych cech, które sprawiają, że można je postrzegać jako rodzeństwo. Rzadko kiedy rodzeństwo jest identyczne, niemniej zazwyczaj da się dostrzec u niego podobne zachowania oraz cechy wyglądu. Pierwszym prawie identycznym schematem działania występującym w komputerze oraz w mózgu jest sposób przesyłania informacji poprzez sygnały elektryczne. Mózg wykorzystuje sygnały analogowe, z kolei komputer preferuje sygnał cyfrowy wyrażony za pomocą systemu liczb binarnych, czyli systemu zero-jedynkowego, w którym występują tylko dwie wartości: 0 oraz 1. Czym jednak są te poszczególne sygnały? Sygnał analogowy można wyobrazić sobie na przykładzie zegarka analogowego, którego wskazówka, przemieszczając się po tarczy, pokazuje godzinę. W ten sposób wskazówka stanowi reprezentację czasu. W przypadku sygnału cyfrowego zapisanego poprzez system binarny pozbywamy się wyobrażenia całej reprezentacji i przechodzimy do bardziej skromnego oraz uproszczonego zestawienia informacji, które zapisane są nie jako ciągła fala, tylko dwie wspomniane wcześniej liczby: 0 oraz 1. Świat sygnałów analogowych jest więc pełen różnych odcieni, podczas gdy świat sygnałów cyfrowych jest czarno-biały, niemal rodem z kultowej Rodziny Addamsów.
Użycie dwóch różnych rodzajów sygnałów nie oznacza jednak, że mózg nie chce niekiedy działać tak samo jak jego młodszy brat komputer. Podobnie binarny sposób funkcjonowania potrafi prezentować system nerwowy przy działaniu impulsów. Impulsy porównać można do palca naciskającego przełącznik światła. Jeśli użyjemy wystarczająco dużo siły, przełącznik przeskoczy i lampa osiągnie jeden z dwóch stanów – światło się włączy lub zgaśnie, jeśli wcześniej było już włączone. W momencie, gdy impuls osiągnie wystarczającą wartość i przekroczy pewien próg, wtedy neuron również osiągnie jeden z dwóch stanów – włączy się lub wyłączy. Sam neuron jest komórką nerwową, czyli podstawowym elementem budowy układu nerwowego. Każdy neuron jest jak ziarno piasku, które samo w sobie jest niezwykle małym elementem, a mimo to jest w stanie zbudować ogromną i zachwycającą pustynię, a w przypadku neuronów układ nerwowy.
Zarówno mózg, jak i komputer mają podobne „zainteresowanie” i wyrażają je poprzez wykonywanie tego samego działania, jakim jest przeprowadzanie różnych obliczeń. Tak właściwie do 2007 roku komputer zawsze był takim nieco stereotypowym młodszym bratem, który chodził do tej samej szkoły co jego starszy brat i na każdej lekcji słyszał przykre dla siebie porównania do niego. Podczas gdy mózg świetnie sobie radził z wieloma obliczeniami na raz, komputer robił wszystkie po kolei w typowo sekwencyjny sposób, czyli krok po kroku. Wszystko zmieniło się we wspomnianym roku 2007, kiedy firma Nvidia opracowała technologię CUDA, pozwalającą na wykonywanie wielu obliczeń równolegle, co znacznie zwiększyło wydajność w porównaniu do technologii z tradycyjnymi sekwencyjnymi procesorami.
Takich wspólnych cech łączących mózg oraz komputer można by było wymienić jeszcze kilka, co pokazuje, jak bardzo zbliżone swoim funkcjonowaniem są do siebie te dwie „maszyny”. Skoro aż tak wiele ich łączy, to co by się stało, gdyby rozwinięto ich wspólną relację poprzez ich połączenie? Koncepcja ta określana jest mianem interfejsu mózg–komputer i mimo że może ona wzbudzać wrażenie jakiegoś elementu wyciągniętego z przyszłości lub z dzieła kulturowego o konwencji cyberpunka, to projekty takich interfejsów nie są niczym nowym i pojawiają się już od wczesnych lat 80. Ludzki mózg ma niesamowitą zdolność autosugestii, która objawia się tym, że zarówno wykonana czynność, jak i ta, o której pomyślimy, powoduje powstanie tej samej aktywności mózgowej. Temat ten należy do dość skomplikowanych, jednak do samego zrozumienia idei interfejsów wystarczy zrozumienie wyłącznie tego schematu. W przypadku wykonania ruchu prawą ręką dojdzie do takiego samego „podświetlenia” mózgu, jak w przypadku samego pomyślenia o tym, że właśnie tą ręką ruszamy. Badacze po dostrzeżeniu tej zależności zauważyli w niej ogromny potencjał poprawy jakości życia wielu chorych, którzy ze względu na swoje dolegliwości utracili możliwość wykonywania nawet podstawowych czynności lub komunikowania się ze światem, co mocno zmniejszyło komfort ich życia.
Możliwość komunikowania się ze światem umożliwia ludziom zapewnianie takich fundamentalnych potrzeb jak poczucie bezpieczeństwa oraz uczucie przynależności, które znalazły swoje miejsce w hierarchii potrzeb, nazywanej obecnie piramidą Maslowa. Co ciekawe, sama piramida nie jest do końca dziełem Maslowa, powstała ona bardziej w ramach zniekształcenia jego pomysłów przez inne osoby. Wróćmy jednak do głównego tematu. Skoro komunikacja jest aż tak istotną kwestią w życiu praktycznie każdej osoby, to jak wygląda sytuacja osób, które na skutek chorób lub zaburzeń utraciły możliwość porozumiewania się za pomocą własnego głosu, poprzez pisanie na kartce czy klawiaturze? Rzeczywistość pozbawiona szansy na przekazanie informacji na temat potrzeb, uczuć czy też powiedzenia innym, jak wiele dla nas znaczą, byłaby zapewne przerażającą wizją dla wielu osób. Taki jest niestety świat ludzi, których słowa zostały uwięzione przez ich własny organizm. Posiadają miliony myśli, które nie są w stanie opuścić ich mózgu. Co by się jednak stało, gdyby istniał komputer będący w stanie odczytać te myśli? Choć może się to wydawać abstrakcyjne i niemożliwe, właśnie w taki sposób działają interfejsy mózg–komputer. W taki sposób komunikował się ze światem również znany fizyk, doktor Stephen Hawking, zmagający się ze stwardnieniem zanikowym bocznym, chorobą prowadzącą nawet do całkowitego paraliżu.
Jak zostało już wspomniane wcześniej, nasze mózgi charakteryzuje dość ciekawy sposób działania – zarówno pomyślenie o czynności, jak i jej wykonanie aktywują te same partie mózgu, dzięki czemu wystarczy zwykła myśl o czymś, aby nasz mózg poniekąd zinterpretował to jako wykonanie działania. Każda myśl jest więc zakodowana w aktywności mózgu. Samą aktywność możemy dostrzec za pomocą elektroencefalografu, który rejestruje sygnały elektryczne przedstawiające tzw. fale mózgowe. Co wspólnego ma samo badanie elektroencefalograficzne (w skrócie EEG) z interfejsem mózg-komputer? Właśnie poprzez to badanie komputer jest w stanie wstępnie zapoznać się z myślami mózgu, aby następnie w odpowiedni sposób je przeanalizować. Osoba chora, zmagająca się z zaburzeniami mowy lub niemogąca pisać za pomocą rąk zakłada specjalny czepek zawierający kilkanaście elektrod rejestrujących aktywność mózgową. Elektrody te przesyłają sygnały elektryczne do aparatury, która zamienia sygnał analogowy na sygnał cyfrowy, czyli ten w postaci systemu binarnego. System binarny to taki język ojczysty komputera, każda informacja zapisana w tym systemie jest dla niego zrozumiała. Przetworzony sygnał dopasowywany jest następnie do znanych wzorców aktywności mózgu, a na samym końcu działania interfejsu dochodzi do tzw. działania na otoczenie, w którym interfejs informuje użytkownika o tym, w jaki sposób został dopasowany sygnał do wzorca aktywności i co się ze względu na ten fakt dzieje. Umożliwia to użytkownikowi dokonywanie zmian w działaniu interfejsu.
Skąd jednak biorą się wzorce aktywności i czym one są? Każda istota żywa jest „atakowana” różnymi bodźcami, które interpretuje centrum sterowania, czyli mózg. Badanie EEG umożliwia zaobserwowanie zależności pomiędzy różnymi bodźcami a aktywnością mózgu. Dostrzec to można poprzez załamki, które związane są czasowo z danym bodźcem. Określane są one inaczej jako potencjały i jednym z najlepiej poznanych oraz najczęściej wykorzystywanych w interfejsach mózg-komputer jest komponent P300. Jest to reakcja na oczekiwany, pojawiający się co jakiś czas bodziec. Jest on wzorcem, do którego dopasowywana jest zarejestrowana później w czasie użytkowania aktywność mózgu. Co może być takim bodźcem? Właściwie wszystko to, co jesteśmy w stanie zobaczyć i usłyszeć bądź czego jesteśmy w stanie dotknąć. Muszą być spełnione tylko dwa wspomniane wcześniej warunki – osoba powinna się tego bodźca spodziewać, a on sam ma pojawiać się co jakiś czas. Kiedy się więc pojawi, potencjał P300 zostanie zarejestrowany.

Jak to jednak wygląda z perspektywy użytkownika interfejsu opartego na tym właśnie potencjale? Takie interfejsy służą do komunikacji ze światem zewnętrznym. Poza wcześniej skrótowo opisanym czepkiem z elektrodami i aparaturą, która przetwarza sygnał, użytkownik ma przed sobą również matrycę, która zawiera w sobie kilka kolumn i wierszy z literami, cyframi oraz znakami interpunkcyjnymi. Interfejs zawiera w sobie także syntezator mowy do generowania utworzonych zdań. Kolumny i wiersze zazwyczaj co kilka sekund przecinają się ze sobą, co powoduje podświetlenie się jednego znaku. Taką matrycę stanowić może zwykły ekran w laptopie z uruchomionym programem interfejsu, który powoduje podświetlenie określonych znaków. Gdy osoba chce, aby komputer przeczytał jej myśli i przekazał je innym osobom, musi skupić się na znakach, które stworzą zdanie, o którym myśli. W momencie gdy rząd wraz z kolumną się przetną, ukazując znak, który jest celem tej osoby, zarejestrowany zostanie komponent P300, a litera zostanie zapisana. Użytkownik reaguje w ten sam sposób na kolejne litery do momentu, aż zostanie utworzone słowo bądź zdanie, które chciał przekazać światu.
Poniżej przedstawiona została grafika z procesem zapisania słowa „chomik” za pomocą interfejsu opartego o komponent P300. Litery kluczowe, które były bodźcami oczekiwanymi, zostały zaznaczone kolorem zielonym. Proces zaczyna się od lewego górnego rogu i kończy na prawym dolnym. Sama matryca stanowi skróconą wersję matrycy interfejsu stworzonego przez neurobiologa doktora Emanuela Donchina oraz jego współpracowników.
Przedstawiony tutaj przykład jest tylko jednym z wielu zastosowań interfejsów mózg-komputer, o których śmiało można powiedzieć, że umożliwiają komputerowi czytanie w ludzkich myślach. Odejście od postrzegania interfejsów tylko przez pryzmat filmów science-fiction umożliwiłoby wielu osobom, które straciły już nadzieję, powrót do prowadzenia życia choć trochę zbliżonego do tego z okresu sprzed choroby. Mimo że aktualnie efektywne korzystanie z opisanego wyżej interfejsu trwa tylko około 10 minut, to dla osób chorych jest to aż 10 minut, podczas których wreszcie są w stanie komunikować się ze światem. Zdobycie nowego kanału komunikacji to nie tylko poprawa samopoczucia i komfortu pacjenta, lecz także dostarczenie mu nowej motywacji, co może zwiększyć powodzenie rehabilitacji. Pośrednie połączenie mózgu z komputerem może być postrzegane przez niektórych za kontrowersyjne, nie zmienia to jednak faktu, że dla wielu osób jest to szansa na wyjście z załamania psychicznego spowodowanego brakiem kontaktu werbalnego z innymi i z takich szans świat powinien korzystać. Każdy człowiek musi mieć możliwość używania swojego głosu do wypowiadania się. Szczególnie dotyczy to osób dla których codzienne życie jest ogromnym cierpieniem.
tekst: Jesica Ponichtera
zdjęcia: istock
Tekst pochodzi z Biuletynu 3 (351) / 2023