Niechętnie zapraszamy do swoich domów głośniki z inteligentnymi asystentami. Ich producenci – Amazon, Google czy Apple – zapewniają konsumentów, że urządzenia nasłuchują wyłącznie wywołania „po imieniu” i o żadnym podsłuchiwaniu nie może być mowy. Okazuje się jednak, że do podsłuchiwania dźwięków z wnętrz naszych domów wcale nie jest potrzebna Aleksa, Siri, Asystent Google czy Cortana.
Dysk twardy jak mikrofon
Wystarczą do tego tradycyjne dyski twarde, których jest zresztą jeszcze całkiem sporo. Fakt, w laptopach coraz częściej mamy już wyłącznie do czynienia z pamięcią SSD, niemniej w przypadku pecetów wciąż popularne jest stosowanie konfiguracji HDD+SDD. Tym ciekawiej wypadają wyniki badań naukowców z Uniwersytetu Michigan, do których przed majową prelekcją dotarł Thomas Claburn z redakcji The Register. Dzięki uzyskaniu dostępu do systemu pomiarowego PES, możliwe jest wykorzystanie dowolnego dysku twardego jako... mikrofonu.
Zobacz też: Project Alias – elektroniczny grzyb ma poskromić głosowych asystentów
Gwoli jasności – w najczęściej dziś wykorzystywanych magistralach SATA dane z PES nie są przekazywane wyżej, np. do systemu operacyjnego, więc szanse na ich przechwycenie są raczej znikome. Ponadto, zamiast robić z dysku mikrofon, znacznie łatwiej jest przejąć sam mikrofon. Scenariusz opisany w pracy naukowców z Michigan należy raczej traktować bardziej jako pokaz pomysłowości i ciekawostkę niż faktyczne zagrożenie. Oczywiście sens wykorzystania tej nietypowej formy podsłuchu jest znacznie większy, gdy atakujący dysponuje regularnym fizycznym dostępem do dysku. Oddajmy jednak głos samym badaczom:
Nasze badania dowodzą, że mechaniczne części w magnetycznych dyskach twardych mogą zachowywać się jak mikrofony z precyzją pozwalającą na przechwytywanie i ekstrakcję ludzkiej mowy. Mikrofony te są w stanie zbierać ludzką mowę z dokładnością porównywalną do usługi Shazam rozpoznającej muzykę.
PES, od Positional Error Signal, to działający w firmware dysku twardego mechanizm, który śledzi ruch głowicy elektromagnetycznej i monitoruje ewentualne odchylenia od żądanej trasy na talerzu. Rzeczone odchylenia mogą być spowodowane na przykład wstrząsami, niemniej PES jest na tyle dokładne, że może mierzyć mikrodchylenia powodowane… drganiami powietrza wywoływanymi przez fale akustyczne. Słowem – zakłócenia ruchu ramienia głowicy wystarczą, by na podstawie danych zebranych przez PES odtworzyć rozmowę przeprowadzoną nieopodal komputera z dowolnym magnetycznym dyskiem twardym.
Zobacz też: Dynamiczna spektroskopia fotoakustyczna – przesyłanie dźwięku laserem i parą
Naukowcom udało się nawet ustalić, jak głośna musiałaby ta konwersacja. Tutaj do pokonania jest kolejna przeszkoda – wymagany poziom natężenia dźwięku to od 75 do 85 decybeli, czyli dość dużo jak na zwykłą rozmowę. Z drugiej strony mowa o surowych danych z PES – w rozmowie z The Register naukowcy byli zgodni, ze próg udałoby się obniżyć po zaangażowaniu algorytmów przetwarzania dźwięku. Szczegóły techniczne tej ciekawej koncepcji zostaną przedstawione w maju podczas IEEE Symposium.