Нейросети розкрили особисті дані користувачів соцмереж

Швейцарські вчені з’ясували, що мовні моделі можна використовувати для отримання даних про відвідувачів Інтернету. Результати дослідження були опубліковані на сервері препринтів arXiv. 

Фахівці Федерального інституту технологій (ETH Zurich) зі Швейцарії Робін Стааб та Марк Веро підтвердили, що великі мовні моделі (LLM) можуть збирати та розкривати особисті дані користувачів. Як приклад вчені взяли 1,5 тисяч випадкових профілів з майданчика Reddit і проаналізували їх активність за допомогою LLM.

У матеріалі йдеться, що нейромережі перевірили акаунти в соцмережах та повідомлення 1,5 тисяч користувачів, а потім звузили їх число до 520 осіб. Автори відзначили, що LLM змогли впевнено визначити місце народження та проживання, а також рівень доходу людей, які володіли цими обліковими записами.

Так, мовна модель GPT-4 змогла ідентифікувати багато атрибутів з високим ступенем точності – 85 відсотків, LlaMA-2-7b – 51 відсоток.

“Це говорить нам про те, що ми видаємо багато особистої інформації в інтернеті, не замислюючись про це”, – заявив Робін Стааб. За його словами, наприклад, дані про доходи люди повідомляли у відповідних редакціях на Reddit, не підозрюючи, що їх можуть розкрити.

У середині жовтня швейцарські вчені заявили, що чат-боти зі штучним інтелектом можуть розкривати та збирати персональну інформацію від користувача. За словами фахівців, отриманими даними можуть скористатися шахраї.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

2023-11-01