Nghệ thuật ẩn mình – Kevin D. Mitnick, Robert Vamosi

Trong trường hợp của người lính thánh chiến trẻ tuổi trên, những gì có trong bối cảnh là một trụ sở quân sự.

Trong siêu dữ liệu của bức ảnh tự sướng đó còn có kinh độ và vĩ độ chính xác – hay vị trí địa lý – của nơi chụp ảnh. Tướng Hawk Carlisle, người đứng đầu Bộ Tư lệnh Không quân Hoa Kỳ, ước tính chỉ mất 24 tiếng đồng hồ kể từ khi bức ảnh tự sướng được đăng lần đầu tiên trên mạng xã hội cho đến khi trụ sở đó bị tiêu diệt hoàn toàn.

Dĩ nhiên, có thể dùng siêu dữ liệu trong file hình ảnh để định vị bạn. Dữ liệu EXIF trong một hình ảnh kỹ thuật số chứa thông tin về ngày và giờ chụp, nhà sản xuất và model của máy ảnh, kinh độ và vĩ độ của nơi chụp (nếu bạn bật tính năng định vị trên máy). Chính từ thông tin này trong file mà quân đội Mỹ có thể tìm ra trụ sở của Daesh giữa sa mạc mênh mông, cũng như Mark Loveless đã sử dụng dữ liệu EXIF để xác định vị trí của John McAfee. Công cụ này có sẵn trong chương trình kiểm tra file trên hệ điều hành OSX của Apple và trong các công cụ tải xuống như FOCA cho Windows và Metagoofil cho Linux, do đó bất kỳ ai cũng có thể sử dụng nó để truy cập vào trường siêu dữ liệu lưu trữ trong các bức ảnh và tài liệu.

Đôi khi, thủ phạm tiết lộ vị trí của bạn không phải file ảnh mà là một ứng dụng. Mùa hè năm 2015, trùm ma túy Joaquin “El Chapo” Guzman trốn thoát khỏi Altiplano, một nhà tù được tăng cường an ninh mức độ cao nhất ở Mexico, và lập tức biến mất. Liệu có phải như vậy?

Hai tháng sau đó, Jesus Alfredo Guzman Salazar, người con trai 29 tuổi của El Chapo, đăng một hình ảnh lên Twitter. Mặc dù hai người đàn ông ngồi ở bàn ăn với Salazar bị che đi bằng các biểu tượng cảm xúc, nhưng hình dáng người ngồi bên trái rất giống với El Chapo. Hơn nữa, Salazar còn chú thích cho bức ảnh này là, “Tháng 8 ở đây, với ai thì các bạn đã biết rồi đấy.” Các tweet cũng chứa dữ liệu về vị trí của người đăng – Costa Rica – tức là con trai của El Chapo đã không tắt chức năng tự động gắn thẻ trên ứng dụng điện thoại thông minh của Twitter.

Dù gia đình bạn không có tù nhân trốn trại, nhưng bạn vẫn cần nhận thức được rằng các thông tin và hình ảnh kỹ thuật số ẩn giấu trong ảnh của mình (đôi khi mắt thường cũng thấy được) có thể tiết lộ rất nhiều điều cho một người không biết bạn, và nó có thể quay trở lại ám ảnh bạn.

Ảnh trực tuyến có thể cung cấp nhiều thông tin hơn chứ không chỉ dừng lại ở việc tiết lộ vị trí của bạn. Khi kết hợp với một số chương trình phần mềm nhất định, chúng có thể hé mở các thông tin cá nhân về bạn.

Năm 2011, Alessandro Acquisti, một nhà nghiên cứu ở Đại học Carnegie Mellon, đưa ra một giả thiết đơn giản: “Tôi muốn xem liệu từ một khuôn mặt trên đường phố có thể suy luận ra một số An sinh Xã hội hay không.” Và câu trả lời là có. Bằng cách chụp qua webcam hình ảnh một người tình nguyện tham gia vào nghiên cứu trên, Acquisti và nhóm của anh đã có đủ dữ liệu để thu thập thông tin cá nhân về người đó.

Hãy nghĩ về điều đó. Bạn có thể chụp ảnh một người đi trên đường rồi dùng phần mềm nhận dạng khuôn mặt để xác định danh tính của họ. Nếu không có xác nhận từ chính người đó, một số kết quả bạn tìm ra có thể là sai. Nhưng khả năng cao là phần lớn các “kết quả khớp dữ liệu” sẽ xác định được cho bạn một cái tên cụ thể.

Chia sẻ với tờ Threatpost, Acquisti nói: “Có sự pha trộn giữa dữ liệu trực tuyến và dữ liệu ngoại tuyến, và khuôn mặt chính là đường dẫn – là mối liên kết thực sự giữa hai thế giới này. Tôi nghĩ bài học rút ra ở đây khá là u ám. Chúng ta phải đối diện với thực tế rằng khái niệm về sự riêng tư của chúng ta đang bị xói mòn. Bạn không còn riêng tư trên đường phố hoặc trong đám đông nữa. Sự kết hợp của tất cả các công nghệ này đang thách thức kỳ vọng của chúng ta về sự riêng tư.”

Nhóm nghiên cứu của Acquisti đến Đại học Carnegie Mellon nhờ các sinh viên điền vào một bảng câu hỏi khảo sát trực tuyến. Webcam trên máy tính xách tay chụp lại ảnh từng người khi họ trả lời bảng câu hỏi, và những bức ảnh này được tham chiếu chéo ngay trên mạng bằng phần mềm nhận dạng khuôn mặt. Khi họ thực hiện gần xong bảng câu hỏi, một số ảnh được truy xuất đã xuất hiện trên màn hình. Acquisti cho biết 42% số ảnh đã được xác định chính xác và liên kết tới các hồ sơ của sinh viên trên Facebook.

Nếu sử dụng Facebook, có lẽ bạn đã biết về công nghệ nhận dạng khuôn mặt tương đối hạn chế của họ. Khi bạn tải ảnh lên, Facebook sẽ cố gắng gắn thẻ những người trong mạng lưới của bạn, những người có trong danh sách bạn bè của bạn. Bạn có một chút quyền kiểm soát trong chuyện này. Ở mục cài đặt, bạn có thể yêu cầu Facebook thông báo mỗi khi người khác đăng ảnh có mặt bạn và quyết định xem có nên cho phép họ gắn thẻ bạn không. Bạn cũng có thể chọn đăng bức ảnh đó lên tường hoặc dòng thời gian của mình sau khi có thông báo.

Để ẩn các ảnh được gắn thẻ trong Facebook, hãy mở tài khoản và đi tới “Private Settings” (Cài đặt riêng tư). Có nhiều tùy chọn khác nhau, bao gồm giới hạn hình ảnh cho dòng thời gian riêng tư. Ngoài ra, Facebook vẫn chưa cung cấp tùy chọn để ngăn người khác gắn thẻ bạn mà chưa xin phép.

Các công ty như Google và Apple cũng tích hợp công nghệ nhận diện khuôn mặt trong một số ứng dụng như Google Photo và iPhoto. Bạn nên xem phần cài đặt cấu hình cho các ứng dụng và dịch vụ đó để giới hạn những gì mà công nghệ nhận diện khuôn mặt có thể thực hiện. Cho đến nay, Google vẫn khá dè dặt trong việc đưa công nghệ nhận diện khuôn mặt vào tính năng tìm kiếm hình ảnh của mình (được biểu thị bằng biểu tượng máy ảnh trong cửa sổ tìm kiếm của Google). Bạn có thể tải lên một hình ảnh đã có, và Google sẽ tìm kiếm bức ảnh đó, nhưng nó sẽ không tìm kiếm các bức ảnh khác cũng có người trong ảnh. Trong nhiều tuyên bố khác nhau, Google đã nhiều lần khẳng định rằng việc để người dùng xác định người lạ bằng khuôn mặt là hành động “vượt qua những ranh giới đáng sợ.”

Mặc dù vậy, một số chính phủ đàn áp đã làm điều đó. Họ chụp ảnh người tham gia trong các cuộc biểu tình lớn chống chính phủ rồi đưa ảnh lên mạng. Trong trường hợp này, thực ra họ không sử dụng phần mềm nhận diện hình ảnh mà sử dụng lợi thế của đám đông (crowdsource) cho quá trình nhận dạng. Ngoài ra, một số tiểu bang của Mỹ cũng đã bắt đầu sử dụng cơ sở dữ liệu hìnhảnh của các Sở Quản lý xe Cơ giới để xác định nghi phạm trong các vụ án hình sự. Nhưng đó là những hoạt động phức tạp ở cấp độ tiểu bang. Một nhà nghiên cứu đơn độc có thể làm được gì?

Acquisti và nhóm nghiên cứu của anh muốn tìm hiểu xem có thể tham chiếu chéo trực tuyến bao nhiêu lượng thông tin trích xuất từ hình ảnh về một người. Để tìm câu trả lời, họ sử dụng một công nghệ nhận diện khuôn mặt gọi là Pittsburgh Pattern Recognition, hoặc PittPatt, hiện thuộc sở hữu của Google. Các thuật toán được sử dụng trong PittPatt đã được cấp phép cho nhiều công ty bảo mật và tổ chức chính phủ khác nhau. Ngay sau khi mua lại công nghệ này, Google đã chính thức tuyên bố ý định của mình: “Như chúng tôi vẫn khẳng định trong hơn một năm qua, chúng tôi sẽ không bổ sung tính năng nhận diện khuôn mặt cho Google cho đến khi nào tìm ra mô hình bảo mật đủ mạnh cho nó. Và đến giờ chúng tôi vẫn chưa tìm ra mô hình đó.” Hãy hy vọng rằng công ty này sẽ tiếp tục giữ lời.

Tại thời điểm thực hiện nghiên cứu trên, Acquisti có thể sử dụng PittPatt kết hợp với các hình ảnh Facebook khai thác được (qua dữ liệu) từ các hồ sơ cá nhân mà nhóm nghiên cứu cho rằng có thể tìm kiếm công khai, ví dụ những hình ảnh cá nhân mà các sinh viên ở Carnegie Mellon đã đăng lên cùng với một chút ít thông tin nào đó. Sau đó, họ khớp tập hợp các khuôn mặt đã biết này với tập hợp các khuôn mặt “ẩn danh” trên một website hẹn hò trực tuyến. Ở đó, các nhà nghiên cứu có thể xác định được 15% trong số các tài khoản được cho là “ẩn danh” này.

Tuy nhiên, thí nghiệm đáng sợ nhất là liên kết khuôn mặt của một người với số An sinh Xã hội của người đó. Acquisti và nhóm nghiên cứu thực hiện tìm kiếm các hồ sơ trên Facebook có thông tin về ngày sinh và quê quán của một người. Trước đây, năm 2009, cũng nhóm nghiên cứu này đã chứng minh rằng chỉ riêng thông tin này cũng đủ để họ lấy được số An Sinh Xã Hội của một người (số này được cấp tuần tự theo công thức riêng của từng tiểu bang, và từ năm 1989, nó được cấp vào ngày sinh hoặc gần ngày sinh của mỗi người, do đó việc đoán bốn chữ số cuối cùng trở nên dễ dàng hơn).

Sau một số tính toán ban đầu, các nhà nghiên cứu gửi một bảng khảo sát bổ sung, hỏi các sinh viên Carnegie Mellon xem năm chữ số đầu tiên trong số An sinh Xã hội của họ do thuật toán phỏng đoán có đúng không. Và phần lớn đều trả lời là đúng.

Tôi cá rằng có một số bức ảnh mà bạn không muốn xuất hiện trên mạng nữa. Nhưng khả năng cao là bạn sẽ không thể lấy lại tất cả, dù rằng đã xóa chúng khỏi các trang mạng xã hội. Điều này một phần là vì sau khi bạn đăng một nội dung lên mạng xã hội, nó sẽ thuộc về quyền sở hữu của mạng đó và rời khỏi tay bạn. Và bạn đã đồng ý như vậy trong các điều khoản dịch vụ.

Nếu sử dụng ứng dụng phổ biến là Google Photos, thì dù bạn đã xóa ảnh ở đó cũng không nhất thiết có nghĩa là nó đã biến mất. Nhiều khách hàng nhận thấy hình ảnh vẫn ở đó ngay cả khi họ xóa ứng dụng khỏi thiết bị di động. Tại sao? Bởi vì một khi hình ảnh chạm tới đám mây, nó sẽ tồn tại độc lập với ứng dụng, nghĩa là các ứng dụng khác có thể tiếp cận và tiếp tục hiển thị hình ảnh bạn đã xóa.