Nguồn: Luật sư Xiao Sa
Tháng trước, cơ quan quản lý quyền riêng tư của Ý Garante đã đưa ra kết luận rằng OpenAI Có một hoặc nhiều vi phạm các quy định của EU và công nghệ được ChatGPT sử dụng để thu thập dữ liệu người dùng đã vi phạm luật riêng tư của quốc gia này. ChatGPT, vốn tạo nên cơn sốt trí tuệ nhân tạo sáng tạo, một lần nữa lại rơi vào tranh cãi về việc tuân thủ dữ liệu.
Dữ liệu và sức mạnh tính toán là cốt lõi của trí tuệ nhân tạo tổng hợp. Bảo mật dữ liệu là vấn đề cốt lõi của việc tuân thủ trí tuệ nhân tạo tổng quát. Đằng sau sự phụ thuộc ngày càng tăng của trí tuệ nhân tạo vào dữ liệu, trí tuệ nhân tạo tổng hợp thu thập dữ liệu một cách bí mật, điều này gây ra hậu quả nghiêm trọng đối với các nguyên tắc "đồng ý có hiểu biết" và thách thức "cần thiết tối thiểu". Đồng thời, AI tổng quát tiềm ẩn rủi ro rò rỉ dữ liệu rất lớn trong giai đoạn chạy. Điều này đặt ra mối đe dọa nghiêm trọng đối với việc bảo vệ thông tin cá nhân. Hôm nay, nhóm Sajie sẽ nói về những thách thức và yêu cầu tuân thủ mà trí tuệ nhân tạo tổng hợp mang lại cho việc bảo mật thông tin cá nhân.
01 Thu thập và sử dụng kho dữ liệu< /strong>
Theo nguồn dữ liệu, dữ liệu liên quan đến thông tin cá nhân có thể được chia đại khái thành dữ liệu kho ngữ liệu liên quan đến thông tin cá nhân và dữ liệu do người dùng tải lên liên quan đến dữ liệu thông tin cá nhân.
Trí tuệ nhân tạo sáng tạo phụ thuộc nhiều vào dữ liệu và cần lượng dữ liệu lớn để đáp ứng yêu cầu đào tạo. Điều này xác định rằng trí tuệ nhân tạo tổng quát thường tích cực thu thập và xử lý dữ liệu công khai và không công khai, quy mô dữ liệu đào tạo trước thường có thể đạt tới hàng tỷ, thậm chí hàng chục tỷ tham số. Nếu có thông tin cá nhân trong đó, theo Điều 27 của "Luật bảo vệ thông tin cá nhân", "Người xử lý thông tin cá nhân có thể xử lý trong phạm vi hợp lý thông tin cá nhân mà cá nhân đó tự mình tiết lộ hoặc đã được người khác tiết lộ hợp pháp; trừ khi cá nhân từ chối rõ ràng." Nếu người xử lý thông tin xử lý thông tin cá nhân được tiết lộ và có tác động đáng kể đến quyền và lợi ích cá nhân, họ phải có được sự đồng ý của cá nhân theo quy định của luật này." Điều 7 của "Các biện pháp tạm thời của Cơ quan quản lý" của Trí tuệ nhân tạo sáng tạo" cũng nhấn mạnh rằng Nhà cung cấp "cung cấp dịch vụ trí tuệ nhân tạo sáng tạo" (sau đây gọi là nhà cung cấp) phải thực hiện đào tạo trước, đào tạo tối ưu hóa và các hoạt động xử lý dữ liệu đào tạo khác theo quy định của pháp luật và tuân thủ các quy định sau đây : (3) Nếu có liên quan đến thông tin cá nhân, phải có sự đồng ý của cá nhân hoặc các trường hợp khác phù hợp với pháp luật và quy định hành chính. từng chủ đề thông tin một.
Vì khó nhận được sự đồng ý của chủ thể thông tin nên việc xóa trực tiếp thông tin cá nhân trong cơ sở dữ liệu có được không? Ở đây cũng có những khó khăn. Một mặt, hiện nay thiếu các thuật toán làm sạch thông tin cá nhân hiệu quả và có một nghịch lý kỹ thuật nhất định; mặt khác, quy mô khổng lồ của cơ sở dữ liệu khiến việc làm sạch dữ liệu thủ công trở nên cực kỳ tốn kém và có nguy cơ xảy ra lỗi thứ cấp. rò rỉ thông tin cá nhân. Các nghiên cứu đã chỉ ra rằng công nghệ làm sạch dữ liệu dựa trên nhận dạng thực thể được đặt tên có tỷ lệ thu hồi là 97% (tên) và 80% (số đơn vị điều dưỡng) dữ liệu sức khỏe lâm sàng. Nói cách khác, khi thông tin cá nhân tồn tại trong tập hợp và cơ sở dữ liệu, hiệu quả làm sạch thông tin cá nhân sẽ kém trong giai đoạn đào tạo và các công ty công nghệ gặp rủi ro về tuân thủ. Nhóm Sajie nhắc nhở rằng khi các công ty công nghệ sử dụng dữ liệu kho ngữ liệu để đào tạo, họ nên cố gắng chọn các bộ dữ liệu không chứa thông tin cá nhân, đồng thời cải thiện độ chính xác của thuật toán nhận dạng càng nhiều càng tốt và ẩn danh hoặc cắt xén thông tin đã nhận dạng. thông tin cá nhân. Việc áp dụng cơ chế lọc máy và cơ chế rà soát thủ công ở phía kiểm toán cũng là biện pháp tuân thủ có nhiều ưu điểm hơn là nhược điểm.
02 Việc thu thập và sử dụng thông tin được tải lên bởi người dùng
Dữ liệu do người dùng tải lên có thể được phân chia vào Dữ liệu mà người dùng chủ động cung cấp" và "dữ liệu mà người dùng cung cấp thụ động". Cái gọi là dữ liệu do người dùng tích cực cung cấp đề cập đến dữ liệu cụ thể được người dùng tải lên để nhận phản hồi từ trí tuệ nhân tạo tổng hợp. Cái gọi là dữ liệu do người dùng cung cấp thụ động đề cập đến dữ liệu được người dùng tải lên để sử dụng các ứng dụng hoặc chức năng khác của thiết bị chứa thuật toán trí tuệ nhân tạo tổng hợp.
Hoạt động của trí tuệ nhân tạo tổng hợp thường yêu cầu người dùng chủ động "cung cấp" một số dữ liệu nhất định, sau đó phân tích và đưa ra phản hồi dựa trên các thuật toán. Trong quá trình này, dữ liệu tương tác giữa người và máy tính sẽ được ghi lại, lưu trữ và phân tích và có thể trở thành dữ liệu để đào tạo thay thế thuật toán mô hình. Tuy nhiên, trong bối cảnh nhà cung cấp dịch vụ không thực hiện nghĩa vụ nhắc nhở của mình và người dùng thiếu nhận thức về bảo mật, dữ liệu do người dùng cung cấp có thể bao gồm thông tin cá nhân như diện mạo cá nhân, địa chỉ và thông tin liên hệ của người dùng. Các mô hình dịch vụ phức tạp và các kịch bản ứng dụng đa dạng của trí tuệ nhân tạo tổng hợp làm trầm trọng thêm nguy cơ này. Với sự phát triển của công nghệ kỹ thuật số, danh tính của người dùng bị ràng buộc sâu sắc với thông tin liên hệ, dữ liệu khuôn mặt, dấu vân tay, v.v. và trí tuệ nhân tạo tổng hợp thường thu thập một lượng lớn thông tin cá nhân. Ví dụ: phạm vi ứng dụng của chương trình chatbot nổi tiếng của một công ty AI bao gồm nhiều lĩnh vực như giảng dạy, nghiên cứu khoa học, tài chính, truyền thông, giải trí… Bản ghi trò chuyện của người dùng với nó chứa một lượng lớn thông tin nhạy cảm, chẳng hạn như như bản sắc cá nhân, sở thích, thói quen, v.v. Nếu dữ liệu này rơi vào tay kẻ xấu sẽ dẫn đến vi phạm quyền riêng tư cá nhân, đánh cắp danh tính, gian lận tài chính và các rủi ro khác, gây tổn hại trực tiếp cho người dùng.
Ngoài ra, trí tuệ nhân tạo tổng quát có nhiều tình huống sử dụng khác nhau và thường được nhúng trong các ứng dụng chính và thậm chí cả các thiết bị. Ví dụ: vào tháng 1 năm nay, một trình duyệt nhất định đã công bố giới thiệu ba khả năng AI tổng quát chính và một công ty nào đó đã ra mắt điện thoại thông minh đầu tiên trên thế giới được trang bị công nghệ AI tổng quát. Ngay cả khi công nghệ trí tuệ nhân tạo tổng hợp không được sử dụng, người dùng chắc chắn sẽ tạo và tải lên dữ liệu khi sử dụng các ứng dụng và thậm chí cả thiết bị có liên quan và dữ liệu có thể chứa nội dung bị nghi ngờ là thông tin cá nhân.
Điều 11 của "Các biện pháp tạm thời quản lý trí tuệ nhân tạo sáng tạo" quy định rằng "các nhà cung cấp phải thực hiện nghĩa vụ bảo vệ thông tin đầu vào và hồ sơ sử dụng của người dùng theo quy định của pháp luật và không được thu thập những thông tin không cần thiết." thông tin cá nhân và không được lưu giữ bất hợp pháp" Thông tin đầu vào và hồ sơ sử dụng của người dùng có thể xác định danh tính của người dùng sẽ không được cung cấp bất hợp pháp cho người khác. Nhà cung cấp phải nhanh chóng tiếp nhận và xử lý các yêu cầu truy cập, sao chép, chỉnh sửa, bổ sung và xóa thông tin cá nhân của họ theo quy định của pháp luật. Yêu cầu." Các luật và quy định như "Luật bảo vệ thông tin cá nhân" và "Quy định về bảo vệ thông tin cá nhân của trẻ em trên Internet" đã xây dựng các quy định bắt buộc về thời gian lưu trữ dữ liệu. Dựa trên điều này, có thể đặt câu hỏi liệu thông tin bị nghi ngờ là thông tin cá nhân do người dùng tích cực cung cấp có thể được nhà cung cấp dịch vụ ghi lại, lưu trữ và lưu trữ hay không.
Đồng thời, có một số tranh cãi về việc liệu loại thông tin này có thể được sử dụng để huấn luyện các thuật toán hay không. Điều 7 của “Các biện pháp tạm thời quản lý trí tuệ nhân tạo sáng tạo” nhấn mạnh rằng “các nhà cung cấp dịch vụ trí tuệ nhân tạo sáng tạo (sau đây gọi tắt là nhà cung cấp) phải thực hiện đào tạo trước, đào tạo tối ưu hóa và các hoạt động xử lý dữ liệu đào tạo khác theo quy định của pháp luật , và tuân thủ các quy định sau:... (III) ) liên quan đến thông tin cá nhân, phải có sự đồng ý của cá nhân hoặc các trường hợp khác tuân thủ luật pháp và quy định hành chính." Sự cho phép của người dùng có được cho lần sử dụng đầu tiên không đủ để chi trả cho yêu cầu sử dụng dữ liệu trong giai đoạn đào tạo thuật toán và các công ty công nghệ phải có ủy quyền sử dụng rõ ràng hơn hoặc Loại dữ liệu này chỉ được sử dụng trong các trường hợp khác tuân thủ quy định của pháp luật, nếu không có thể vi phạm các quy định dân sự liên quan. luật, luật hành chính và cả luật hình sự. Tuy nhiên, ngay cả khi được người dùng ủy quyền rõ ràng thì vẫn có nguy cơ rò rỉ dữ liệu rất lớn trong giai đoạn vận hành của trí tuệ nhân tạo tổng hợp, các công ty công nghệ chỉ được phép sử dụng dữ liệu thông tin cá nhân nếu đảm bảo tính bảo mật của dữ liệu.
Để cải thiện chất lượng sản xuất, nhiều công ty công nghệ sẽ cố gắng hết sức để tăng cường khả năng lưu giữ dữ liệu và cải thiện khả năng tổng hợp dữ liệu. Ví dụ: Điều 2 trong “Chính sách quyền riêng tư” của một công ty AI nêu rõ: “Chúng tôi có thể tổng hợp hoặc loại bỏ thông tin nhận dạng cá nhân để thông tin đó không còn được sử dụng để nhận dạng bạn và sử dụng thông tin đó để phân tích các dịch vụ của chúng tôi. thêm các tính năng của dịch vụ của chúng tôi, tiến hành nghiên cứu và các mục đích tương tự khác." Đây là một giải pháp khả thi, nhưng theo nguyên tắc "đồng ý có hiểu biết", nhà cung cấp dịch vụ có nghĩa vụ thông báo, tức là nhà cung cấp dịch vụ cần phải cung cấp dữ liệu đối tượng cần thu thập, mục đích của dữ liệu và các rủi ro có thể xảy ra phải được giải thích trước cho chủ thể thông tin và việc thu thập chỉ được thực hiện sau khi được sự đồng ý của chủ thể thông tin. Đồng thời, các công ty công nghệ nên cung cấp cho người dùng quyền lựa chọn từ chối sử dụng thông tin cá nhân của mình, thay vì biến điều khoản này thành điều khoản thông báo cứng nhắc và bắt buộc. Ngoài ra, theo nguyên tắc "tối thiểu cần thiết", thông tin cá nhân do các công ty công nghệ thu thập phải được thu thập theo cách phù hợp để đạt được mục tiêu và ít ảnh hưởng nhất, đồng thời thông tin cá nhân của người dùng phải được thu thập rõ ràng và cụ thể. .
03 Viết ở cuối
So với trí tuệ nhân tạo truyền thống, trí tuệ nhân tạo tổng quát thường có tính chủ động thu thập thông tin mạnh mẽ hơn và nguy cơ lạm dụng dữ liệu cao hơn. Trí tuệ nhân tạo tổng hợp cần liên tục tăng cường khả năng hiểu ngữ cảnh thông qua tập hợp dữ liệu và tập dữ liệu quy mô lớn để liên tục nâng cấp và tối ưu hóa chính nó, trong tất cả các giai đoạn vận hành trí tuệ nhân tạo tổng hợp bao gồm thu thập dữ liệu, lưu trữ dữ liệu, xử lý dữ liệu và tạo dữ liệu. , điều đó chắc chắn sẽ xảy ra. liên quan đến nhiều thông tin cá nhân và tạo ra nhiều rủi ro pháp lý và tuân thủ. Trong thời đại dữ liệu lớn, việc xóa mờ nội hàm và ranh giới của thông tin cá nhân, sự chậm trễ của luật pháp và các quy định cũng như việc theo đuổi thành tựu công nghệ cũng khiến một số công ty công nghệ bỏ qua những rủi ro đó. Nhóm Sajie nhắc nhở rằng việc tuân thủ là điều kiện tiên quyết và đảm bảo cho sự phát triển lành mạnh của ngành. Trong khi theo đuổi thành công, đừng xem nhẹ các ranh giới pháp lý.