Facebook sử dụng AI để loại bỏ những phát ngôn gây thù hận

Hate speech là gì?

Hate speech là cụm từ thường được sử dụng để chỉ những phát ngôn xấu đi, nhằm mục đích vào 1 số ít đặc thù bản thân của ” nạn nhân “, với mục tiêu lôi kéo kích động sự thù ghét. Cụ thể hơn, phát ngôn thù hận là những phát ngôn có đặc thù tiến công, sỉ nhục một cá thể hoặc một nhóm cá thể đơn cử, với mục tiêu reo rắc sự chán ghét hay lôi kéo đấm đá bạo lực so với cá thể hoặc nhóm cá thể nào đó, vì nguyên do tôn giáo, sắc tộc, giới tính, quan điểm chính trị … Phát ngôn thù hận có rủi ro tiềm ẩn gây tác động ảnh hưởng xấu tới sự bình yên của xã hội. Trong 1 số ít trường hợp, phát ngôn thù hận không chỉ dừng ở ” phát ngôn “. Nó hoàn toàn có thể gây ra đấm đá bạo lực trong xã hội, gây hận thù giữa những hội đồng, và thậm chí còn dẫn đến những hành vi đơn cử, như những hành vi khủng bố ở 1 số ít nước châu Âu và Mỹ … Facebook sử dụng AI để loại bỏ những phát ngôn gây thù hận - Ảnh 1.

(Ảnh minh họa)

Ở Nước Ta, hate speech cũng không thiếu trên mạng xã hội. Nhiều khi, không có nguyên do gì đơn cử như phân biệt chủng tộc, tôn giáo, giới tính, mà đơn thuần chỉ là … thích thì chửi, không đồng quan điểm là … lăng nhục. Thậm chí, mái ấm gia đình của những người bị tình nghi phạm tội cũng hoàn toàn có thể trở thành tiềm năng để dân cư mạng ” ném đá ” với những lời lẽ vô cùng nặng nề. Người càng nổi tiếng thì càng dễ trở thành nạn nhân của những phát ngôn kiểu này. Ví dụ, một người nổi tiếng trên mạng xã hội từng bị tiến công và ” ném đá ” thậm tệ trên Facebook chỉ vì quan điểm về một yếu tố không làm hài lòng nhiều người. Thay vì phản biện quan điểm, họ lại tập trung chuyên sâu vào lăng mạ hình thức, giới tính của người đó một cách thản nhiên. Hay việc ca sĩ Lynk Lee bị công kích vì phẫu thuật chuyển giới hồi tháng 6 cũng là một ví dụ nổi bật của hate speech.

Sử dụng AI để loại bỏ nội dung gây thù hận

Facebook đã dành nhiều năm để kiến thiết xây dựng và tiến hành AI vào việc vô hiệu những nội dung mang tính thù hận trên nền tảng mạng xã hội của mình. Công ty này cho biết hiện họ đang sử dụng công nghệ tiên tiến để dữ thế chủ động phát hiện và gỡ bỏ gần 95 % nội dung. Tuy nhiên, 5 % còn lại hoàn toàn có thể khó xử lý.

Mới đây, Facebook cho biết trong quý 3 năm 2020, hệ thống AI của họ đã phát hiện và gỡ bỏ 94,7% trong số 22,1 triệu nội dung khiêu khích sự thù hận trên trang xã hội; tăng từ 80,5% trong số 6,9 triệu nội dung so với cùng kỳ của năm trước. Các số liệu này được lấy từ ấn bản mới nhất của Báo cáo Thực thi Tiêu chuẩn Cộng đồng do công ty phát hành hàng quý kể từ tháng 8.

Bản update được đưa ra chỉ vài ngày sau khi Giám đốc quản lý và điều hành Facebook Mark Zuckerberg phát biểu trước Quốc hội về lao lý Internet, trong đó ông liên tục chỉ ra sự nhờ vào của công ty vào những thuật toán để phát hiện nội dung khủng bố và bóc lột trẻ nhỏ trước khi nó được Viral thoáng rộng trên mạng xã hội. Facebook sử dụng AI để loại bỏ những phát ngôn gây thù hận - Ảnh 2.Facebook sử dụng AI để vô hiệu những phát ngôn gây thù hận .Giống như nhiều mạng xã hội khác, Facebook dựa vào AI để giúp một nhóm người kiểm duyệt một khối lượng nội dung khổng lồ ngày càng tăng trên nền tảng Facebook và Instagram. Việc xóa những bài đăng và quảng cáo phản cảm của người dùng là một trách nhiệm khó khăn vất vả, một phần bởi có những từ ngữ và hình ảnh nếu đứng độc lập thì vô hại nhưng lại hoàn toàn có thể gây tổn thương người khác khi được ghép lại với nhau .Trong một cuộc gọi video với những phóng viên báo chí vào tuần trước, Giám đốc công nghệ Facebook, Mike Schroepfer, đã lý giải một số ít công cụ AI mới nhất mà Facebook đang sử dụng để tìm nội dung có hại trước khi nó được Viral, ví dụ điển hình như sử dụng tài liệu trực tuyến từ mạng lưới hệ thống của Facebook để cải tổ, thay vì sử dụng một tập hợp tài liệu ngoại tuyến .

Nội dung khó nhất để AI nắm bắt vẫn là nội dung dựa trên sự tinh tế và ngữ cảnh – những dấu hiệu mà máy tính chưa có khả năng phân biệt được. Schroepfer cũng cho biết thêm, Facebook hiện đang nỗ lực phát hiện các meme kích động sự thù hận; công ty đã tung ra bộ dữ liệu có sẵn công khai liên quan đến nội dung như vậy với hy vọng giúp các nhà nghiên cứu cải thiện khả năng phát hiện.

Ví dụ, nội dung có thể gây tổn thương người khác bằng việc sử dụng các meme như trích dẫn hình ảnh một nghĩa trang được chèn lên đó dòng chữ “bạn thuộc về nơi đây”.

“Nếu dòng chữ được chèn lên có nội dung “Bạn thuộc về nơi đây” và hình nền là một sân chơi thì không sao. Nhưng nếu đó là hình ảnh một nghĩa địa, thì có thể được hiểu đó là nội dung gây thù ghét”, ông nhấn mạnh.

Rõ ràng là do đặc thù của mạng xã hội, nhiều người nấp sau màn hình hiển thị đã không ngần ngại sử dụng những lời lẽ gây kích động, lặng mạ hoặc xúc phạm người khác, điều họ mà không dám hoặc không hề làm ở ngoài đời .

5/5 - (1 vote)

Bài viết liên quan

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments