Internet được ví như “đại dương” thông tin bao la với hàng trăm tỷ trang web cùng vô số các tài nguyên. Người dùng trên toàn thế giới có thể truy cập để tìm kiếm hình ảnh, tin tức, sách,... tùy theo nhu cầu sử dụng. Tuy nhiên, theo báo cáo của Trung tâm Nghiên cứu Pew (Pew Research Center) vào cuối năm 2023, nội dung Internet có nguy cơ biến mất bất cứ lúc nào. Cụ thể, gần 40% trang web vào năm 2013 đã bị xóa sổ, các nội dung trực tuyến trong quá khứ chính thức bị "lãng quên". 


Digital Decay là thuật ngữ được nhóm tác giả của nghiên cứu sử dụng để mô tả tình trạng các trang web và nội dung trực tuyến không thể truy cập được theo thời gian. Theo nghiên cứu vào tháng 10/2023 của Trung tâm Nghiên cứu Pew, tỷ lệ nội dung trên Internet bị xóa sau 10 năm gia tăng đáng kể. Tính từ năm 2013 - 2023, con số này là 38%, trong đó có 8% nội dung của năm 2023 đã biến mất.  


Bài báo cáo được đăng tải trên website Trung tâm Nghiên cứu Pew vào ngày 17/5


Báo cáo của Trung tâm Nghiên cứu Pew chỉ ra rằng “38% trang web từ năm 2013 đến nay không thể truy cập”


Điều này lý giải cho việc nhiều trang web hay bài viết được lưu trữ bằng cách sử dụng bookmark đã trở nên không thể truy cập sau một khoảng thời gian. Đặc biệt, trường hợp này thường xảy ra với tính năng "Kỷ niệm" của Facebook. Ví dụ, bài đăng "Kỷ niệm" từ 5 năm trước có thể hiển thị thông báo "Nội dung này hiện không hiển thị" do trang web gốc đã bị xóa hoặc thay đổi nội dung.


Người dùng không thể truy cập vào các bài viết từ những năm trước trong tính năng “Kỷ niệm” của Facebook



Hơn hết, nghiên cứu cũng cho thấy 23% trang tin tức, bao gồm cả trang web của các đài truyền hình lớn và nhỏ, có ít nhất một đường dẫn bị gãy. Số liệu được thu thập từ hơn 500.000 trang web của hơn 2.000 trang tin tức, đủ lớn để đưa ra kết luận cho các nghiên cứu chuyên sâu hơn về vấn đề này. 


23% trang web tin tức có ít nhất một liên kết bị hỏng


Tương tự như các trang tin tức, 21% trang web của chính phủ cũng có tình trạng gãy link. Hiện tượng này phổ biến hơn ở các trang web địa phương nhỏ cấp huyện hoặc thành phố. Hầu hết các trường hợp gãy link xảy ra trên các trang có bảo mật nhất định như https//. Trong số các trường hợp gãy link, 6% liên quan đến tệp pdf, có thể là tài liệu hướng dẫn tạm thời, và 16% liên quan đến việc chuyển hướng đến URL không đúng với nội dung ban đầu.


Cứ 5 trang web của chính phủ thì có 1 trang chứa liên kết bị lỗi


Trên các trang thông tin miễn phí nhữ Wikipedia, tỷ lệ gãy link còn cao hơn nhiều so với trang web thông thường. Với 50.000 trang thông tin được khảo sát, 54% link ở mục “Tham khảo” bị hỏng. 


Ngoài ra, “Digital Decay” diễn ra mạnh mẽ hơn trên mạng xã hội. Ví dụ, trên Twitter (hiện là X) và các nền tảng khác, chỉ sau vài tháng, có gần 20% bài đăng (tweet) không còn hiển thị ở chế độ công khai (Public). 60% trong số này là do tài khoản bị khóa, xóa hoặc chuyển sang chế độ riêng tư. 40% còn lại do người dùng tự xóa bài đăng. Thêm vào đó, 1% tweet bị xóa chỉ sau 1 giờ đăng tải, 3% bị xóa sau 1 ngày, 10% bị xóa sau 1 tuần và 15% bị xóa sau 1 tháng. 


Với 5 tweet được đăng tải, thì có 1 tweet sẽ "biến mất" khỏi chế độ xem công khai chỉ sau vài tháng


Để xác định trang web không còn khả dụng, Trung tâm Nghiên cứu Pew đã sử dụng phương pháp sau: một trang web được coi là không thể truy cập nếu nó trả về một trong chín mã lỗi nhất định, cho thấy trang web hoặc máy chủ lưu trữ đã bị xóa hoặc không còn hoạt động.  


Báo cáo này của Trung tâm Nghiên cứu Pew cũng tập trung vào việc xác định các trang web không còn khả năng truy cập, cụ thể là những trang đã bị xóa hoặc không thể truy cập được nữa. Các vấn đề khác như nội dung thay đổi hoặc những vấn đề về khả năng truy cập dành cho người dùng khiếm thị không được đề cập đến trong báo cáo này. 

Như Quỳnh



Subscribe Newsletter của Advertising Vietnam để theo dõi nhiều tin tức hấp dẫn về ngành quảng cáo.