Backlink và AI Visibility (Phần 1): Liệu liên kết ngược còn là "tiền tệ hợp pháp" trong kỷ nguyên tìm kiếm AI?

Đây là Phần 1 trong series 2 phần về nghiên cứu tác động của Backlink lên khả năng hiển thị AI. Phần 1 tập trung vào phương pháp nghiên cứu và 2 phát hiện đầu tiên: vai trò của Authority và tầm quan trọng của chất lượng liên kết. Phần 2 sẽ đi sâu vào 2 phát hiện còn lại về nofollow links và image links, cùng với hướng dẫn chiến lược cụ thể.
Tóm tắt nhanh
Trong lịch sử SEO, backlink luôn được coi là một trong những "đơn vị tiền tệ" đáng tin cậy nhất để đạt được khả năng hiển thị trên kết quả tìm kiếm. Nhưng khi các mô hình ngôn ngữ lớn (LLM) như ChatGPT, Gemini, hay Perplexity dần trở thành kênh tìm kiếm thông tin phổ biến, câu hỏi đặt ra là: liệu backlink có còn giữ nguyên giá trị trong "nền kinh tế tìm kiếm" mới này?
Infinity đã phân tích dữ liệu từ Semrush trên 1.000 tên miền, tạo ra khoảng 35.000 điểm dữ liệu để tìm câu trả lời. Kết quả cho thấy backlink vẫn có tác động đến khả năng hiển thị trong AI, nhưng quy tắc cuộc chơi đã thay đổi đáng kể so với SEO truyền thống.
Các điểm chính cần nắm
- Backlink vẫn có tác động đến AI visibility, nhưng chỉ ở mức vừa phải (Pearson ~0.23, Spearman ~0.36)
- Chất lượng > Số lượng: Mối tương quan mạnh nhất là giữa Authority Score và AI mentions (Pearson 0.65)
- Đa dạng nguồn liên kết quan trọng hơn tổng số backlink: unique linking domains có giá trị hơn raw backlink count
- Mối quan hệ phi tuyến tính: Có "ngưỡng đột phá" cần vượt qua – lợi ích lớn nhất tập trung ở top 30% (decile 8-10)
- Mỗi nền tảng AI khác nhau: ChatGPT đánh giá Authority Score cao nhất; ChatGPT Search và Perplexity đánh giá thấp nhất
- Phương pháp đo lường: Khoảng cách giữa Pearson và Spearman cho thấy tồn tại ngưỡng tối thiểu trước khi thấy ROI

Bối cảnh: Tại sao nghiên cứu này quan trọng?
Chúng ta đều biết rằng liên kết có ảnh hưởng đến khả năng hiển thị trong tìm kiếm dựa trên AI. Tuy nhiên, cách chúng hoạt động bên trong các mô hình ngôn ngữ lớn – bao gồm AI Overviews của Google, Gemini, hay ChatGPT – vẫn còn là một "hộp đen" mà ít ai thực sự hiểu rõ.
Sự phát triển của các mô hình tìm kiếm AI đang làm thay đổi quy tắc về khả năng hiển thị tự nhiên và cuộc cạnh tranh giành thị phần trong kết quả LLM. Nếu trước đây bạn tập trung xây dựng backlink để leo lên top Google, thì giờ đây câu hỏi trở nên phức tạp hơn: liệu những liên kết đó có giúp bạn được ChatGPT đề cập không? Liệu Perplexity có "nhìn thấy" authority của bạn không? Và nếu có, thì loại backlink nào thực sự tạo ra sự khác biệt?
Đây là những câu hỏi mà cho đến nay chưa có nghiên cứu nào thực sự đào sâu. Infinity tin rằng việc hiểu được mối quan hệ giữa backlink và AI visibility sẽ giúp các marketer định hình lại chiến lược link building cho phù hợp với thời đại mới.
Phương pháp nghiên cứu: Làm thế nào để "đo" được điều không thể đo?
Quy mô và nguồn dữ liệu
Nghiên cứu này được thực hiện trên 1.000 tên miền được chọn ngẫu nhiên, với toàn bộ dữ liệu được lấy từ Semrush AI SEO Toolkit – nền tảng phân tích tìm kiếm và khả năng hiển thị AI của Semrush.

Điều đáng chú ý là nghiên cứu không chỉ tập trung vào một nền tảng AI duy nhất, mà đo lường số lượng đề cập (mentions) và Share of Voice (SoV) trên năm nền tảng khác nhau: ChatGPT phiên bản thông thường, ChatGPT với tính năng Search được kích hoạt, Gemini của Google, AI Overviews trong Google Search, và Perplexity.
Một lưu ý quan trọng: Claude.ai không được đưa vào phân tích lần này. Lý do là vì người dùng Claude thường có xu hướng sử dụng công cụ này cho các tác vụ tạo sinh (generative tasks) như viết bài, phân tích văn bản, hay lập trình – hơn là để tìm kiếm thông tin trên web. Điều này khiến việc so sánh với các nền tảng tìm kiếm AI thuần túy trở nên không công bằng.
Các chỉ số backlink được đo lường
Để hiểu được mối quan hệ giữa backlink và AI visibility, nghiên cứu đã đo lường bảy chỉ số backlink cốt lõi cho mỗi tên miền.
Đầu tiên là tổng số backlink (total backlinks) – con số tổng hợp tất cả các liên kết trỏ về một website. Tiếp theo là số tên miền liên kết độc nhất (unique linking domains), một chỉ số cho biết có bao nhiêu website khác nhau đang liên kết đến bạn, thay vì chỉ đếm số lượng liên kết.
Nghiên cứu cũng phân biệt giữa follow links (liên kết thông thường, còn gọi là dofollow) và nofollow links (liên kết có thuộc tính rel="nofollow"). Sự phân biệt này đặc biệt quan trọng vì trong SEO truyền thống, nofollow links thường được coi là ít giá trị hơn do không truyền "link juice" – nhưng liệu điều này có còn đúng trong thế giới LLM?
Authority Score (Ascore) là một chỉ số tổng hợp của Semrush, đánh giá chất lượng tổng thể của một website dựa trên số lượng và chất lượng backlinks, lưu lượng truy cập tự nhiên đến các trang nguồn liên kết, và mức độ spam của hồ sơ liên kết. Đây là một proxy quan trọng để đánh giá "uy tín" của một domain trong mắt các công cụ tìm kiếm – và như chúng ta sẽ thấy, cả trong mắt các mô hình AI.
Cuối cùng, nghiên cứu phân biệt giữa text links (liên kết dạng văn bản, thường là anchor text) và image links (liên kết được nhúng trong hình ảnh). Sự phân biệt này mở ra những insight thú vị về cách các mô hình AI xử lý các loại liên kết khác nhau.
Hiểu về công cụ phân tích: Tương quan Pearson và Spearman
Trước khi đi vào kết quả, Infinity muốn giải thích ngắn gọn về phương pháp thống kê được sử dụng trong nghiên cứu này. Nếu bạn đã quen với các khái niệm tương quan Pearson và Spearman, có thể chuyển thẳng sang phần kết quả. Nhưng nếu không, việc hiểu được hai công cụ này sẽ giúp bạn đánh giá đúng ý nghĩa của các con số.

Cả Pearson và Spearman đều là hệ số tương quan – những con số nằm trong khoảng từ -1 đến +1, cho biết mức độ liên quan giữa hai biến số. Hệ số càng gần +1 hoặc -1 thì tương quan càng mạnh; gần 0 nghĩa là tương quan yếu hoặc không có.
Hệ số Pearson (r) đo lường mối quan hệ tuyến tính giữa hai biến. Nói đơn giản, nó trả lời câu hỏi: "Khi X tăng một đơn vị, Y có tăng một lượng cố định không?" Pearson sử dụng các giá trị thô và khá nhạy cảm với các điểm dữ liệu bất thường (outliers). Điểm yếu của Pearson là nếu mối quan hệ có đường cong hoặc có ngưỡng, nó sẽ đo lường thấp hơn thực tế.
Hệ số Spearman (ρ) lại đo lường mối quan hệ đơn điệu (monotonic) – tức là liệu các giá trị có luôn biến động theo cùng hướng hay không, không nhất thiết phải theo đường thẳng. Spearman sử dụng thứ hạng thay vì giá trị thô, nên bền vững hơn với các điểm dữ liệu bất thường và có thể phát hiện các mô hình phi tuyến tính.
Tại sao cần sử dụng cả hai? Đây là điểm quan trọng nhất. Khoảng cách giữa hệ số Pearson và Spearman có thể tiết lộ rằng mức tăng không tuyến tính – tức là có một ngưỡng cần vượt qua trước khi thấy hiệu quả.
Hãy tưởng tượng một ví dụ thực tế: Bạn chi 5 triệu đồng cho quảng cáo Facebook (hành động X) và hầu như không thấy tác động gì đến doanh số (kết quả Y). Bạn tăng lên 10 triệu, 20 triệu – vẫn không có gì đáng kể. Nhưng khi vượt qua ngưỡng 50 triệu đồng/tháng, doanh số đột nhiên bắt đầu tăng trưởng đều đặn.
Trong trường hợp này, Pearson sẽ cho thấy tương quan yếu (vì mối quan hệ không tuyến tính), nhưng Spearman sẽ cho thấy tương quan mạnh hơn (vì khi chi tiêu tăng, doanh số cuối cùng cũng tăng, chỉ là sau một ngưỡng nhất định). Khoảng cách giữa hai hệ số này chính là tín hiệu cho thấy "có ngưỡng tối thiểu cần đạt được."
Việc hiểu được điều này sẽ giúp bạn đọc các kết quả nghiên cứu dưới đây một cách chính xác hơn.
Phát hiện 1: Authority quan trọng, nhưng chỉ là một mảnh ghép trong bức tranh lớn
Tín hiệu đầu tiên mà nghiên cứu kiểm tra là mức độ mạnh yếu của mối quan hệ giữa số lượng liên kết ngược mà một website nhận được so với Share of Voice (SoV) của nó trên các nền tảng AI.

Kết quả cho thấy Authority Score có mối liên kết vừa phải với Share of Voice, với hệ số Pearson khoảng 0.23 và Spearman khoảng 0.36. Con số này nói lên điều gì?
Trước hết, authority cao hơn đồng nghĩa với SoV cao hơn – điều này xác nhận rằng backlink vẫn có tác động trong thế giới AI search. Tuy nhiên, mối tương quan chỉ ở mức "vừa phải" (moderate) cho thấy backlink không phải là yếu tố duy nhất, và thậm chí có thể không phải là yếu tố quan trọng nhất.
Điều thú vị hơn nằm ở khoảng cách giữa Pearson (0.23) và Spearman (0.36). Sự khác biệt này cho thấy lợi ích thu được không đồng đều – có một ngưỡng nhất định mà bạn cần vượt qua. Nói cách khác, việc cải thiện Authority Score từ 20 lên 30 có thể không mang lại nhiều lợi ích, nhưng cải thiện từ 70 lên 80 có thể tạo ra sự khác biệt đáng kể.
Authority hỗ trợ visibility, nhưng nó không giải thích được phần lớn sự khác biệt giữa các website. Điều này có nghĩa là còn nhiều yếu tố khác đang tác động đến khả năng được AI đề cập, bao gồm chất lượng nội dung, nhận thức về thương hiệu (brand perception), topical authority, và có thể cả những yếu tố mà chúng ta chưa xác định được.
Một phát hiện quan trọng về đa dạng nguồn liên kết
Ngoài Authority Score, nghiên cứu còn phát hiện một điều đáng chú ý: số lượng domain liên kết độc nhất (unique linking domains) quan trọng hơn tổng số backlink.

Điều này có ý nghĩa thực tiễn rất lớn. Nói đơn giản, website của bạn có nhiều khả năng có Share of Voice lớn hơn khi bạn có liên kết từ nhiều website khác nhau, thay vì một số lượng lớn liên kết chỉ từ một vài nguồn.
Hãy tưởng tượng hai kịch bản: Website A có 10.000 backlinks, nhưng 8.000 trong số đó đến từ cùng một mạng lưới blog. Website B chỉ có 5.000 backlinks, nhưng đến từ 3.000 domain khác nhau bao gồm các trang tin tức, diễn đàn, blog cá nhân, và website doanh nghiệp. Theo nghiên cứu này, Website B có khả năng được AI đề cập nhiều hơn Website A, mặc dù có ít backlink hơn về mặt tuyệt đối.
Tại sao lại như vậy? Một giả thuyết hợp lý là các mô hình AI, giống như công cụ tìm kiếm truyền thống, coi sự đa dạng nguồn liên kết như một tín hiệu về độ tin cậy và uy tín thực sự. Nếu nhiều website độc lập đều đánh giá nội dung của bạn đáng để liên kết đến, đó là một "bằng chứng xã hội" mạnh mẽ hơn so với việc chỉ có một vài nguồn liên kết nhiều lần.
Phát hiện 2: Chất lượng vượt trội số lượng – và con số chứng minh điều đó
Trong tất cả các mô hình AI được phân tích, mối quan hệ mạnh nhất xuất hiện giữa Authority Score và số lần được đề cập (mentions), với hệ số Pearson đạt 0.65 và Spearman đạt 0.57. Đây là mối tương quan mạnh nhất trong toàn bộ nghiên cứu, và nó mang một thông điệp rõ ràng: chất lượng backlink quan trọng hơn rất nhiều so với số lượng.
Authority Score đo lường điều gì?
Để hiểu được ý nghĩa của phát hiện này, trước tiên cần hiểu Authority Score (Ascore) của Semrush đang đo lường những gì. Theo định nghĩa chính thức:
"Authority Score là thước đo tổng hợp đánh giá chất lượng tổng thể của một website. Điểm càng cao, giá trị của các liên kết ra ngoài từ domain đó đến website khác càng lớn."
Ascore tính đến ba yếu tố chính: số lượng và chất lượng của các backlinks mà website đó nhận được, lưu lượng truy cập tự nhiên đến các trang nguồn liên kết (tức là những trang đang liên kết đến website đó), và mức độ spam của hồ sơ liên kết.
Tất nhiên, Ascore chỉ là một proxy – một cách đo lường gián tiếp. Các mô hình ngôn ngữ lớn có thể có cách riêng để đánh giá chất lượng backlink mà chúng ta không hoàn toàn hiểu. Tuy nhiên, dữ liệu từ nghiên cứu này cho thấy Ascore của Semrush có thể là một đại diện khá tốt cho "chất lượng" trong mắt các LLM.
Sự khác biệt giữa các mô hình AI
Điều thú vị là không phải tất cả các mô hình AI đều đánh giá Authority Score như nhau. Hầu hết các mô hình đều coi trọng chỉ số này ở mức tương đương cho số lần đề cập, nhưng có hai ngoại lệ đáng chú ý.
ChatGPT Search và Perplexity đánh giá Ascore thấp nhất so với mức trung bình. Điều này có thể gợi ý rằng các công cụ tìm kiếm AI "thuần túy" – những công cụ được thiết kế đặc biệt để tìm kiếm thông tin trên web – có thể sử dụng các tín hiệu khác ngoài authority truyền thống.
Ngược lại, ChatGPT thông thường (phiên bản không kích hoạt tính năng tìm kiếm) lại đánh giá Ascore cao nhất trong số tất cả các mô hình. Điều này có thể là vì khi không có khả năng tìm kiếm web real-time, ChatGPT phải dựa nhiều hơn vào các tín hiệu về uy tín đã được "học" trong quá trình training.
Mối quan hệ phi tuyến tính: Bài học về "ngưỡng đột phá"
Một trong những insight quan trọng nhất từ nghiên cứu này là mối quan hệ giữa Authority Score và số lần được đề cập không diễn ra theo đường thẳng. Thay vào đó, nó tuân theo một mô hình phi tuyến tính với ngưỡng rõ ràng.

Để minh họa, nghiên cứu chia tập dữ liệu thành 10 phần bằng nhau gọi là decile, mỗi phần chứa 10% số điểm dữ liệu khi được sắp xếp theo thứ tự. Kết quả cho thấy số lượt đề cập trung bình tăng từ khoảng 21.5 ở decile 8 lên khoảng 79.0 ở decile 9 – một bước nhảy gần gấp 4 lần chỉ trong một bậc.

Con số này nói lên điều gì? Nó cho thấy lợi ích lớn nhất đạt được khi bạn đạt đến ngưỡng authority cao nhất. Việc cải thiện từ mức "khá" lên mức "tốt" có thể không mang lại nhiều thay đổi, nhưng việc đột phá vào nhóm "xuất sắc" tạo ra sự khác biệt đáng kể.
Điều này có ý nghĩa chiến lược quan trọng: đừng kỳ vọng lợi nhuận từ những cải tiến nhỏ lẻ. Bạn cần một "khoản đầu tư tối thiểu" – cả về thời gian, nguồn lực và nỗ lực – để vượt qua ngưỡng và bắt đầu thấy hiệu quả thực sự. Đây không phải là cuộc chơi của sự tăng trưởng tuyến tính, mà là cuộc chơi của những bước tiến đột phá.
Infinity tin rằng bài học này có thể áp dụng rộng hơn cho nhiều lĩnh vực SEO khác: việc xuất bản nội dung mới, tối ưu hóa kỹ thuật, cải thiện trải nghiệm người dùng. Trong tất cả các lĩnh vực này, có thể tồn tại những "ngưỡng đột phá" mà bạn cần vượt qua trước khi thấy ROI rõ ràng.
Tạm kết Phần 1: Nền tảng đã được thiết lập
Qua Phần 1 của nghiên cứu này, chúng ta đã thiết lập được một số nền tảng quan trọng để hiểu về mối quan hệ giữa backlink và AI visibility.
Thứ nhất, backlink vẫn có tác động đến khả năng được các mô hình AI đề cập – đây không phải là một yếu tố đã "chết" trong kỷ nguyên LLM. Tuy nhiên, tác động này chỉ ở mức vừa phải, cho thấy còn nhiều yếu tố khác đang tham gia vào phương trình.
Thứ hai, chất lượng liên kết – được đo lường qua Authority Score – quan trọng hơn nhiều so với số lượng. Mối tương quan giữa Ascore và AI mentions là mạnh nhất trong toàn bộ nghiên cứu, và điều này đặc biệt đúng khi bạn đạt đến ngưỡng authority cao nhất.
Thứ ba, sự đa dạng nguồn liên kết có giá trị hơn việc tích lũy nhiều liên kết từ ít nguồn. Các mô hình AI dường như đánh giá cao "bằng chứng xã hội" từ nhiều website độc lập.
Thứ tư, mối quan hệ giữa backlink và AI visibility không tuyến tính – có ngưỡng cần vượt qua, và lợi ích lớn nhất tập trung ở nhóm đầu bảng.
Nhưng đây mới chỉ là một nửa câu chuyện. Trong Phần 2, Infinity sẽ chia sẻ hai phát hiện còn lại của nghiên cứu – và đây là những phát hiện có thể thay đổi hoàn toàn cách bạn nghĩ về chiến lược link building.
Phần 2 sẽ bao gồm:
Phát hiện thứ ba liên quan đến nofollow links – và đây có thể là phát hiện quan trọng nhất của toàn bộ nghiên cứu. Kết quả cho thấy sự khác biệt đáng kể giữa cách LLM và công cụ tìm kiếm truyền thống xử lý loại liên kết này, mở ra những cơ hội mới cho các marketer.
Phát hiện thứ tư về image links – liệu liên kết được nhúng trong hình ảnh có hiệu quả bằng liên kết văn bản? Câu trả lời có thể khiến bạn ngạc nhiên và thay đổi cách bạn đầu tư vào visual content.
Ngoài ra, Phần 2 cũng sẽ cung cấp benchmarks cụ thể để bạn có thể đánh giá vị trí hiện tại của mình, cùng với hướng dẫn chiến lược chi tiết về cách áp dụng những phát hiện này vào thực tế.
Đón đọc Phần 2: [Backlink và AI Visibility (Phần 2): Nofollow, Image Links và Chiến lược hành động cho kỷ nguyên AI Search]




