Năm 2026, đầu tư toàn cầu vào hạ tầng AI đang đứng trước một bước ngoặt cấu trúc quan trọng.
Trong ba năm vừa qua, câu chuyện trọng tâm của cuộc đua năng lực tính toán AI chỉ xoay quanh một điểm: các "hyperscaler" đã mở rộng trung tâm dữ liệu và mua GPU với tốc độ chưa từng có, đẩy chi phí đầu tư (CapEx) lên mức kỷ lục mà gần như không quan tâm đến chi phí. Dự báo, tổng CapEx của bốn nhà cung cấp dịch vụ đám mây lớn—Amazon, Microsoft, Google (Alphabet) và Meta—sẽ đạt 725 tỷ USD vào năm 2026, tăng 77% so với mức 410 tỷ USD của năm 2025. Nếu tính thêm Nvidia, Apple, Tesla và các thành viên khác trong nhóm Magnificent Seven, con số này gần chạm mốc 754,2 tỷ USD. Theo dự báo của Gartner, tổng chi tiêu cho AI toàn cầu sẽ đạt 2,59 nghìn tỷ USD năm 2026, tăng 47% so với năm trước.
Tuy nhiên, quy mô không còn là ưu tiên duy nhất. Một sự chuyển dịch sâu rộng hơn đang diễn ra: CapEx AI đang dịch chuyển từ tập trung cao sang phân bổ rộng. DIGITIMES đã xác định "phân bổ" là từ khóa công nghệ của năm 2026, báo hiệu sự chuyển đổi kép hướng tới phi tập trung cả về thị trường AI lẫn chuỗi cung ứng. Sự dịch chuyển này không chỉ mang tính địa lý—mà còn là tái cấu trúc toàn diện về thành phần nhà đầu tư, kiến trúc kỹ thuật và cấu trúc ngành.
Kết thúc thời kỳ tập trung: "Hóa đơn" 725 tỷ USD và nỗi lo về lợi nhuận
Để hiểu điểm khởi đầu của xu hướng phân bổ, trước hết cần nhận diện đỉnh điểm của sự tập trung.
Năm 2026, bốn "hyperscaler" lớn dự kiến chi từ 650 đến 700 tỷ USD CapEx, chiếm khoảng 40% tổng CapEx của các công ty Russell 1000—gấp đôi mức năm 2024. Cụ thể: Amazon hướng đến khoảng 200 tỷ USD, Microsoft giữ mục tiêu 190 tỷ USD, Alphabet nâng dự báo lên 175–185 tỷ USD, còn Meta dự trù 125–145 tỷ USD.
Tốc độ điều chỉnh tăng này tự thân đã là tín hiệu quan trọng. Chỉ trong 6 tháng qua, kỳ vọng thị trường về CapEx đám mây năm 2026 đã tăng gần 80%. Barclays dự báo CapEx của các nhà cung cấp đám mây lớn sẽ đạt 919 tỷ USD năm 2027 và khoảng 1,16 nghìn tỷ USD năm 2028. CreditSights ước tính khoảng 75% CapEx của các hyperscaler năm 2026—tương đương 450 tỷ USD—sẽ dành cho hạ tầng AI.
Tuy nhiên, việc mở rộng đầu tư tập trung liên tục đang vấp phải câu hỏi về hiệu quả sinh lời. Tháng 6 năm 2026 (giờ Bắc Kinh), giá cổ phiếu Microsoft giảm gần 20% chỉ trong một tháng, thổi bay gần 1,3 nghìn tỷ USD giá trị vốn hóa trong 8 tháng qua. Các nhà đầu tư đang soi xét khoản CapEx dự kiến 190 tỷ USD của Microsoft cho năm 2026—trong đó khoảng hai phần ba dành cho tài sản vòng đời ngắn như GPU và CPU, vốn hao mòn nhanh và gắn liền với doanh thu ngắn hạn. Biên lợi nhuận gộp của Microsoft Cloud được điều chỉnh xuống còn 64%, giảm 4 điểm phần trăm so với năm trước. Báo cáo tháng 6 của Goldman Sachs chỉ ra rằng tỷ trọng đầu tư công nghệ Mỹ/GDP đã tăng lên khoảng 4,9%, vượt đỉnh bong bóng dot-com năm 2000.
Lợi nhuận biên từ đầu tư tập trung đang giảm, tạo động lực trực tiếp nhất cho xu hướng phân bổ.
Điểm bùng phát của suy luận: Vì sao năng lực tính toán phải phân tán?
Logic nền tảng của CapEx AI phân tán bắt đầu từ chính sự thay đổi trong cấu trúc nhu cầu tính toán.
Tại GTC 2026, CEO Nvidia Jensen Huang khẳng định: khối lượng công việc suy luận AI sẽ lớn hơn huấn luyện tới hàng tỷ lần, mở ra kỷ nguyên "suy luận ở quy mô lớn". IDC dự báo đến năm 2027, các tác vụ suy luận sẽ chiếm hơn 70% tổng nhu cầu tính toán thông minh. TrendForce còn cụ thể hơn: năm 2026, năng lực tính toán suy luận AI dự kiến tăng 122% so với năm trước, vượt xa mức tăng 56% của huấn luyện AI.
Huấn luyện và suy luận có yêu cầu hạ tầng hoàn toàn khác biệt. Huấn luyện tập trung, mật độ cao, thời gian dài—phù hợp với trung tâm dữ liệu quy mô lớn. Ngược lại, suy luận phân tán, độ trễ thấp, đồng thời cao, đòi hỏi phản hồi thời gian thực. Khi một agent AI phải hoàn thành suy luận và trả kết quả trong vài chục mili giây, độ trễ vật lý khi truyền dữ liệu từ biên về trung tâm dữ liệu tập trung rồi trả lại trở thành nút thắt không thể vượt qua.
Các kiến trúc sư Akamai chỉ ra rằng, trò chơi điện tử yêu cầu độ trễ token đầu dưới 15 mili giây, đề xuất thương mại điện tử khoảng 20 mili giây, trong khi độ trễ mạng giữa trung tâm dữ liệu tập trung và người dùng cuối thường lên tới hàng chục mili giây, khiến tương tác thời gian thực bất khả thi. Với triển khai tập trung, 1 GW năng lực tính toán cần 75 Tbit/s băng thông đi ra (Blackwell), còn thế hệ tiếp theo như Vera Rubin sẽ cần 135 Tbit/s; nếu phân bổ trên 20 node, mỗi node chỉ cần 3,75 Tbit/s. Đây là phép tính tuân theo quy luật vật lý, không phải chiến lược kinh doanh.
Đồng thời, tương tác đa phương tiện đang tạo ra lưu lượng outbound khổng lồ, chi phí băng thông công cộng cao dai dẳng trở thành "sát thủ vô hình" của lợi nhuận AI. Thêm vào đó là các quy định về định vị dữ liệu ngày càng siết chặt tại EU (GDPR), Đông Nam Á và Trung Đông, khiến triển khai tập trung ngày càng khó cân bằng giữa trải nghiệm người dùng, chi phí và tuân thủ. Năng lực tính toán AI không còn gói gọn trong đám mây lõi mà đang tiến hóa thành kiến trúc phân tán ba tầng: lõi, vùng và biên.
Từ bốn ông lớn đến toàn chuỗi giá trị: Mở rộng thành phần CapEx
Khía cạnh thứ hai của phân bổ là mở rộng thành phần tham gia đầu tư.
Ba năm qua, đầu tư hạ tầng AI chủ yếu do bốn nhà cung cấp đám mây lớn và Nvidia dẫn dắt. Nhưng năm 2026, cục diện này thay đổi. Theo Chứng khoán Zhongtai, tổng CapEx AI của nhóm MAG7 sẽ đạt khoảng 754,2 tỷ USD năm 2026, trong khi CapEx AI nội địa Trung Quốc đạt khoảng 805,8 tỷ nhân dân tệ (tương đương 110 tỷ USD). Tổng cộng, CapEx AI tại Trung Quốc và Mỹ sẽ đóng góp khoảng 1.007,6 tỷ nhân dân tệ vào GDP Trung Quốc, chiếm 0,68% GDP và đóng góp khoảng 0,33 điểm phần trăm vào tăng trưởng GDP. Chuỗi giá trị AI đã vượt chuỗi đầu tư đô thị trở thành động lực biên chính cho tăng trưởng GDP.
Sự tham gia của doanh nghiệp tăng tốc. Khảo sát mới nhất của RBC cho thấy các công ty đang nhanh chóng ứng dụng AI, phần lớn đã chuyển từ thử nghiệm sang triển khai quy mô lớn. Khảo sát doanh nghiệp Nhật Bản cho thấy 47,8% đã triển khai AI ở quy mô sản xuất, với nhóm doanh nghiệp lớn đạt 62,7%. Dù tỷ lệ ứng dụng ở doanh nghiệp vừa và nhỏ còn hạn chế (khoảng 12% tại Nhật), tỷ lệ 64,7% ở doanh nghiệp lớn cho thấy AI đã vượt qua giai đoạn thử nghiệm để bước vào triển khai đại trà.
Sự tham gia của chủ thể quốc gia cũng nổi bật. Tại đại hội đồng cổ đông Nvidia tháng 6 năm 2026 (giờ Bắc Kinh), Jensen Huang tiết lộ gần 40 quốc gia/vùng lãnh thổ, đại diện cho tổng GDP 50 nghìn tỷ USD, đang xây dựng "nhà máy AI" dựa trên hạ tầng Nvidia. Đầu tư hạ tầng AI đang chuyển từ "câu chuyện nội bộ công nghệ" thành "cạnh tranh chiến lược cấp quốc gia".
Phân bổ còn thể hiện ở cấu trúc tài trợ. Chứng khoán Zhongtai nhận định các ông lớn AI Mỹ đã bước vào giai đoạn CapEx dựa vào vay nợ. Các hyperscaler không còn chỉ dựa vào dòng tiền tự do mà tận dụng đòn bẩy tài chính để khuếch đại đầu tư. Điều này khiến tính bền vững của CapEx không chỉ phụ thuộc vào dòng tiền từng doanh nghiệp mà còn vào điều kiện thị trường tín dụng rộng lớn hơn.
Biên là mặt trận: Triển khai hạ tầng AI phân tán
Biểu hiện cụ thể nhất của phân bổ chính là điện toán biên.
Năm 2026, AI biên chuyển từ khái niệm sang triển khai quy mô lớn. Akamai và Nvidia đã ra mắt "AI mesh" chung, biến mạng lưới hơn 4.400 node biên toàn cầu của Akamai thành nền tảng suy luận AI phân tán. Akamai đang chuyển đổi từ nhà phân phối đám mây hàng đầu thành nền tảng suy luận AI phân tán lớn nhất thế giới, đã triển khai GPU NVIDIA Blackwell RTX 6000 PRO trên quy mô toàn cầu.
Sự chuyển đổi này không phải cá biệt. Tháng 6 năm 2026 (giờ Bắc Kinh), công ty trí tuệ biên Trung Quốc Yuntian Chuangxiang hoàn tất vòng gọi vốn E trên 1 tỷ nhân dân tệ, dẫn đầu bởi Quỹ Đầu tư Internet Trung Quốc. Công ty cũng công bố nâng cấp chiến lược từ "nhà cung cấp dịch vụ trí tuệ biên" lên "lưới thông minh thời gian thực" cho kỷ nguyên AGI. Antimatter huy động 300 triệu euro để triển khai 100 trung tâm dữ liệu vi mô phân tán Policloud đầu tiên trong năm 2026. NXP củng cố danh mục AI biên bằng cách mua lại Kinara, bổ sung các NPU độc lập.
IDC dự báo đến năm 2027, hơn 80% doanh nghiệp sẽ triển khai hạ tầng biên phân tán, tốc độ xây dựng hạ tầng biên sẽ vượt trung tâm dữ liệu lõi. Điều này đồng nghĩa biên không còn chỉ là phần bổ trợ cho điện toán đám mây—mà đang trở thành thành phần cốt lõi của hạ tầng AI.
Logic kinh doanh của AI biên rất rõ ràng: tác vụ suy luận nhạy cảm với độ trễ hơn nhiều so với huấn luyện, các node biên lại gần nguồn dữ liệu và người dùng hơn. Với doanh nghiệp, triển khai biên còn giải quyết bài toán tuân thủ dữ liệu (dữ liệu ở lại địa phương), chi phí băng thông (giảm truyền tải lên đám mây) và độ tin cậy (phục hồi thảm họa tại chỗ). Những thách thức này khó giải quyết đồng thời trong kiến trúc tập trung, nhưng kiến trúc phân tán lại có lời giải khả thi.
Kỷ nguyên hạ tầng đa tầng: Sự chuyển dịch trong logic đầu tư
Hạ tầng AI đang chuyển từ cấu trúc "tập trung đơn tầng" sang "phân tán đa tầng", kéo theo sự thay đổi sâu sắc về logic đầu tư.
Thứ nhất, cấu trúc nhu cầu chip thay đổi. Huấn luyện vẫn do GPU Nvidia thống trị—doanh thu trung tâm dữ liệu Nvidia dự kiến đạt 193,7 tỷ USD tài khóa 2026, tăng 68% so với năm trước. Nhưng nhu cầu suy luận đa dạng đang mở ra thị trường mới cho ASIC và chip biên. Các tổ chức dự báo lượng xuất xưởng ASIC sẽ đạt khoảng 7,7 triệu đơn vị năm 2026, chiếm 45% thị phần và vượt GPU lên 58% vào năm 2027. Broadcom có thể chiếm khoảng 60% thị phần ASIC máy chủ AI vào năm 2027.
Thứ hai, phân bổ địa lý đầu tư hạ tầng đang dịch chuyển. Trung tâm dữ liệu quy mô lớn tiếp tục mở rộng—tổng đầu tư trung tâm dữ liệu toàn cầu dự kiến đạt 1,6 nghìn tỷ USD vào năm 2030—nhưng tốc độ xây dựng node biên còn nhanh hơn. Năng lực tính toán AI không còn gói gọn trong đám mây lõi mà lan tỏa ra các tầng lõi, vùng và biên.
Thứ ba, chu kỳ hoàn vốn đầu tư thay đổi. Đầu tư trung tâm dữ liệu tập trung đòi hỏi vốn lớn, thời gian hoàn vốn dài, thường mất nhiều năm để thu hồi. Triển khai AI biên thường nhỏ hơn, triển khai nhanh hơn, gần sát các kịch bản kinh doanh cụ thể nên có thể đánh giá hiệu quả hoàn vốn chi tiết hơn. Sự khác biệt này đang thay đổi logic định giá của thị trường vốn đối với đầu tư AI—từ "ai chi nhiều nhất" sang "ai chi hiệu quả nhất".
Theo Research and Markets, thị trường hạ tầng AI toàn cầu sẽ tăng từ 71,88 tỷ USD năm 2025 lên 90,91 tỷ USD năm 2026. Tuy nhiên, con số này chỉ phản ánh thị trường phần cứng hẹp. Nếu tính cả triển khai AI doanh nghiệp, điện toán biên và giải pháp ngành, quy mô CapEx AI phân tán còn lớn hơn nhiều.
Rủi ro và rào cản: Con đường phân bổ không bằng phẳng
Xu hướng CapEx AI phân tán đã rõ, nhưng không thiếu rào cản.
Nút thắt phía cung vẫn rất căng thẳng. Dòng Blackwell của Nvidia luôn trong tình trạng cung không đủ cầu nhiều quý liên tiếp. Các linh kiện chủ chốt như HBM đã được các khách hàng lớn đặt trước đến tận 2026, thậm chí 2027. Bernstein Research nhận định chỉ riêng giá HBM tăng cũng có thể khiến CapEx AI của hyperscaler tăng thêm khoảng 30%.
Hạ tầng điện cũng là rào cản lớn. Nhu cầu điện của trung tâm dữ liệu AI đang đẩy lưới điện hiện hữu đến giới hạn. Kết nối một cụm tính toán tập trung 1 GW vào lưới điện đã là dự án kéo dài nhiều năm. Dù kiến trúc phân tán giảm tải điện trên từng node, lại đặt ra yêu cầu mới với khả năng tiếp nhận phân tán của lưới điện.
Rủi ro địa chính trị cũng rất đáng kể. Các biện pháp kiểm soát xuất khẩu chip AI tiên tiến của Mỹ tiếp tục ảnh hưởng đến chuỗi cung ứng toàn cầu. Báo cáo quý I tài khóa 2027 của Nvidia đã loại trừ doanh thu từ mảng trung tâm dữ liệu Trung Quốc. Dù CapEx AI Trung-Mỹ vẫn liên kết chặt chẽ, bất ổn chính sách đang làm tăng ma sát chuỗi cung ứng.
Cuối cùng, thị trường vốn đang ngày càng thiếu kiên nhẫn với lợi nhuận đầu tư AI. Goldman Sachs chỉ ra mâu thuẫn cốt lõi của làn sóng AI ngày càng gay gắt—nền tảng cơ bản vẫn mạnh, nhưng thị trường đã định giá quá nhiều tăng trưởng tương lai. Từ tháng 11 năm 2022, vốn hóa các công ty liên quan AI đã tăng vọt 27 nghìn tỷ USD, vượt xa mức 9 nghìn tỷ USD theo các chỉ số vĩ mô. Nếu đầu tư phân tán không nhanh chóng chuyển hóa thành doanh thu và lợi nhuận, tâm lý thị trường có thể chuyển từ "nghi vấn quy mô" sang "nghi vấn logic".
Kết luận
Phân bổ CapEx AI không phải là phủ nhận tập trung, mà là sự bổ sung và mở rộng của nó.
Huấn luyện vẫn cần trung tâm dữ liệu quy mô lớn; suy luận chuyển ra biên. Các ông lớn tiếp tục đẩy mạnh, trong khi doanh nghiệp và chủ thể quốc gia cùng nhập cuộc. GPU vẫn là trụ cột cho huấn luyện, còn ASIC và chip biên mở ra mặt trận mới. Đây là kỷ nguyên hạ tầng đa tầng—mỗi tầng phục vụ một chức năng riêng, mỗi chủ thể giữ một vị trí sinh thái riêng.
Năm 2026 đánh dấu bước ngoặt quan trọng trong quá trình chuyển đổi này. DIGITIMES dự báo tăng trưởng CapEx thị trường AI toàn cầu sẽ giảm tốc từ 66% năm 2025 xuống 31% năm 2026, nhưng giảm tốc không đồng nghĩa đình trệ. Trái lại, tăng trưởng chậm lại thường là tín hiệu chuyển từ "mở rộng quy mô" sang "tinh chỉnh xây dựng". Hạ tầng AI đang chuyển từ thị trường tập trung "kẻ thắng ăn cả" sang hệ sinh thái hợp tác phân tầng.
Với nhà đầu tư, hiểu ý nghĩa của sự chuyển dịch cấu trúc này có thể quan trọng hơn việc theo dõi con số CapEx quý tới. Phân bổ CapEx AI đang tái định hình logic đầu tư dài hạn của điện toán đám mây, thiết kế chip, kiến trúc CNTT doanh nghiệp, thậm chí cả chính sách công nghiệp quốc gia. Đích đến cuối cùng của sự thay đổi này vẫn chưa rõ, nhưng hướng đi thì đã rất rõ ràng.
Câu hỏi thường gặp
Q1: Động lực cốt lõi của CapEx AI phân tán là gì?
Sự bùng nổ nhu cầu suy luận là động lực chính. Năm 2026, năng lực tính toán suy luận AI dự kiến tăng 122% so với năm trước, vượt xa mức tăng 56% của huấn luyện. Đặc thù yêu cầu độ trễ thấp, đồng thời cao của tác vụ suy luận đã phơi bày nút thắt vật lý của trung tâm dữ liệu tập trung, khiến node biên phân tán trở thành lựa chọn tất yếu. Yếu tố tuân thủ dữ liệu và chi phí băng thông cũng đẩy năng lực tính toán ra biên.
Q2: Cụ thể CapEx của bốn nhà cung cấp đám mây lớn năm 2026 là bao nhiêu?
Amazon: khoảng 200 tỷ USD; Microsoft: khoảng 190 tỷ USD; Alphabet: 175–185 tỷ USD; Meta: 125–145 tỷ USD. Tổng cộng khoảng 725 tỷ USD, tăng 77% so với năm 2025. Khoảng 75% số này sẽ dành cho hạ tầng liên quan AI.
Q3: AI biên liên quan thế nào đến điện toán đám mây?
Chúng bổ trợ cho nhau, không thay thế nhau. Đám mây lõi xử lý huấn luyện mô hình lớn và suy luận phức tạp, trong khi node biên đảm nhận phản hồi thời gian thực độ trễ thấp, tiền xử lý dữ liệu và tuân thủ địa phương. Năng lực tính toán AI đang tiến hóa thành kiến trúc phân tán ba tầng—lõi, vùng và biên—tạo thành hệ sinh thái hợp tác.
Q4: CapEx AI phân tán ảnh hưởng thế nào đến ngành chip?
Huấn luyện vẫn do GPU Nvidia thống trị—doanh thu trung tâm dữ liệu dự kiến đạt 193,7 tỷ USD tài khóa 2026. Nhưng nhu cầu suy luận đang mở ra thị trường mới cho ASIC và chip biên, lượng xuất xưởng ASIC dự kiến đạt 7,7 triệu đơn vị năm 2026 và vượt thị phần GPU vào năm 2027. Nhu cầu chip đang chuyển từ "một ngôi vương" sang "nhiều đối thủ".
Q5: Đầu tư hạ tầng AI tăng trưởng cao có thể kéo dài bao lâu?
Barclays dự báo CapEx của các nhà cung cấp đám mây lớn sẽ đạt 919 tỷ USD năm 2027 và khoảng 1,16 nghìn tỷ USD năm 2028. Ban lãnh đạo Nvidia đã nâng trần CapEx ngành AI năm 2030 lên 4 nghìn tỷ USD. Tuy nhiên, tăng trưởng đang chậm lại—từ 66% năm 2025 xuống 31% năm 2026—khi ngành chuyển từ "mở rộng quy mô" sang "tinh chỉnh xây dựng".




