Nói thật: xG đo lường xác suất một cú sút sẽ thành bàn thắng, dựa trên vô số yếu tố. Chúng ta đang nói về vị trí sút, bộ phận cơ thể được sử dụng, loại kiến tạo, góc sút, liệu đó có phải là tình huống một đối một, áp lực phòng ngự, và thậm chí cả những thứ như giai đoạn của pha bóng dẫn đến cú sút – bóng sống, tình huống cố định, phản công nhanh. Nó là một số thập phân từ 0 đến 1, trong đó 0.1 có nghĩa là 10% cơ hội ghi bàn, và 0.8 có nghĩa là 80% cơ hội. Vậy cú sút dễ dàng từ sáu mét đó? Đó có lẽ là 0.7 hoặc 0.8 xG. Một cú sút cầu may từ 30 mét? Có thể là 0.02.
Nó được tính toán như thế nào? Chà, đó không phải là một công thức đơn giản mà bạn có thể viết ra trên một tờ giấy ăn. Các nhà cung cấp dữ liệu như Opta, StatsBomb và FBref (chủ yếu sử dụng dữ liệu StatsBomb cho xG) đều có các mô hình độc quyền của riêng họ, được xây dựng trên các thuật toán học máy được đào tạo trên hàng trăm nghìn, nếu không phải hàng triệu, cú sút trong quá khứ. Mỗi cú sút trong cơ sở dữ liệu lịch sử của họ được gắn thẻ với tất cả các yếu tố tôi đã đề cập, và mô hình sau đó học cách dự đoán tần suất các cú sút tương tự trong lịch sử đã dẫn đến bàn thắng.
Lấy ví dụ mô hình Opta. Nó được cho là sử dụng hơn 300.000 cú sút từ các giải đấu hàng đầu khác nhau làm dữ liệu đào tạo. Mô hình của StatsBomb thường được coi là chi tiết hơn vì họ theo dõi nhiều dữ liệu sự kiện hơn, như vị trí chính xác của mỗi cầu thủ trên sân vào thời điểm sút, và thậm chí cả những thứ như vận tốc sút. Chi tiết bổ sung này có thể dẫn đến sự khác biệt nhỏ về giá trị xG cho cùng một cú sút giữa các nhà cung cấp khác nhau. Ví dụ, một cú sút mà một hậu vệ trực tiếp cản tầm nhìn khung thành có thể có xG thấp hơn trong mô hình của StatsBomb so với của Opta nếu Opta không đánh giá vị trí phòng ngự nặng như vậy.
Bây giờ, hãy nói về mùa giải La Liga 2025-26. Real Madrid, như mong đợi, đang bay cao. Sau 15 trận đấu, họ đứng đầu bảng xếp hạng thực tế với 38 điểm, ghi 35 bàn và để thủng lưới 12 bàn. Nhưng các con số cơ bản của họ cũng ấn tượng không kém. Tổng xG của họ là 32.5, và Expected Goals Against (xGA) của họ là 10.8, tốt nhất giải đấu. Điều này có nghĩa là họ đang *vượt trội* xG của mình một chút với 2.5 bàn, nhưng quan trọng là, *kém hơn* xGA của mình 1.2 bàn. Việc họ để thủng lưới nhiều hơn xGA cho thấy họ có thể hơi kém may mắn với một số cú sút mà họ phải đối mặt, hoặc thủ môn của họ không thực hiện được những pha cứu thua mà thủ môn của các đội khác có thể làm được.
Hãy xem xét Barcelona. Họ đứng thứ 3 trong giải đấu với 31 điểm, ghi 28 bàn và để thủng lưới 15 bàn. xG của họ cho đến mùa giải này là 29.1, và xGA của họ là 16.5. Điều này cho thấy họ đang hơi *kém hơn* xG của mình (ghi ít hơn 1.1 bàn so với dự kiến) nhưng cũng *vượt trội* xGA của mình (để thủng lưới ít hơn 1.5 bàn so với dự kiến). Điều này có thể chỉ ra một số vấn đề về khả năng dứt điểm ở tuyến trên, nhưng cũng có thể là do thủ môn xuất sắc hoặc các pha cản phá kịp thời của hàng phòng ngự đã cứu họ ở phía sau.
Dưới đây là tổng quan về ba đội đứng đầu La Liga sau Vòng đấu 15:
| Đội | Bàn thắng thực tế | xG | Bị thủng lưới thực tế | xGA | Hiệu số bàn thắng | Hiệu số xG |
| :------------- | :----------- | :----- | :-------------- | :----- | :-------------- | :------------ |
| Real Madrid | 35 | 32.5 | 12 | 10.8 | +23 | +21.7 |
| Girona | 31 | 28.9 | 18 | 17.2 | +13 | +11.7 |
| Barcelona | 28 | 29.1 | 15 | 16.5 | +13 | +12.6 |
Hiệu số xG của Real Madrid là +21.7, tốt hơn Girona tới 9 bàn (+11.7), điều này giải thích tại sao họ cảm thấy thống trị đến vậy ngay cả khi khoảng cách điểm thực tế chưa lớn. Girona, mặt khác, đang thi đấu vượt quá khả năng một chút, ghi nhiều hơn 2.1 bàn so với xG của họ. Đó là dấu hiệu của khả năng dứt điểm chất lượng từ những cầu thủ như Artem Dovbyk, người đã có 11 bàn từ xG là 8.9.
Nó còn phức tạp hơn nữa. Còn có Non-Penalty Expected Goals (NPxG). Các quả phạt đền về cơ bản là một cú sút có xG đảm bảo là 0.76 (theo mô hình của Opta, mặc dù có thể thay