Giá cả trên Polymarket có chính xác không? Tôi đã mô phỏng một tình huống khủng hoảng với 200 tác nhân để tìm hiểu
Tựa đề gốc: Cách tôi vận hành 200 tác nhân AI để phân tích cuộc khủng hoảng eo biển Hormuz bằng Mirofish và so sánh với Polymarket
Tác giả gốc: Con Khỉ Thông Minh
Dịch: Peggy, BlockBeats
Lời chú thích của biên tập viên: Khi trí tuệ nhân tạo bắt đầu mô phỏng một không gian dư luận, việc dự đoán chính sự kiện đó đang âm thầm thay đổi.
Bài viết này ghi chép lại một thí nghiệm về tình hình xung quanh eo biển Hormuz: tác giả đã sử dụng MiroFish để xây dựng một hệ thống mô phỏng gồm 200 tác nhân, cho phép các chính phủ, phương tiện truyền thông, công ty năng lượng, nhà giao dịch và người dân thường cùng tồn tại trong một mạng xã hội mô phỏng, hình thành các đánh giá thông qua sự tương tác liên tục, tranh luận và truyền bá thông tin, đồng thời so sánh kết quả của nhóm này với mức giá thị trường của Polymarket.
Kết quả không nhất quán. Cuộc thảo luận nhóm nhìn chung mang tính lạc quan hơn, trong khi thị trường lại tỏ ra bi quan hơn đáng kể; trong môi trường trao đổi tự do, số ít người bi quan lại gần với mức giá thực tế hơn; và khi đặt vào tình huống phỏng vấn, hầu hết các đại lý đều đi đến một quan điểm ôn hòa và hợp tác hơn.
Sự phân chia kiểu này không phải là điều xa lạ. Trong thực tế, các tuyên bố công khai thường có xu hướng ổn định và lạc quan, trong khi đánh giá rủi ro thực sự lại ẩn chứa trong hành động và những lời nói không chính thức. Nói cách khác, những gì mọi người nói, những gì họ nghĩ và cách họ đặt cược thường là ba hệ thống khác nhau.
Trong một cấu trúc như vậy, tín hiệu có giá trị nhất thường không đến từ sự đồng thuận, mà đến từ những tiếng nói dường như đi ngược lại xu hướng chung giữa muôn vàn tiếng ồn.
Dưới đây là bản gốc:
Tôi đã sử dụng MiroFish để mô phỏng tình hình tại eo biển Hormuz trong vài tuần tới. Công cụ này rất hiệu quả trong việc giải quyết các vấn đề như vậy vì nó có khả năng thực hiện phân tích kịch bản cực kỳ phức tạp: đưa nhiều chủ thể tham gia, với các vai trò và động cơ khác nhau, vào cùng một hệ thống, đồng thời cho phép các chủ thể này liên tục tương tác, tranh luận và dần dần đi đến một kết quả mang tính đồng thuận.

Dưới đây là các bước cụ thể mà tôi đã thực hiện để chạy mô phỏng này và kết quả mà tôi thu được cuối cùng. Ai cũng có thể làm được điều đó; điều quan trọng là chỉ cần biết phải thực hiện những bước nào.
Trước hết, MiroFish là một dự án mã nguồn mở do một nhóm nghiên cứu Trung Quốc phát triển. Sau khi bạn nhập một loạt tài liệu vào hệ thống, hệ thống sẽ trước tiên xây dựng một đồ thị tri thức, sau đó tạo ra các tính cách đại lý khác nhau dựa trên đồ thị này, và cuối cùng đưa các đại lý này vào một môi trường Twitter mô phỏng. Trong môi trường này, họ sẽ đăng bài, chia sẻ lại, bình luận, bấm thích và tranh luận với nhau. Sau khi mô phỏng kết thúc, bạn cũng có thể phỏng vấn từng tác nhân một để tìm hiểu quan điểm và quá trình suy luận của họ.

Khi bạn đưa vào một kịch bản khủng hoảng, hệ thống sẽ tạo ra một cuộc thảo luận xoay quanh sự kiện đó; từ cuộc thảo luận đó, bạn có thể rút ra một dự đoán.
Tôi đã đề cập đến một câu hỏi đang được thảo luận trên Polymarket: Đến cuối tháng 4 năm 2026, liệu hoạt động vận tải biển qua eo biển Hormuz có trở lại bình thường không?

Vì vậy, tôi đã nhập tất cả thông tin này vào MiroFish và tạo ra 200 vai trò đại diện — bao gồm chính phủ, truyền thông, quân đội, các công ty năng lượng, nhà giao dịch và người dân bình thường — rồi để họ tranh luận trong 7 ngày mô phỏng. Cuối cùng, tôi đã so sánh kết quả của họ với giá thị trường.
Cấu trúc tổng thể như sau:
· Mẫu: GPT-4o mini, sự cân bằng tối ưu giữa chi phí và hiệu quả trong kịch bản 200 tác nhân
· Hệ thống bộ nhớ: Zep Cloud, được sử dụng để lưu trữ ký ức của các đại lý và đồ thị tri thức
· Bộ xử lý mô phỏng: OASIS (một nền tảng tương tự Twitter do Camel-AI cung cấp)
· Phần cứng: Mac mini M4 Pro, RAM 24GB
· Thời lượng: Mất khoảng 49 phút để hoàn thành 100 vòng mô phỏng
· Chi phí: Mỗi lần gọi API có giá khoảng 3 đến 5 đô la
· Vật liệu giống: Bản tóm tắt dài 5.800 ký tự được tổng hợp từ Wikipedia, CNBC, Al Jazeera, Forbes và Reuters, bao gồm diễn biến quân sự, tình hình phong tỏa, giá dầu, thiệt hại kinh tế, các nỗ lực ngoại giao, cùng các yếu tố liên quan đến khoản đầu tư trị giá 3,2 nghìn tỷ USD của Hội đồng Hợp tác Vùng Vịnh (GCC). Nói cách khác, tất cả thông tin cốt lõi cần thiết để các tác nhân đưa ra phán đoán đều đã được đưa vào.
Cách thực hiện quy trình này (Hướng dẫn từng bước)
Nếu bạn muốn tự thực hiện quy trình này, đây là các bước chi tiết mà tôi đã thực hiện. Toàn bộ quá trình này mất khoảng 2 giờ để thiết lập, với chi phí API dao động từ 3 đến 5 đô la; việc tăng số vòng hoặc số lượng đại lý sẽ làm chi phí tăng thêm.
Những thứ bạn cần
· Python 3.12 (không sử dụng phiên bản 3.14, vì tiktoken sẽ báo lỗi khi chạy trên phiên bản này)
·Node.js 22 trở lên
·Một khóa API của OpenAI (GPT-4o Mini có giá cả phải chăng và phù hợp với trường hợp này)
·Một tài khoản Zep Cloud (phiên bản miễn phí là đủ cho các mô phỏng quy mô nhỏ)
·Một máy tính có bộ nhớ đủ dùng. Tôi đang sử dụng một chiếc Mac mini M1 Pro với 24GB bộ nhớ, nhưng 16GB cũng đủ dùng
Bước 1: Cài đặt MiroFish

Sau đó, hãy cấu hình tệp .env của bạn
OPENAI_API_KEY=sk-khóa-của-bạn
OPENAI_BASE_URL=liên kết
OPENAI_MODEL=gpt-4o-mini
ZEP_API_KEY=khóa-ZEP-của-bạn
Bước 2: Tạo một dự án và tải lên tài liệu ban đầu của bạn
Tài liệu ban đầu là phần quan trọng nhất trong toàn bộ quy trình, vì nó quyết định những thông tin mà tác nhân nắm được về tình hình hiện tại. Tôi đã soạn thảo một bản tóm tắt dài khoảng 5.800 ký tự, bao gồm diễn biến quân sự, tình hình phong tỏa, giá dầu, thiệt hại kinh tế, các nỗ lực ngoại giao và khía cạnh đầu tư của Hội đồng Hợp tác Vùng Vịnh (GCC), với các nguồn tham khảo từ Wikipedia, CNBC, Al Jazeera, Forbes và Reuters.
Bước 3: Tạo ra hệ thống khái niệm
Bước này cho MiroFish biết cần nhận diện những loại thực thể nào và những mối quan hệ nào có thể tồn tại giữa các thực thể này.
Cuối cùng, tôi đã xác định được 10 loại thực thể: quốc gia, quân đội, nhà ngoại giao, thực thể thương mại, tổ chức truyền thông, thực thể kinh tế, tổ chức, cá nhân, cơ sở hạ tầng, thị trường dự đoán; và 6 loại mối quan hệ. Nếu kết quả được tạo tự động chưa hoàn toàn phù hợp với tình huống của bạn, bạn cũng có thể điều chỉnh chúng theo cách thủ công.
Bước 4: Xây dựng đồ thị tri thức
Bước này yêu cầu sử dụng Zep Cloud. MiroFish sẽ gửi tài liệu gốc và hệ thống khái niệm đến Zep, đơn vị sẽ chịu trách nhiệm trích xuất thực thể và xây dựng đồ thị.
Quá trình này sẽ mất khoảng một đến hai phút. Cuối cùng, tôi đã thu được một đồ thị gồm 65 nút và 85 cạnh, kết nối các yếu tố như các quốc gia, nhân vật, tổ chức và hàng hóa.
Bước 5: Tạo đại lý
MiroFish sẽ sử dụng đồ thị tri thức để xây dựng một hồ sơ nhân cách toàn diện cho từng thực thể, bao gồm loại tính cách MBTI, độ tuổi, quốc gia xuất xứ, phong cách đăng tải, các yếu tố kích thích cảm xúc, các chủ đề nhạy cảm và ký ức tổ chức.
Ban đầu, tôi đã tạo ra 43 tác nhân cốt lõi từ đồ thị tri thức. Sau đó, hệ thống có thể mở rộng các vai trò cốt lõi này lên số lượng tổng cộng mà bạn mong muốn. Cuối cùng, tôi đã đặt tổng số nhân vật là 200 và bổ sung thêm các vai trò dân sự đa dạng như nhà giao dịch tiền điện tử, phi công hàng không, giáo sư, sinh viên, nhà hoạt động xã hội, v.v.
Bước 6: Chuẩn bị môi trường mô phỏng

Bước này sẽ thiết lập cấu hình mô phỏng hoàn chỉnh, bao gồm lịch trình hành động của các tác nhân, các bài đăng ban đầu và các thông số thời gian. MiroFish sẽ tự động chọn một bộ cài đặt mặc định hợp lý, chẳng hạn như giờ cao điểm, thời gian ngừng hoạt động và tần suất đăng bài cho các loại đại lý khác nhau.
Cấu hình của tôi lúc đó như sau: mô phỏng tổng cộng 168 giờ (7 ngày), 100 vòng (mỗi vòng tương ứng với 1 giờ), chỉ sử dụng kịch bản Twitter và thiết lập lịch hoạt động riêng cho từng tác nhân.
Bước 7: Bắt đầu chạy mô phỏng

Vậy là đã đến lúc phải chờ đợi. Về phía tôi, việc chạy 200 tác nhân và 100 vòng mô phỏng với GPT-4o mini mất khoảng 49 phút. Bạn có thể theo dõi tiến trình thông qua API hoặc xem trực tiếp nhật ký.
Trong suốt quá trình này, các bot sẽ hoạt động hoàn toàn tự động: chúng sẽ tuân thủ lịch trình và tự quyết định việc đăng bài, retweet bình luận, chia sẻ, nhấn thích hoặc chỉ đơn giản là lướt qua dòng tin, tất cả đều không cần sự can thiệp của con người.
Bước 8 (Tùy chọn): Nhân viên phỏng vấn
Sau khi quá trình mô phỏng hoàn tất, hệ thống sẽ chuyển sang chế độ lệnh. Lúc này, bạn có thể tiến hành phỏng vấn riêng từng nhân viên hoặc phỏng vấn tất cả nhân viên cùng một lúc:

Phân tích
MiroFish sẽ trước tiên đọc tài liệu gốc và tự động tạo ra cấu trúc ontology (gồm 10 loại thực thể và 6 loại quan hệ); sau đó, nó sẽ trích xuất một đồ thị tri thức dựa trên các định nghĩa này (gồm 65 nút và 85 cạnh). Dựa trên nền tảng này, hệ thống sẽ xây dựng một hồ sơ nhân cách đầy đủ cho từng thực thể, bao gồm loại tính cách MBTI, độ tuổi, quốc gia xuất xứ, phong cách đăng tải, các yếu tố kích thích cảm xúc và các yếu tố liên quan đến ký ức tổ chức.
Cuối cùng, 43 tác nhân cốt lõi đã được tạo ra từ đồ thị tri thức, sau đó được mở rộng lên tổng cộng 200 tác nhân. Điều này đã mang đến một loạt vai trò đa dạng hơn cho tầng lớp bình dân, nhằm tăng cường tính đa dạng và tính chân thực cho toàn bộ mô phỏng.

Chi tiết cụ thể như sau:
· 140 đại diện từ các tầng lớp bình dân: nhà giao dịch tiền điện tử, phi công hàng không, quản lý chuỗi cung ứng, sinh viên, nhà hoạt động xã hội, giáo sư, v.v.
· 16 chức vụ ngoại giao/chính phủ: Bộ trưởng Ngoại giao Iran, Bộ trưởng Ngoại giao Ả Rập Xê Út, Bộ trưởng Ngoại giao Oman, Thủ tướng Bahrain, Bộ trưởng Ngoại giao Trung Quốc, Liên minh Châu Âu (EU), Liên Hợp Quốc (LHQ), v.v.
· 15 cơ quan truyền thông: Reuters, CNN, Bloomberg, Al Jazeera, BBC, Fox, Wall Street Journal, v.v.
· 10 vấn đề liên quan đến năng lượng và vận tải: OPEC, Platts, QatarEnergy, Aramco, Maersk, v.v.
· 7 tổ chức tài chính: Polymarket, Kalshi, Goldman Sachs, JPMorgan, Citadel, ADIA, v.v.
· 2 nhân vật quân sự/chính trị: Ông Trump, Tư lệnh Lực lượng Vệ binh Cách mạng Hồi giáo Iran
Trong quá trình mô phỏng kéo dài 7 ngày (100 vòng), các kết quả sau đây đã được tạo ra:
1.888 bài đăng
6.661 bản ghi hành vi (ghi lại tất cả các hành động)
1.611 lượt chia sẻ lại trích dẫn (các đại lý trả lời lẫn nhau)
4.051 lần làm mới (chỉ xem nguồn tin)
311 người không tham gia (chọn đứng ngoài quan sát)
208 lượt thích, 207 lượt chia sẻ lại
70 quan điểm độc đáo (những lập trường hoặc đánh giá mới, độc lập)
Nhìn chung, hệ thống này không chỉ đơn thuần tạo ra thông tin mà còn gần giống với một mô phỏng hành vi xã hội. Hầu hết thời gian, người ta thấy các đại lý đang tiếp thu thông tin và tương tác thay vì liên tục tạo ra kết quả. Cấu trúc này gần giống với cách thức lan truyền thông tin trong môi trường dư luận thực tế — nội dung gốc hạn chế, xen lẫn với việc lặp lại tràn lan, các hành vi lợi dụng hệ thống và phản hồi mang tính cảm tính.

Các đại lý dành phần lớn thời gian để đọc và trích dẫn quan điểm của người khác thay vì chủ động tạo ra nội dung mới.
Toàn bộ nhóm cho thấy một xu hướng rõ rệt trong việc lan truyền cảm xúc: những quan điểm lạc quan dễ dàng được khuếch đại và chia sẻ hơn, trong khi những đánh giá bi quan, dù về mặt logic có thể gần với thực tế hơn, lại có xu hướng lan truyền ít hơn và ít được chú ý hơn.
Điều thú vị hơn nữa là 19 chuyên viên đã tự nguyện đưa ra các đánh giá xác suất cụ thể trong bài đăng của mình, không phải vì họ được yêu cầu mà là kết quả tự nhiên của cuộc thảo luận.

Xác suất trung bình của nhóm hình thành tự phát là 47,9%, trong khi thị trường Polymarket đưa ra xác suất là 31%, dẫn đến chênh lệch 16,9 điểm phần trăm giữa hai bên.
Trong quá trình mô phỏng, một số tác nhân thậm chí còn thay đổi quan điểm sau hơn 100 vòng tương tác.
Sau khi kết thúc mô phỏng, tôi đã sử dụng tính năng phỏng vấn của MiroFish để đặt cùng một câu hỏi cho 43 đại lý chính: Xác suất để lưu lượng giao thông hàng hải tại eo biển Hormuz trở lại bình thường (từ 0–100%) trong khoảng thời gian từ nay đến cuối tháng 4 năm 2026 là bao nhiêu?
Kết quả như sau: Trong số 43 nhân viên, có 31 người đã cung cấp các con số cụ thể, trong khi 12 người còn lại từ chối trả lời. Điều đáng chú ý là những ý kiến thận trọng nhất thường chọn cách tự kiểm duyệt thay vì đưa ra những dự đoán rõ ràng — một hành vi rất giống với cách hành xử của các tổ chức này trong thực tế.

Giá trị trung bình của mỗi hạng mục đều trên 60%: Quân sự: 75%, Truyền thông: 69%, Năng lượng: 66%, Tài chính: 65%, Ngoại giao: 61%. Con số này trên thị trường hiện ở mức 31,5%.
Kết quả tổng hợp từ quá trình tiến hóa tự nhiên so với kết quả phỏng vấn cho thấy hai bức tranh hoàn toàn khác biệt.
Đây là phát hiện quan trọng nhất.

Kết quả phỏng vấn thường mang tính lạc quan hơn. Khi các nhà phân tích được tự do đưa ra nhận định, quan điểm của phe bi quan thường được thể hiện mạnh mẽ và cụ thể hơn; tuy nhiên, trong các cuộc phỏng vấn riêng, do xu hướng hợp tác, hầu hết mọi người đều đưa ra đánh giá trong khoảng 60%–70%.
Kết quả tự nhiên đáng tin cậy hơn. Một cố vấn tài chính đã chia sẻ trong một cuộc thảo luận sôi nổi rằng họ ước tính con số này là 65%, một đánh giá được hình thành trong quá trình trao đổi; trong khi đó, một nhân viên trả lời câu hỏi trong một cuộc phỏng vấn về cơ bản chỉ đang thực hiện việc so sánh theo mẫu.
Điều trớ trêu là, những người bi quan trong các biểu hiện tự nhiên lại chính là những người dự đoán chính xác nhất. Trong số 7 đại diện tham gia mô phỏng đưa ra xác suất ≤30% (Bộ trưởng Ngoại giao Iran, Bộ trưởng Ngoại giao Trung Quốc, Kalshi, Platts, một giáo sư kinh tế, một sinh viên Iran và một nhà hoạt động phản chiến), mức trung bình là 22%, chênh lệch chưa đến 10 điểm phần trăm so với kết quả của Polymarket. Kinh nghiệm chuyên môn + Sự tự nhiên trong cách thể hiện = Gần gũi nhất với thị trường.
Điều quan trọng hơn là, đây không chỉ là hiện tượng xảy ra trong lĩnh vực trí tuệ nhân tạo; các chủ thể trong thế giới thực cũng hành xử theo cách tương tự.
Khi phỏng vấn bất kỳ nhà lãnh đạo quốc gia nào về một cuộc khủng hoảng, họ sẽ luôn đề cập đến cam kết của chúng ta đối với hòa bình, cũng như sự lạc quan của chúng ta về các giải pháp. Đây là một kịch bản tiêu chuẩn, những lời cần phải nói trước ống kính. Nhưng nếu nhìn vào những gì họ thực sự đang làm: triển khai quân sự, áp đặt các biện pháp trừng phạt, đóng băng tài sản, rút vốn đầu tư—thì những hành động của họ thường cho thấy một bức tranh hoàn toàn khác.
Thái tử Ả Rập Xê Út đã chia sẻ với Reuters rằng chúng tôi tin tưởng vào các biện pháp ngoại giao, trong khi quỹ đầu tư quốc gia của ông đang nhắm đến việc phân bổ tới 3,2 nghìn tỷ USD vào các tài sản tại Mỹ. Tổng thống Iran có thể nói rằng hòa bình là mục tiêu chung của chúng ta, song Lực lượng Vệ binh Cách mạng Iran lại đang rải mìn ở eo biển. Trump sẽ nói rằng "chúng ta sẽ xem sao", đồng thời từ chối mọi đề xuất ngừng bắn.
Mô phỏng này vô tình tái hiện lại cùng một sự chia rẽ về quan điểm: khi những người dùng ẩn danh đưa ra lập luận, tranh luận, phản hồi và lan truyền thông tin, nhóm chuyên gia dần dần thống nhất ở mức 20%–30% — bi quan hơn và gần với thực tế hơn; nhưng một khi đưa họ vào phòng họp và chính thức hỏi “Dự đoán của các vị là gì?”, họ lập tức chuyển sang chế độ ngoại giao: 65%–70%, lạc quan hơn rõ rệt.
Các bài đăng tự nhiên, mang tính chất gần gũi với hành vi cá nhân và các cuộc trò chuyện không chính thức; kết quả phỏng vấn, mang tính chất gần gũi với các buổi họp báo. Nếu bạn thực sự muốn biết ai đó đang nghĩ gì, đừng hỏi thẳng họ—hãy quan sát cách họ hành xử khi không có ai để ý.
Tiếp theo là gì?
Đây chỉ là một cuộc thử nghiệm ban đầu. Mục tiêu không phải là đưa ra một dự đoán chắc chắn, mà là thông qua mô phỏng nhóm như thế này, để xác định những tín hiệu nào hữu ích, ở đâu có sự sai lệch, và những phần nào đáng được tối ưu hóa.
Đã có câu trả lời: các cuộc thảo luận diễn ra một cách tự nhiên có thể mang lại những tín hiệu hiệu quả, trong khi các cuộc phỏng vấn thì không; những người bi quan chính là nguồn tín hiệu; và xu hướng hợp tác của GPT-4o mini thực sự là một vấn đề.
Thí nghiệm tiếp theo sẽ có một số cải tiến.
Đầu tiên là dữ liệu hạt giống có quy mô lớn hơn. Không còn chỉ là một bản tóm tắt 5.800 từ, mà còn giới thiệu bối cảnh lịch sử kéo dài hơn 20 năm: các sự kiện liên quan tại eo biển Hormuz, xung đột ngày càng leo thang giữa Iran và Mỹ, các cuộc khủng hoảng dầu mỏ trong quá khứ, những thay đổi trong chính sách ngoại giao của Hội đồng Hợp tác Vùng Vịnh (GCC), v.v.—tóm lại là những gì một nhà phân tích địa chính trị thực thụ sẽ cân nhắc trong đầu trước khi đưa ra đánh giá.
Thứ hai là một mẫu mạnh mẽ hơn. GPT-4o mini đã đủ để thực hiện quá trình xác thực với chi phí 3 đô la, nhưng một mô hình mạnh mẽ hơn sẽ giúp tác nhân này phản ánh sát hơn cách suy nghĩ riêng của nhân vật, thay vì mặc định sử dụng câu “Tôi nhìn nhận cuộc đối thoại một cách lạc quan” vào những thời điểm quan trọng.
Cuối cùng, thêm các máy chủ proxy. Con số 200 đã là một kết quả tốt, nhưng vẫn còn nhiều tiềm năng để phát triển hơn nữa: đa dạng hóa các vai trò con người thường gặp, mở rộng sự đại diện của các giọng nói địa phương, và bao quát thêm các trường hợp đặc biệt. Càng nhiều người tham gia, cấu trúc thảo luận càng phong phú và thông điệp thu được càng có giá trị.
Bạn cũng có thể thích

Tôi vừa tìm thấy một "đồng tiền meme" tăng giá chóng mặt chỉ trong vài ngày. Có lời khuyên nào không?

TAO là Elon Musk, người đã đầu tư vào OpenAI, và Subnet là Sam Altman

Kỷ nguyên "phân phối tiền điện tử hàng loạt" trên các chuỗi công khai đã kết thúc.

Sau khi eo biển Hormuz bị phong tỏa, chiến tranh sẽ kết thúc khi nào?

Trước khi sử dụng X Chat, "WeChat phương Tây" của Musk, bạn cần hiểu rõ ba câu hỏi này.
Ứng dụng X Chat sẽ có sẵn để tải xuống trên App Store vào thứ Sáu tuần này. Giới truyền thông đã đưa tin về danh sách các tính năng, bao gồm tin nhắn tự hủy, chống chụp màn hình, nhóm chat 481 người, tích hợp Grok và đăng ký không cần số điện thoại, định vị nó là "WeChat phương Tây". Tuy nhiên, có ba câu hỏi hầu như chưa được đề cập trong bất kỳ báo cáo nào.
Trên trang trợ giúp chính thức của X vẫn còn một câu chưa được giải đáp: "Nếu những kẻ nội bộ độc hại hoặc chính X khiến các cuộc hội thoại được mã hóa bị lộ thông qua các thủ tục pháp lý, cả người gửi và người nhận đều hoàn toàn không hay biết."
Không. Sự khác biệt nằm ở nơi lưu trữ các khóa.
Với công nghệ mã hóa đầu cuối của Signal, các khóa mã hóa không bao giờ rời khỏi thiết bị của bạn. X, tòa án, hay bất kỳ bên thứ ba nào khác đều không nắm giữ chìa khóa của bạn. Máy chủ của Signal không có khả năng giải mã tin nhắn của bạn; ngay cả khi bị triệu tập, chúng cũng chỉ có thể cung cấp dấu thời gian đăng ký và thời gian kết nối cuối cùng, như đã được chứng minh trong các hồ sơ triệu tập trước đây.
X Chat sử dụng giao thức Juicebox. Giải pháp này chia khóa thành ba phần, mỗi phần được lưu trữ trên ba máy chủ do X vận hành. Khi khôi phục khóa bằng mã PIN, hệ thống sẽ truy xuất ba phần này từ các máy chủ của X và kết hợp chúng lại. Dù mã PIN có phức tạp đến đâu, X mới là người thực sự nắm giữ chìa khóa, chứ không phải người dùng.
Đây là cơ sở kỹ thuật của "câu trên trang trợ giúp": vì chìa khóa nằm trên máy chủ của X, nên X có khả năng phản hồi các thủ tục pháp lý mà người dùng không cần biết. Signal không có khả năng này, không phải vì chính sách, mà đơn giản là vì nó không có "khóa" cần thiết.
Hình minh họa sau đây so sánh các cơ chế bảo mật của Signal, WhatsApp, Telegram và X Chat theo sáu khía cạnh. X Chat là ứng dụng duy nhất trong bốn ứng dụng mà nền tảng nắm giữ khóa và là ứng dụng duy nhất không có tính năng Bảo mật Chuyển tiếp (Forward Secrecy).
Ý nghĩa của Bảo mật Chuyển tiếp (Forward Secrecy) là ngay cả khi khóa bị lộ tại một thời điểm nhất định, các tin nhắn trước đó cũng không thể được giải mã vì mỗi tin nhắn đều có một khóa duy nhất. Giao thức Double Ratchet của Signal tự động cập nhật khóa sau mỗi tin nhắn, một cơ chế mà X Chat không có.
Sau khi phân tích kiến trúc của X Chat vào tháng 6 năm 2025, giáo sư mật mã học Matthew Green của Đại học Johns Hopkins nhận xét: "Nếu chúng ta đánh giá XChat như một hệ thống mã hóa đầu cuối, thì đây dường như là một lỗ hổng có thể dẫn đến hậu quả nghiêm trọng." Sau đó, ông nói thêm: "Tôi sẽ không tin tưởng điều này hơn là tôi tin tưởng những tin nhắn riêng tư (DM) hiện tại chưa được mã hóa."
Từ báo cáo của TechCrunch vào tháng 9 năm 2025 cho đến khi được đưa vào hoạt động vào tháng 4 năm 2026, kiến trúc này không hề thay đổi.
Trong một tweet ngày 9 tháng 2 năm 2026, Musk cam kết sẽ tiến hành các bài kiểm tra bảo mật nghiêm ngặt đối với X Chat trước khi ra mắt trên nền tảng X Chat và sẽ công khai toàn bộ mã nguồn.
Tính đến ngày ra mắt 17 tháng 4, chưa có cuộc kiểm toán độc lập nào của bên thứ ba được hoàn thành, không có kho mã nguồn chính thức nào trên GitHub, nhãn quyền riêng tư của App Store tiết lộ rằng X Chat thu thập năm hoặc nhiều hơn năm loại dữ liệu bao gồm vị trí, thông tin liên hệ và lịch sử tìm kiếm, mâu thuẫn trực tiếp với tuyên bố tiếp thị "Không quảng cáo, không theo dõi".
Không phải giám sát liên tục, mà là một điểm truy cập rõ ràng.
Đối với mỗi tin nhắn trên X Chat, người dùng có thể nhấn giữ và chọn "Hỏi Grok". Khi nhấn nút này, thông điệp sẽ được gửi đến Grok dưới dạng văn bản thuần, chuyển từ trạng thái mã hóa sang trạng thái không mã hóa ở giai đoạn này.
Thiết kế này không phải là điểm yếu mà là một tính năng. Tuy nhiên, chính sách bảo mật của X Chat không nêu rõ liệu dữ liệu văn bản thuần túy này sẽ được sử dụng để huấn luyện mô hình Grok hay liệu Grok có lưu trữ nội dung cuộc trò chuyện này hay không. Bằng cách chủ động nhấp vào "Hỏi Grok", người dùng tự nguyện gỡ bỏ lớp bảo vệ mã hóa của tin nhắn đó.
Ngoài ra còn có một vấn đề về cấu trúc: Nút này sẽ nhanh chóng chuyển từ "tính năng tùy chọn" thành "thói quen mặc định" như thế nào? Chất lượng phản hồi của Grok càng cao, người dùng càng tin tưởng và sử dụng nó thường xuyên hơn, dẫn đến tỷ lệ tin nhắn không được mã hóa bảo vệ ngày càng tăng. Về lâu dài, độ mạnh mã hóa thực tế của X Chat không chỉ phụ thuộc vào thiết kế của giao thức Juicebox mà còn phụ thuộc vào tần suất người dùng nhấp vào "Hỏi Grok".
Phiên bản phát hành ban đầu của X Chat chỉ hỗ trợ iOS, trong khi phiên bản Android chỉ ghi "sắp ra mắt" mà không có thời gian cụ thể.
Trên thị trường điện thoại thông minh toàn cầu, Android chiếm khoảng 73%, trong khi iOS chiếm khoảng 27% (IDC/Statista, 2025). Trong số 3,14 tỷ người dùng WhatsApp hoạt động hàng tháng, 73% sử dụng hệ điều hành Android (theo Demand Sage). Tại Ấn Độ, WhatsApp có 854 triệu người dùng, với hơn 95% sử dụng trên hệ điều hành Android. Tại Brazil, có 148 triệu người dùng, trong đó 81% sử dụng Android, và tại Indonesia, có 112 triệu người dùng, với 87% sử dụng Android.
Sự thống trị của WhatsApp trên thị trường truyền thông toàn cầu được xây dựng trên nền tảng Android. Signal, với khoảng 85 triệu người dùng hoạt động hàng tháng, cũng chủ yếu dựa vào người dùng quan tâm đến quyền riêng tư ở các quốc gia sử dụng Android nhiều.
X Chat đã né tránh chiến trường này, với hai cách hiểu khả thi. Một trong những vấn đề là nợ kỹ thuật; X Chat được xây dựng bằng Rust, và việc đạt được khả năng hỗ trợ đa nền tảng không hề dễ dàng, vì vậy việc ưu tiên iOS có thể là một hạn chế về mặt kỹ thuật. Một lựa chọn khác là chiến lược; với iOS chiếm gần 55% thị phần tại Mỹ, trong khi cơ sở người dùng cốt lõi của X cũng ở Mỹ, việc ưu tiên iOS đồng nghĩa với việc tập trung vào cơ sở người dùng cốt lõi của họ thay vì cạnh tranh trực tiếp với các thị trường mới nổi do Android thống trị và WhatsApp.
Hai cách giải thích này không loại trừ lẫn nhau, mà dẫn đến cùng một kết quả: Khi ra mắt, X Chat đã tự nguyện từ bỏ 73% thị phần người dùng smartphone toàn cầu.
Vấn đề này đã được một số người mô tả như sau: X Chat, cùng với X Money và Grok, tạo thành một bộ ba cung cấp hệ thống dữ liệu khép kín song song với cơ sở hạ tầng hiện có, tương tự về mặt khái niệm với hệ sinh thái WeChat. Đánh giá này không phải là mới, nhưng với sự ra mắt của X Chat, việc xem xét lại sơ đồ này là điều đáng giá.
X Chat tạo ra siêu dữ liệu giao tiếp, bao gồm thông tin về việc ai đang nói chuyện với ai, trong bao lâu và tần suất như thế nào. Dữ liệu này được chuyển vào hệ thống nhận dạng của X. Một phần nội dung tin nhắn sẽ được xử lý thông qua tính năng Hỏi Grok và đi vào chuỗi xử lý của Grok. Các giao dịch tài chính được xử lý bởi X Money: quá trình thử nghiệm công khai bên ngoài đã hoàn tất vào tháng 3, chính thức mở cửa cho công chúng vào tháng 4, cho phép chuyển tiền pháp định ngang hàng thông qua Visa Direct. Một lãnh đạo cấp cao của Fireblocks đã xác nhận kế hoạch triển khai thanh toán bằng tiền điện tử vào cuối năm nay, hiện công ty đang nắm giữ giấy phép chuyển tiền tại hơn 40 tiểu bang của Mỹ.
Mọi tính năng của WeChat đều hoạt động trong khuôn khổ pháp lý của Trung Quốc. Hệ thống của Musk hoạt động trong khuôn khổ pháp lý phương Tây, nhưng ông cũng đồng thời giữ chức người đứng đầu Bộ Hiệu quả Chính phủ (DOGE). Đây không phải là bản sao của WeChat; mà là sự tái hiện lại cùng một logic nhưng trong bối cảnh chính trị khác.
Điểm khác biệt là WeChat chưa bao giờ tuyên bố rõ ràng rằng giao diện chính của họ sử dụng công nghệ "mã hóa đầu cuối", trong khi X Chat thì có. Theo cách hiểu của người dùng, "mã hóa đầu cuối" có nghĩa là không ai, kể cả nền tảng, có thể xem được tin nhắn của bạn. Thiết kế kiến trúc của X Chat không đáp ứng được kỳ vọng này của người dùng, nhưng nó lại sử dụng thuật ngữ này.
X Chat hợp nhất ba luồng dữ liệu "người này là ai, họ đang nói chuyện với ai và tiền của họ đến từ đâu và đi về đâu" trong tay một công ty duy nhất.
Câu hướng dẫn trong trang trợ giúp chưa bao giờ chỉ đơn thuần là hướng dẫn kỹ thuật.

Tăng vọt gấp 50 lần, với giá trị sổ sách (FDV) vượt quá 10 tỷ USD, tại sao lại là RaveDAO?

Phiên bản Beta mới ra mắt của Parse Noise, làm thế nào để "sử dụng" hiệu quả công nghệ này?

Đây là một thứ của quá khứ? Unpacking the Hermes Agent Tools Supercharge Your Throughput to 100x

Tuyên chiến với trí tuệ nhân tạo? Câu chuyện tận thế đằng sau cảnh Ultraman bị thiêu rụi trong nhà.

Các quỹ đầu tư mạo hiểm tiền điện tử đã chết? Chu kỳ tuyệt chủng của thị trường đã bắt đầu

Hành trình trở nên ngốc nghếch của Claude được minh họa bằng sơ đồ: Cái giá của sự tiết kiệm, hay làm thế nào mà dự luật API tăng gấp 100 lần

Sự thoái lui vùng rìa đất: Một cuộc thảo luận lại về sức mạnh hàng hải, năng lượng và đồng đô la

1 tỷ DOT được tạo ra từ hư không, nhưng hacker chỉ kiếm được 230.000 đô la.

Cuộc phỏng vấn mới nhất của Arthur Hayes: Các nhà đầu tư cá nhân nên ứng phó như thế nào với cuộc xung đột Iran?

Vừa nãy, Sam Altman lại bị tấn công, lần này là bằng súng.

Thống đốc California ký lệnh cấm giao dịch tay trong trên thị trường dự đoán
Lệnh mới từ Thống đốc Gavin Newsom cấm giao dịch tay trong trên thị trường dự đoán với…

Tóm tắt về việc phong tỏa eo biển và tiền ổn định | Bản tin sáng của Rewire News

Từ kỳ vọng cao ngất trời đến sự thay đổi gây tranh cãi, chương trình airdrop Genius gây ra phản ứng dữ dội từ cộng đồng.
Tôi vừa tìm thấy một "đồng tiền meme" tăng giá chóng mặt chỉ trong vài ngày. Có lời khuyên nào không?
TAO là Elon Musk, người đã đầu tư vào OpenAI, và Subnet là Sam Altman
Kỷ nguyên "phân phối tiền điện tử hàng loạt" trên các chuỗi công khai đã kết thúc.
Sau khi eo biển Hormuz bị phong tỏa, chiến tranh sẽ kết thúc khi nào?
Trước khi sử dụng X Chat, "WeChat phương Tây" của Musk, bạn cần hiểu rõ ba câu hỏi này.
Ứng dụng X Chat sẽ có sẵn để tải xuống trên App Store vào thứ Sáu tuần này. Giới truyền thông đã đưa tin về danh sách các tính năng, bao gồm tin nhắn tự hủy, chống chụp màn hình, nhóm chat 481 người, tích hợp Grok và đăng ký không cần số điện thoại, định vị nó là "WeChat phương Tây". Tuy nhiên, có ba câu hỏi hầu như chưa được đề cập trong bất kỳ báo cáo nào.
Trên trang trợ giúp chính thức của X vẫn còn một câu chưa được giải đáp: "Nếu những kẻ nội bộ độc hại hoặc chính X khiến các cuộc hội thoại được mã hóa bị lộ thông qua các thủ tục pháp lý, cả người gửi và người nhận đều hoàn toàn không hay biết."
Không. Sự khác biệt nằm ở nơi lưu trữ các khóa.
Với công nghệ mã hóa đầu cuối của Signal, các khóa mã hóa không bao giờ rời khỏi thiết bị của bạn. X, tòa án, hay bất kỳ bên thứ ba nào khác đều không nắm giữ chìa khóa của bạn. Máy chủ của Signal không có khả năng giải mã tin nhắn của bạn; ngay cả khi bị triệu tập, chúng cũng chỉ có thể cung cấp dấu thời gian đăng ký và thời gian kết nối cuối cùng, như đã được chứng minh trong các hồ sơ triệu tập trước đây.
X Chat sử dụng giao thức Juicebox. Giải pháp này chia khóa thành ba phần, mỗi phần được lưu trữ trên ba máy chủ do X vận hành. Khi khôi phục khóa bằng mã PIN, hệ thống sẽ truy xuất ba phần này từ các máy chủ của X và kết hợp chúng lại. Dù mã PIN có phức tạp đến đâu, X mới là người thực sự nắm giữ chìa khóa, chứ không phải người dùng.
Đây là cơ sở kỹ thuật của "câu trên trang trợ giúp": vì chìa khóa nằm trên máy chủ của X, nên X có khả năng phản hồi các thủ tục pháp lý mà người dùng không cần biết. Signal không có khả năng này, không phải vì chính sách, mà đơn giản là vì nó không có "khóa" cần thiết.
Hình minh họa sau đây so sánh các cơ chế bảo mật của Signal, WhatsApp, Telegram và X Chat theo sáu khía cạnh. X Chat là ứng dụng duy nhất trong bốn ứng dụng mà nền tảng nắm giữ khóa và là ứng dụng duy nhất không có tính năng Bảo mật Chuyển tiếp (Forward Secrecy).
Ý nghĩa của Bảo mật Chuyển tiếp (Forward Secrecy) là ngay cả khi khóa bị lộ tại một thời điểm nhất định, các tin nhắn trước đó cũng không thể được giải mã vì mỗi tin nhắn đều có một khóa duy nhất. Giao thức Double Ratchet của Signal tự động cập nhật khóa sau mỗi tin nhắn, một cơ chế mà X Chat không có.
Sau khi phân tích kiến trúc của X Chat vào tháng 6 năm 2025, giáo sư mật mã học Matthew Green của Đại học Johns Hopkins nhận xét: "Nếu chúng ta đánh giá XChat như một hệ thống mã hóa đầu cuối, thì đây dường như là một lỗ hổng có thể dẫn đến hậu quả nghiêm trọng." Sau đó, ông nói thêm: "Tôi sẽ không tin tưởng điều này hơn là tôi tin tưởng những tin nhắn riêng tư (DM) hiện tại chưa được mã hóa."
Từ báo cáo của TechCrunch vào tháng 9 năm 2025 cho đến khi được đưa vào hoạt động vào tháng 4 năm 2026, kiến trúc này không hề thay đổi.
Trong một tweet ngày 9 tháng 2 năm 2026, Musk cam kết sẽ tiến hành các bài kiểm tra bảo mật nghiêm ngặt đối với X Chat trước khi ra mắt trên nền tảng X Chat và sẽ công khai toàn bộ mã nguồn.
Tính đến ngày ra mắt 17 tháng 4, chưa có cuộc kiểm toán độc lập nào của bên thứ ba được hoàn thành, không có kho mã nguồn chính thức nào trên GitHub, nhãn quyền riêng tư của App Store tiết lộ rằng X Chat thu thập năm hoặc nhiều hơn năm loại dữ liệu bao gồm vị trí, thông tin liên hệ và lịch sử tìm kiếm, mâu thuẫn trực tiếp với tuyên bố tiếp thị "Không quảng cáo, không theo dõi".
Không phải giám sát liên tục, mà là một điểm truy cập rõ ràng.
Đối với mỗi tin nhắn trên X Chat, người dùng có thể nhấn giữ và chọn "Hỏi Grok". Khi nhấn nút này, thông điệp sẽ được gửi đến Grok dưới dạng văn bản thuần, chuyển từ trạng thái mã hóa sang trạng thái không mã hóa ở giai đoạn này.
Thiết kế này không phải là điểm yếu mà là một tính năng. Tuy nhiên, chính sách bảo mật của X Chat không nêu rõ liệu dữ liệu văn bản thuần túy này sẽ được sử dụng để huấn luyện mô hình Grok hay liệu Grok có lưu trữ nội dung cuộc trò chuyện này hay không. Bằng cách chủ động nhấp vào "Hỏi Grok", người dùng tự nguyện gỡ bỏ lớp bảo vệ mã hóa của tin nhắn đó.
Ngoài ra còn có một vấn đề về cấu trúc: Nút này sẽ nhanh chóng chuyển từ "tính năng tùy chọn" thành "thói quen mặc định" như thế nào? Chất lượng phản hồi của Grok càng cao, người dùng càng tin tưởng và sử dụng nó thường xuyên hơn, dẫn đến tỷ lệ tin nhắn không được mã hóa bảo vệ ngày càng tăng. Về lâu dài, độ mạnh mã hóa thực tế của X Chat không chỉ phụ thuộc vào thiết kế của giao thức Juicebox mà còn phụ thuộc vào tần suất người dùng nhấp vào "Hỏi Grok".
Phiên bản phát hành ban đầu của X Chat chỉ hỗ trợ iOS, trong khi phiên bản Android chỉ ghi "sắp ra mắt" mà không có thời gian cụ thể.
Trên thị trường điện thoại thông minh toàn cầu, Android chiếm khoảng 73%, trong khi iOS chiếm khoảng 27% (IDC/Statista, 2025). Trong số 3,14 tỷ người dùng WhatsApp hoạt động hàng tháng, 73% sử dụng hệ điều hành Android (theo Demand Sage). Tại Ấn Độ, WhatsApp có 854 triệu người dùng, với hơn 95% sử dụng trên hệ điều hành Android. Tại Brazil, có 148 triệu người dùng, trong đó 81% sử dụng Android, và tại Indonesia, có 112 triệu người dùng, với 87% sử dụng Android.
Sự thống trị của WhatsApp trên thị trường truyền thông toàn cầu được xây dựng trên nền tảng Android. Signal, với khoảng 85 triệu người dùng hoạt động hàng tháng, cũng chủ yếu dựa vào người dùng quan tâm đến quyền riêng tư ở các quốc gia sử dụng Android nhiều.
X Chat đã né tránh chiến trường này, với hai cách hiểu khả thi. Một trong những vấn đề là nợ kỹ thuật; X Chat được xây dựng bằng Rust, và việc đạt được khả năng hỗ trợ đa nền tảng không hề dễ dàng, vì vậy việc ưu tiên iOS có thể là một hạn chế về mặt kỹ thuật. Một lựa chọn khác là chiến lược; với iOS chiếm gần 55% thị phần tại Mỹ, trong khi cơ sở người dùng cốt lõi của X cũng ở Mỹ, việc ưu tiên iOS đồng nghĩa với việc tập trung vào cơ sở người dùng cốt lõi của họ thay vì cạnh tranh trực tiếp với các thị trường mới nổi do Android thống trị và WhatsApp.
Hai cách giải thích này không loại trừ lẫn nhau, mà dẫn đến cùng một kết quả: Khi ra mắt, X Chat đã tự nguyện từ bỏ 73% thị phần người dùng smartphone toàn cầu.
Vấn đề này đã được một số người mô tả như sau: X Chat, cùng với X Money và Grok, tạo thành một bộ ba cung cấp hệ thống dữ liệu khép kín song song với cơ sở hạ tầng hiện có, tương tự về mặt khái niệm với hệ sinh thái WeChat. Đánh giá này không phải là mới, nhưng với sự ra mắt của X Chat, việc xem xét lại sơ đồ này là điều đáng giá.
X Chat tạo ra siêu dữ liệu giao tiếp, bao gồm thông tin về việc ai đang nói chuyện với ai, trong bao lâu và tần suất như thế nào. Dữ liệu này được chuyển vào hệ thống nhận dạng của X. Một phần nội dung tin nhắn sẽ được xử lý thông qua tính năng Hỏi Grok và đi vào chuỗi xử lý của Grok. Các giao dịch tài chính được xử lý bởi X Money: quá trình thử nghiệm công khai bên ngoài đã hoàn tất vào tháng 3, chính thức mở cửa cho công chúng vào tháng 4, cho phép chuyển tiền pháp định ngang hàng thông qua Visa Direct. Một lãnh đạo cấp cao của Fireblocks đã xác nhận kế hoạch triển khai thanh toán bằng tiền điện tử vào cuối năm nay, hiện công ty đang nắm giữ giấy phép chuyển tiền tại hơn 40 tiểu bang của Mỹ.
Mọi tính năng của WeChat đều hoạt động trong khuôn khổ pháp lý của Trung Quốc. Hệ thống của Musk hoạt động trong khuôn khổ pháp lý phương Tây, nhưng ông cũng đồng thời giữ chức người đứng đầu Bộ Hiệu quả Chính phủ (DOGE). Đây không phải là bản sao của WeChat; mà là sự tái hiện lại cùng một logic nhưng trong bối cảnh chính trị khác.
Điểm khác biệt là WeChat chưa bao giờ tuyên bố rõ ràng rằng giao diện chính của họ sử dụng công nghệ "mã hóa đầu cuối", trong khi X Chat thì có. Theo cách hiểu của người dùng, "mã hóa đầu cuối" có nghĩa là không ai, kể cả nền tảng, có thể xem được tin nhắn của bạn. Thiết kế kiến trúc của X Chat không đáp ứng được kỳ vọng này của người dùng, nhưng nó lại sử dụng thuật ngữ này.
X Chat hợp nhất ba luồng dữ liệu "người này là ai, họ đang nói chuyện với ai và tiền của họ đến từ đâu và đi về đâu" trong tay một công ty duy nhất.
Câu hướng dẫn trong trang trợ giúp chưa bao giờ chỉ đơn thuần là hướng dẫn kỹ thuật.
