#Components của Quy trình Quyết định Markov

Trạng thái (S):

Đại diện cho tất cả các tình huống có thể mà một tác nhân có thể gặp phải.

Ví dụ trong #OpenfabricA I: Tình trạng hiện tại của một bot giao dịch theo dõi giá cổ phiếu hoặc một chatbot theo dõi dòng trò chuyện của người dùng.

Hành động (A):

Tất cả các hành động có thể mà tác nhân có thể thực hiện trong mỗi trạng thái.

Ví dụ: Một công cụ gợi ý chọn một sản phẩm để đề xuất dựa trên sở thích của người dùng.

Xác suất chuyển tiếp (P):

Xác suất chuyển từ một trạng thái này sang trạng thái khác.