CSP-CutsetConditioning/main.tex at main · samuelbruno33/CSP-CutsetConditioning · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
% report.tex
\documentclass[a4paper,11pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage[italian]{babel}
\usepackage{geometry}
\usepackage{microtype}
\usepackage{booktabs}
\usepackage{enumitem}
\usepackage{hyperref}
\usepackage{courier}
\usepackage{caption}
\usepackage{amsmath}
\geometry{margin=2.5cm}

\title{Cutset Conditioning per CSP: implementazione e risultati}
\author{Samuel Bruno}
\date{}

\begin{document}
\maketitle

\begin{abstract}
La relazione descrive l'implementazione di un solver per problemi di soddisfacimento di vincoli (CSP) basato sulla tecnica di \emph{cutset conditioning}. All'interno è mostrato il metodo adottato, la struttura dei file sorgente, il flusso d'esecuzione del programma e i risultati sperimentali su istanze di \emph{map coloring} e \emph{cryptoarithmetic}. Vengono inoltre fornite indicazioni per riprodurre gli esperimenti.
\end{abstract}

\section{Introduzione}
Cutset conditioning è una tecnica che sfrutta la struttura del grafo dei vincoli: si sceglie un sottoinsieme di variabili, detto cutset, e si esplorano tutte le possibili assegnazioni per esse. Una volta fissato il cutset, le variabili rimanenti (dette residui) formano un grafo senza cicli, che può quindi essere risolto con algoritmi più semplici ed efficienti. Nel progetto, in particolare, il grafo residuo viene risolto tramite l’algoritmo \emph{TREE-CSP-SOLVER} basato su \emph{directional arc consistency (DAC)}, che garantisce una risoluzione polinomiale.

Per ogni assegnazione del cutset si costruisce e si risolve il problema residuo; se il residuo ammette una soluzione, questa viene combinata con i valori assegnati al cutset per ottenere una soluzione completa del CSP.

Ad esempio, nella mappa dell’Australia, la variabile South Australia (SA) appartiene a tutti i cicli. Se la si fissa, le altre regioni rimaste formano una struttura aciclica che può essere risolta tramite TREE-CSP-SOLVER.

Questa strategia è discussa nella letteratura di riferimento (Russell \& Norvig, Artificial Intelligence: A Modern Approach, §6.5.1; Dechter, Tractable Structures for Constraint Satisfaction Problems, §3.1).

\section{Metodo utilizzato}
In questa sezione vengono descritti i punti essenziali del metodo implementato:

\begin{enumerate}
  \item \textbf{Rappresentazione CSP:} ogni istanza è rappresentata da:
   \begin{itemize}
      \item \texttt{variables}: lista di nomi delle variabili;
      \item \texttt{domains}: lista del dominio dei valori possibili;
      \item \texttt{constraints}: lista di coppie \((\text{constraint\_variables}, \text{constraint\_function})\) dove la prima è una tupla di coppie di variabili (per le mappe ad esempio, sono le coppie di regioni adiacenti) mentre \(\text{constraint\_function}\) è una funzione booleana che, dati i valori assegnati a quelle variabili, nello stesso ordine, restituisce \texttt{True} se il vincolo è soddisfatto.
   \end{itemize}
  \item \textbf{Selezione del cutset:} si costruisce il grafo di adiacenza considerando solo i vincoli binari; si applica un'euristica greedy \emph{min-fill}, che rimuove iterativamente la variabile che introduce il minor numero di archi aggiuntivi (fill-in) finché non rimangono cicli (cycle-cutset).
  \item \textbf{Combinazioni e verifica parziale:} si generano tutte le possibili combinazioni di valori per le variabili del cutset. Ogni assegnazione parziale viene controllata per verificare che rispetti i vincoli interni al cutset (ad esempio, che due regioni adiacenti non abbiano lo stesso colore). Se i vincoli non sono rispettati, quell’assegnazione viene scartata.
  \item \textbf{Costruzione del problema residuo:} una volta fissato il cutset, il problema rimanente (che coinvolge tutte le altre variabili) diventa privo di cicli. A questo punto:
\begin{itemize}
    \item si mantengono i vincoli che riguardano solo le variabili residue;
    \item i vincoli binari che collegano una variabile del cutset a una variabile residua vengono trasformati in vincoli unari sulla variabile residua, sfruttando i valori fissati del cutset;
    \item in presenza di vincoli n-ari, invece di inserire tutte le variabili nel cutset, se ne sceglie una sola (tipicamente quella con grado massimo nel grafo) per evitare esplosioni combinatorie;
    \item eventuali vincoli più complessi che coinvolgono sia cutset che residuo verranno verificati solo quando l’assegnazione completa sarà disponibile.
\end{itemize}

  \item \textbf{Risoluzione del residuo:} il problema residuo, ora ad albero, viene risolto con l’algoritmo \emph{TREE-CSP-SOLVER}, che prevede una passata bottom-up (arc-consistency tra parent e child) e una successiva passata top-down (assegnamento senza backtracking). Se si trova una soluzione per il residuo, questa viene combinata con l’assegnazione del cutset per ottenere la soluzione completa del CSP. In caso contrario, si passa alla successiva combinazione di valori per il cutset.

\end{enumerate}

\section{Descrizione dei file sorgente e del loro scopo}
Il progetto è organizzato in più file Python che realizzano l’implementazione della tecnica di cutset conditioning:

\subsection*{csp.py}
Definisce la classe \texttt{CSP} che contiene variabili, domini e vincoli. Fornisce il metodo
\texttt{is\_consistent}, che serve a controllare passo dopo passo se una certa assegnazione
parziale rispetta i vincoli già definiti. In questo modo, durante la ricerca di una soluzione,
si scartano subito le strade che non possono portare a un risultato valido.

\subsection*{tree\_solver.py}
Implementa l’algoritmo \texttt{TREE-CSP-SOLVER} (Russell \& Norvig, §5.5), che risolve CSP ad albero in tempo lineare rispetto al numero di variabili. L’algoritmo applica una fase di propagazione di vincoli (directional arc consistency) e successivamente assegna i valori ai nodi top-down senza necessità di backtracking.

\subsection*{cutset.py}
Qui si trovano le parti principali che implementano la tecnica del cutset conditioning.
Nel dettaglio:
\begin{itemize}
  \item una funzione costruisce il grafo di adiacenza delle variabili a partire dai vincoli binari, e utilizza la procedura greedy \emph{min-fill} integrata con leaf pruning per individuare un insieme di variabili da rimuovere (il cutset) in modo da eliminare i cicli;
  \item una funzione si occupa di trasformare vincoli binari che collegano variabili del cutset e variabili residue in vincoli unari sulle variabili residue, fissando i valori già assegnati nel cutset;
  \item nel caso di vincoli n-ari, il cutset include solo una variabile scelta in maniera euristica (grado massimo) per controllare la complessità;
  \item infine, la funzione \texttt{solve\_with\_cutset} si occupa di: provare tutte le possibili assegnazioni per il cutset, di verificare quali siano ammissibili, di costruire di volta in volta il problema residuo e di risolverlo con \texttt{tree\_solve}. Se il residuo ha una soluzione, questa viene combinata con i valori del cutset per ottenere una soluzione completa del CSP.
\end{itemize}

\subsection*{mapcolor.py e cryptarithmetic.py}
Questi due file hanno lo scopo di generare istanze concrete del problema da dare in input al solver.
\begin{itemize}
  \item \texttt{mapcolor.py} produce problemi di colorazione di mappe: la mappa dell’Australia (7 regioni e 3 colori), una mappa semplificata dell’Europa (11 regioni e 4 colori) e una piccola versione degli Stati Uniti (5 regioni e 3 colori). I vincoli stabiliscono che due regioni confinanti non possano avere lo stesso colore.
  \item \texttt{cryptarithmetic.py} produce puzzle di criptoaritmetica, ovvero \texttt{T+T=EE}, \texttt{SEND+MORE=MONEY} e \texttt{TWO+TWO+TWO=SIX}. In questo caso le lettere rappresentano cifre e i vincoli impongono sia che tutte le lettere abbiano valori diversi, sia che l’equazione sia rispettata.
\end{itemize}

\subsection*{main.py}
E' lo script principale che gestisce l’esecuzione del programma.
Per ogni istanza costruita (sia di mappe che di criptoaritmetica), lo script crea il corrispondente oggetto CSP, lo risolve tramite \texttt{solve\_with\_cutset} e salva l’intero risultato in un file di log all’interno della cartella \texttt{logs\_of\_istances}. I log sono utili per seguire i passaggi compiuti dal solver e per verificare i risultati ottenuti, anzichè farli stampare ad ogni iterazione in console.

\section{Istanze testate e risultati}
Elenco delle istanze eseguite e risultato osservato con la configurazione adottata:

\begin{tabular}{@{}lll@{}}
\toprule
Categoria & Istanza & Risultato \\
\midrule
Map coloring & Australia (7 regioni, 3 colori) & Soluzione trovata \\
Map coloring & Europa semplificata (11 regioni, 4 colori) & Soluzione trovata \\
Map coloring & USA semplificata (5 regioni, 3 colori) & Soluzione trovata \\
Crypto & T + T = EE & Nessuna soluzione (problema mal posto) \\
Crypto & SEND + MORE = MONEY & Soluzione trovata \\
Crypto & TWO + TWO + TWO = SIX & Soluzione trovata \\
\bottomrule
\end{tabular}

% ----- Esempio CSP ------

\section{Flusso di esecuzione del programma sulla mappa dell'Australia}
In questa sezione viene descritto in modo dettagliato il flusso del solver applicato all’istanza \texttt{australia}.
Le variabili sono \texttt{['WA','NT','SA','Q','NSW','V','T']}, ciascuna con dominio \(\{R,G,B\}\), e i vincoli binari impongono che regioni confinanti abbiano colori diversi.

\paragraph{1. Costruzione del grafo dei vincoli}
Il modulo \texttt{cutset.py} costruisce il grafo di adiacenza a partire dai vincoli binari.
Ogni nodo rappresenta una regione, e ogni arco un vincolo di diversità di colore tra due regioni adiacenti.
La lista di adiacenza iniziale è:

\begin{itemize}
  \item \texttt{WA: \{NT, SA\}} (grado 2)
  \item \texttt{NT: \{WA, SA, Q\}} (grado 3)
  \item \texttt{SA: \{WA, NT, Q, NSW, V\}} (grado 5)
  \item \texttt{Q:  \{NT, SA, NSW\}} (grado 3)
  \item \texttt{NSW:\{SA, Q, V\}} (grado 3)
  \item \texttt{V:  \{SA, NSW\}} (grado 2)
  \item \texttt{T:  \{\}} (isolata, grado 0)
\end{itemize}

\paragraph{2. Individuazione del cutset con l'algoritmo Min-Fill}
Per rendere il grafo aciclico e poter applicare un risolutore ad albero, il programma utilizza la funzione \texttt{find\_cycle\_cutset\_min\_fill}.
L’algoritmo seleziona iterativamente i nodi da rimuovere in modo da ridurre al minimo il numero di nuovi archi (fill-in) necessari tra i loro vicini.
Questo processo elimina progressivamente i cicli presenti nella rete dei vincoli.

Nel caso della mappa australiana, i nodi rimossi sono:
\[
\text{cutset (min-fill)} = [\texttt{WA},\ \texttt{NT},\ \texttt{Q},\ \texttt{SA}]
\]
La rimozione di questi nodi rende il grafo residuo aciclico, composto da \(\{\texttt{NSW}, \texttt{V}, \texttt{T}\}\).

\paragraph{3. Esplorazione e verifica delle assegnazioni del cutset}
Il solver genera tutte le possibili assegnazioni per le variabili del cutset.
Ogni combinazione viene verificata rispetto ai vincoli interni tra le variabili del cutset stesso; quelle non consistenti vengono immediatamente scartate.
Ad esempio:
\begin{itemize}
  \item \(\{\texttt{WA='R', NT='R', Q='R', SA='R'}\}\) viene scartata poiché viola il vincolo \texttt{WA != NT};
  \item \(\{\texttt{WA='R', NT='G', Q='R', SA='B'}\}\) risulta valida poiché tutti i vincoli interni sono rispettati.
\end{itemize}

\paragraph{4. Costruzione del problema residuo e pruning con vincoli unari}
Una volta trovata un’assegnazione valida per il cutset, il solver costruisce il problema residuo composto dalle variabili rimanenti:
\[
R = \{\texttt{NSW}, \texttt{V}, \texttt{T}\}
\]
A questo punto, i vincoli che collegavano variabili del cutset a quelle del residuo vengono trasformati in vincoli unari, sfruttando i valori già assegnati.
In questo passaggio si riducono i domini delle variabili residue sulla base delle restrizioni imposte dal cutset fissato.

Ad esempio, per l’assegnazione del cutset:
\[
\{\texttt{WA}='R',\ \texttt{NT}='G',\ \texttt{Q}='R',\ \texttt{SA}='B'\}
\]
si ottiene:
\begin{itemize}
  \item \texttt{NSW} è adiacente a \texttt{SA} e \texttt{Q}: quindi non può essere né \(B\) né \(R\), e il suo dominio \(\{R,G,B\}\) diventa \(\{G\}\);
  \item \texttt{V} è adiacente a \texttt{SA}: quindi non può essere \(B\), e il suo dominio diventa \(\{R,G\}\);
  \item \texttt{T} è isolata, quindi mantiene il dominio \(\{R,G,B\}\).
\end{itemize}

\paragraph{5. Risoluzione del residuo con TREE-SOLVER e arc consistency}
Il grafo residuo, ora aciclico, viene risolto dal modulo \texttt{tree\_solver.py} attraverso la funzione \texttt{tree\_solve}.
Questa opera in due fasi, secondo la procedura dell'algoritmo \emph{TREE -CSP-SOLVER} di Russell \& Norvig:

\begin{enumerate}
  \item \textbf{Passata bottom-up: MAKE-ARC-CONSISTENT}
  In questa fase il solver applica un altro pruning, che però riguarda i vincoli binari interni al residuo.
  Scorrendo i nodi in postorder (dal basso verso la radice), il solver elimina dai domini dei genitori tutti i valori che non hanno alcun valore compatibile nei figli.
  Questo garantisce la consistenza degli archi (\emph{arc consistency}) all’interno del residuo.

  Ad esempio, per la coppia \(\texttt{NSW}-\texttt{V}\):
  \(\texttt{NSW}\) ha dominio \(\{G\}\) e \(\texttt{V}\) ha dominio \(\{R,G\}\);
  poiché esiste almeno un valore compatibile (\(\texttt{NSW}=G, \texttt{V}=R\)), nessun valore viene eliminato e la componente risulta consistente.

  \item \textbf{Passata top-down: assegnamento deterministico}
  Dopo la propagazione, l’albero è già consistente.
  Partendo dalla radice, il solver assegna il primo valore disponibile nel dominio, e per ciascun figlio seleziona il primo valore compatibile con quello del genitore.
  Questo produce una soluzione completa in modo deterministico:
  \begin{itemize}
    \item \(\texttt{NSW} = G\)
    \item \(\texttt{V} = R\) (compatibile con \texttt{NSW}=G)
    \item \(\texttt{T} = R\) (isolata, primo valore disponibile)
  \end{itemize}
\end{enumerate}

\paragraph{6. Composizione finale della soluzione}
Combinando la soluzione del residuo con l’assegnazione del cutset, il solver ottiene la colorazione completa:
\[
\{\texttt{WA}='R',\ \texttt{NT}='G',\ \texttt{Q}='R',\ \texttt{SA}='B',\ \texttt{NSW}='G',\ \texttt{V}='R',\ \texttt{T}='R'\}
\]
Il log finale mostra la sequenza di pruning, la propagazione dei vincoli e l’assegnamento che porta a questa soluzione coerente.


\section{Riproducibilità}
Per riprodurre i risultati:
\begin{enumerate}
  \item copiare tutti i file Python nella stessa directory;
  \item E' preferibile avere installata l’ultima versione di Python 3 (non sono richieste librerie esterne);
  \item eseguire \texttt{python3 main.py} (i file dei risultati sono creati in \texttt{logs\_of\_istances}).
\end{enumerate}

\section*{Riferimenti}
\begin{itemize}
  \item S. Russell, P. Norvig — \emph{Artificial Intelligence: A Modern Approach}, 4th ed. — sezione 6.5.1 (Cutset conditioning).
  \item R. Dechter — \emph{Tractable Structures for Constraint Satisfaction Problems} (2006) — sezioni su cycle-cutset e w-cutset (§3.1).
\end{itemize}

\end{document}