# ── SECTION 1: LOAD CHECKPOINT ───────────────────────────────────────────────

import pandas as pd
import numpy as np
from scipy import stats
from sklearn.preprocessing import LabelEncoder
from scipy.stats import ks_2samp
from fairlearn.metrics import demographic_parity_difference, equalized_odds_difference
from sklearn.metrics import matthews_corrcoef, log_loss, confusion_matrix, precision_recall_curve, auc
import matplotlib.pyplot as plt
import seaborn as sns
bins_proxy   = [-np.inf, 0.0, 50397.0, np.inf]
labels_proxy = ['Low-Balance', 'Mid-Balance', 'High-Balance']

df = pd.read_csv('checkpoint.csv')

print(f'Checkpoint loaded: {df.shape[0]:,} rows x {df.shape[1]} columns')
print(df.columns.tolist())

Checkpoint loaded: 6,362,620 rows x 11 columns
['step', 'type', 'amount', 'nameOrig', 'oldbalanceOrg', 'newbalanceOrig', 'nameDest', 'oldbalanceDest', 'newbalanceDest', 'isFraud', 'isFlaggedFraud']

import pandas as pd

results = pd.read_csv('model_results.csv')

y_test = results['y_test']
y_pred = results['y_pred']
y_prob = results['y_prob']


s_test = results[['balance_group', 'tx_type_group']].astype(str)

print("All audit variables (including s_test) are now defined.")

All audit variables (including s_test) are now defined.

# Thresholds from SETUP, THRESHOLDS AND ENVIRONMENT Notebook section
THRESHOLDS = {
    'SPD':      0.10,   # Fairness
    'EOD':      0.10,   # Fairness
    'MCC':      0.50,   # Performance
    'LOG_LOSS': 0.40,   # Performance
    'PR_AUC':   0.70,   # Performance
    'KS':       0.30,   # Performance
}

fairness_results = {}

for proxy, label in [
    ('tx_type_group', 'Transaction Type (Economic Role Proxy)'),
    ('balance_group',  'Account Balance Tier (Wealth Proxy)')
]:
    sf = s_test[proxy].astype(str).values
    spd = demographic_parity_difference(y_test, y_pred, sensitive_features=sf)
    eod = equalized_odds_difference(y_test, y_pred, sensitive_features=sf)

    spd_pass = abs(spd) < THRESHOLDS['SPD']
    eod_pass = abs(eod) < THRESHOLDS['EOD']

    print(f'\n{"=" * 60}')
    print(f'Fairness: {label}')
    print('=' * 60)

    groups = sorted(np.unique(sf))
    if proxy == 'balance_group':
        order  = ['Low-Balance', 'Mid-Balance', 'High-Balance']
        groups = [g for g in order if g in groups]

    group_stats = {}
    print(f'\n{"Group":<14} {"N":>8} {"Actual Fraud":>13} '
          f'{"Pred Fraud":>11} {"TPR":>8} {"FPR":>10} {"Pred Rate":>10}')
    print('-' * 78)

    for g in groups:
        mask = sf == g
        yt_g = y_test.values[mask]
        yp_g = y_pred[mask]
        tp_g = ((yt_g == 1) & (yp_g == 1)).sum()
        fn_g = ((yt_g == 1) & (yp_g == 0)).sum()
        fp_g = ((yt_g == 0) & (yp_g == 1)).sum()
        tn_g = ((yt_g == 0) & (yp_g == 0)).sum()
        tpr_g      = tp_g / (tp_g + fn_g) if (tp_g + fn_g) > 0 else 0
        fpr_g      = fp_g / (fp_g + tn_g) if (fp_g + tn_g) > 0 else 0
        pred_rate_g = yp_g.mean()
        group_stats[g] = {
            'n': mask.sum(), 'tp': tp_g, 'fn': fn_g,
            'fp': fp_g, 'tn': tn_g,
            'tpr': tpr_g, 'fpr': fpr_g, 'pred_rate': pred_rate_g
        }
        print(f'{g:<14} {mask.sum():>8,} {yt_g.sum():>13,} {yp_g.sum():>11,} '
              f'{tpr_g:>8.4f} {fpr_g:>10.6f} {pred_rate_g:>10.4%}')

    print(f'\nSPD = {spd:+.4f} | Threshold |SPD| < {THRESHOLDS["SPD"]} '
          f'| {"PASS" if spd_pass else "FAIL"}')
    print(f'EOD = {eod:+.4f} | Threshold |EOD| < {THRESHOLDS["EOD"]} '
          f'| {"PASS" if eod_pass else "FAIL"}')

    fairness_results[proxy] = {
        'spd': spd, 'eod': eod,
        'spd_pass': spd_pass, 'eod_pass': eod_pass,
        'group_stats': group_stats
    }

print('\nFairness metrics computed.')

============================================================
Fairness: Transaction Type (Economic Role Proxy)
============================================================

Group                 N  Actual Fraud  Pred Fraud      TPR        FPR  Pred Rate
------------------------------------------------------------------------------
CASH_OUT        447,193           798       3,656   0.9900   0.006420    0.8175%
OTHER           825,331           845       4,592   0.9953   0.004550    0.5564%

SPD = +0.0026 | Threshold |SPD| < 0.1 | PASS
EOD = +0.0053 | Threshold |EOD| < 0.1 | PASS

============================================================
Fairness: Account Balance Tier (Wealth Proxy)
============================================================

Group                 N  Actual Fraud  Pred Fraud      TPR        FPR  Pred Rate
------------------------------------------------------------------------------
Low-Balance     420,537             6         172   0.6667   0.000399    0.0409%
Mid-Balance     419,077           225       4,390   0.9733   0.009958    1.0475%
High-Balance    432,910         1,412       3,686   0.9972   0.005279    0.8514%

SPD = +0.0101 | Threshold |SPD| < 0.1 | PASS
EOD = +0.3305 | Threshold |EOD| < 0.1 | FAIL

Fairness metrics computed.

# ── SECTION 8: FAIRNESS VISUALIZATION ────────────────────────────────────────
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle(
    'Section 8 — Fairness Metrics: SPD and EOD\n'
    'ClearBoxAI Audit CBA-2026-002',
    fontsize=13, fontweight='bold'
)

colors_map = {
    'CASH_OUT':    '#FF6B6B',
    'OTHER':       '#4ECDC4',
    'Low-Balance': '#FF6B6B',
    'Mid-Balance': '#FFC107',
    'High-Balance':'#4CAF50'
}

for row_idx, (proxy, res) in enumerate(fairness_results.items()):
    gs     = res['group_stats']
    groups = list(gs.keys())
    if proxy == 'balance_group':
        order  = ['Low-Balance', 'Mid-Balance', 'High-Balance']
        groups = [g for g in order if g in gs]
    bar_colors = [colors_map.get(g, '#90CAF9') for g in groups]

    tprs = [gs[g]['tpr'] for g in groups]
    axes[row_idx, 0].bar(groups, tprs, color=bar_colors, edgecolor='black', alpha=0.85)
    axes[row_idx, 0].set_title(
        f'{proxy}\nTrue Positive Rate per Group\n'
        f'EOD={res["eod"]:.4f} | {"PASS" if res["eod_pass"] else "FAIL"}',
        fontsize=9, fontweight='bold'
    )
    axes[row_idx, 0].set_ylabel('TPR (fraud caught per group)')
    axes[row_idx, 0].set_ylim(0, 1.2)
    for i, v in enumerate(tprs):
        label = f'{v:.4f}' if v > 0 else 'ZERO'
        color = '#C62828' if v == 0 else 'black'
        axes[row_idx, 0].text(i, v + 0.03, label,
                              ha='center', fontsize=9, fontweight='bold', color=color)

    pred_rates = [gs[g]['pred_rate'] for g in groups]
    axes[row_idx, 1].bar(groups, pred_rates, color=bar_colors, edgecolor='black', alpha=0.85)
    axes[row_idx, 1].set_title(
        f'{proxy}\nPredicted Fraud Rate per Group\n'
        f'SPD={res["spd"]:+.4f} | {"PASS" if res["spd_pass"] else "FAIL"}',
        fontsize=9, fontweight='bold'
    )
    axes[row_idx, 1].set_ylabel('Predicted fraud rate')
    for i, v in enumerate(pred_rates):
        axes[row_idx, 1].text(i, v + 0.0001, f'{v:.4%}',
                              ha='center', fontsize=9, fontweight='bold')

plt.tight_layout()
plt.savefig('fig_fairness_01.png', dpi=150, bbox_inches='tight')
plt.show()

df.to_csv('checkpoint_v2.csv', index=False)
print("Checkpoint v2 saved.")

Checkpoint v2 saved.

Regulation	Provision	Status
BoG CISD 2026	Annexure E §l(i) – Material bias	TRIGGERED
BoG CISD 2026	§115(2)(b) – Notify regulator	REQUIRED
BoG CISD 2026	Annexure E §e(i)(3) – Fairness risk identified	CONFIRMED
NIST AI RMF 1.0	MEASURE 2.11 – Bias documented	Complete
NIST AI RMF 1.0	§3.7 – Harmful bias managed	Breached
EU AI Act 2024/1689	Article 6(3) – High-risk classification	Reference

FAIRNESS AND BIAS¶

Finding: Fairness and Bias Audit¶

TPR Disparity Analysis¶

Interpretation¶

Root Cause Analysis¶

Regulatory Status¶

Risk Assessment¶

Group	N (Samples)	Actual Fraud	TPR	FPR	Predicted Rate
CASH_OUT	447,193	798	0.9900	0.006420	0.8175%
OTHER	825,331	845	0.9953	0.004550	0.5564%

Metric	Value	Threshold	Result
SPD	+0.0101	below 0.10	PASS
EOD	+0.3305	below 0.10	FAIL more than three times the threshold

Group	N (Samples)	Actual Fraud	TPR	FPR	Predicted Rate
Low-Balance	420,537	6	0.6667	0.000399	0.0409%
Mid-Balance	419,077	225	0.9733	0.009958	1.0475%
High-Balance	432,910	1,412	0.9972	0.005279	0.8514%