// NEXUS_DOLANANDATA_2026 //

FLOOD SEGMENTATION

Aerial flood mapping via SegFormer-B3 // Triple Loss (CE+Dice+Focal) // 4x TTA Inference // 47.2M Parameters

0
Best Val mIoU
0
Training Images
0
Parameters
10
Semantic Classes

Analisis Dataset

Eksplorasi mendalam terhadap 1.892 citra aerial (1.444 train + 448 val) dengan 10 kelas segmentasi.

Sampel Gambar Dataset

Sample 6358 Sample 6676 Sample 7118 Sample 7193 Sample 7313 Sample 8967
Class Pixel Distribution
Kelas grass dan tree mendominasi lebih dari 50% total piksel, sementara kelas vehicle dan water sangat langka (<2%). Ketimpangan ini memerlukan class weighting khusus.
Class Imbalance
Visualisasi skala logaritmik memperlihatkan perbedaan jumlah piksel antar kelas yang sangat ekstrem — hingga 100x lipat antara kelas dominan dan minoritas.
Class Frequency
Frekuensi kemunculan kelas di seluruh gambar. Kelas building_non_flooded dan road_non_flooded hampir tidak muncul sama sekali di data.
Co-occurrence Heatmap
Heatmap co-occurrence menunjukkan kelas mana yang sering muncul bersamaan dalam satu gambar. Tree + Grass adalah pasangan paling umum.
Pixel Pie Chart
Proporsi piksel per kelas dalam bentuk pie chart. Sangat jelas terlihat dominasi kelas vegetasi (grass + tree).
Coverage Boxplot
Boxplot menunjukkan variasi cakupan (coverage) setiap kelas per gambar. Kelas langka memiliki median mendekati nol dengan outlier tinggi.
Train vs Val
Perbandingan distribusi piksel antara data Train dan Validasi. Distribusi yang mirip memastikan validasi yang representatif.
Class Richness
Histogram jumlah kelas unik per gambar. Rata-rata setiap gambar mengandung 3-4 kelas berbeda.
Objects per Image
Distribusi jumlah objek per gambar. Mayoritas gambar memiliki 5-15 objek anotasi individual.
Image Dimensions
Scatter plot dimensi gambar. Sebagian besar gambar berukuran seragam (640×480 piksel).
Size Heatmap
Heatmap konsentrasi ukuran gambar. Mayoritas terkonsentrasi di satu titik (resolusi seragam).

SegFormer-B3

Arsitektur Transformer untuk segmentasi semantik dari NVIDIA, di-fine-tune pada dataset banjir aerial.

IN
Input Image
480×640
B3
MIT-B3
Encoder
FE
Multi-Scale
Features
ML
MLP Decode
Head
UP
Upsample
Bilinear 4×
10
Segmentation
Map (10 cls)
Backbone
MIT-B3
Parameters
47.2M
Pre-trained
ImageNet-1K
Input Size
480 × 640
Batch Size
16 (8/GPU)
GPU
2× Tesla T4
Optimizer
AdamW
Scheduler
OneCycleLR
Loss Function
CE + Dice + Focal
Loss Weights
0.3 / 0.5 / 0.2
Epochs
25
AMP
FP16 Mixed

Kurva Pelatihan

Visualisasi perjalanan model selama 25 epoch pelatihan pada dual GPU Tesla T4.

Training Curves
0.3683
Best Val mIoU
0.5205
Best Val mDice
0.6149
Pixel Accuracy
Ep 19
Best Epoch
EpochTr LossTr mIoUVal LossVal mIoUVal mDiceStatus

Performa Per Kelas

Rincian IoU per kelas menunjukkan kekuatan dan kelemahan model pada masing-masing kategori segmentasi.

Per Class IoU

Hasil Prediksi (Before-After)

Visualisasi overlay prediksi model pada gambar test menggunakan Test-Time Augmentation (TTA) 4×.

Building Flooded
Building Non-Flooded
Grass
Pool
Road Flooded
Road Non-Flooded
Tree
Vehicle
Water

Statistik Submisi

Ringkasan file submission.csv yang diunggah ke Kaggle Leaderboard.

0
Total Rows
0
Test Images
0
Non-Empty Predictions
0
Detection Rate
~12 MB
File Size